SASユーザー総会論文集 2014年

>100 Views

April 21, 25

スライド概要

「生物多樟性を探るために」~統計解析からわかったトンボと生物多様性について~ 宇久村三世
政府におけるオーフンデータの取組について 鈴木一広
JST情報資産のオープン化について 佐藤正樹
Let's匿名データ分析:パック旅行費支出と世帯情報の関連の検討 魚住龍史
全国消費実態調査の匿名データを用いた2人以上 宇野慧
ビジネスにおけるビッグデータ活用の歴史と今後の展望 坂巻英一
DeloitteのAudit AnalyticsにおけるSAS Visual Analyticsの活用事例紹介 戸田大介
CDISC標準対応でSASプログラマーが抱える問題点と解決策 片山雅仁
アマゾンウエブサービス(AWS)による公共データの活用 吉荒祐一
SAS Loves Big Data via Hadoop ~Big Data Driven Innovation~ 惟高裕一
システム管理負荷を軽減させる、SAS BI運用に関する検討 青柳吉博
SASを教える・SASを始める,新しいSASの操作方法,SAS Enterprise Guideのご案内 古賀信二
基礎自治体のSNSを活用した情報発信の有効性の評価 有馬昌宏
最近の公的統計ヂータの利用について~二次的利用の取組と統計のオープンデータの高度化を中 高部勲
大学と企業における統計教育とSAS 山之内直樹
科学的マーケティング手法による大学マネジメント・サイクルの持続的発展-山形大学EM部の「学生を知り抜]く」 IRへの挑戦- 福島真司
インターネット時代の医薬品営業に関する考察 武藤猛
マーケティングとデータ解析研究会 朝野煕彦
G2:因子分析とクラスタ一分析 藤居誠
G4:コーホー卜分析 田村玄
「マーケティング分野におけるベイズ統計の活用事例に関する一考察」 中見真也
Domination理論によるリスク管理標準 中西美紗
生物学的同等性試験における例数設計:正確,近 似と漸近 張方紅
イヌテレメトリー試験におけるデザインと統計解析 法に関するシミュレーション検討 橋本敏夫
Model based Library によるLogical Checkの自動 生成-チェック仕様書作成業務の効率化- 三木悠吾
PMDAへの承認申請時CDISC標準電子データ提出に向けた祉内標準のリモデリング 神谷亜香里
SAS Suppory CDISC and Clinical MetaData Manegement Bill J. Gibson
欠測のあるデータに対する各種解析手法と欠測メカニズムに対する感度分析 (1)セッションの概要と 基本事項の整理 土居正明
欠測のあるデータに対する各種解析手法と欠測メ カニズムに対する感度分析 (2)解析手法の解説 1(SM. MMRM) 大江基貴
欠測のあるデータに対する各種解析手法と欠測メカニズムに対する感度分析 (3)解析手法の解説 2(MI,P MM,S PM) 高橋文博
欠測のあるデータに対する各種解析手法と欠測メカニズムに対する感度分析 (4)欠測メカニズムに 対する感度分析 駒寄弘
欠測のあるデータに対する各種解析手法と欠測メカニズムに対する感度分析 (5)まとめと質疑応答 土居正明
欠測のあるデータに対する総合的な感度分析と主 解析の選択 土居正明
ODS GRAPHICSを用いた臨床試験データの可視 化への挑戦 豊泉樹一郎
投与前値を含むクロスオーバー法による経時デー タの解析 高橋行雄
医療・臨床研究分野におけるCDISC標準規格群への取り組み 大津洋
SASとExcelを用いたCDISC ADaM標準における作 業効率化の試 高浪洋平
大学における統計家育成のためのCDISC教育の実 佐野雅隆
産官学でのCDISC標準利用に向けた取り組み:実務担当者のために 承認申請のためのCDISC実装 とメタデータ作成 浅見由美子
PMDAにおける次世代審査・相談体制とCDISCの 利用について 安藤友紀
社内標準策定でのCDISCの利用 坂上拓
SASを用いたEMICMアルゴリズムによるMST推定の性能評価 中川雄貴
透明性実現のための製薬企業による臨床データ 角田亮
生存時間解析におけるノンパラメトリック検定の多 重比較に関する研究 島村文也
抗がん剤の第2相試験における被験者数変動を考 慮した最適デザイン 豊泉滋之
SAS/IMLによる医療経済評価(モデル分析) 奥山ことぱ
減らせ突然死院外心肺停止のビッグデータから見 えてくるもの 田久浩志
東京都23区の公立図書館の比較評価一続計と DEAの共生一 新村秀一
LS-Means再考-GLMとPLMによるモデル推定後のプロセス- 魚住龍史
SASによるニ項比率の差の非劣性検定の正確な 方法について 武藤彬正
線形モデルにおけるCLASSステートメントの機能 吉田早織
SASによる二項比率における正確な信頼区間の 比較 原茂恵美子
オッズ、比の信頼区間の構成法の比較 飯塚政人
ネットワークメタアナリシスによる無作為化比較試 験の統合 福井伸行
FREQプロシジャによる割合の差の信頼区間-V9.4 における機能拡張と性能評価. 飯塚政人
MCMCプロシジャによるNormalizedPower Priorの実用的な実装 武田純
多重補完法におけるPattern-Mixtureモデルに基づく感度分析 伊藤陽一
隠れマルコフモデルによる予測モデルの構築 稲葉洋介
ICLIFETESTプロシジャを用いた区間打切りデータ の解析と既存プロシジャによる結果との比較 西本尚樹
傾向スコアを用いた共変量の調整におけるバイア スと標準誤差のふるまいについて 松井優作
動画による統計表現~新しい統計の要約~ 関根暁史
伝統芸能実演家の動的データベースの作成 坂部裕美子
SASでCDISC SDTMデータを効率的に利用するためにDefine-XMLのメタデータを活用する 富永一宏
ODS markupを使ったADaM define-xmlの作成 坂上拓
PROC MIANALYZEを用いた、多重代入法による 結果の統合 石田和也
HadoopとSASとの連携テクニック 小林泉
SASを用いたコピユラに従う擬似乱数の生成 矢田真城
数独解答プロセスをExcel画面上にリアルタイムで 可視化するSASプログラム 森岡裕
Let's Make Forest Plot by SAS 堀田真一
SAS ハッシュオブジェクトを利用して医薬品開発に使用するプログラムを効率化する-有害事象と併用薬、臨床検査値と途中変更のある施設基準値 のマッチングからSASプログラムコードの分析まで 森岡裕
SASユーザー総会論文集の無料一般公開のイン パクト与信モデル構築 高橋 行雄
データ分析における「第三の変数」の功罪 岩崎学
データサイエンスを活用したビジネス拡大の事例 倉橋一成
LOGISTICプロシジャによる解析と最新の機能拡彊 浜田知久馬
政府統計ミクロデータの符号表からSAS変数のラベルとフォーマットを自動生成するSASプログラム の作成方法 周防節雄
規定問題/同時方程式モデルを用いた健康/不健康支出の分析 宇野慧
規定問題/ジニ係数による所得格差の解析 木下陽介
規定問題/ミクロデータを用いたセルフメディケー ションの実態把握に関する検討 芥川麻衣子
規定問題/ゲーム・インターネット好きの世帯は、 どのような食生活をしているのか?? 吉田大祐
規定問題/年代別の魚食傾向に関する考察一教 育用疑似ミクロデータを用いてー KGあならいず
規定問題/住宅ローン返済中における家計の逼 迫と消費行動に関する分析 谷口裕明

profile-image

SAS言語を中心として,解析業務担当者・プログラマなのコミュニティを活性化したいです

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

医療、政府・自治体、大学による エコシステムの実証 論文集

2.

SAS、SASを構成するプロダクト群は、 SASI n s t i t u t eI n c .の登録商標です。 その他、本論文集に記載されている会社名、製品名は、一般にそれぞれ各社の商標または登録商標です。 本論文集の一部または全部を無断転載することは、著作権法上の例外を除き、禁止されています。 本論文集の内容を実際に運用した結果の影響については、責任を負いかねます。

3.

目次 オープンデータ 目 「生物多樟性を探るためにJ ‑ 統計解析からわかったトンボと生物多様性に・ついて 一一一一一一 3 宇久村三世(北海道札幌旭丘高等学校) 政府におけるオープンデータの取組について 19 鈴木一広(内閣官房情報通信技術(lT )総合戦略室) JST情報資産のオープン化について 20 佐藤正樹(独立行政法人科学技術振興機構 ( J S T ) ) L e t ' s匿名データ分析:パック旅行費支出と世帯情報の関連の検討 2 1 魚住龍史(京都大学大学院) 全国消費実態調査の匿名データを用いた、 2人以上世帯の保険需要の分析 32 宇野慧(アステラス製薬株式会社) ビジネス活用 I ビジネスにおけるビッグデータ活用の歴史と今後の展望 45 坂巻英一(公立大学法人宮城大学) D e l o i t t eの AuditA n a l y t i c sにおける SASV i s u a lA n a l y t i c sの活用事例紹介 49 戸田大介(有限責任監査法人卜ーマツ) CDISC標準対応で SASプログラマーが抱える問題点と解決策 50 片山雅仁(イーピーエス株式会社) 小山車己 山本松雄 プラットフォーム アマゾンウエブサービス (AWS)による公共データの活用 目 63 吉荒祐一(アマゾンデータサービスジャパン株式会社) SASLovesBigDatav i aHadoop‑BigDataDrivenInnovation‑ 64 惟高裕一(塩野義製薬株式会社) 北西由武 都地昭夫 システム管理負荷を軽減させる、 SASBI運用に関する検討 77 青柳吉博(独立行政法人国立がん研究センター) SASを教える・ SASを始める 新しい SASの操作方法 SASE n t e r p r i s eGuideのご案内 古賀信二 (SASI n s t i t u t eJapan株式会社) 83

4.

言財布 基礎自治体の SNSを活用した情報発信の有効性の評価 I 95 有馬昌宏(兵庫県立大学) 最近の公的統計データの利用について 二次的利用の取組と統計のオープンデータの高度化を中心に 105 高部勲(総務省統計局統計調査部経済基本構造統計課) 大学と企業における統計教育と SAS 109 山之内直樹(第一三共株式会社) n s t i t u t eJapan株式会社) 阿部浩也 (SASI 堺伸也(イーピー工ス株式会社) 科学的マーケティング手法による大学マネジメント・サイクルの持続的発展 一山形大学 EM部の『学生を知り抜くJlRへの挑戦一 110 福島真司(国立大学法人山形大学) │ マーヶテルヲ告理 インターネット時代の医薬品営業に関する考察 I 117 武 藤 猛 (MarkeTechC o n s u l t i n g ) 126 マーケティングとデータ解析研究会報告 朝野照彦(中央大学) 藤居誠(株式会社東急エージェンシー) 田村玄(株式会社ビデオリサーチ) 中見真也(学習院大学) 松本和宏(株式会社富士通研究所) リスク管理 Dominationtheoryongeneralgraphsf o rr i s kmanagement I 147 中西美紗(統計数理研究所) 医薬品開発 生物学的同等性試験における例数設計:正確,近似と漸近 I 157 張方紅(グラクソ・スミスクライン株式会社) 安藤英一 イヌテレメトリー試験におけるデザインと統計解析法に閲するシミュレーション検討 橋本敏夫(田辺三菱製薬株式会社) 中西展大 河口裕 武内喜茂 173

5.

ModelbasedL ibraryに よ る LogicalCheck自動生成とチェック仕様書作成業務の効率化 184 三 木 悠 吾 (DOT インターナショナル株式会社) PMDAへの承認申請時 CDISC標準電子データ提出に向けた祉内標準のリモデリング 199 神谷亜香里(塩野義製薬株式会社) 坂井絵理 惟高裕一 北西由武 角谷伸一 小坂明子 ImplementingandleveragingCDISCwithSASnowandi nthef u t u r e一 一 一 一 213 B i l lJ .G i b s o n( S A SI n s t i t u t eI n c . ) │企画セッション│欠測のあるデータに対する各種解析手法と欠測メカニズムに対する感度分析 ( 1)セッションの概要と基本事項の整理 220 日本製薬工業協会 医薬品評価委員会 データサイエンス部会 タスクフオース 4 欠測のあるデータに対する解析方法論・ S ASプログラム検討チーム 土居正明(東レ株式会社) 藤原正和(塩野義製薬株式会社) 横山雄一(持田製薬株式会社) │企画セッション│欠測のあるデータに対する各種解析手法と欠測メカニズムに対する感度分析 ( 2 )解 析 手 法 の 解 説 1(SM.MMRM) 238 日本製薬工業協会 医薬品評価委員会 データサイエンス部会 タスクフォース 4 欠測のあるデータに対する解析芳法論・ S ASプログラム検討チーム 大江基貴(株式会社大塚製薬工場) 土居正明(東レ株式会社) 縄田成毅(杏林製薬株式会社) │:企画セッション 1欠 測 の あ る デ ー タ に 対 す る 各 種 解 析 手 法 と 欠 測 メ カ ニ ズ ム に 対 す る 感 度 分 析 ( 3 )解 析 手 法 の 解 説 2(MI, PMM, SPM) 一 254 日本製薬工業協会 医薬品評価委員会 データサイエンス部会 タスクフォース 4 欠測のあるデータに対する解析方法論・ S ASプログラム検討チーム 高橋文博(田辺三菱製薬株式会社) 藤原正和(塩野義製薬株式会社) 大浦智紀(臼本イーライリリ 株式会社) 横山雄一(持田製薬株式会社) │:企画セッション│欠測のあるデータに対する各種解析手法と欠測メカニズムに対する感度分析 ( 4 )欠 測 メ カ ニ ズ ム に 対 す る 感 度 分 析 274 日本製薬工業協会 医薬品評価委員会 データサイエンス部会 タスクフォース 4 欠測のあるデータに対する解析芳法論・ S ASプログラム検討チーム 駒寄弘(マルホ株式会社) 高橋文博(田辺三菱製薬株式会社) 横溝孝明(大正製薬株式会社) │:食画セッション│欠測のあるデータに対する各種解析手法と欠測メカニズムに対する感度分析 ( 5 )まとめと質疑応答 日本製薬工業協会 医薬品評価委員会 データサイエンス部会 タスクフォース 4 欠測のあるデータに対する解析方法論・ S ASプログラム検討チ ム 土居正明(東レ株式会社) 288

6.

欠測のあるデータに対する総合的な感度分析と主解析の選択 292 日本製薬工業協会医薬品評価委員会データサイエンス部会タスクフォス 4 欠測のあるデータに対する解析方法論・ SASプログラム検討チーム 土居正明(東レ株式会社) ODSGRAPHICSを用いた臨床試験データの可視化への挑戦 3 0 7 豊泉樹一郎(塩野義製薬株式会社) 財前政美 北西由武 都地昭夫 投与前値を含むクロスオーバー法による経時データの解析 324 高橋行雄 ( B i o S t a t研究所株式会社) │ C D I S Cセッション│医療・臨床研究分野における CDISC標準規格群への取り組み 338 大津洋 ( 1贋天堂大学大学院) 木内貴弘(東京大学) l C D I S Cセッシヨン ISASと Excelを用いた CDISCADaM標準における作業効率化の試み一‑341 高浪洋平(武田薬品工業株式会社) 1 C D I S Cセッション│大学における統計家育成のための CDISC教育の実践 3 5 2 佐野雅経(東京理科大学) ! C D I S Cセッシヨン!承認申請のための CDISC実装とメタデータ作成 356 浅見由美子(第一三共株式会社) 奥田恭行 T o n yChang(AmgenI n c . l │ C D I S Cセッション IPMDAにおける次世代審査・相談体制と CDISCの利用について一一一一一一 363 安藤友紀(独立行政法人医薬品医療機器総合機構) │CD 隠 Cセッション│社内標準策定での CDISC 利用 366 坂上拓(株式会社中外臨床研究センター) SASを用いた EMICMアルゴリズムによる MST推定の性能評価 3 7 2 中川雄貴(東京理科大学大学院) 若林将史 浜田知久馬 透明性実現のための製薬企業による臨床データ共有 角田亮 ( SASI n s t i t u t eJ a p a n株式会社) 382 生存時間解析におけるノンパラメトリック検定の多重比較に関する研究 3 9 7 島村文也(東京理科大学大学院) 抗がん剤の第 2相試験における被験者数変動を考慮した最適デザイン 豊泉滋之(ファイザー株式会社) 浜田知久馬(東京理科大学大学院) 398

7.

その他関連分野 S A S / I M Lによる医療経済評価(モデル分析) E 4 0 1 奥山ことば (MSD株式会社) 減らせ突然死 院外心肺停止のビッグデータから見えてくるもの 418 回久浩志(国土舘大学) 田中秀治 L 統計解析 東京都 23区の公立図書館の比較評価一続計と DEAの共生一 4 3 1 新村秀一(成践大学) L S ‑ M e a n s再考ー GLMと PLMによるモデル推定後のプロセス. 449 魚住龍史(京都大学大学院) SASによるニ項比率の差の非劣性検定の正確な方法について 464 武藤彬正(株式会社タクミインフォメーションテクノロジー) 宮島育哉 榊原伊織 線形モデルにおける C LASSステートメントの機能 474 吉田早織(日本化薬株式会社) 魚住龍史(京都大学大学院医学研究科) SASによるニ項比率における正確な信頼区聞の比較 488 原茂恵美子(株式会社タクミインフォメーションテクノロジー) 榊原伊織 武藤彬正 宮島育哉 オツズ比の信頼区間の構成法の比較 497 飯塚政人(東京理科大学大学院) 猪嶋恭平 浜田知久馬 ネットワークメタアナリシスによる無作為化比較試験の統合 510 福井伸行(株式会社データフォーシーズ) 乙黒俊也(日本たばこ産業株式会社) 磯崎充宏 FREQプロシジャによる割合の差の信頼区間 ‑V9.4における機能拡張と性能評価.一一一‑527 飯塚政人(東京理科大学大学院) 魚住龍史 浜田知久馬 MCMCプロシジャによる N o r m a l i z e dP o w e rP r i o rの実用的な実装 539 武田純(アステラス製薬株式会社) 多重補完法における P a t t e r n ‑ M i x t u r eモデルに基づく感度分析 伊藤陽一(北海道大学大学院) 西本尚樹(北i 毎道科学大学) 553

8.

隠れマルコフモデルによる予測モデルの構築 5 5 9 稲葉洋介(株式会社新日本科学) 宮岡悦夫(東京理科大学) I CL lF ETESTプロシジャを用いた区間打切りデータの解析と 既存プロシジャによる結果との比較 5 6 5 西本尚樹(北海道科学大学) (北海道大学大学院) 伊藤陽 傾向スコアを用いた共変量の調整におけるバイアスと標準誤差のふるまいについて一一一一 5 7 5 松井健作(東京理科大学大学院) 下川朝有 } I I崎 洋 平 宮岡悦良 ト 動画による統計表現 ~システム 新しい統計の要約 5 7 9 関根暁史(株式会社 ACRONET) 伝統芸能実演家の動的データベースの作成 5 9 3 坂部裕美子(公益財団法人統計情報研究開発センター) SASで CDISCSDTMデータを効率的に利用するために D e f i n e ‑ X M Lのメタデータを活用する 6 0 3 富永一宏(イーピーエス株式会社) ODSmarkupを使った ADaMd e f i n e ‑ x m l作成 6 1 5 坂上拓(株式会社中外臨床研究センター) 西本優美 矢嶋友也 PROCMIANALYZEを用いた、多重代入法による結果の統合 6 2 7 石田和也(株式会社タクミインフォメーションテクノロジー) 斎藤和宏 HadoopとSASとの連携 " " S A Sユーザーのための Hadoop分散処理フレームワークの活用方法 641 小林泉 ( S A SI n s t i t u t eJ a p a n株式会社) SASを用いたコピユラに従う擬似乱数の生成 6 4 3 矢田真城(株式会社 ACRONET) 浜田知久馬(東京理科大学大学院) 数独解答プロセスを E x c e l画面上にリアルタイムで可視化する SASプログラム 6 5 7 森岡裕(ナイフィックス株式会社) F u a dJ .F o t y( U . S .C e n s u sB u r e a u ) 知平菜美子(株式会社 NSD) 周防節雄(兵庫県立大学) L e t 'sm akeF o r e s tP l o tbySAS 堀田真一(ファイザー株式会社) 6 7 5

9.

l 医薬品開発、 SASシ ス テ ム SASハッシュオブ.ジエク卜を利用して医薬品開発に使用するプログラムを効率化する ‑683 ‑有害事象と併用薬、臨床検査値と途中変更のある施設基準値のマッチングから SASプログラムコードの分析まで 森岡裕(ナイフィックス株式会社) 神田悟志 S~ ユーザー会活動の紹介 投与前値を含むクロスオーバー法での経時データの解析 高橋行雄 ( B i o S t a t研究所株式会社) 目 699 融.忽斉ンシステム 715 与信モデル構築 小野潔(株式会社インテック) 松淳一徳 │ 基調講演 データ分析における「第三の変数」の功罪 目 729 岩崎学(成践大学) データサイエンスを活用したビジネス拡大の事例 748 倉橋一成 ( i A n a l y s i s合同会社) │ チュートリアル L O G I S T I Cプロシジャによる解析と最新の機能拡彊 781 浜田知久馬(東京理科大学大学院) 政府統計ミクロデータの符号表から S AS変数のラベルとフォーマットを 自動生成する S ASプログラムの作成方法 周防節雄(兵庫県立大学) 8 3 1

10.

l ~データ分析 E │参加カテコリー B I島根県観光キャラクターを応援する会 規定課題レボ卜 847 不健康支出の分析 自由課題レポ ト:同時方程式モデルを用いた健康 f 851 │参加カテコリー 8 │東京理科大学統計解析 規定課題レポート 865 自由課題レポート:ジニ係数による所得格差の解析 867 │参加カテゴリー c│芥川麻衣子 規定課題レポート 自由課題レポート:ミクロデータを用いたセルフメディケーションの実態把握に関する検討 873 876 │参加カテコリー c│クルーズ株式会社 規定課題レポート 883 r 自由課題レポート: ゲーム・インターネット好きの世帯は、どのような食生活をしているのか ??J 885 │奉加カテコリー cI KGあならいず 規定課題レポート 自由課題レポート:年代別の魚食傾向に関する考察一教育用疑似ミクロデータを用いてー │参加カテコリー c│ソニー銀行 891 893 総合リスク管理部 規定課題レポート 自由課題レポート:住宅ローン返済中における家計の逼迫と消費行動に関する分析 897 899

12.

鑑三』ム絡通比

13.

旬、政府・問点以当減量点一 9 W l J 生物多様性を探るために 統計解析からわかった トンボと生物多様性について 与\1r~ d 1J 宇久村三世 北海道札幌旭E高 等 学 校 生 物 部 │匡制府自吋持機務総ミム明 9 W l J 要旨: 5年間のトンボ相の解析から、トンボ棺の多様度指数の変動と、 正の相関、負の相関のある種を特定することがで、きた。和文標 題の論文名を言語解析したところ、トンボや生物多様性の研究 の必要性がわかった。 キーワード:生物多様性、ノシメトンボ、アジアイトトンボ 3 ‑ ー

14.

‑データの解析方法をマスターしたいと思ったから ‑自然の仕組みを知り、見た目にはわからない 生態系の仕組みを客観的に表したいから ‑生物多様性は重要 →大量のデータを集めて分析し、 研究を進めてし、く必要がある • r 勝ち虫 J → 児 や 万 の 鍔 に .豊作をもたらす→銅鐸に .ことわざ、童謡の題材に s ・不退転の決意を表す 日本人にとって身近な生物 ‑ 4 ‑

15.

旦璽堕璽讐盟盟盟盟盟理E 所有のデータ(トンボ相の定量調査の結果) ‑本校生物部が行ってきた、 2009‑2013年の トンボ相の定量調査の結果である • 5‑9月に月 3回(年 1 5回)の調査を 5年間行った ・石狩川下流域の沼や雨水調節池の 5地点、で、行った .それぞれの地点で造成後の経過年数が異なる →一度に十数年の変動がわかる • 5年間で、 28種 、1 3 . 5 8 4個体のトンボを採集した ‑ 5 ‑

16.

種数 日0 : : [ J.,L.へ¥、 ア 一 一 一 一 一 一 二 ぷ7 r 1 5 • ↑ O 2012~2013 一 ー一近 i 臥幽棉 l L 一一一一 L: 二二 主単正証 4 5 6 7 8 9 1 0 1 1 1 2 1 Vfff1 ::[十 If 国博数 6 ‑ ー ̲ I 三三 七 九 四 ; 2 6 29 3 0 J

17.

~~ノ!六、d'- 3 。一一 o 2 3 4 5 6 7 8 9 一一一一一一一一 一 10 1 1 12 13 14 15 16 1 7 18 1 9 2 u 2 1 22 : 2 3 24 25 缶 百 四 油 田 造成後の経過年数 ‑この結果は日本学生科学賞の中央審査会で発表 この変動の要因となっている種を探そう! !医積政府自治体、… X 皐 ' " ' 。 C∞ { l0 5 { l 1 0 O ! 5 Z O { l { I~5 。 0) 2つにグループ分け 1 0 司 F均壁 ‑ 7 ‑

18.
[beta]
│
医
療
一
体I
一一所長時十紬 ~9
所有のデータ(トンボ栢の定量調査の結果)

②自由度とt値から p値を種ごとに計算し、
全体の多様度指数との正の相関を調べた (p<O.05)
=。ノシメトンボ、オオルリボシヤンマ、
ク口イトトンボ、ナツアカネに絞った
X平均・LV町

‑守口ずトトンボ

.ナツアカネ f

e
i 06,

・オオル'1*!/ヤンマ
︑
ン
︒
も

バ
M

'''・

品

位

∞

Iぷ 約 ‑ 川 ド

│
医
療
、
政
府
・
自
治
体
、
大
学
に
よ
る
ヱ
コ
匁
弘
の
説
付
仔
綿
J

所有のデータ(トンボ相の定量調査の結果)

③全体の多様度指数との負の相関を調べた

(p>O.2)(r<O)
コアジアイ卜トンボ、ルリイトトンボ、
セスジイトトンボ、アキアカネに絞った
X 寧n・Y~Cν

‑セ疋ナノイトトJ ポ

加ぞ沸イゐ上ンポ

ι

(
)
‑ .・・
ルリイトトノボ・ .

7キアカ#・

"
000

o
o
s

0:0

‑
8
‑

. . ..

~[1

19.

所有のデータ(トンボ相の定量調査の結果) ④アジアイトトンボ、ルリイトトンボ、アキアカネと、 全体の多様度指数との相関係数 r を調べた 当アジアイトトンボが最小(ー0 . 3 7 5 ) ⑤アジアイトトンボ、ルリイトトンボ、アキアカネと、 ノシメトンボとの相関係数 r を調べた =今アジアイトトンボが最小(ー0 . 6 6 3 ) 闇..アジアイトトンボが最も関係がある 所有のデータ(トンボ相の定量調査の結果) く解析結果> 散布図の右下のグループ vが小さい →多様度指数の平均が高い・ c =今高い値で小さく変動している .ノシメトンボ→相聞が最大 ・アジアイトトンボ→相闘が最小 コ全体の変動に大きく関係している ノシメトンボ&アジアイトトンボ の採集で全体の多様性変動がわかる? ‑ 9 ‑ 1 4

20.

所有のデータ(トンボ相の定量調査の結果) く解析結果から〉 ノシメトンボやアジアイトトンボや生物多様性 0年間で、 についての研究は、この約4 何について、どれくらい行われているのかを知る ため、 JSTの論文データをJMPで解析した 1 1 1 峨ト…哨 ~9 [鴎政府聞大学による JST の論文データ│ く解析方法( J M P ) > ①和文表題の論文からトンボ関係の論文のみを抽出 ②抽出した論文数が全体の何%を占めるのか調べた ③奈良先端科学技術大学院大学(松本研究室)の 『茶釜』で、抽出した論文タイトルを単語に分害J I 16 1 0・ ー

21.

│臨即時一一る工コシステム保証… JST の論文データ│ く解析方法( J M P ) > ④トンボについての研究の経年変化や、 論文名を単語に分割した結果から、 トンボの研究で多いテーマを調べた ⑤「生物多様性 J rノシメトンボ,アカネj 『アジアイトトンボ」が題に使用されている論文の 発行年を結合し、経年変化を見た 1 1 JST の論文データ く解析結果〉 .. . 2 5 7本 → 約 0.008% ②「生物多様性 J トンボ研究の論文数・・・ 1 7 2本 → 約 0.005% 「ノシメトンボ,アカネ J. ・ .1 0本 → 約 0.0003% 「アジアイトトンボ J . .. 8本 → 約 0.0002% 極最孟語忌量制主面!こない!I 18 ‑ 1 1 ‑

22.

JSTの論文データ ④トンボの研究は、 2000年から急激に増えている 1 9 JSTの論文データ 1997年 京 都 議 定 書 締 結 2 0 ‑ 1 2 ‑

23.

JSTの論文データ ④トンボの研究では、幼虫(ヤゴ)に関することが多い Y :トンボ研究のキーワード 目 LIn‑‑持母鉱 FSMマヘム 21 JST の論文データ ④幼虫の研究では、『科」を調べているものが多い Lin‑持邑材需﹁伊雲‑ 2 2 ‑ 1 3 ‑

24.

JSTの論文データ ⑤「生物多 生物多様性が注目されてきて、研究も増えているお JSTの論文データ ⑤「生物多様性J の研究では、遺伝子組換えに関す Y : f ! 生絹多様位I 語文@キーワード 4 I ヤ J ことが多い 自 24 ‑ 1 4・

25.

JSTの論文データ ⑤「ノシメトンボ,アカネ Jr アジアイトトンボjが タイトルに使用された件数の経年変化 ノシメトンボとアジアイトトンボの研究は、 まだまだ少ない 25 JSTの論文データ ⑤『ノシメトンボ,アカネ」の研究では、 「トンボ目トンボ科アカネ類 J の分類でのものが多い 2 6 ‑ 1 5 ‑

26.

JSTの論文データ ⑤「アジアイトトンボ」の研究では、 交尾産卵に 2 7 • 5年間のトンボ相の定量調査 →ノシメトンボとアジアイトトンボが 多様性変動に大きく関係している • JST タイプBのデータ →生物多様性やトンボの研究は増えてきている →最近になって注目されてきている →ノシメトンボやアジアイトトンボの研究は少ない 28 ー 1 6 ‑

27.

• JSTタイプBのデータ →トンボの研究・・圃科ごとにヤゴ、 →生物多様性・・・遺伝子組換え →ノシメトンボ・・・トンボ目トンボ科アカネ類 →アジアイ卜トンボ・・・交尾産卵 29 ‑生物多様性は重要であり、ノシメトンボと アジアイトトンボは多様性と大きく関わっている ‑今後はノシメトンボやアジアイトトンボの種と しての特性や、生物多様性の研究を増やしていく べきである 30 ‑ 1 7‑

28.

参考 ・田久浩志ほか 2006.JMPによる統計解析入門第2版 『茶釜 J :奈良先端科学技術大学院大学 情報科学研究科自然言語処理学講座(松本研究室) 謝辞 統計解析やJMPの使用方法などを教えていただいた 北海道大学地球環境科学研究院の片平浩孝先生、 的確なアド Jミイスを下さった顧問の綿路先生、 トンボの調査に協力していただいた方々に、 改めてお礼申し上げます 3 1 ‑ 1 8・

29.

医樟政府開大学問一九の実証…ー蝕 W J 9 政府におけるオーフンデータの取組について 鈴木一広 内閣官房/情報通信技術(I T)総合戦略室/参事官 医痕、政府・自治体均一員欝欝誌弘一 加9 要旨: 我が国のオープンデータの取組は、平成 24年 7月に I T戦略本部で「電 子行政オープンデータ戦略」が決定されてから、具体的に進められて きました。 このオープンデータの取組について、平成26 年 6月に改定された「世 界最先端 I T国家創造宣言」等の基本方針の概要を説明するとともに、 公開データの利用ルール(政府標準利用規約)の整備と府省横断的な データ検索システム(データカタログサイト)に関する最近の具体的取 組を説明します。また、今後の展望と課題についても説明します。 ‑ 1 9 ‑

30.

トよー;んこ o とテ証一WJ] JST 情報資産のオープン化について 佐藤正樹 独立行政法人科学技術振興機構 (JST)/ 情報企画部海外・連携推進グループ/調査役 l医 療 政 府 間 大 学 問 問 時 事a I i SAS:l-"-.~ 2 0 1 9 要旨: JST の情報事業は昭和 3 2年 ( 1 9 5 7年)!こJ I C S Tとして発足して以来、 5 0数年にわたって 圏内外の科学技術文献(論文、学術雑誌記事、国や地方公共団体の研究報告書、企業 技報など)を収集、整理・体系化してきました。 具体的には、圏内資料 1 2, 0 0 0誌、海外資料4, 7 0 0 誌をもとに現在約 3 , 0 0 0万論文の書 誌情報を蓄積している他、 3 0 0万件以上の化学物質の情報や 1 0 0万語以上の科学技 術・特許用語の体系等を整備しています。 作成したJ ST 科学技術データは、これまで主に文献の書誌・抄録データベースから供さ れ、先行技術調査をはじめとする検索のために広〈使用されてきましたが、昨今は意思 決定を支援するための分析や言語処理的な研究などに利用したいというニーズに応え るため、バルクデータ ( C S V , JSON)やWeb経由 ( R D F )による提供体制も整備していま す 。 昨年度は、今般のデータオープン化の流れを受け、分析に資するJ ST データの提供を加 速するための足がかりとして、 SAS 社と共催で統計・分析コンテスト「データサイエンス・ アドベンチャー杯 (h枇p : l l w w w . s a s c o m . j p / A A C / )Jを開催しました。このコンテストを行っ たことでJ ST 科学技術データに対するニーズが把握できたことから、まずは研究用途で のデータオープン化を推進することになりました。 ST の保有する科学技術データの説明を行うとともに、データ活用の事例 本発表では、 J 紹介を交えたJ ST 情報事業のデータオープン化の取組みについてお話しします。 2 0 ‑ ー

31.

L e t ' s 匿名データ分析:パック旅行費支出と世帯情報の関連の検討 0魚 住 龍 史 京都大学大学院医学研究科医学統計生物情報学 L e t ' sa n a l y z eanonymousd a t a :i n v e s t i g a t i o nf o rt h er e l a t i o n s h i pbetweent r a v e lf e e sandh o u s e h o l dc h a r a c t e r i s t i c s R y u j iUozumi Departmentof B i o m e d i c a /S t a t i s t i c sandB i o i n f o r m a t i c s , KyotoU n i v e r s i t yGraduateS c h o o /ofM e d i c i n e 要旨 旅行・観光市場は世界的にみて成長性の高い産業であり,波及効果の裾野の広い産業である.特に,各旅 行会社は高齢者向けのサービスを多く提供している.魚住 ( 2 0日)の報告によると,全国消費実態調査の個票 データから作成された,擬似ミクロデータを用いたデータ分析の結果,パック旅行費支出額は年齢とともに 増加し,特に 2人世帯において支出額が高いことが示唆された.本稿では,擬似ミクロデータよりも多くの 情報が含まれた匿名データを用いて,パック旅行費支出と世帯情報の関連を検討したデータ分析結果を報告 する. キーワード:匿名データ,データ分析,パック旅行費,圏内旅行費,外国旅行費, 1 0大費目,教養娯楽, 世帯情報,集計用乗率 1 はじめに 旅行・観光市場は世界的にみて成長性の高い産業であり,波及効果の裾野の広い産業である.観光庁にお いて,旅行・観光産業の経済効果に関する調査研究が定期的に実施されている.この調査は,日本の旅行・ 観光における消費実態を明らかにし,旅行・観光施策の基礎資料のために活用することを目的として実施され ている. 2 0 1 2年の調査によると,圏内旅行消費は 2 2 . 5兆円であり,世界的に見ても上位の国として位置づけ 6 . 7兆円といわれており, られる.さらに,圏内旅行消費が日本経済へ及ぼす影響としても,生産波及効果は 4 9 9万人であると報告されている [1] 雇用創出効果は 3 SASユーザー総会では, 2 0 1 3年より Le t 'sデータ分析コンテストが行われている.このコンテストは規定 課題と自由課題に取り組むことが課せられている.魚住 ( 2 0 1 3 )による報告では,平成 1 6年全国消費実態調 査の個票データに基づいて作成された擬似ミクロデータを用いて,パック旅行費支出と世帯情報の関連の検 討が行われた [2‑4]結果,パック旅行費は年齢とともに増加し, 2人世帯ほどパック旅行費への支出額が高 いことが示された.しかし,擬似ミクロデータでは,パック旅行費が国内旅行と外国旅行のどちらのデータ であるか判別できず,さらなる検討はできなかった. 21・ ー

32.

本稿では,平成 1 6年全国消費実態調査の匿名データを用いて,パック旅行費支出と世帯情報の関連を検討 することを目的とする.また,その他の家計簿における収入・支出データを用いて,パック旅行費との関連 を検討する.なお,本稿で用いる匿名データは,独立行政法人統計センターによって作成され,一般の利用 に供することを目的として調査票情報を特定の個人または法人その他の団体の識別(他の情報との照合によ る識別を含む)ができないように加工されている [5] データとしては, 1780変数格納された CSV形式のフ 936行 , 2人以上の世帯は 43, 8 6 1行のデータとなる.なお, 8人以上の世帯はデ ァイルであり,単身世帯は 3, ータから削除されている.さらに,本データには集計用乗率が含まれており,家計収支編に使われた乗率を 7 3, 232件 , 2人以 リサンプリングの抽出率で調整したものである.集計用乗率を重みとすると,単身世帯で 8 797件のデータとなる.なお,リサンプリングは単身世帯と 2人以上の世帯それぞれにおい 上の世帯で 335, て,地域ごとに調査報告書に掲載されている結果表のうち,家計収支編等に使われた基本的な集計時に用い た集計用乗率の大きさに基づいて層化した上で,各層において抽出率が約 8割となるように集計用乗率によ る確率比例抽出を行っている.本データを SASにインポートした上で,検討を行う. 2 パック旅行費支出と世帯情報の関連の検討 本稿では,パック旅行費に焦点を当てる.匿名データにおいて,パック旅行費は消費支出における大分類 ,中分類「教養娯楽サーピス Jに含まれる変数である. 「教養娯楽 J 本稿で用いる要約指標としては,集計用乗率で重み付けした平均値を用いる.まず,匿名データにおいて, パック旅行費に影響を及ぼす可能性のある世帯情報として,年齢カテゴリ,世帯人員,企業区分,企業規模, 産業カテゴリ,職業カテゴリが挙げられる.これらを説明変数として, GLMSELECTプロシジャにより変数 ‑ 1のような右 選択を行った.なお,パック旅行費は,支出していない世帯については 0となり,結果,図 1 にスソを引し、た分布となる.そこで,図 1 ‑ 2のような対数変換後のパック旅行費を目的変数として用いた. a y e s i a ni n f o r m a t i o nC r i t e r i a に基づき実施した.結果,年齢カテ 変数選択は STEPWISE法を採用し, SchwarzB ゴリ,世帯人員,企業規模が選択された.以下,これらの要因がパック旅行費にどのように影響を及ぼすか 検討する.なお,年齢カテゴリは 25歳未満, 7 5歳以上のカテゴリ化, 2 5歳以上 7 5歳未満については 5歳刻 2カテゴリの変数である. みでカテゴリ化した,計 1 443オ なお,本検討では,勤労世帯のみを抽出し,単身世帯及び 2人以上 7人以下の世帯の匿名データ 27, 1 ili‑‑ 2e ' 'a ‑ ‑ 2 プザベーションを対象とした. 曲 制 . . 回 1 . 脈 " 。 劉 1 O O 噸3 • 筑lOOOO・QO(泊。 1 0 10&(パヲタ.符.) パック線符. 図1 ‑ 1:パック旅行費の分布(円) " 図1 ‑ 2:対数変換後のパック旅行費の分布 幽 22・

33.

2 . 1 年齢による影響 各年齢における 1 0大費目の支出割合を図 2・ 1 ,各年齢におけるパック旅行費の支出額(円)を図 2・ 2,各年 齢における教養娯楽の支出割合を図 2 ‑ 3に示す.図 2 ‑ 2における支出額は集計用乗率による重み付き平均を示 ‑‑m している.なお,図 2・ 1と図 2 ‑ 3は GCHARTプロシジャ,図 2・ 2は SGPLOTプロシジャを用いて作成した. 品 4 1 9 8 3 9 9 62 1 4 2 7 4 3 2 2 1 8 0 W ⁝園川 怖 い ‑闇臨園川 淵 EEE輯 m ‑ m E園盟問 園川園盟問 ‑ 盟 問 置臨問 目 自 醐 ‑ A g e : < 25 25<= 30<= 35<= 40<= 45<= 50<= 55<= 60<= 65<= 70<= 75<= <30 <35 <40 <45 <50 <55 <60 <65 <70 <75 園 田E 盤‑ 消費支出肉訳 光拠・水道 空通・通信 ・ ・ ・圃 章典・軍事用品 教育 図2 ‑ 1:各年齢における 1 0大費目の支出割合 図2 ‑ 1は,下から食料,住居,光熱・水道、家具・家事用品,被服及び履物,保健医療,交通・通信,教 育,教養娯楽,その他の消費支出の順に積まれたグラフである. 図2 ‑ 1より,例えば,消費支出に占める住居の割合に注目すると, 7 5歳以上のカテゴリを除いて,年齢と ともに支出は減少している.また,消費支出に占める交通・通信の割合においても,年齢とともに支出は減 少している.しかし,今回焦点を当てるパック旅行費が含まれている教養娯楽に着目すると,年齢が変化し でも支出は横ばいとなっている.そこで,各年齢におけるパック旅行費の支出額のグラフとして,図 2・ 2を 見て検討する. 図2 ‑ 2より,パック旅行費は年齢とともに増加していることが分かる.特に,年齢が 5 5歳以上のグループ において,パック旅行費は顕著に高くなっている.さらに,図 2 ‑ 3において,各年齢における教養娯楽に占 めるパック旅行費の支出割合を見ても,年齢とともにパック旅行費支出割合は高くなっていることが分かる. ここで,図 2 ‑ 1において,消費支出に占める教育の割合が低い年齢では,図 2 ‑ 2及び図 2 ‑ 3におけるパック 旅行費の支出額及び支出割合が高くなっていることが分かる.本データにおいて, 1 0大費目の lつである教 育費には教科書・学習参考教材,補習教育,授業料等が含まれている.すなわち,子供の授業料,教科書・ 学習参考教材,補習教育による教育費への支出が多い年齢の世帯においては,パック旅行費に支出できる割 合が低くなってしまうと考えられる. ‑ 2 3 ‑

34.

N~ 8 0 7 4 3 田<,え<7 0 N‑221: 0 < = , <75 1 7 5 < = 4 7 1 1 5 3 62 8 2 83 5 3 1 3 7 6 43 9 3 3 引9 . 8 39 現 : 62 1 4 2 7 4 3 2 2 1 物 2観綿 ぬ れ に ‑ γ r 。 冊 6 . , ・ 汚3 A g e : <25 .25申 30<.一分平 -40<~ 45申 5O<~ 55ぐ~60<扇 65申 70<= 7 5 申 <30 < 3 5 <40 <45 <50 <55 <6 0 <65 <70 <7S 8000 附 畑制{敏酬眠時詰醤 図2 ‑ 2:各年齢におけるパック旅行費支出額(円) ZM 復帰惣 図2 ‑ 3:各年齢における教養娯楽の支出割合 ‑ 4に示した. な さらに,各年齢におけるパック旅行費の支出額を,国内旅行費,外国旅行費に分けて図 2 ‑ 4は SGPANELプロシジャを用いて作成した. お,図 2 N= 471 1 5 3 6 2828 3 5 3 1 3764 3 9 3 3 4198 3996 2142 7 4 3 2 2 1 80 。 ∞o ∞o 1 2 ←了 3000 4000 5000 0 ∞ ∞ 1 o 2 o 3000 4000 5000 円 図2 ‑ 4:各年齢における(国内/外国)パック旅行費支出額(円) 図2 ‑ 4より,パック旅行費の支出が多い年齢が 55歳以上のグループは,主に園内パック旅行として利用し ていることが分かる.一方,外国パック旅行への支出は,国内パック旅行費に比べて,そこまで多くないこ とが分かる. 2.2 世帯人員による影響 各世帯人員における 1 0大費目の支出割合を図 3 ‑ 1,各世帯人員におけるパック旅行費の支出額を因子2,各 ‑ 3に示す. 世帯人員における教養娯楽の支出割合を図 3 ‑ 2 4 ‑

35.

N= 1 8 3 6 5 9 6 8 6854 986 307 6 7 園 陸 消費支出肉叡 醤 4 3 2 世帯人員 5 2 3富その他の鰭聾= 錯:童福 被 服 揺 = 章 典 ・ 脚 産 量 因 子 1:各世帯人員における 1 0大費目の支出割合 図3 ・ 1より,パック旅行費が含まれている教養娯楽について,単身世帯では支出割合が若干高いが, 2人以 上の世帯においては世帯人員数依らず支出割合は横 l 乱、となっている.しかし,教育に注目すると,特に 4 人以上の世帯においては,消費支出に占める教育の割合が高くなっている.この背景として,世帯人数が多 いことによって,子供がいる世帯であることが考えられる.その結果,子供の授業料,教科書・学習参考教 材,補習教育による教育費の占める割合が高くなったと考えられる. N‑ 3 岨︿権割 ・ 5 輔 副Z 闘醐肉眼醤 因子2 :各世帯人員におけるパック旅行費支出額(円) ‑ 2 5・ 榔 = 叫. . ~~型 因 子3: 各世帯人員における教養娯楽の支出割合

36.

次に,図 3 ・ 2及び図 3 ・ 3より,特に 2人世帯において,パック旅行費の支出額及び教養娯楽に占めるパック 旅行費の支出割合は高くなっていることが分かる.ここで,図 3 ‑ 1において,単身世帯及び 2人世帯で 1 0大 費目に占める教育の割合が低いことが分かる.消費支出に占める教育の割合の低い 2人世帯においては, そ の分パック旅行費に支出できる割合が高くなったと考えられる. 上述のように,子供の教育への支出がパック旅行費支出に影響しているか検討するために,さらなるデー タ分析として,子供と同居している世帯(生計が同一であることを意味する),同居していない世帯別のパッ ク旅行費支出額を図 3 ‑ 4,子供と同居している世帯,同居していない世帯別の教養娯楽の支出割合を図 3・5に 示す. hN {lES剖}臨EU吋務仲 E‑‑ N‑1 9 1 8 3 子供と同膳 (生計同一} 円 ~. ~. (N21:1回 糟拙【醐鍋護団叡穏 因子4 : 各世帯特徴におけるパック旅行費支出額(円) 3 期 Emd 達制堅 図3 ‑ 5:各世帯特徴における教養娯楽の支出割合 図3 ‑ 4より,パック旅行費支出額は子供と同居している世帯の方が少ないことが分かる.また,図 3 ‑ 5より, 教養娯楽に占めるパック旅行費の割合は,子供と同居している世帯の方が低いことが分かる. v . . 事 uFm 咽f 剖 4岬 . . 私立に通う子供 Y回 No (N=4343) (N=7942) ー 浦償支出債餐棟集〉肉.. . 蝿 因子 6: 各世帯特徴におけるパック旅行費支出額(円) 醐 富 山. 6 砕綾 図み 7 :各世幣特徴における教養娯楽の支出割合 図3 ‑ 4及び図 3・5より,子供との同居の有無がパック旅行費支出に影響を与えることが分かつた.さらに, 子供の通学先の学校形態を検討する.本匿名データでは,子供が私立あるいは国公立のどちらの形態の学校 ‑ 2 6 ‑

37.

に通学しているかという情報が含まれている.そこで,学費がより多くかかることが予想される,私立へ通 う子供の有無別のパック旅行費支出額を図 3・ 6,私立へ通う子供の有無別の教養娯楽の支出割合を図 3 ‑ 7に示 す.なお,私立へ通う子供 "No" は,国公立へ通う子供の Y e s " を意味している. 図3 ‑ 6より,私立へ通う子供がいる世帯の方が,パック旅行費支出額が高いことが分かる.これは,私立 へ通う子供がし、る世帯の方が,国公立へ通う子供がいる世帯に比べて,経済的に余裕のあることが背景とし て考えられる.次に,図 3 ‑ 7より,私立へ通う子供がいる世帯といない世帯で,教養娯楽の支出割合は同程 度であることが分かる.以上より,私立へ通う子供がし、る世帯の方が, 国公立へ通う子供がし、る世帯に比べ て経済的に余裕があり,パック旅行費に限らず,消費支出自体が多いことが分かる 2 . 3 2人世帯に対する検討 2 . 2 において, 2人世帯のパック旅行費支出額が高いことが分かつた. そこで, さらなる検討として, 2人 世帯を対象として, 2 . 1 で検討した,年齢による影響についてデータ分析する. ‑ ‑ E E m m‑‑‑ 0大費目の支出割合を図 4 ‑ 1,各年齢におけるパック旅行 まず, 2人世帯を対象とした,各年齢における 1 費の支出額を図 4 ‑ 2,各年齢における教養娯楽の支出割合を図 4 ‑ 3に示す. 品 N = 57 347 的 5 2 嶋田盟問 朝国圃川 田山田掴叫 田川園田川 一一開園田暫 剛川田翻欄叩 棚田醒 ω 嶋田関関 酬川園鶴腿醐吋 圃明・闇臨時一 ‑ 847 1 3 2 5 9 9 1 414. 130 叩 圃 園 田 剛 一 一 目 373 452 A g e : <25 25<= 30<= 35<= 40< 45<= 50<= 55<= 60<= 65<= 70<= 75<= <30 <35 <40 <45 <50 <55 <60 <65 <70 <75 二三 .圃瞳 宣料 被服且び履物 教聾娯集 富 電置盤墨 軍置罷盈 田町田 消費支出向駅 錯:措置 章典・軍事器 図4・ 1:各年齢における 1 0大費目の支出割合 図4 ‑ 1は,図 2 ‑ 1 と比べて, 1 0大費呂に占める教育の割合が極めて低くなっていることが分かる.また, その他の消費支出の割合が高くなっている.ここで,本データのその他の消費支出としては,諸雑費(理美 容サービス,理美容用品,身の回り用品,たばこ,小遣い(使途不明)),交際費(食料,家具・家事用品,被 服及び履物,教養娯楽,他の物品サービス,贈与金),仕送り金等が含まれる.これは,パック旅行費と同じ ように, 比較的経済的に余裕のある世帯において,支出が多くなる項目であると考えられる.よって, ‑27‑ 2人

38.

世帯を対象にした図 4・lにおいて,消費支出に占める教育の割合の低い世帯では, その他消費支出に支出で きる割合が高くなったと考えられる. < 2 5 戸 一 一 ・ ・圃‑ 山 一 一 一 一 一 一 一 一 一 一 … … 令 冊 一 一 時 一 一 一 ー 一 ー 一 一 一1 2 6 .. A 5 4 . ̲ .. . 3 . 7 3 . . . . . 4 5 2 .. ̲ ̲ J ! 4 L ̲ ̲ 1 3 2 S .̲ 9 91 .̲ ̲ 4 1 4 1 3 0 5 2 3 4 7 5 N= . 5 7 2 5 < : 客: . < 3 0 3 0 < 句 、 < . , 器事制。 柑 相 制5 2 民家・佃 5 0 < = .(55 5 5 < = .(即 ・ 0 < = . < 6 5 N=414 6 5 ( : 弓〈商 箇 献 機騒騒盤機機 = . < 7 5震 N 52I 週欝噌鶴 a ・昭島 1 5 < : 貫 。 犠 舗 趨 ~ 2 1 l O O 。 " 紙 . 0 0 0 4000 円 盤 川山ぉ~ 間働 Io尚一山 ' i i ' 面京民 ,団関 否認 i : l i 民 A a e : <25 25申 3 0<= 35<= 40<= 45<= 50<= 5 5 申副)<= 6 5 申 7 0<= 7 S 中 < 3 0 < 35 <40 <45 <50 <55 <曲 <65 <70 <75 1 0 0 0 0 輔副噛輔副晴置 :各年齢におけるパック旅行費支出額(円) 図4・2 鵬 Em.6 画問要 図 4・3:各年齢における教養娯楽の支出割合 図 4・2及び図 4・3では,単身世帯から 7人世帯までを対象とした図 2・2と異なり,年齢とともにパック旅行 費支出額は単調に増加しておらず, 30歳代の世帯においても支出額が比較的高い, 2峰性の分布となってい 0歳以上の世帯においては,図 2 ‑ 2と比べて,パック旅行費支出額が高くなって ることが分かる.さらに, 6 いる.図 2・2及び図 2・3においては,年齢が高くなるほどパック旅行費支出額は高くなることが示唆された. しかし, 2人世帯を対象とした検討を行った結果,年齢が高いだけがパック旅行費支出に寄与していないこ とが考察された. U噌議時 Al医者制︼臨E 加陥 お側四 例制 E 血相 m‑‑ ‑R 繍 図4 ‑ 4:各世帯特徴におけるパック旅行費支出額(円) 霊 円 ︐ .幽 6000 曙寸帽 aJ向 4000 齢制計 一…一一一一‑ 干催 2 0 0 0 No (N=5 2 8 5 ) 獄自国伽制品協E 2 聖 図 4・5:各世帯特徴における教養娯楽の支出割合 また,図 3 ‑ 4及び図 4・4より,子供と同居している世帯のうち, 2人世帯である割合は 683/19183= 3.6%で あることが分かる. ‑ 2 8 ‑

39.

以上より, 2人世帯では子供と同居している世帯が少ないことによって,教育費に支出する割合が低くな り,その結果,パック旅行費支出額が全体的に高いことが分かつた. さらに, 2人世帯を対象として,各年齢におけるパック旅行費の支出額を国内旅行費,外国旅行費に分け ‑ 6に示した. て図 4 Nニ 25<~ , < 2 5 57 < 3 0 347 526 30<~,く 35 < 4 0 454 4 0 < ,エ <45 3 7 3 4 5 < 三 < 5 0 452 35<~, 〈 ω~ 847 55<~, < 6 0 1 3 2 5 60<~, < 6 5 9 9 1 65<~, < 7 0 414 7 0 < " く ,75 1 3 0 7 5く = 52 。 ∞ 2 0 2 0 0 0 4 0 0 0 6 0 0 0 円 図4 ‑ 6:各年齢における(国内/外国)パック旅行費支出額(円) ‑ 6より,単身世帯から 7人世帯を対象として検討した図 2 ‑ 4と同様に,パック旅行費の支出が多い年齢 図4 が5 5歳以上のグループは,主に国内パック旅行として利用していることが分かる.一方,外国パック旅行費 ‑ 4とは異なる分布が得られて については,どの年齢増においてもそこまで大きな違いが見られなかった図 2 いる, 70歳以上及び 25歳から 45歳までの年齢において,外国パック旅行費支出額が高い傾向にあることが 分かる.特に, 25歳から 3 5歳までの年齢において,外国パック旅行費支出額が高い要因として,婚姻件数 の割合が高い年齢であることが挙げられる [ 6 ] その結果,大多数の新婚夫婦が新婚旅行として,外国パック 旅行を使うことが多い年代であると考えられる. 2 . 3 企業規模による影響 各企業規模における 1 0大費目の支出割合を図 5 ‑ 1,各企業規模におけるパック旅行費の支出額を図 5 ‑ 2,各 ‑ 3に示す. 企業規模における教養娯楽の支出割合を図 5 図5 ‑ 1より,企業規模によって,パック旅行費が含まれている教養娯楽の支出割合が大きく異なることは ‑ 3 ないことが分かる.また,他の大費目についても,企業規模によって異なる項目はなかった.さらに,図 5 においても,企業規模によって,教養娯楽に占めるパック旅行費支出割合が異なることはなかった. ‑29‑

40.
[beta]
N= ー
,̲
̲
̲
̲
1
2
9
1
一一一一一一4
9
.
生之一一一一一..8
4
4
1一一 叩
一1
7
Q
9
̲
̲
̲
̲
̲
̲̲̲̲527
3
…

企業規模

5
<
=,
<
=
2
9 3
0<=,<=4
9
9 500<=,<=999

1
<
=
,<=4

1
0
0
0<=

‑田

富
田

回幽園

駅

豊富:童書星

軍且・軍事用品
轍育

図 5・1:各企業規模における 1
0大費目の支出割合

N

1
<
=
.<=4

幽

5
<
=
.申 :
2
9

5

馳〈叫.

制

5
0
0
<
=
.<=99
9

1
0
0
0
<
=

企議健制医

1
0
0
0

2
縦
訓
。

3000

・ 5

1
<
=
.
<
'4

2
9

‑
0
‑
, <
>
・
,

拘""".'"叫9
9

5
叫)<烹.‑開

4000
刷拙回融}糟醤

図5
・2
:各企業規模におけるパック旅行費支出額(円)

書
鎚

1
似泌<‑

s.
備品摺要

図5
‑
3:各職業における教養娯楽の支出割合

図5
‑
2より,企業規模が大きくなるほどパック旅行費支出額は若干高くなっていることが分かる.これは,

企業規模が小さい企業においては,パック旅行中の仕事の代理ができない等のことが起因していると考えら
れる.

‑
3
0・

41.

3 まとめ 本稿では,パック旅行費に影響を与える世帯の特徴を表す要因として,年齢カテゴリ,世帯人員,企業規 模がどのように影響を与えるか検討を行った.結果,パック旅行費支出は年齢とともに増加し, 2人世帯ほ どパック旅行費への支出額が高いことが分かつた. 2人世帯においてパック旅行費の支出額が高い要因とし て,子供の教育費に占める支出割合が低い世帯であることが考えられ,結果,パック旅行費へ割り当てるこ とのできる支出割合が高くなったと考えられる.同様の議論より,子供と別居している世帯ほどパック旅行 費の支出額が高い傾向にあることが分かった.また,子供がし、る世帯においては,私立に通う子供を持つ世 帯の方が,国公立へ通う子供を持つ世帯に比べて,パック旅行費の支出額が高い傾向にあった.さらに,パ ック旅行費の区分として,国内パック旅行と外国パック旅行に分けて検討を行った結果,全体的に年齢が高 い世帯において支出額が高い傾向にあった.しかし, 2人世帯を対象とした検討の結果,外国パック旅行に ついては, 2 5歳から 45歳の年齢においても支出額が高いことが分かり,その要因として,婚姻に伴う外国 への新婚旅行が考えられる.なお, 2人世帯を対象としたパック旅行費支出額の分布は 2峰性を示し,外国 パック旅行費支出の多い 25歳から 45歳の年齢層による影響が強いことが示唆された.ここで,年齢が高い 世帯ほどパック旅行費の支出が多い想定の下,高齢者でも安心して旅行ができるバリアフリー特集,高齢者 を対象とした人に優しい宿, 60歳からの旅行応援特集など,各旅行会社及び各団体は多くの高齢者向けのサ 0 ービスを提供している状況である [7‑1 1 . 今後は,世帯において子供と同居しているかどうか調査した上で, 子供と同居していない世帯や,子供のいない 2人世帯をターゲットとしたプロモーションも,国内・外国旅 行をより活性化させることにつながると期待される. 参考文献 川観光庁.旅行・観光産業の経済効果に関する調査研究 ( 2 0 1 2年版). h段。 : / / w w w . m l i t . l ! : o . i o / c o m m o n l 0 0 1 0 4 0 5 2 4 . o d f .2 0 1 4 / 0 6 / 2 1アクセス. [ 2 ]魚住龍史.ミクロデータ分析コンテスト:規定課題.SASユーザー総会論文集 20日 ,5 0 7 ‑ 5 1 0 . [ 3 ]魚住龍史.擬似ミクロデータによる圏内旅行費支出と世帯情報の関連の検討.SASユーザー総会論文集 2 0 1 3, 5 1 1 ‑ 5 1 4 . [ 4 ]魚住龍史.SASによる擬似ミクロデータを用いたパック旅行費支出と世帯情報の関連の検討.公的ミクロ データの利用に関する研究集会 2 0 1 3 . [ 5 ]独立行政法人統計センター.匿名データ利用の手引(学術研究・高等教育目的関係)2013年最終改正. 仏 l ! : o . i o / s e r v i c e s / 2 i i / t o k u m e it e b i k i . o d f .2 0 1 4 / 0 6 / 2 1アクセス. h 伽 : / , 加w w . n s t a [ 6 ]厚生労働省.平成 22年人口動態統計月報年計(概数)の概況. 抗o : / / w w w . m b l w .l ! : o . i o / t o u k e i l s a i k in/hw / i i n k o u l l ! : 活o o o / n e n四 i 1 0 / k e k k a 0 4 . h t m . 12 0 1 4 / 0 6 / 2 1アクセス. h [ 7 ]H .I .S .60歳からの旅行を応援します. h t t o : / / w w w . h i s ‑i.∞m! t v o / s 四 i o r 1 , . 2 0 1 4 / 0 6 / 2 1アクセス. [ 8 ]JTB. バリアフリー特集.h 伽: / / d o m . i t b . c o 泊i v a d o / t h e m e /ba r r i e r f r e e / .2 0 1 4 / 0 6 / 2 1アクセス. 明 t 2 . i 0 / . [ 9 ]全旅連(全国旅館ホテル生活衛生同業組合連合会)シルバースター部会.人に優しい宿.h 伽: / / v a d o 2 0 1 4 / 0 6 / 2 1アクセス. 回v e l .r a k u t e n . c o .i o / s o e c i a l / v a s a s h i i / . 2 0 1 4 / 0 6 / 2 1アクセス. [ 1 0 ]楽天トラベル.人に優しい宿. h t t o : / I ‑ 3 1・

42.

全国消費実態調査の匿名データを用いた、 2人以上世帯の保険需要の分析 宇野慧 アステラス製薬株式会社開発本部データサイエンス部 A n a l y s i so f h o u s e h o l d s '( t w opωpleo rmore)i n s u r a n c edemand, byu s i n gN a t i o n a ls u r v e yoff a m i l yincomeande x p e n d i t u r ed a t a . S a t o s h iUno D a t aS c i e n c e, G l o b a lD e v e l o p m e n t , A s t e l l a sPharmaI n c . 要旨 保険商品は貯蓄型と非貯蓄型に大別されるが、世帯の加入行動の違いに関して分析を行った事例は少ない。 6年度の総務省全国消費実態調査の匿名データを用い、貯蓄型保険と非貯蓄型保険両方の需要 本稿では平成 1 に対して、世帯属性の中でも特に就業状況が与える影響に着目した。推定モデルには、連立方程式の誤差の 分散構造のみに関係性を盛り込んだ SUR(SeeminglyU n r e l a t e dR e g r e s s i o n )T o b i tモデルを用いた。その結果、就 業状況が保険需要に与える影響は貯蓄型と非貯蓄型で大きく異なることが確認できた。特に、自営業世帯は 非貯蓄型保険に対して非常に高い保険需要を示す一方で、貯蓄型保険に対する保険需要は非常に低い水準と なることが分かつた。 キーワード:全国消費実態調査匿名デー夕、保険需要、 SURT o b i tモデル、 NLMIXEDプロシジャ 1.はじめに 世帯の保険需要は、資産選択の問題として多くの実証分析の蓄積がある。演本 ( 2 0 0 1 )や岩本 ( 2 0 0 3 )では「生 命保険に関する全国消費実態調査データ Jを用いて保険需要を分析している。このデータは公益財団法人生 命保険文化センターが実施しているもので、保険支出に関する詳細な情報が調査されている。保険加入理由 などの意識調査に関する質問項目がある一方で、保険以外の資産保有額については情報が少ない。 演本 ( 2 0 0 1 )では世帯主の保険金額、および家族全員の保険金額を被説明変数に、世帯主年齢、世帯主職業、 子供の有無などを説明変数に設定した重回帰分析を行っている。その結果として、同居する子供の数や、自 営業世帯であることが保険需要を高める要因であると指摘している。前者については、万一の時の生活保障 金額がより大きく必要である事。後者については、世帯主が死亡した場合の影響が一般従業者世帯よりも大 2 0 0 3 )では、保険の加入動機についても着目した分析を行って きい事が原因であると考察している。また岩本 ( いる。具体的には、 「満期保険受取額/老後に必要な資金総額Jをライフサイクル目的の貯蓄動機の指標と定 義している。貯蓄動機の強さが保険需要に与える影響をコントロールするために、死亡保険金額・満期保険 ‑32‑

43.

金額それぞれとの同時推定を行う TypeI I IT o b i tモデルを構築し、貯蓄動機と保険需要を推定している。分析 の結果、死亡保険金需要と満期保険金需要では世帯年収や資産保有額、住宅ローンの有無で影響の大きさが 異なる傾向が見られることを示している。 その他のデータを用いた研究事例として、日経 NEEDS RAD巳Rデータを用いた浅野 ( 1 9 9 8 )がある。浅野 ( 1 9 9 8 )では個人年金と生命保険需要に対して、自らの老後に備えるライフサイクル動機、遺された子孫の生活 を重視する遺贈動機が影響していると想定し、公的年金制度変更がこれらの動機に与えた影響について考察 0代の世帯で生命保険を増 している。分析の結果、基礎年金支給開始年齢の引き上げに伴い、世帯主年齢が 3 額させる傾向が見られたことから、遺産動機による保険需要の可能性を示唆している。 以上の先行研究では、保険加入あるいは需要金額の分析として、家計の保険加入動機(ライフサイクル動機 か、遺産動機かなど)や、あるいは機能面(死亡、疾病、老齢、それぞれ直面するリスクに対する個別需要)に 着目したものが多い。しかしながら、商品特性としての貯蓄型/非貯蓄型の選択、という側面に関して明示的 に分析を行っている研究は確認できなかった。 良く知られた事実として、保険商品は貯蓄型と非貯蓄型の 2種類に大別することができる。一般的に貯蓄 型保険では、保険料を継続的に支払い、契約期間を満了すると満期保険金として一括金額が受領できるタイ プの保険が多い。また、契約期間中に解約した場合に解約返戻金が設定されていることから、これを満了前 の貯蓄と考えることもできる。しかしながら、この解約金を通常の金融資産として扱うことは一般的ではな い。満期時点での給付金額が決まっている確定給付型の保険が多く、原則的に満期までの長期的な資産運用 の性質を持つ金融商品として、非貯蓄型と比べて月当たりの支払額が高額に設定されている点が特徴である。 したがって、資産運用に関してリスク回避的な世帯の加入率が高く、支払額も高いと考えられる。 一方で、非貯蓄型保険は毎月の掛け捨て型であるため、貯蓄型のような金融資産的な性質は持たない。月当 たりの支払額は貯蓄型に比べて安価に設定されていることが多い。そのため、リスクを選好する世帯では、 非貯蓄型保険で支出を安価に抑え、その差額分を別の金融商品として資産運用に回す可能性が考えられる。 以上のように、貯蓄型と非貯蓄型では保険商品の特性も異なり、世帯の各保険に対する需要も大きく異なる と考えられる。そのため本稿では、各保険の加入行動に影響を与えている世帯属性に着目して分析を行った。 本稿で用いたデータは、平成 1 6年度の全国消費実態調査の匿名データのうち、世帯員が 2人以上の 43861世 帯である。匿名データでは調査世幣が特定されないために、貯蓄残高など一部の変数についてのトップコー ディングや、リサンプリングなど、の一部加工を行っている。そのため、実際の調査の集計結果と完全には一 致しない点に注意が必要である。本稿では、提供されたデータをそのまま用いて分析を行った。 以下で本稿の構成を概説する。 2節では、分析に用いたデータの変数名や作成方法などの詳細について説明 する。また、非貯蓄型保険、貯蓄型保険それぞれの保険料支払額について、基本統計量と度数分布図により 分布を確認する。 3節では、本稿で行う分析に関する理論的な背景を説明すると共に、推定に用いたプログ ラムの概要を記載する。詳細なプログラム本文については、月J I 途確認されたい。 4節では、推定結果の概略 を説明し、加えて簡単な解釈を行う。 5節では、本稿のまとめと、今後の分析に対する展望を述べる。 2 .データセットの特性について 2 ‑1.分析に用いた変数名、および作成方法 前節で述べた通り、本稿では平成 1 6年度の全国消費実態調査の匿名データを用いて分析を行う。今回分析 対象とした「世帯員が 2人以上の世帯」については、平成 1 6年度の 9月から 1 1月の 3か月間の消費支出が ‑ 3 3 ‑

44.

調査されている。そのため多くの世帯でボーナス月の影響が除かれており、年間全体を通じた支出を表して いるわけではない点に注意が必要である。本調査の特徴として、各世帯人員の年代や就業状況等についても 詳細に調査を行っている。また、貯蓄残高などストックのデータもあり、全てで 1 7 8 0系列のデータセットと なっている。なお、今回のデータでは貯蓄性保険のうち年金保険は他と性質が異なり、かっ加入している世 帯が僅少であるため分析からは除外している。また、分析の対象としている貯蓄性保険と非貯蓄型保険につ いては、自動車保険や住宅用火災保険は別項目として計上されている。そのため、支出額の詳細な内訳は不 明であるが、生命保険(疾病特約を含む)および医療保険が支出の大半であると考えられる。本稿の分析で用い た変数の情報について、以下の表 2・lにまとめた。 ‑ 1 分析に用いた変数一覧 表2 変数名 区分 詳細説明 非貯蓄型保険 被説明 非貯蓄型保険料の支払し、額 (V1065+VI474)について、支払額が 0の世帯は 変数 そのまま 0、プラスの世帯は自然対数変換した値 貯蓄型保険料の支払い額( V 0 6 1 3 )について、支払額が 0の世帯はそのまま 0、 貯蓄型保険 プラスの世帯は自然対数変換した値 自営業ダミー 就業 世帯主/世帯 2人目の企業区分が自営 (V0045N0059=2)の場合に 1をとるダ│ 状況 ミ一変数 大企業ダミー 世帯主/世帯 2人目の企業区分が民営 (V0045N0059=1 )かっ、企業規模が 500 人以上 (V0046>=4)の場合に lをとるダミー変数 世帯主/世帯 2人目の企業区分が民営 (V0045N0059 1 )かつ、企業規模が 500I 中小企業ダミー 二 人未満 (V0046<=3)の場合に lをとるダミー変数 世帯主/世帯 2人目の企業区分が官公 (V0045N0059=3)の場合に lをとるダ 公務員ダミー ミ一変数 r4 )の場: 世帯主/世帯 2人目の就業・非就業の別が非就業 (V0044N0058=3o 非就業ダミー 合に lをとるダミー変数 ※推定の際には、この変数を基準に設定する 経常所得 その他 経常所得 ( V 0 4 0 2 )を自然対数変換した値 貯蓄 世帯 貯蓄残高 ( V 0 6 7 1 )について万円単位を円単位にしたものを自然対数変換し 属性 た値 女性ダミー V 0 3 9 3 )が lの場合に lをとるダミー変数 世帯主性別;女性 ( 世帯主年齢 0 4 2 ) 世帯主年齢に関する 5歳刻みの区分デー夕刊0 世帯人数 V O O I 7 ) 世帯人員数( 1 8歳未満人数 1 8歳未満の世帯人員数( V 0 3 8 8 ) 6 5歳以上人数 6 5歳以上の世帯人員数( V 0 3 8 9 ) 大都市圏ダミー 居住地域が 3大都市圏 (VOOI6=1)の場合に lをとるダミー変数 ‑34‑

45.

2 ‑ 2 . 基本統計量、散布図 2 ‑ 1で設定した Y l :非貯蓄型保険料支払額(自然対数変換値)、 Y 2 :貯蓄型保険料支払額(自然対数変換値)それぞ れの基本統計量及び度数分布図を図 2 ‑ 2 ‑ 1、図 2 ‑ 2 ‑ 2に示した。また、各保険の加入・非加入の 2値のマトリ ‑ 2 ‑ 1で示した。さらに、両保険料支払額が正の世帯について、散布図を図 2 ‑ 2 ‑ 3に示した。これら クスを表 2 に加え、本稿で着目する就業属性について、世帯主の就業属性で切り分けを行った両保険支払額の基本統計 ‑ 2 ‑ 2および表 2 ‑ 2 ‑ 3に示した。 量を表 2 図2 ‑ 2l 非貯蓄型保険料支払額の度数分布図、基本統計量 司 非貯蓄型保険の支払額(自然対数値)の分布 50 非貯蓄型保険 40 λ ﹄・l v よ 却 2 0 1 0 N 4 3 8 6 1 N ( > O ) 2 6 2 8 9 mean 8 . 5 9 s t d 1 .1 3 mm 1 . 20 Q1 7 . 9 4 median 8 . 6 9 Q3 9 . 3 7 max 1 2 . 7 7 。 0 . 0 0 0. 75 1 . 5 0 225 3 . 0 0 3 . 7 5 4 . 5 0 525 6 . 0 0 6 . 7 5 7日1 &25 9 . 0 0 9 . 7 51 0国111251 2 . 0 0 1275 非貯嘗重E 保醸の支払額{自然対数変幾) 図2 ‑ 2 ‑ 2 貯蓄型保険料支払額の度数分布図、基本統計量 崎 h‑ ‑ ‑ ‑ i 貯蓄型保険の支払額(自然対数値)の分布 貯蓄型保険 30 m ︐ キ 入 ギiv 1 0 。 0 . 0 0 . 9 1 . 8 2 . 7 3 . 6 4 . 5 5 . 4 N 4 3 8 6 1 N ( > O ) 2 7 5 2 7 mean 1 0 . 2 3 s t d 0 . 9 6 日 un 5 . 0 4 Q1 9 . 7 1 median 1 0 . 3 5 一品ι J 6 . 3 72 8 .1 9 . 0 9 . 9 1 0 . 8 1 1 . 7 126 1 3 . 5 1 4 . 4 貯 司E 型保践の支払額{自撚対数変換} ‑ 3 5 ‑ Q3 1 0 . 8 7I max 1 4 . 8 3

46.

表2 ‑ 2・ l 各保険の加入・非加入世帯数の度数分布表 貯蓄型:加入 貯蓄型.非加入 合計 非貯蓄型・加入 1 8 9 0 6世帯 7 3 8 3世帯 26289世帯 非貯蓄型・非加入 8 6 2 1世帯 8 9 5 1世帯 1 7 5 7 2世帯 合計 27527世帯 1 6 3 3 4世帯 4 3 8 6 1世帯 上記の表から、非貯蓄型・貯蓄型の両方に加入している世帯が 40%程度、非貯蓄型・貯蓄型のいずれか一 方に加入している世帯がそれぞれ 20%程度、いずれの保険にも加入していない世帯が 20%となった。各保険 の加入世帯について見ると、非貯蓄型保険では平均値が 8 . 5 9 ( 指数変換すると約 5400円)の比較的正規分布に 近い分布となる。また、貯蓄型保険についても、平均値が 1 0 . 2 3 (指数変換すると約 27700円)の比較的正規分 布に近い分布となることが分かつた。 図2 ‑ 2 ‑ 3 非貯蓄型保険と貯蓄型保険支払額の散布図(し、ずれの支出も正のサブサンプル) 非貯蓄型保険と貯蓄型保倹支払署員の散布図 1 2 B84 (鎖倒緩有総理}窃禄Mmg鍾嘘剥栂匙株 。 o 。 s 0 1 2 1 0 1 4 貯蓄E 重量保陵の支払額{自然対数変換) 。葬貯蓄霊峰険の支払組{自然対数変換)ー 勾 ヲ 9 5 ¥予測限界一一一一ー回帰 以上の図から分かる通り、非貯蓄型と貯蓄型両方の保険に加入している世帯(18906世帯)では、両方の保険 の保険料支払額について、顕著な相関は確認できなかった。 さらに、本稿で着目する就業状況について考察するため、世帯主の就業属性で区分した両保険の基本統計 量を以下の表 2 ‑ 2 ‑ 2および表 2 ‑ 2 ‑ 3で確認する。 ‑36・

47.

表2 ‑ 2 ‑ 2 世帯主の就業状況で区分した非貯蓄型保険料支払額の基本統計量 非貯蓄型保険 世帯数 加入世帯数 加入率(%) 平均値 標準偏差 非就業・その他 9855 4757 4 8 . 3 8. 47 1 . 12 自営業 7060 3192 4 5 . 2 8 . 6 7 1 . 17 大企業 6479 4923 7 6 . 0 8 . 6 0 1 .1 2 中小企業 1 5 0 2 5 9280 61 .8 8 . 6 0 1 .1 1 公務員 5442 4137 7 6 . 0 8 . 5 9 1 .1 5 表 2之‑ 3 世帯主の就業状況で区分した貯蓄型保険料支払額の基本統計量 貯蓄型保険 世帯数 加入世帯数 加入率(%) 平均値 標準偏差 非就業・その他 9855 6076 61 .7 1 0 . 0 5 1 .02 自営業 7060 6 0 . 1 9 . 8 8 0 . 3 5 大企業 6479 5567 8 5 . 9 1 0 . 2 6 0 . 9 2 中小企業 15025 11046 7 3 . 5 1 0 . 2 2 0 . 9 4 公務員 5442 4832 8 8 . 8 1 0. 47 0 . 9 2 表2 ‑ 2・2から分かるように、非貯蓄型保険に関しては就業状況に応じて加入率が異なり、非就業や自営業 に比べ、大企業、中小企業、公務員の加入率が高いことが確認できた。また、加入世帯の平均値に着目する と、非就業に比べ他の世帯が若干高い傾向が確認できる。 ‑ 2 ‑ 3について考察する。加入率に着目すると、自営業世帯が突出して低いことが 次に、貯蓄型保険の表 2 わかる。また、非貯蓄型と同様に、非就業と比較して大企業、中小企業、公務員の世帯では加入率が高い傾 向が確認できる。さらに、加入世帯の平均値についても、非就業と比較して大企業、中小企業、公務員の世 帯では支払額が若干高い傾向が確認できる。 本節では分析で用いるデータセットの特徴を述べ、基本統計量等について確認した。次節では、上記で得 られた両保険の加入行動の傾向を検証するための、推定モデルについて解説する。 3 . 推定モデ、ル 本節では、推定モデルの構成を解説し、最尤推定する尤度式を示す。本稿で分析に用いた推定モデルは、 ①非貯蓄型保険需要に関する推定式、②貯蓄型保険需要に関する推定式の 2式で構成される。非貯蓄型保険、 貯蓄型保険のいずれも負の値を取りえないことから、前節で確認したように支払額が 0の点での打ち切り分 布を形成している。このため、通常の線形回帰モデルを用いると、推定結果にバイアスが生じることが知ら れている。そのため、本稿では非貯蓄型、貯蓄型それぞれの加入選択と支払額選択を同時に扱える、 S U R ( S e e m i n g l yU n r e l a t e dR e g r e s s i o n ) T o b i tモテずルを用いて推定を行う。これは連立方程式推定の一種で、推定 モデルの誤差分散構造のみに関係a性を盛り込んだモデルである。負の値も取り得る潜在的な需要変数 ( y 申)を用 いて、数学的には以下のように記述できる。 ‑37‑

48.

f f : : c ; L : ) f :コ ニ ; ) ( : )N ( ( : ) ( 7 1 : c ) ) 上式の通り、非貯蓄型保険、貯蓄型保険の両方について、潜在的な保険需要 ( Y I 'と Y 2')の値に応じて、実際 の保険料支払額が決定される状況が記述できる。 2節で確認した通り、各保険の加入・非加入の区分が 4つ に分かれることから、それぞれの状況に対応した 4通りの尤度関数を以下のように考えることができる。 i f Y1=0 and Y2 =0 then (Xβ Xr 0"12 1 Lニ ① 2 1一一,一一,一一一│ lσ11σ22σ11σ22) 土砂(叫べれ 警官左手)) σ12LIJ L T E l l φ b 1 ‑何 人l l J 十(と i f Y1>0 and Y2 >0 then 1 (Y I‑X β Y2‑Xr σ 1 2 i 仇│一一一一一.一一一一一一.̲ ̲ ' ̲ " ̲ 1 Jσ112σJσ122' σ 1 1 σ 2 2 σ lん j L= ス 式中の φ、 φはそれぞれ l変量標準正規分布の累積分布関数、確率密度関数を表す。また、 φ2、 φ2はそ れぞれ 2変量標準正規分布の標準正規分布の累積分布関数、確率密度関数を表す。 次に、モデルを構成する説明変数の設定について述べる。両保険の支払額を考察するために、それぞれに 影響を与えると考えられる世帯属性として、以下のものを説明変数に設定した。 ‑世帯主の就業属性(非就業・その他世帯を基準として、自営業、大企業、中小企業、公務員) ・世帯 2人目の就業属性(非就業・その他世帯を基準として、自営業、大企業、中小企業、公務員) ・その他世帯主属性(世帯主女性ダミー、世帯主年齢区分) 8歳未満人員数、 6 5歳以上人員数、大都市圏ダミー) ・世帯属性(世帯人員数、 1 ・収入等(経常所得対数値、貯蓄対数値) 以上の設定をもとに、上述の尤度関数が構成でき、この式をもとにパラメータの最尤推定値を求める。推 定に先立ちパラメータの初期値を指定する必要がある。これについては、各推定式単体で T o b i tモデルの最尤 推定を行って得たパラメータ推定値を、初期値として設定した。 ‑ 3 8 ‑

49.

推定プログラムの概要は、以下の通りである。詳細については、別途プログラム本体を参照されたい。 p r o cn l m i x e ddatFdatat e c h~ NEWRAP; /ネパラメータの初期値設定*/ parmsb1 00 ~ b230s1 1~ s 2 2 ; boundss1 1s 2 2>0 ;pi~atan( 1 )叫; y l~ l o g ̲ k a k e s u t e ;y2~ l o g ̲ V0613; /キ右辺を定義する*/ x b e t a~ bl OO+bl Ol* J i e i l+ . . .+b 1 3 0 * l o g ̲ s a v i n g ; xgamma~ /*誘導系のモデル式を定義する*/ e l~ y l‑x b e t a ; e 2~ y2‑xgamma; /*分散共分散行列の行列式を定義する*/ d e t ̲ s i g~ s1 1*ホ 2*s22**2‑s 1 2 *ホ2 ; /*尤度関数を定義*/ i f y lニ o andy2~ 0t h e n o g ( p r o b b 町 m (xbet a / s l l, xgamma/s 2 2, s I 2 / ( s l l* s 2 2 ) ) ) ; 1~ l e l s ei f y lニ o andy2>0t h e n 11~ ー log(s22) +l og(PDF('NORMAL', e 2 / s 2 2, 0, 1 ) ) +l o g( l‑CDF('NORMAL', 1 I ( ト( s I 2 / ( s l l * s 2 2 ) )材 2 ) * * 0 . 5 a /s 1 1+ ( s1 2 / ( s1 1* s 2 2 ) ) * e 2 / s 2 2 ), 0, 1 ) ) ; *( x b e t e l s ei f y l>0andy2~ 0t h e n ll~ ー log(s l1) +1 og(PDF('NORMAL', e l l s 1 1, 0, 1 ) ) ( l‑CDF('NORMAL', l I ( l‑ ( s I 2 / ( s I 1* s 2 2 ) ) *勺)仲 0 . 5 +l o g 2 2 + ( s I 2 / ( s I 1ち 2 2 ) )匂 l / s l l ), O, I ) ) ; *(xgamma/s h e n e 1 s ei f y 1>0andy2>0t ll~ ー 1/2*log(2 本 pi) ー 1/2 * l o g (d e t ̲s i g )ー l I d e t ̲ s i g 本 ( s 2 2 * e 1* * 2‑2ホs 1 2 * e 1* e 2+s l1 * e 2 *ホ2 ); modellog̲ V0613‑g e n e r a 1 ( 1 1 ) ; r u n ;/キ尤度関数の最大化を定義*/ ‑ 3 9 ‑ b200+b201本 J i e i l+ . . .+b230本 l o g ̲s a v i n g;

50.

4 .推定結果および考察 3節で述べた推定プログラムを実行することにより、以下の結果を得ることが出来る(表 4・1 ) 。一般的な線 形モデルでは、対数変換した被説明変数に対して、説明変数の推定値はカテゴリ一変数であれば基準に対す る比、連続量であれば変化率や弾力性として解釈できる。しかし、 Tobitモデルでは加入・非加入の 2値選択 と、支払額の量的選択の傾向を同一パラメータで推定しているため、線形モデ、ルのような解釈を行うことが できない点に注意が必要である。以下では各世帯属性について推定結果を概観し、簡単に解釈を行う。 表 4‑1 推定結果 非貯蓄型保険需要の推定 推定値 貯蓄型保険需要の推定 pi f 直 標準誤差 世帯主自営業ダミー 2 . 2 3 8 0. 146 < . 0 0 0 1 世帯主大企業ダミー 1 .225 0 . 0 8 9 < . 0 0 0 1 世帯主中小企業ダミー 0 . 5 0 2 0 . 0 7 9 < . 0 0 0 1 世帯主公務員ダミー 1 .224 0 . 0 9 1 2人目自営業ダミー ‑ 0 . 1 6 5 2人目大企業ダミー 推定値 標準誤差 pi f 直 3. 350 0 . 1 1 3 < . 0 0 0 1 0. 305 0, 0 70 < . 0 0 0 1 0 . 1 3 2 0 . 0 6 2 0 . 0 3 3 < . 0 0 0 1 0 . 4 8 5 0 . 0 7 1 < . 0 0 0 1 0 . 1 1 8 0 . 1 6 3 0 . 3 6 9 0 . 0 9 3 < . 0 0 0 1 0 . 3 2 6 0 . 0 9 5 0 . 0 0 1 0 . 0 4 6 0, 0 75 0. 538 2人目中小企業ダミー 0. 169 0 . 0 5 4 0 . 0 0 2 0 . 1 1 4 0 . 0 4 2 0 . 0 0 7 2人目公務員ダミー 0 . 4 4 7 0 . 0 8 5 < . 0 0 0 1 0 . 3 8 0 0 . 0 6 6 < . 0 0 0 1 世帯主年齢 0 . 0 5 0 0 . 0 1 3 < . 0 0 0 1 0 . 0 4 6 0 . 0 1 0 < . 0 0 0 1 世帯人員数 0 . 1 2 7 0 . 0 2 7 < . 0 0 0 1 0. 173 0 . 0 2 1 < . 0 0 0 1 1 8歳未満人数 ー0 . 1 3 8 0 . 0 3 5 < . 0 0 0 1 0 . 0 3 4 0 . 0 2 7 0 . 2 0 7 65歳以上人数 ‑ 0 . 3 8 0 0 . 0 3 8 < . 0 0 0 1 ‑ 0 . 0 2 1 0 . 0 2 9 0. 48 3 大都市圏ダミー 0 . 1 0 0 0 . 0 4 4 0 . 0 2 3 ‑ 0. 387 0 . 0 3 5 < . 0 0 0 1 世帯主女性ダミー ‑ 0 . 5 8 2 0 . 0 8 5 < . 0 0 0 1 ‑ 0 . 2 7 3 0 . 0 6 7 < . 0 0 0 1 経常所得対数値 ‑ 0 . 0 2 7 0 . 0 1 0 0 . 0 0 5 0. 4 3 3 0 . 0 0 8 < . 0 0 0 1 貯蓄対数値 0 . 0 1 8 0 . 0 0 5 0 . 0 0 0 0 . 0 2 2 0 . 0 0 4 く 幽 崎 N ofo b s e r v a t i o n 43861 ‑ 2 *LogL i k e l i h o o d 323635 AIC 323709 . 0 0 0 1 [世帯主の就業状況について} 非貯蓄型保険では、無職世帯を基準としていずれの就業状況も高い保険需要となり、特に自営業世帯が 突出して支払額が高い傾向が確認できた。一方で、貯蓄型保険では、逆に自営業の保険需要が著しく低い 傾向が確認できた。また、全体的に公務員世帯は非貯蓄型、貯蓄型ともに高い保険需要を示す傾向が確認 できた。こうした傾向は基本統計量ベースで検討した 2節の結果と整合的である。 ‑ 4 0・

51.

自営業世帯の傾向が突出して見られた点については、貯蓄型保険に関する何らかの制度(例えば、自身で 運営している事業の方で計上するなど)が影響している可能性などが考えられる。演本( 2 0 0 1 )が指摘してい る通り、自営業世帯では世帯主に万ーの事態があった場合に、一般従業世帯よりも影響が大きいことから 保険需要は高まると考えられる。この需要を非貯蓄型の保険でカバーしている可能性も否定できないが、 やはり何らかの制度上の影響があると思わる。この点についての検証は今後の課題としたい。 I 世帯 2人目の就業状況について] 全体的に、世帯主の就業状況と比較すると影響の度合いは軽微であった。若干の傾向として、非貯蓄型、 貯蓄型ともに公務員世帯では支払額が高い傾向が見られ、公務員共働き世帯で高い保険需要となることが 確認できた。また、世帯主の就業状況とは逆に、 2人目が自営業の世帯では貯蓄型の需要がやや高まる傾 向が確認できた。 [世帯主属性について] 世帯主の年齢が高まるにつれ保険料の支払額は高まり、その傾向は非貯蓄型と貯蓄型で同程度であるこ とが確認できた。一般的に高齢になるほどライフサイクル動機での保険需要は低下すると考えられるため、 今回の推定結果は遺産動機の発現、もしくは年齢の高まりにより保険料の設定自体が高まることが原因と 解釈できる。また、世帯主が女性の世帯では、非貯蓄・貯蓄ともに低い水準であった。 [世帯属性について I 世帯人数の増加に伴い、保険料の支払額も高まる自明の結果が確認できた。また、子供が多い世帯では 非貯蓄型よりも貯蓄型を選択する傾向が強いことが確認できた。一方で、高齢者が多い世帯では非貯蓄型 の支払いは少なくなるものの、貯蓄型については顕著な傾向が見られなかった。また、大都市圏では貯蓄 型保険の需要が低い傾向が確認できた。 I 所得・貯蓄について] 高所得世帯では非貯蓄型よりも貯蓄型を選好する傾向が確認できた。また、貯蓄額については非貯蓄型 に対しては影響しないものの、貯蓄型に対しては有意な正の影響が確認でき、世帯の資産選好と整合的な 結果が得られた。 5 . まとめと今後の課題 本稿では平成 1 6年度の総務省全国消費実態調査匿名データを用い、非貯蓄型保険と貯蓄型保険両方の需要 に対して、世帯属性の中でも特に就業状況が与える影響に着目した。推定モデルには、連立方程式の誤差の 分散構造のみに関係性を盛り込んだ S U R ( S e e m i n g l yU n r e l a t e dR e g r e s s i o n )T o b i tを用いた。 推定の結果、就業状況が保険需要に与える影響は、非貯蓄型と貯蓄型で大きく異なることが確認できた。 特に、白営業世帯では非貯蓄型保険需要が突出して高い一方で、貯蓄型保険需要が突出して低い特徴的な傾 向が確認できた。また世帯 2人固までの就業状況を考慮すると、公務員世帯が他の世帯と比較して非貯蓄型、 貯蓄型のいずれも高い需要となることが確認できた。 ‑ 4 1 ‑

52.

次に、課題と今後の展望について述べる。今回の分析で自営業世帯の保険加入行動の独自性が明らかとな ったが、その原困としていくつかの可能性を提示したものの、詳細を明らかにすることは困難である。その ため、こうした需要の独自性が生じる原因については今後検討を行いたい。また今回の分析では SURT o b i t モデルで推定を行ったが、この推定方法には①同時決定モデルではないことから、保険加入選択の同時性を 厳密には考慮できていない点、②加入・非加入の 2値選択と支払額の量的選択の傾向を同一パラメータで推 定している点、などで問題がある。さらに推定の都合上、世帯主年齢や世帯人員数など本来はカテゴリ一変 数として扱うものについて、単調性を仮定した連続量として推定している。こうした問題点をクリアするた めの方法として、 2値選択と量的選択の傾向を別のパラメータで推定する H u r d l eモデ、ル( T w o ‑ p a r tモデル)を同 時方程式モデルに拡張する方法が考えられる。一段と複雑な尤度関数を推定することになるため、今後の課 題としたい。 6 .参考・引用文献 •W o o l d r i d g e, J .,( 2 0 1 0 ), E c o n o m e t r i cA n a l y s i so f C r o s sS e c t i o nandP a n e lD a t a( 2nde d ふMITPress ・浅野哲, ( 1 9 9 8 ), r 公的年金制度と個人年金、生命保険需要 J,日本経済研究 No.36, p . 8 3 ‑ 1 0 2 ・岩本光一郎, ο003), r 保険需要の要因分析:家計のライフサイクルの視点、から J, r 生命保険に関する 全国実態調査」の再分析, 第 2章 ・演本浩幸, ( 2 0 0 1 ), r 生命保険金額に影響を及ぼしている原因 J, W郵政研究所月報Jl2001 .2 ‑ 4 2・

55.

SASユーザ、総会 2014発表資料 ビジネスにおけるビッグデータ活用の歴史と今後の展望 坂巻英一 公立大学法人宮城大学 事業構想、学部 H i s t o r yandF u t u r eP r o s p e c to fB i gD a t ai nB u s i n e s sArea Y o s h i k a z u,SAKAMAKI D e p a r t m e n to f P r o j e c ta n dD e s i g n 要旨 近年,メデ、イア等でビッグデータとしづ言葉を耳にする機会が多い。企業活動の仮定に於いて蓄積さ れたテラバイト,ペタバイトといった市販されている分析ツールでは分析することが困難な巨大なデー タを指す。近年,こうしたデータを効率的に処理する技術が次第に篠立されつつあり,企業の経営効率 改善に役立てようとする試みも盛んになってきている。巨大なデータを処理するに当たり必要となるコ ンビュータの性能向上と共に, RDBを中心としたデータベースだけではなく,並列分散処理を実現する ソフトウェアとして Hadoopが無料で使用できるようになったことが, ビッグデータの活用を後押しし ていると言えよう。 ところが,企業に蓄積された大規模データを分析し,そこから得られた知見を企業の経営効率改善に 役立てようという動きは 1 9 9 0年代の前半には既に始まっていたのである。有名な事例として POSデー タを分析しそこから得られた知見を基に庖舗のレイアウトを変更したところ,売上改善を実現すること ができた,とし、う報告が挙げられる。こうしてみると,ビッグデータやデータサイエンスに関連する技 術は今に始まったものではないことに気付かされる。本稿ではビジネスにおけるビッグデータ利用の歴 史について概観すると共に,ビッグデータ活用の今後の展望について概観する。 キーワード:ビッグデータ,データサイエンス,データマイニング 崎 4 5 ‑

56.

1 . ビールと紙おむつの事例 論文要旨で既述したように,ビッグデータを分析した結果得られた知見をビジネスで活用した事例は 1 9 9 0 年代の前半にまで遡る。有名な事例として,アメリカのあるスーパーマーケットチェーンが行った POSデー タの分析事例が有名であろう。これは庖舗に蓄積された POSデータを分析した結果,金曜日の夜になると多 くの顧客が缶ビールと紙おむつを一緒に購入する傾向があることが分かつた,というものである。この底舗 では分析結果を基に,缶ビーノレ売り場の横に紙おむつを並べたところ,缶ビールと紙おむつの売上が共に上 9 9 2年 1 2月に発行された W a l lS t r e e tJ o u r n a lで紹介され,ビッグデー がった,というのだ。分析結果は 1 タ分析の初期の頃の代表的な成功事例として後に広く知られるようになった。 こうした分析手法は一般に併寅分析と呼ばれており,現在,流通小売業界において最もよく行われる分析 手法のひとつである。 POSデータを分析することで得られた知見を基に,同時に購買される傾向のある商品 を見つけ出し,陳列棚の棚割りを決定する際に利用されている。併買分析はリアル庖舗だけではなく,ネッ トショップでも利用しているサイトは多い。畑azon.com等で商品を購入した際に,他の商品を勧められたこ とはないだろうか。これはレコメンデーションエンジンと呼ばれており,併買分析の結果を活用した典型的 な事例であると言える。 2 . データサイエンテイストという仕事 ビッグデータを分析する技術者は,最近,データサイエンテイストと呼ばれており,近い将来,人材不足 に陥る可能性が高いと言われている。ところが,データサイエンスとし、う言葉自体,既に様々な場所で使わ れているにも拘らず,データサイエンテイストが行う仕事については,未だに定義があいまいなままである。 最近の求人広告を見ていると,データサイエンテイストと呼ばれる職種は大きく分けて 2種類に分かれてい るように思われる。 一つ目がビッグデータの管理等を効率的に行う, S Eタイプの職種である。 Hadoopのコーディングや J a v a s c r i p tを利用した帳票を出力させるための WEB画面の構築もここに含まれる。そして二つ目がアナリス トタイプの職種である。営業部門やマーケティング部門と密に連絡をとりながら,データベースから抽出さ れたデータを解析し,得られた知見を営業やマーケティングの現場へフィードパックする需要な役割を果た P S S,R等の すことになる。データサイエンテイスト募集,と書かれた求人広告の中でよく目にする SASや S B Iツールのオベレーションスキルを持った人材がここに該当する。 ところで, SASや SPSSを使用した分析業務はいつ頃からあるのだろうか。少なくとも, 90年代の中ごろに は,企業が保有する顧客データを分析し,得られた知識を経営改善に生かそうという取り組みが存在してい たように記憶している。こうして見ても,データサイエンテイストと呼ばれる職業が今に始まったものでは ないことに気付かされるのではなかろうか。 3 . ピッグデータの活用を進めるために 「ビッグデータ j や「データサイエンス j という言葉が消滅しでも,企業に蓄積された大規模データを活 用しよう,という動きは引き続き残ると考えられる。なぜならば,大規模データのビジネスでの活用は今に 始まったものではなく, 2 0年近くも前から存在するからである。それでは,ビッグデータの活用を成功に導 46・ ー

57.

くためにはどうしたらよいのだろうか。図 1は社内にデータサイエンス専門の部隊を有するか否か,社内に 独自の大規模データを保有しているか否か,を基に企業を 4つのパターンに分類した結果である。 独自の大規模データを保有しており社内にデータサイエンテイスト集団を抱えている企業は,既に,ビッ グデータの活用が相当進んで、いる企業である。こうした企業は社内にも十分なノウハウが蓄積されており, ビッグデータを日常的に活用した経営改善に取り組んでいると考えられる。問題は社内に独自の大規模デー タを保有しているにも関わらず,専門の部隊を有しない企業である。データサイエンスに関する技術やノウ ハウは一朝一夕では蓄積することができないため,外部のコンサルティング会社等に分析業務を依頼しなけ 時一一一一一一 ればならないことが多い。 一を唯一一¥一一 ι 一 一一九う何一一品一 一エ一扱ん V噂一一 m J 一 首 切 g一 一 日 一 jH﹁ Lし 一一一問時一とお一 J 一サ部い一 ﹁川町 一社む均一 一 げ 組 一 社内にデータサイ エンス専門の部隊 が存在する 独自の大規模デー; タを保有しない つ 問 問 一FJ﹂ 独自の大規模デー タを保有する 図 1 保有データの規模ごとに見たデータサイエンスへの取り組み ところが,ここで是非次のことを記憶に留めておいて欲しい。データサイエンスに関する技術やノウハウ は技術者やアナリストの中に蓄積されるものだ。そのため,業務を外部に丸投げするようなプロジェクトの 進め方をしたのでは,時間が経っても社内には全くノウハウが蓄積されない,という事態が発生しかねない。 こうした方法でプロジェクトを進めていくと,気付いた時には社内のシステムがブラックボックス化し社内 だけではデータサイエンスに関するプロジェクトを回せなくなっていることもあり得るのだ。やむを得ずシ ステム開発や分析業務を外部に委託する場合には, {可を最終ゴールとするのか,プロジェクトの目的を経営 陣が明確にしておく必要があると言える。 ビッグデータの活用を社内で成功させるためには, 3つの Sが重要な役割を果たすことに気付かされる。 ) , Statistics(統計解析)そして Strategy(経営戦略)である。これら 3 それは, System(Database,Hadoop等 つの要素を全て兼ね備えた人材は地球上探し回っても数えるほどしかいない。つまり,これらの要素のうち のいずれかに秀でた人材を集め,データサイエンスチームを社内に構築した上でプロジェクトを推進してゆ くことが求められるのである。 どんなに高価な情報システムや統計ソフトを導入しでも,戦略が揺らいでいてはよい成果は得られない。 また,どんなに良い戦略を構築しでも,数値的な裏付けが十分でなければよい成果は得られない。これら 3 つの Sが融合した時に初めて,ビッグデータの活用は成功するのである。これを聞いて,初期の頃のデータ マイニングを思い出す人がいるのではなかろうか。データマイニングがはやり始めた 90年代の後半,データ マイニングプロジェクトを成功に導くために必要な要素として,全く同じことが言われていたことに気付か されよう。 ‑ 4 7 ‑

58.

図 2 データサイエンスに必要な要素 4 . バズワードはし 1ずれ消滅する 企業に蓄積された大規模データを分析し企業の経営改善に活用する取り組みが現在様々な企業に於いて 行われている。一方で,第 3節で既述した通り労働市場に於いてデータサイエンテイストと呼ばれる人材は それほど多くないのが現状であり,今後,人材が不足することが予想される。一方で,起業に蓄積された大 規模データを分析しデータの背後に潜む規則性や法則性を見つけ出す技術はかつて「データマイニング」と 呼ばれており. 2 0年以上前から存在するのである。 r データサイエンテイスト Jや「ビッグデータ」という 言葉は大手のメディアが騒ぎ立てたがゆえに,現在,パズワードになっているのではなかろうか。 これらの言葉の定義が未だに明確で、はないことや,パズ、ワードは必ず消滅する運命をたどってきた歴史を 考えると,近い将来. r データサイエンテイスト」や「ビッグデータ」という言葉は消滅するのではなし、か と考えられる。ところが,大規模データのビジネスでの活用は 2 0年以上も前から世の中に存在していたので ある。 r データマイニング」から「ビジネスインテリジェンス」そして「ビッグデータ J r データサイエン 0年以上前から何ら変わらないのだ。 スJ.時間の流れと共に呼び方が変わっただけで,やっていることは 2 5 . まとめ ビッグデータという言葉を耳にするようになってかなりの時間が経ったような気がする。 分析ツールは複雑な計算をアイコン操作や短いプログラムで実行することを可能にする。つまり,与えら れた問題の答えを見つけ出すのは非常に得意である。ところが,分析ツールは何が問題なのか,までは考え てくれないのである。それを考えるのは社内の人間に他ならない。分析ツールは複雑な計算を行うための道 具でしかなく,決して分析ツールを導入しただけでは,結果を出すことはできないのだ。 SAS システムを始 めとした分析ツールに加え,それをどのように活用したらよいか,を考える立場の人材がビッグデータを活 用する上で必要なのだということを肝に銘じておく必要があると言えよう。 以上 ‑ 4 8 ‑

59.

!医痕政府自飢え説場援謀長… ~9 D e l o i t t eのA u d i tA n a l y t i c sにおけるSAS V i s u a lA n a l y t i c sの活用事例紹介 戸田大介 有限責任監査法人トーマツ /DeloitteAnalytics/ジュニアスタッフ 問、政府・部品1 接説ト 要旨: 当監査法人で取り組んでいる AuditAnal凶 csという監査業務を差別化する ための分析サービスを紹介させて頂きます。 当法人の AuditAnal凶csは会計監査の品質向上・効率化を実現しただけで なく、監査クライアントへ会計監査を通じて新たな知見を提供することをも可 能としました。視覚的に財務データ・非財務データを識別することで監査チー ムは効率的にリスクエリアを特定し、監査を行うことが可能となり、また、大 規模な監査対象の多岐にわたるデータを網羅的に集計・認識することで、 漏れの少ない品質の高い監査を行うことが可能となりました。加えて、これら の分析結果を視覚的に監査報告書としてクライアントへ提供することで、会 計監査を通じてクライアントビジネスへの気づきを提供することも可能となり ました。 D e l o i t l eのAuditAnal凶csでは SASV i s u a lA n a l y l i c sを用いて分析を行って おります。当該製品を用いた AuditAnal凶csの分析事例をご紹介させて頂き たいと思います。 ‑ 4 9 ‑ w r n

60.

4 I一 i医鴎癒 政蜘府 自蹴治j台体 大蝉学i 臥 こ は よ 泣 一 一 ‑ 千 ? 巧 品 一 訟 ぷ 持 均 ら み ゐ 三 勾 し . 持 一 I 釘 一 s 剖 山 白 … 5 s 一 A一 CDISC標準対応で SASプログラマーが 抱える問題点と解決策 片山雅仁小山車己山本松雄 イーピーエス株式会社 CRO事業本部 DSセンター Problemsands o l u t i o n st h a t SASprogrammersfacedw i t h CDISCS t a n d a r d s . MasahitoKatayama, TakumiKoyama,MatsuoYamamoto DataScienceCenter,EPSC o r p o r a t i o n l E 5 町一一大学iこ 時寸みゐ. 要旨: CDISC標準対応にあたり、 SASプログラマーだけでは解決できな い問題点がある。弊社では社内研修を通じてその解決策を展開し ている。 キーワード :CDISC SDTM ADaM CDASH SASプログラマー 業務プロセス組織横断教育研修 2 ‑ 5 0 ‑

61.

一 ! ;::1己主呈 同局ミ 1 9 9 7年 C l i n i c a lD a t aI n t e r n a t i o n a lS t a n d a r d sC o n s o r t i u m ( C D I S C )発 足 2 0 0 4年 SDTMV 1 . 0 リリース ‑FDA がC DISCによるデータ申請受付を開始 外資系製薬メーカーを中心に C DISCが 普 及 2 0 1 3年 9月 PMDAf次世代審査・相談体制に関する説明会』 製薬メーカー・ CRO各社対応に追われる 2 0 1 6年 CDISC標準準拠電子データ提出の義務化開始 i ミ ム 持 勢 鎚 ! ふ 一 会 !監療政府叫均 ~I)]9 CDISC 標準への各社対応 ♂おJ二比一 l 「 う 吋 ー す … っ … 妹 !!J 製薬メーカー B社 l i 準備してきたけど C DISCL ik eだから申請に耐えられるか自信が ; ない。 J 一 一 一 「 2 0 1 6年までに対応しなきゃいけない! !どうしよう... J ICROX 社 i これからどんどん C DISC案件が増えそうだ J jCROY社 し iSDTMrヰ誰が作?主らいいの??SASは必要なの??J ‑ 5 1 ‑ 4

62.

ハ 当 ハ 団 ~fj~i&Iffl.Êm:tf.$~*~I;:d:~J::::J::I . 仁 川 mス デ の 実証一融 医積政府間雄同 ~Irn9 CDISC標準への SASプログラマーの関わり DB SDTM ADaM 解析用の SASデータセットを作成する従来の業務に近いため SDTM、ADaMを作成 l こSAS プログラマーは重要な役割を果たしている。 │鶴政府開末学問一ぷ尚一 S:l‑<f‑Sit 2 0 1 9 SASプログラマーが直面した問題 SASプログラマー Aさん 「そもそも CRF、オリジナルの DBがCDISC標準からとても遠い... J 例)よくありがちな患者背景データのオリジナル DB E儒泊~(・E・E盟・R7圃圃圃阿国副司肌・E盟国理 症例番号 性別 X 0 0 1・0 1 X 0 0 3 ‑ 0 1 2 符 原疾患 合併症 既往歴 2 「石両;志向インなのに 6 ‑ 5 2 ‑

63.

(医療、政間合広夫婦塑襲撃広一 ~9 SASプログラマーが直面した問題 両玩ゐマ斗瓦 「測定項目やコードリストの区分がうまく SDTMIこマッピング できな n し止土一一一一…一一 例)併用薬剤の CRF この Terminologyだけでも 併用薬剤名 投与経路 100 個以上ある I I 経口でも色々ありすぎる! 口 1・経口 口 2・注射 口 3外用 口9 :静注 NCIC o n t r o l l e dTerminology Code66729 ! ROUTE(Routeo fA d m i n i s t r a t i o n ) |臨時治伝説嚇膨ら会 ~9 SASプログラマーが直面した問題 SASプログラマー Bさん(つづき) 「測定項目やコードリストの区分がうまく SDTMにマッピングできな 例)有害事象の転帰の CRF 口 1・回復 口2 :軽 快 口 3後遺症ありマ¥ 口4 :未回復 ロ5:死亡 口6 :死亡未回復ど 口 7・不明 戸〆、 NOTRECOVERED/NOTRESOLVED RECOVERED/RESOLVED ゆ 物 繊 川 、、~ RECOVERED/RESOLVEDWITH SEQUELAE RECOVERING/RESOLVING''" UNKNOWN ‑ 5 3 ‑

64.

l医 膿 政 府 自 治 体 、 大 学 に よ る 工 コ 閉 山 実 証 一 四 僻 2 a J SASプログラマーが直面した問題 ‑問題点を整理すると.. ~SDTM やADaM はSASプログラマーが作成するしかない! ~CRF 、オリジナルの DBがSDTM からかけ離れていて苦労する。 =辛そもそもSAS プログラマーが全て考えるべきことでしょうか? プログラマーがCDISC 標準を学習すれば対応できるか? 辛 =SAS = 辛 口B設計者がCDISC 標準を学習すれば対応できるか? 今 = CRFは?プロトコル設計者は? 9 l医 療 政 府 自 綿 大 学 に よ る 工 コ シ ズ テ ム 保 山 ユ ー ~I~9 解決策はあるのか? ‑誰がCDISC 標準を学習すべきなのか ~Clinical P rogrammer? ~D ataManager? ~Bio S t a t i s t i c i a n ? ~Medical W r i t e r? 》薬事? ~CRA? 》非臨床? ~MedicalA仔airs? =辛臨床データのLif e c y c l e lこ関わる全ての人が学習するのが理想 10 54・ ー

65.

!鴎政府的場開務格?ふ紬 ~~ 解決策はあるのか? ‑どうやって COISC 標準を学習すべきなのか yCOISCO f f i c i a lT r a i n i n gの受講 》学会 (OIA、SASユーザー会など)に参加 yCJUG、phUSEなどのユーザーク、ループに参加 ySNS(L inkedlnなど)のユーザーグループに参加 yWebinerfこ参加 州国人で I m p l e m e n t a t i o nGuideを読む 》社内 l こCOISC プロジェクトチームを作る =キ人、物、金、時間、情報を厭わなければ選択肢は豊富 1 1 |産額政問自ふ主催特欝解除~~.,-.* 201~ 解決策はあるのか? ‑いつまでに COISC 標準を学習すべきなのか y2016年度(+移行期間 2年程度)の COISC標準の義務化まで 》有識者の確保、組織の見直し等の準備期間は必要 =辛今から始めれば、まだ間に合う =辛弊社では、 2012年4月から準備を始めました 1 2 ‑ 5 5 ‑

66.

l藍 摂 政 府 自 治 体 大 学 に よ る ェ ー か み し … 齢 ~9 2 0 1 2年4月 社 内 C D I S Cプロジェクト発足 .CDISC標準対応の推進 ・当初 l まSASプログラマーが直面する問題解決のテーマにしていたわ けではない ・しかし、プロジェクトの活動を通じて解決の手がかりが見えてきた 1 3 │町一体蝉一 プロジェクト初期の活動内容 .DM、統計解析、システム開発と組織横断的な体制 .CDISC標準の勉強会実施 G、C o n t r o l l e dT e r m i n o l o g y、TAStandrds、 T >I CDISCI m p l e m e n t a t i o nu s i n gSASなど。。。 ‑業務フローの検討、自社標準テンプレートの作成 聞主にプロジェクト内部の活動だった。準備期間。 ‑社内に展開する必要がある。 1 4 ‑ 5 6 ・

67.

EZ 皇室盤調議盟国 社内 CDISC研修の実施 ‑カリキュラム紹介 TCDISC全般、 SDTM、CDASH、ADaM TIG、C o n t r o l l e dT e r m i n o l o g y、Define‑XML、R e v i e w e r ' sguideo 。 》ディスカッション、事例紹介、お悩み相談 期、第2期 ・第 1 ・各期約 3ヶ月 ・卒業テストあり 1 5 E塁塁韮盟議謹盟塑望彊E 社内 CDISC研修のコンセプト .CDISC 標準の中核は SDTM TSDTMから CDASH、 へ SDTMからADaMへ ‑業務担当者間の連携が不可欠 》共通認識 》業務プロセスの確認 TCDASH当 SDTM= 宇ADaM 当 T LF= 争CSR 》担当業務以外への理解 1 6 欄 5 7 ‑

68.

医忠政府自治体点によー十時点斗鎌倉 9 W l J 社内 CDISC研修で伝えたかったこと .CDISC 標準に準拠した新薬申請パッケージ r :SDTM、ADaM、TLF。付随する M e t a d a t a r :SASプログラマーが申請資料作成に関わる機会は多い 功 S AS プログ、ラマーだけで対応できるか? 1 7 医 療、政府・問 、大学 による守ヌリ.尚一会 ~m,ißlrrn.Iit~~f*, *~l;:. 一一 ~9 2014 社内 CDISC研修でイ云えたかったこと ‑臨床データに携わるすべての担当者が知るべき 》なぜ? =辛 SDTMは高度に標準化されている。 円滑に作成するにはそれなりの準備と仕組みが必要。 r :CRF設計、 DB設計=宇 CDASH 》プロトコル 》治験実施スケジュール 》評価項目 18 ‑ 5 8 ‑

69.

医癒吋自治体;淳一以ぷ轡彰A:~~"-&fl 2 0 1 9 社内 CDISC研修の効果 ‑まずは知ってもらう。気付いてもらう。 ~SDTM が中核 ~SDTM 作成を見据えた CDASH 》個人の知識、スキルも大切。でもそれだけではない。 》ましてや S ASプログラマーだけでは対応できないことも多々ある。 19 i 均 以 理 騨 額 関 与 じ 子 会 会 問、政府自治体 ~llJ9 社内 CDISC研修受講者の感想 (DM担当者) ‑立上げの段階の意識を変える ・DB 設計の教育 ・C RF設計から C D I S Cを意識しなければならない ・DM 内での業務分担 ・関連部署との連携強化が必要 ・他の試験を意識する必要がある ・システム担当者でも C D I S Cの知識が必要 .CDASHだけではなく全体の流れを把握する必要あり ・上流工程で工数がかさんでも下流工程で削減できる など ‑ 5 9 ‑ 20

70.

l医 療 政 府 間 却 に よ る 一 弘 の 実 証 s … 会 W J 9 今後の展開 ‑もっと安日ってもらう。 T ‑CRA、非臨床などのLifecycleに関わる人への研修の展開 2 1 ‑ 6 0 ‑

72.

弓 う ' ‑ ' . " . . o 忌 巳 高 忌 舟 財 > 1 , . ‑ ; 1 ヨ 溢 凶 噛 F , へ

73.

!医療政府開…る一弘の実証 SASユーザー純金 ~o アマゾンウェフ、サービス (AWS)による 公共データの活用 吉荒祐一 アマゾンデータサービスジャパン株式会社 i l医 療、政府間、大学時一一説誠実 ドf !l:lユーザー絡会 ~~I 要旨: 公共機関によるオープンデータの推進には、利用しやすい形でデータを 公開する事と、データの解析によりビジネスの価値を生む事のこつの重 要な要素があります。アマゾンウェブサービスが、いかに、このオープン データの両輪を力強く推進しているかご紹介します。 ‑ 6 3・

74.

l藍療一体大学一一誠実主 SASLovesB i gDatav i aHadoop ‑BigDataD r i v e nInnovation‑ 惟高裕一,北西由武,都地昭夫 塩野義製薬株式会社 SASLovesB i gDatav i aHadoop ‑BigDataD r i v e nI n n o v a t i o n ‑ YuichiKoretaka,YoshitakeK i t a n i s h i, AkioT s u j i SHIONOGI&CO.,LTD. 医療、政府・自治体、大学によるヱコジ杭み1 1 1 … 山 総 会 ‑ 要旨: シオノギで構築した Hadoop環境の紹介, HadoopとSASを連携させる方 法,およびその留意点,さらにはそれらを利用したデータ解析事例に ついて報告する. キーワード:BigData,Hadoop,hive,HDFS,OpenData, SAS/ACCESSI n t e r f a c et oHadoop ‑ 6 4・

75.

l‑問点!とみ送灘籍軍J ふ齢 [ I J 1 n 内容 ‑背景 • H a d o o p環境の紹介 H a d o o pとI ま ーシオノギの H a d o o p環境 一 • S A SとH a d o o pの連携 ‑S A S / A C C E S SI n t e r f a c et oH a d o o pに触れてみて ‑解析事例 │一関知 B i gDo t o1 / ) ,道混〈特に医薬関連〉 世界では, ー各製薬会社がデータを提供し相互利用化が進み始めている (DataSphere) ‑ EUでは透明性を主目的にした臨床試験データ公開の動きがある 一医薬品産業会でのビッグデータ活用に向けて新たな学会が作られてきてい る(BigDIPなど} a 倒 調a 醐町周"."iMH 胸剛......恥"勉陶 .. 岡闘舗& ・・・‑‑・...切剖.指旬 6 B協 ( # ,t l‑ , ha n'lgo 問 問a . r e0!w o ; l d o f p c 描 I b d l t町 f t ; ' a d ; ; a r ' o l'Q四ηc e r c e 匂 盟' d 圃圃圃 、 ‑ 6 5 ‑ 留盟国‑ liIl盟国‑

76.
[beta]
E
5
2
3
F
5
1
自体苧Ii一一時aIi

l

$A$:
l
‑
f
!
‑
o
f
t

2
0
1
4

医薬麗速の B
;
gDo
t
o(
1
/
2
)
・製薬業界における B
i
gData解析ニーズの高まり
一社内データ

・PGx
ーオーブンデータ
・添付文書ヂータベース
J
A
D
E
R
/
A
E
R
S
)
・医薬品副作用データベース (

,

州 陶 酔W
6fld
参D
a
t
a
f
f
(
C
脳・削 d
a
t
街E
H
R
)
;
;
:H'f!

•O
p
e
nF
D
A
・その他多数
• EHR:E
l
e
c
t
r
o
n
i
cH
e
a
l
t
hReco
同

EE
冨翠盟銭湯議離韓Em
I
医薬爵速の B
i
gDot
o(
2
/
2
)

I
I
バ担少出
間 四 四 回 目 叩 副

寄ナ

帯¥

",.・時制畑一嶋一蜘・…祖国

い棚一一

?+Bt一

r 一
aM
⁝
一

Au
ベ
一

j

免
﹀一
人
一a

プ
一

一

Jト H

一
一r﹂一

一
一
im

[医薬品副作用

圃

!アイデア次第でDBの組み合わせは
多数考えられ,組み合わせ数に応
じてデータは大きくなってくる

ー6
6
‑

. .

1
1

[添付文書

園田園園

f
I

{
.
.
.
l

ta孟

¥!I里'

・
画
面
、

77.

│医師出向!とお議鋭I ム ム 齢 ~[1 ひとつの選択肢として ; データ量と処理リソースの膨見, i 門家処理理:やと空事?竺ぜ停ざ経:二J Hadoop環境で、の解析 一高度なJavaプログラミングの知識が必要 一製薬会社のプログラマにとっては敷居が [ 一 一 一 点説 経 路 … ~[1 l 肉容 忌 牛 • .肉.:11:R • Hadoop環境の紹介 一Hadoopとは ーシオノギの Hadoop環境 ‑らえ 5片 山 吉 川 ,J i】 1 . / . . 1" 護 持 m f¥CCE5SIηtρr~ 霊 J.:)/ 併す " I a t . ' ^ j ‑ 6 7‑

78.

ト医積政府印刷干るー接持路島一会 ~9 Hod ∞pとは Googleの基盤技術!こ基づき, OSS合として実装された大規模分散 処理フレームワーク 拡張可能 拡張可能 トダ 、+広張奇能 *OSS:OpenSource 片 足 医 積 甲 府1 5 2 I Hødoop~ぽ • HDFS*とし、う分散ファイルシステム, MapReduce とし、う分散処理システムを基本機能とする G 侃 障問 y 1 冒B G 細道 Hadoop環境 会 HDFS:HadoopD i s l r i b u l e dF i l eSyslem ‑ 6 8 ‑

79.

一一自制定!と必殺鍔弘三一 9 W l J HDFS 企望77.-1防空竺ヨりファイルを分散して保持;す;~ I 1 1 • 1 台の PCでは扱えないような サイズのデータを扱える 1 1 ‑実際は分割したデータのコ ピーも保存されており,どこ かの PCが壊れても問題ない 画 置 医癌政府自治…と品薄構持;t-~-ø* MapReduce ;全~型型冷=rk-+型理を分散させて行う j Mapper Reducer 分解・抽出 集約・計算 ‑ 6 9 ‑ 2 0 1 9

80.

~I]9 │僅療政府自治体大学によるーテム今実証…‑髄 Hodωp( H D F S + M o p R e d u c e ) ・基本の H a d o o p環境だけで出来る処理は限られる • M a p R e d u c e処理のためには J a v aのプログラミングス I キルが必要であり,敷居が高い 直陸圏直留選遊園謹醤醤盛盤固 ~..・ 錨轟i 13 EE 塁塁監護議議離盟置圃 H o d o o p. I . コシステム 議 E -・ Map 冨~ ‑ ・ ・ ・ m J l ヨ ・ ・ ・ Hadoop環境 7 0 ー ・ 轟 P i g 1 4

81.

│医師府自…議務総ん J ~I]9 H ; v e込 E ・HiveQし と し 、 う SQLライクな言語で、 HDFS上に存在 するデータを操作できる 向車 ・P i g L a t i nという言語を使って, HDFS上のデータを 操作できる Mahout 私 自睡 ・ビッグ、データを用いた機械学習(レコメンド,ク ラスタリング,分類)を可能にするライブラリ 15 │ 医 療 政 府 叫 点1 1 務縄本ふ髄 W J 9 塩野襲製薬解析センターの分散処理システム S羽 s SAS/ACCESS Interface ⑥ toHadoopTM ‑ 7 1・

82.

9 章容 . ~包Jæ.. 同局ミ • H a d o o p環境の紹介 H a d o o pとは ーシオノギの Hadoop環境 • S A SとH a d o o pの連携 ‑S A S / A C C E S SI n t e r f a c et oHa d o o pに触れてみて ‑解析事例 17 ‑圃圃圃圃圃圃圃圃圃圃圃・圃‑亘量=正sii::量gとー SAS I ACCESS , ,t e r j Q c et oHodoop • S A SとHadoop をH i v e経由で接続できる .連携のための環境設定がやや複雑 .連携させられれば使い方はシンプル ‑ SQL ‑ Hadoop *prochadoopから plgでの操作も可能 ‑ FREQ ・ 一 RANK PROCRANKi n‑ databas eproces si ngi snotsuppo 同edb yHadoop ‑ REPORT ‑ SORT場 事TheNODUPKEYoptioni snotsupportedonHadoopwithi n‑ database processlng. ‑ SUMMARY/MEANS ‑ TABU凶 i f E ( SAS9. 4helpより) ‑ e t c . 18 ‑ 7 2 ‑

83.

!医膿政府開均長暗絡みみー齢 ~9 Had ∞p / . こ接続して解析を行うね/ 2 } I Hadoop側で、準備しておく r ‑ ; L 下記コマンドを実行 州 P o i n t :‑hiveconf、 でHive恨] 1の設定を指定可能 e x . )Reducer の数を指定する場合 / u s r / l i b / h i v e / b i n / h i v e‑ ‑ s e r v i c eh i v e s e r v e r‑ h i v e c o n fmapred.reduce.tasks=25 19 │医憲政府時間報特 2 0 1 9 H a d o o pに接続して解析を行う { 2 / 2 } I SAS 側で通常と同様に計算を命令 HDFS上のライブラリ J を指定 1 計算処理 SASシステム MEANSフ口シジャ i変 重量 r ラ ベJ , ! 時 四 一 ‑ obsno obsno I500000050 0.3696910 03 口9日523I c c 0.3602427 x 1 Ix2 x3 x 1 x2 x 3 直面 守・ 室 ‑・ ・ ヨ 議 EZ 胃璽璽型曹司 HDF I Y ‑ 7 3 ‑

84.
[beta]
w
l
l
9

│医癒政府自治体大学によ一一ムの恥凶ユーザー絡会

解析事倒'
(
O
S
I
M
2
)
OMOp.が公開している, MarketScanl
O
>R
esearchDatabasesなどの商用
データベースをもとにシミュレーションから作成されたデータベース
•

R
e
a
lWorldDataの解析手法研究などを目的としている

単純な頻度 集計を行って処理速度を比較してみる

l

‑使用するデータ
ー
OSIM2rこ含まれる薬剤情報のデータ
一必要な変数だけに絞って約 30GB
程度にした
‑ 118
,
541,
933オブザベーション

∞

• OMOP:ObservalionalMedicalOul mesPartnership

由2
009
・
20120b
開 問 副o
n
8
1M
e
d
i国 10叫 回mesP
a
r
t
n
e
r
s
h
i
p

医癒政府間大学山コシス弘の実証
一
一
一
一
一
一
一
一
一
一
一
一
一
一
一
一
一
一
一
一
一
一
‑
.
時
一1幅
広
一
一
一
一
一
一
一
一
一
一

一
一
一

procIreqdata=hd.ko;
ι
, t
emp2o
r
d
e
r
=
f
r
e
q
;
t
a
b
l
eCONCEPT̲NAME;

S

τ
瓦‑
欄

結果抜粋
副S~,.テA

"副知!fI
h
‑ 耳.
.
.
.
圃

.
1

m
ι 霞勺
;本事例では, Hadoopを使うこと
iで一定のメリットが得られた
に‑""‑

〆
̲
̲
‑

b

基

‑

抑震町131$ 3
1
蛾前,

3筒

‑・崎刻削除

¥陶
.
.
:
:^
:
‑
;
ー割薗田

舗網開

軍総

網"醐,..鍵財嗣,.

h楢 四 時 曲

鎗 飽 甜 噛 n岨 制 帽

~e

.線描

..
帽唱幅

削錫..

,
.
"
出
,81

愉..

‑

梱 酬7 晴 相 側 抽

n
鋪

一
一 一 一 一 一描 2掲 " 幽 閉 笛 閣 1 3 O l
‑ 嶋一
由
一
一 一 一 一
....
・由
鎗 期 総 咽 噛 欄 , ,醐

、
‑ 一一一一一"描

川端醐柵・四,,,.

内網蜘・陶・h
・

h・・白血泊.

均・・抽聞・圃圃

・

1
20
J
l
1
1
f
M 7 穐訓

'飼町

a
舗 網 ' " 醐 縄8

"網開柵制旬駒"'凶

@2oo
9
‑
2012Obse
刊a
t
i
o
n
a
lM
e
d
i
国 10
叫 回mesP
a
r
t
n
e
r
s
h
i
p

‑
7
4・

85.

1 医癒政府開樽は…弱点… w l l 9 まとめ ・世間の流れと同様,医薬関連データの量も増加の一途 を辿っており,並列演算処理できる環境が必要となって きている • J a v aプ日夕、ラマに頼らず, S A S / A C C E S SI n t e r f a c et o H a d o o pを使って S A Sプログラマフレンドリーな環境を整 えることは選択股の一つである 2 3 I~Ji. islJffi.EHsf*.*~今後 ・将来的には, S A Sプログラマが H a d o o p環境を意識せ ずに解析を行えることが理想である • H a d o o pの得意な処理を把握し, S A Sの処理と使い分 けることが重要である 24 ‑ 7 5 幽

86.

│医師府間大学による口以均一一 参考文献, W J [ 1 Website ・はじめての Hadoop‑分散データ処理の基本から実践まで,田津 孝之,横井浩,松井一比良,技術評論社 ( 2 0 1 2 ) . m L • O b s e r v a t i o n a lMedicalOutcomesP a r t n e r s h i p, httmolll 盟主 25 ‑ 7 6 ・

87.

システム管理負荷を軽減させる、 SASB I運用に関する検討 独立行政法人国立がん研究センター 青柳吉博 要旨 • SASB IS e r v e rおよびVDIを用いた利便性・拡張性に優れた業 務環境をご紹介します。 VDIを中心として業務環境を仮想化 し統合されたシステム上で、管理することで、システム担当者 )ティに寝れた の負担を最小限にしつつ、耐障害性・セキュ 1 業務環境を幅広く運用することが可能です。 ‑キーワード:医師主導治験、仮想環境、セキュリティ対策、障 害対策 7 7 ‑

88.

内容 ‑国立がん研究センターにおける医師主導治 験実施体制について .システム管理面から見たデータマネジメント 体制の問題点 • SASB IS e r v e rを用いたデータマネジメント体制 .システム担当者の負担を軽減させるインフラ 環境の構築 ‑まとめ 国立がん研究センターにおける医師 主導治験実施体制について 1 1名 ‑トライアルマネジメント ‑築地 ‑柏 4名 7名 .データマネジメント ー築地 ‑柏 1 2名 7名 5名 ・生物統計 .システムメンテナンス ‑監査 一築地 ー相 1名(柏のみ) 1名(柏のみ) 2名 1名 1名 上記以外にも、 CRCや薬事専門家など 100名以上が業務 に関与しています。 7 8 ‑ ー

89.

国立がん研究センターにおける医師 主導治験実施体制について ・医師主導治験実施試験数 2 1件 ・医師主導臨床試験実施数 ・その他 (EDC提供など) 34 件 79・ ー 3件

90.

システム管理面から見た データマネジメント体制の問題点 ‑築地・柏分かれてサーバが構築されており、相互のデータ参 照性は持っていなかったため、事実上協業が不可能だった 0 .業務データの保管場所に関する権顕管理が統一されていな かったため、設定が煩雑になっていた。 ・データマネジメントは SASで行なっていたものの、実行環境の PCはユーザ自身で管理していたため、 PCの障害時や更新時 に適切な対応が行えなかった。 S A S8 1S e r v e rを用いた データマネジメント体制 ・新たなサーバ領域を確保して、臨床試験部門の業務デー 夕、個人データ全てをサーバに保管する。(築地・柏ともに 一力所に保管される) ・上記領域に保管されたデータは統一された権限管理の下 で運用される ・ SASB IS e r v e r を構築し SAS実行領域は原則 BIServerに統 合する 0 ・接続元 PCの環境に依存しないよう作業 PCを全て V D I (仮想 P C )化する ・業務で利用するアプリケーションも原則仮想環境のみで実 行する。 ・相キャンパスにシステム管理者を配置し、システムメンテ ナンス、権限管理等を集中化する 0 0 ‑ 8 0 ‑

91.

SASB IS e r v e r導入後の データマネジメント体制 ̲述 , e . ; , i SASB IServer導入後にシステム管理 者が管理するサーバ群 • SASB IServer ・シェ 7ポイントサーバ • VDI 認証基盤 ・ファイルサーバ .プリントサーバ バックアップサーバ .監視用サーバ ・構成管理用サーバ など計 20以上を 1人で、管理今運用負荷を軽減させるため に自動化・省力化が必須 ‑ 8 1 幽

92.

システム担当者の負担を軽減させる インフラ環境の構築 .認証基盤の統一 ・管理サーバの統合(権限管理、死活監視、構 成管理、セキュリティ対策、ヘルプデ、スクツー ルなど) ・リモート監視ツールの導入 ・アプリケーション配信(仮想アプリケーション) など まとめ ‑国立がん研究センターにおける医師主導治 験実施体制について説明しました。 • SASB IS e r v e rとVDIを導入することで、統一さ れた環境で簡便に SASの運用を行う事ができ ます。 ‑さらに、管理サーバや認証基盤を統合させる など、サーバ管理者の負担を最小限にする 工夫を行う事で、少人数でのシステム運用が 可能となります。 岨 8 2 ‑

93.

(町民・自治九一点掃事長時ムム~何| SAS を教える・ S AS を始める 新しいS AS の操作方法 SAS@E n t e r p r i s eG u i d eのご案内 古賀信二 SASI n s t i t u t eJapan株式会社 Toteach, t os t a r tw i t hthenewwayo fu s i n gSASby SAS⑧ E n t e r p r i s eG u i d e SHINJIKOGA SASI n s t i t u t eJapanL t d . l 医律子府・時一1ふさ#弘延長IÄ~:t-~-.a 2 0 1 4 要 旨 : 【SASを教える][SASを始める]方に新しいSASの操作方法をご案内します。 SASは豊富なプロシジャを提供し、 SAS言語をマスターすることで、 望む統計手法を自在に実行できます。 しかし、 SASが初めての人にとっては、 SAS言語を学ぶことも、習得することも大変です。 ま た 、 SAS ユーザにとっても、人材育成・確保などの課題が発生しています。 キーワード: SAS@E n t e r p r i s eGuide.SASO f f i c eA n a l y t i c s z ‑ 8 3 ‑

94.
[beta]
!医痕政府開相よる印ステムの実証~ユー

~9

SAS(R)9.3 ProceduresbyBaseSAS & SASjSTAT

A
.
̲
!
̲

山 山

語

事事制副

4
監

書

CORR

度数表・集計表の作成、および
集計デ‑
I
j
に対する解析

FREQ

眼1
1
'
:

議 問 団 NS 、SUMMA
尚昆蹄届

基本統計量の算出

a

察

平 署1変量に対する詳細な分析

龍

糠甥

様々な相関係数の計算

UNIVARIATE

RANK
鍾審議4
3
塁機材

データの順位付~j,と標準 d順位付~j

化

B

f標準化

STANDARD

ユーザー定義

ド予定義関開成

FCMP (SAS9)

関数の作成
回帰分析
多変量解析

条件の悪いデ‑
I
j
に対する線形回帰

ORTHOREG

非線形回帰

NUN

因子分析

FACTOR

輔臨騨睡

この他!こち数多くのフ。ロシs;ヤがあります

(医療政府間大学問ロシステムの実証
1
・一一一一ー司守

『一一一ーヨーヨーーヨーヨーー

f
:
H
:
t
i
:=;iiC触

~I]9

ーー

リートデータセヲト C ¥SAS¥ Da同¥ SASDa回¥ DEMOSFJ~sal回目 s7bdat

田町同却咽珂回目︒

一一一一一一一一一一一一一一一一一一一一一一一一一一ーーーキ 1

7
0
.
α
m
α加9
6
0
,
0
<
抱α訓o

PROCSQL;
CREATEVIEWWORK.SORTIempTableS
町tedAS
購入金額 "
n
SELECTT."
FROMECLIBO
l
e
sasT

S
O
J
X
J
O
,
O
O
O

∞
田

4
0
.
α
"
'
0
<
泌
3O,~OOO

QUIT;
官 TLE;
πTLEl"分布購入金額九
FOOTNOTE;
正5MOMENTS
ODSEXCLUDE正XTREMEOBSMOD
QUANTILES;

2
0
α沼侃m
10
,00(瑚lO

。

e
l
l
s
;
GOPTIONShtext 1c
SYMBOLv=SQUAREc=BLUEh=lc
e
l
l
s
;
PATIERNv=SOLID
胃

【
7ログラムがわかちない方】

Sorted
PROCUNIVARIAτEDATA WORK.SORTTempTabJe
C(TYPE=TWOSIDED
CIBASI
罵

ALPHA=O.日5
)

〆過程がわか8ない
〆箆える憲欲低下
〆身近に教わる環境

MUO=O

燭贈入童額
VAR"
H
同I
S
'
訂
TO
G陥 M "晴燭入童額 "
吋
n 問OR
附阿A
札L
(
W=l
L=l
COLOR=YELLOW
阿 U=E
S
'
TSIGMA=EST)

∞

H

I
N

VA

q
d

‑

A ‑ ︐
円

一ト川

リ'

p

一
W
nM一一

E‑

BR

Z﹄‑

cdE

nu‑

VR刊

V︽

u; 一

制則一

C1

附同一一

=
=
一
Ei‑

罵‑

RU

HM

一司

一す一

frE‑
︑
r
L‑

K

L
L‑

5

p ‑ u ‑ ザ凡

凶︐一敏

⁝

一叫刈

ZEMW

ロM

忙一↓一即
m
Mq
一以一靴

H'f‑ 刷

日一

岱

M

幽

8
4
‑

[:1ログラムを教える方】
v
〆観明が難しい

J 業務負担の欄大
J 属人化問題

95.
[beta]
勺ん?払川九ι川η(川 よ ど 弓

ω
戸
J

j

1

医穣、政府.自:治台停、大学によよ:る工3εジ
Uコ宋
Eγfの実証 rιs焔立~噌総蝕会

71~.

SAS⑧ E
n
t
e
r
p
r
i
s
eG
u
i
d
e

w

白一

E霞輯璽置

配
送.
塁

r
;1j,,~ト

"γ
三
.
t
I

~与一川い

‑
‑
‑
J
I
軍叫景

9

I
足場議員一一

•••

W
l
J

戸、政府制点

通切

"匂 O~地

I
.
̲ o明

調 事 必 也

l
'
: a.,~ ~~叩

1

揚
勘

迦 し

抽 川

ー膨織 d

山 拾 い 咽
今

勧 幽t
l
i
i
/
u

ロい何世

噂 伸 、 川 崎

儒
"

自 平 均

Il
;
i
l
l
.
'
,
何

穐叫

に け ' "

事f'C.‑4Jヲ, '",,-, '~c ,, _.l

'"叫

M ポ

L

i

. の 喝d駆け

商キ

1/ 守 加 が

緬扇面耐

.包均

唾
j ;W;1
ー
‑

州向

I

て
"
・
"
舗

紗句信

亀岡パザー門川

エ"
'
'
'
'
J:
S
'
l
4
時
込山内今

.
・

必樹酔

銅像

M

.,雄繊齢

1
1
1

・

剥t
lr‑H

闘匝代レ吋悶

開
,"湖日帆
:
&
. ~.
.
.

a

臥ノ同ゆ#ドノヲ担刷広".,広・ 隆 偽 物

ポ

幽一叱慣般事

油

,
.
河
ド

醐.時

1
‑

船 "
..
'~調"仙

w
.

J吟 抑 制

‑
8
5
‑

?

曲"f' m' 1II震岬~

也 可l'欄 刃 円

.
ョ

i
t
‑""f¥A'脳
!
H
l

蝿

適量判静止1 と 暢 濁 ゆ

"叩,凶~~ -;~

w.内.-.~長

l
'
φ

U

唱官宅周

"
'
1{l,1
"
.,
"
"

与〆・

司H

凶待旬宏、輔、

同

省'~縄

凶 町 ・h

抑 均 ,1
四

.

r
;
;
通
・Z贋
盟系

m

'
'
H
"
'I 慢問:

.
.

円、

ヘ
日 "・~
掛

gi重曹
93a
jL
e
g
a
a
‑
‑喝

.. t
r
i
J.:'a豆沼髭宅
地 ケ で 川 l勺

a︐
Ba
E
E
‑
‑司

i

圃圃・圃圃・

E
瞳E
E

T-~・

96.
[beta]
l

~9

医痕政府臨婚同一テムの実証…ー絡会
BEE‑‑

‑‑‑‑‑‑

•••••

F 再開四百守..園町

U
i
d
.

~!X窓S'

一一
' 附

, ‑ > ト

'
i
" j

ー
・
‑
・
・
・
̲
.
・
・
!
…
‑
n
i

1

亡軍国益ごJ'
1

‑
.
t
I
A、
.
1.
.
.
.
1
1
.
"
1
1
,
、
.
.
.
J
I
'
B
'
.
J
リ
"'てJ
刷

川 町

医疲附

j
自体的……!苧

・

.
,

E::' j司
!
i
)
1
f
"
f
1
l
l
f
'
;
'
;
'
#
主主通E

‑lIii三副血i
孟2

自←→電通←→E
Z

~←ァ酉←→自

TRANSACTI

I

一

品品恥子一泊以一守き守圃剛.

一必需も

・
.
I
・
眼
.
台
.
,
t

'~側聞..踊t
ょ Bl 川町制札!
細書I
D
干h
i醐
!、""‑1嗣百o
!毎
.
.
,
・
入
倉.
.
言
.
I

ザ百円

l'
開
官鴨a
叫
3
貨
もι
市町冶

H

計葺 JIJ~加

E札 u
c
凶 T
E

I

l

自J
I
タ嶋一一
一ゐ一
I :l= "_7~叫糊州

2
0
1
4

SAS!Hf‑o.

15m.圃

:
:
:
:
V
P
E

、
目;j

F

ζ厩転三戸'"

織々なデータ加工メニューを提供

同

8
6
噌

責肘@鴨脚拷般…ぷム

ム

弘4えーム伺いい~

97.

│臨政府自治体大…口システムの実証…哨 9 W 1 J 集計か8回帰分析・多変量解析など統計解析を、簡単なマワス操作で実行 医療政府明大学によ拡散ス問調…四絡会 ' 1 一一一一一 = 1 . . ‑ ‑.~-, . グラフ・チャート・表作成の簡単なマウス操作 ‑ 8 7 ‑ ~9

98.
[beta]
~9

医療政府間大学による四ステムの実証…一帥

‑
‑
‑
‑

プロセスフロー・

‑EEE‑

匝璽量調圃

•••••

仙

,

広元福.."広田"‑'>耕地・スケラ ‑J咽・!トム回・ 5
島プ口問ト即叫 1
固拘附田・

‑
:
m
証

、

…一一

~璽ト?穐←一間←→雪国←→圏←ーも←→毘←一位守一圏←→凶←→画
問問 デ一瞬時脇町 3
里 町 ? 問 問 湾 問E
Z同 制 圏 、 腎 明 感 動
w
i盟‑/
、
一
、…,..,
c
n
o
.
"
t

一 山

i
殻静

駒
、画

│図J

1.直観的なマウス操作で実行した7ロセスをフロー闘として自動生成
2. プロセスの編集・象件変質によ~プロセス分岐ヘ対応

3
. 再利用・共有ヘ対応

│医鷹取府関大学問コシステムの実証…‑総会

9

W
l
J

i
通凶磁鼠.

同ド L~樫剛士J

隅酷自在酔

四 11$9
周純日

寄
島
・

罰
[
1"
7医互主

制1
1
'
事'周初日

電
極
・

I
!
J
!
O
.
初
回l
駒埠鴻持(s)
鵬 白b 則
+蕗亙平孟過

目(;:1闘

敏 7時傭由時審問〉

・継酬献血~

I

.
.
;
.
.
時
服
I
!
)

舟 分t
按

呂田開構持中@鎌倉、 L
制帽陀博li::司剛!l)

じ二率二3仁表裏Eコ

u区二3じ逓遜日
プロセスフローをスケジユ‑Jj,設定でJ
(
¥yチ実行が可能

‑
8
8
‑

99.
[beta]
~

語

I

,

~

..J
2

霜

r
‑
‑
‑
i
~
?iJO;
'.. ‑ζ高畠 f
哩
'
,. II1̲̲;哩jj盟.
E
j
j
i
.
‑
'

・
i
'
:

'議酬嗣雌 J

欄聞闇

‑
‑

f
‑
‑
‑
!
S

. i --:"~

.
.
:
:
.
:
,
;
函
量 E

て空

噌仲町長高
,t1.̲!'::'EI
帽

j
:
'

~

lld!'i
M綱酬刷」

II~ ;
1

‑
‑

4Jii

て十

I
@

b

E
襲
似

入
r

婦

、
、

"
i

z

揺
!
.
:
!

a

g

個

為
慌

0ロ

σ

3 、

2
ω

ロ
h

ま

~

"
'
6

ゐ

震

i
t

、

~

2

e
翌

LJE1

EJ一

i
L

100.
[beta]
W
I
J
9

│医療政府開大学問問ステ峨証一糊

国盟

国周回一盟国

閣周囲回目

醐豊岡

量畠盟彊畠盤盟盟国盤掴E量竃富田園冨圏聞

1

W
l
J
9

医療政府自治体熔中飢弘の実証一総会
SASE
n
t
e
r
p
r
i
s
eGuide基本機能

ロデモ内容

1Jの分割・変数作成・ロジスティック回帰・プロンプト・ヱクスポート
データ結合・要約機能・ 9

ロ利用デタ
" f 受注デタJf顧客マスイ~ J
f製品マスタ」
「受注デヲ J(
デ
ー
ヲ
名 TRANSACTION、外部キ‑:
r
商品小分類コード」、「ユーザー IDJ)

ピ比三笠艮そ型及型塑主注目盛山山隆戸坦吐血主ラ塑
l
唱

1
2
0
0
9

直一

)OÛ~

川喜一

2
0
0
9
2
0
0
9

・

1

I

9
9
0
5
弱
9
9
0
3
7
5

マ

2
3
4

三一 1
'
"
凹

附

f
顧客マスヲJ(
ヂ
ー
ヲ
名 CUSTOMER、
主
キ
|銭]4;綴立}ザ咽 k品世間ゆ隼圃|必年~

刊5

2

5
5
5
4
9
5
3
7
5
刊5

2

9
¥
2
1
9
6
1
5
1, 1
0
1
0
0
8
1
0
7
9
3
6
1
1
0
1
0
0
8
1
2
1
9
6
4
9
1
0
1
0
0
8
1
5
1
9
9
7
5
1
0
1
0
0
9
1
2
1刷 11
0
1
0
0

『ユザ IDJ)
k
弘章種産分民与実証方法 k
与聾合
Hi
弘

働佐南

国

e

登量目│

同一ーボす7百r一一ï曹官一一一一一一

γ30::tfぐ…骨子一一一← lレJ ,-~一一百-;:::-…浦和明日i面市
jfili--- 荷107而Y↑ B"

川 孝 円0
1
円‑'‑‑.J!!.生
r.‑110118
女性
'
0
1
2
'
開田害
崎
川引 2
8
j
貫
性

5450才 代
1910才 代
6560才 代
6960
才代

[
(
,

サ}巴ス

銀行指地

柚 b

製造

現金代引き

友人

佐賀県佐賀市
静 岡 県 兵也市

金融

銀門相込

製造

銀内Jìí~

縫詰
柚b

宮城県仙台市
能本県能本市

「
商
品
マ
ス
イ
,J(デーヲ名:PRODUCT、主キ‑:r
商品小分類コードJ
)
k
島 田 空 母 恒 自 白 血=
"
1

│勝倒防分骨ゆ醐,1<;畑
川

l
'
ゆ

川
団

附"

1
I
F
o
o
t
F
o
o
t
w
e
a
r
1F
o
o
t
w
e
a
r
1F
o
o
t
w
e
a
t
1F
o
o
t
w
e
a
r
守

7イハイキンタ
デイハイキノタ
デイハイキンヴ
デイハイキン"
デイ }\1 :f~担

9
1
2
3
9
6
6
5
8
1
2
3
9
6
6
7
9
1
2
3
9
6
6
9
8
1
2
3
9
6
7
1
8
1
2
3
9
6
7
3

‑
9
0
‑

J

2
0
1
0
/
0
7
/
2
9
2
0
0
8
/
0
5
/
0
9
2
0
1
0刈 9
/
2
5
2
0
0
9
/
0
7
/
0
7

101.
[beta]
一
一
一
一
‑
会 WlJ9

i

│臨政府・問、大学

分析プロセスフローの完成殴

2 回品田義凶器島

一隆一一⑦

骨髄

一割喧⑥

/

骨⁝⁝一世

斗伊④

~

ノ〆

S応 レ ポ ト

ロヲス引の固
帰分併

⑥「受注データ

J
r
顧客マスタJ
r
製品マスタ」在結合{チータ加工}

②縦持ちの商品中分類データを横持ちへ転置(チータ加工}
③

2値の健在持つ、締士服購入フラグを作成(データ加工)

④回帰分析で、商品購入に影聾する属性を特定し、顧客毎の贈入確率を算出(分析}
⑤締士服踊入確率をJ
tーセシトヘ変更(デーヲ加工)
⑥プロンプトの設定で、締士服贈入確率と性別の条件設定(データ加工}
⑦ターゲ世トリストを Excelヘエクスポート

!臨甲府自治体

•••••
•••••
•••••
園醒彊圏E

デ叩タ灘駅

分続周に加工

採量1&
分析

総康

• • • •
悶ゅ

'
I
"

!
'
L
I
:
;W

,需Ia‑

即 ' t '< O A

ー鴎ー

‘出~-

路『

、 肺

' " 町 哨 … ・ 円 叩 叩 叫 割

StoredProcess
として配布

・悶‑

‑
.

齢
‑
主1
蓄
ち
雪
量ζト

I

I

:
コ
ー

SASEnterpriseGuide
で、生成されたフロセスフローをパッキングし、
オフィスツフトからセルフザーピス裂の配信と共有が可能

業 SASQ
問 問 Analytics
ライセンスが必聖

‑
9
1
‑

品

輸輔卿制

品一

③

②

(
!
)

轟
固
⑤

ヨ
ノ

102.

|医療政府開鳩山肌弘の実証 SAS~-"'-総会 ~ll~9 SAS ⑧O 仔i c eA n a l y t i c s 1 .M i c r o s o f tO f fi c e か8あ8ゆるデータへの直鍍アクセス、分析が可能 2 . カスタム処理(*ストアドフ。ロセス}の実行ζ lより複雑な処理E を実現可能 3 .O f f i c e の機能と連携により、レポーテインタ業務を自動化・効率化 匿療政府開大一一テムの実証 ~9 ~The Powert oKnow⑧~ ‑ 9 2・

104.

2品 、

105.

基礎自治体の SNSを活用した情報発信の有効性の評価 有馬目宏 兵庫県立大学応用情報科学研究科 E v a l u a t i o no f E f f e c t i v e n e s so f l n f o r m a t i o nP r o v i s i o nbyL o c a lGovernmentst h r o u g hS o c i a lNetworkingS e r v i c e s r i ma M a s a h i r oA G r a d u a t eS c h o o lofA p p l i e dI n f o r m a t i c s, U n i v e r s i t yofHyogo 要旨 近年, T w i t t e rや Facebookなどのソーシャルメディアの普及を受け,また東日本大震災で果たしたソ ーシャルメディアの機能の有効性を受け,自治体においても,①情報の新たな発信手段の確保,②双方 向コミュニケーションの特性を活かしての行政の説明責任や広聴による住民の地域行政へのより深い 関与,③地域キャラクター(ゆるキャラ)からの情報発信を利用しての観光・訪問客の増加,などを目 的に,広報・公聴の媒体としてソーシャルメディアを導入する動きが見えはじめてきている.しかし, 自治体でのソーシヤルメディアによる広報公聴は,より多くの住民へのリーチやより多くの住民による エンゲージメント,さらには地域理解やコミュニケーションによる QOL( Q u a l i t yo f L i f e ) の向上に資す る可能性がある一方で,情報漏洩・プライパシー侵害・信頼性損失・風評被害などのリスクも含んでお り,実際に住民がどれだけの効用を得られるかについて,さらにはリスクの評価についての定量的分析 は全く行われてはいない.そこで,自治体でのソーシャルメディアを活用した広報・公聴が住民の効用 水準をどれだけ増大させうるか定量的に把握するために,選択実験と仮想市場法 (CVM:C o n t i n g e n t V a l u a t i o nMethod) の手法を用い, 2014年 3月から 4月にかけて全国を対象とするウェブ調査を実施し て , 5, 005 サンプルからの回答を得た.本発表では,この回答データに基づき,自治体からのソーシャ ルメディアを活用した広報・公聴活動が住民にどのように受容され,どれだけの効果をもたらすのかに ついて, JMP ( V e r . l l .O . O ) を利用しての分析と定量評価を試みる. キーワード:基礎自治体,情報発信, SNS,有効性評価,ウェプ調査,選択実験,仮想、市場評価法 1 . はじめに 近年, T w i t t e rや F a c e b o o kなどのソーシャルメディアの普及を受け,また東日本大震災で果たしたソーシャ ルメディアの機能の有効性を受け,自治体においても,①情報の新たな発信手段の確保,②双方向コミュニ ケーションの特性を活かしての行政の説明責任や広聴による住民の地域行政へのより深い関与,③地域キャ ラクター(ゆるキャラ)からの情報発信を利用しての観光・訪問客の糟加,などを白的に,広報・公聴の媒 ‑ 9 5・

106.

体としてソーシャルメディアを導入する動きが見えはじめてきている.実際,佐賀県武雄市では, 2011年 8 月 1日より公式ウェブサイトの全てを F a c e b o o kに移行しており,災害時の情報発信のチャネル確保や地域へ の関心の喚起などの目的で武雄市に追随する自治体も動向を見極めて今後は増加していくものと思われる. しかし,自治体でのソーシャルメディアによる広報公聴は,より多くの住民へのリーチやより多くの住民 によるエンゲージメント,さらには地域理解やコミュニケーションによる QOL ( Q u a l i t yo f L i f e ) の向上に資 する可能性がある一方で,情報漏洩・プライパシー侵害・信頼性損失・風評被害などのリスクも含んでいる. また,これまでにも,地域 SNS ( S o c i a lN e t w o r k i n gS e r v i c e ) への期待と「立ち枯れ」化という現状があり, これらのソーシャルメデ、ィアを活用した地域の振興や自治の発展への期待が,地域 SNSと同じような道を辿 ることは避けなければならない.そのためには,ソーシヤルメディアの自治体による活用の可能性(自治体 内の地域住民と自治体外の潜在訪問者にもたらすメリット)と課題(プライパシー侵害などのデメリット) を定量的に把握しておき,コストと効果の観点からの事前評価をきちんと行っておく必要がある. ところが,このような自治体によるソーシャルメディアの利活用に伴うメリットとデメリットの定最評価 に関する研究は行われてはいない.そこで,本研究では,自治体でのソーシヤルメディアを活用した広報・ 公聴が住民の効用水準をどれだけ増大させうるかを,選択実験と仮想市場法 (CVM:C o n t i n g e n tV a l u a t i o n M e t h o d ) の手法を用い,全国を対象とするウェブ調査を実施して,定量的に評価することを試みる 本研究により,自治体からのソーシャルメデ、ィアを活用した広報・公聴が,自治体内の住民と自治体外か らの潜在来訪者に分けて,どれだけの効果をもたらすかの定量評価が初めて可能となる.その結果,ウェブ 調査というサンプルの偏りの面での問題はあるものの,逆にウェブ調査であることを活かして,当面のソー シヤルメディアの潜在的積極利活用者であるインターネット利用者を調査対象とする調査結果から自治体の ソーシャルメディアによる広報・公聴活動のメリットとデメリットを金銭的に定量評価することが可能とな り,ソーシヤルメディアを利活用する施策立案および政策評価に向けての基礎的データを提供できるものと 考えられる. 2. 研究調査の方法とその概要 自治体におけるソーシャルメデ、イアの一つである地域 SNS ( S o c i a lN e t w o r k i n gS e r v i c e ) の利活用は, 2004 年の熊本県八代市の「ご、ろっとやっちろ」の成功事例を受け,さらには総務省や財団法人地方自治情報セン ターなどからの支援もあり, 2005年以降は全国の自治体に広がる傾向にあったが, 2010年頃には,運営コス トを上回る効果を生んでいるかという経済性の問題やユーザ数やコミュニケーション数の減少による「立ち 枯れ化 Jの問題が顕在化しはじめていた(庄司 (2009)). このような状況の中, T w i t t e rや Facebookなどの民 聞が運営する新しいタイプの SNSが提供されて普及しはじめ,これらのソーシャルメディアの民間企業や NPO法人における利活用の成功事例,特に東日本大震災での SNSの果たした役割とその有効性の認識に基づ き,自治体が自前で地域 SNSや公式ウェブサイトを提供するのではなく, T w i t t e rや Facebookなどのソーシ ヤルメディアをプラットフォームとして,より多くの住民へのリーチとより多くの住民からのエンゲージメ ントを目標に,積極的に活用されていくであろうことが予想されている. 一般に,自治体でのソーシヤルメディアの利活用は,谷本 (2013)によれば,①ブロードキャスト型,② キャラクター型,③限定コミュニティ型に分類されるが,本研究では,まず,全国 1 , 742 の市区町村ならび に 47都道府県の公式ウェプサイトを対象とした目視での悉皆調査を行うことで,自治体のソーシャルメデ、イ ア利用の有無と利活用のされ方の分類による現状把握を行った.その結果, 20日 年 12月 8 日時点、で,全国 ‑ 9 6 ‑

107.

の1 , 719の市町村では, 14.5%の 250市町村でツイッターによる情報発信が行われており, 21 .2%の 365市町 村ではフェイスブックによる情報発信が行われていることが確認できた.なお,我々の目視調査では,自治 体からフェイスブックとツイッターで発信される情報が防災・安心・安全に関連する情報に特化したもので あるかどうかもチェックしているが,防災・安心・安全に関する情報発信に特化してツイッターから発信し ているのは 1 8自治体,フェイスブックから発信しているのは 1 4自治体であった. 一方で,ソーシャルメディアを介しての自治体による情報発信や情報交流について,住民がどのように利 用し,どのように評価しているかを把握するために,ウェブ調査を実施した.ウェブ調査では,回答者に偏 りが生じることは十分に承知しているが,自治体のソーシヤルメディア活用による情報発信ならびに双方向 コミュニケーションの最初のターゲットと想定されるのは,インターネットやソーシャルメディアの現時点 での積極的利用者である.したがって,ウェブ調査であるがゆえに,自治体によるソーシヤルメディアでの 情報発信の受容の実態の把握や自治体のソーシャルメディアの利活用におけるメリットならびにデメリット の住民による評価が適切に行われると期待できるのではなし、かと考えたのである. ウェブ、調査の実施にあたっては,筆者も学識経験者として参画していた地方自治情報センター ( 2 0 1 3 )な どの類似の調査の調査票を参考にしながら,①住所(都道府県・市区町村・郵便番号)・性別・年齢,②居住 年数,③住居の形態と所有関係,④世帯人員,⑤家族構成,⑥職業,⑦インターネットの接続状況,⑧利用 している機器,⑨ SNSの知名と SNSの過去と現在の利用状況・利用頻度・利用 SNSおよび利用しない理由, ⑬インターネットの利用年数,⑪インターネットでの商品・サービスの購買状況,⑫市区町村からの広報紙 の閲覧頻度,⑬市区町村からのチラシや回覧板での知らせの有無と閲覧頻度,⑭居住している市区町村のウ ェブサイトの閲覧頻度,⑮居住している市区町村のソーシヤルメディアでの情報発信の状況と閲覧状況,⑮ 居住していない市区町村のソーシヤノレメディアでの情報発信の閲覧経験,⑪20分野に分類した地域の情報項 目ごとの情報獲得状況と 1 1のメディア別の情報獲得媒体,⑬情報の提供媒体と提供内容と利用料の 3属性の 各水準の組み合わせによる仮想、の地区町村からの情報提供の仕組みに対する利用するかしないかの 2項選択 と 5段階評価と順位づけによる評価,⑩自治体がソーシャルメディアを利用することで発生すると思われる 情報漏洩や無断書き込みの恐れのある情報および名誉棄損に対して求める損害賠償額と市区町村が賠償支払 いのために支払ってもよいと考える保険料の額,⑫自治体のソーシャルメディアによる情報発信への賛否, の 20の設聞から構成される調査票を設計した.その上で,サンフ。ルについては,総サンフロノレ数は 5, 000以上, 200サンプル以上,年齢は 20歳以上を対象として, 30歳未満, 30歳代, 40歳代, 50歳代, 男女でそれぞれ 2, 60歳以上でそれぞれ 450サンプル以上, 47の各都道府県のうち山梨,佐賀,福井,徳島の各県は 20サンプ ル以上,高知,島根,鳥取の各県は 1 5サンフ。ル以上,それ以外の都道府県は 30サンプル以上を確保すると いう条件で株式会社データーサービスに調査を委託し, 1自治体からのソーシヤルメディアによる情報発信に 関するウェブ調査」というタイトルで 2014年 3月 1 5 日から応募型で調査を開始し,サンプルの条件が満た された 4月 25日に調査を終了した. 005であり,都道府県別では, 613サンプルの東京都, 413サ ウェブ調査で得られた有効サンプノレの数は 5, ンプノレの大阪府, 402サンフ。ルの神奈川県がサンプル数の多い都府県であり, 22サンプルの佐賀県と鳥取県, 23サンプルの福井県がサンフ。ル数の少ない県となっている サンフ。ルの性別と年齢と職業ならびにインター ネットの経験年数別の構成比率は図 1に示すとおりで,男女の比率はほぼ等しいが,年齢別に見ると 50歳以 上は男性が多く, 40歳未満は女性が多いというサンプルの偏りが見られる.また,インターネットの経験年 数では 1 1 0年以上 j が 73.6%で最も多く,男女の比率もほぼ等しいが,経験年数が 1 0年未満では女性の比 率が高いという傾向が見られる. ‑97‑

108.

唖二二三二二二三j鵬 9 その他 6. わがらない 8 . 退職後年量生活 5 . 5 . 10 年以上 7 踊職 6 . 家事専業 5 .宇生 3 . 3年以上 5年未満 2 . 1革以よ 3年来満 1 . 1年来満 揮ご二一一ごゴ !画「一一一一一ゴ 制約六議醐制帰 ν弗 V毛 却 2526 0.50470 9 0. 4 9530 5 51 .00000 0 ∞ 1 告 計 畑 値N Z水 準 桝槻桝税制部、脳 ぬ脇 田 10 . 1 0 8 0 桝 233 0.04676 439 008810 702 014088 85 0.01706 942 0.18904 385 0.07726 294 0.05900 77 0.01545 4983 1 .00000 1092 山 18 1395 0.27872 川 1叩 596 較~49ど9歳 川町川9 緑 目 目 語撚ポ穂 l 印 日 出28 174 0.03477 .00000 5005 1 究測値 N 0 6 水準 究測値 N 究測値N 12 6水準 22 9水 量 図 1 自治体からのソーシャルメディアによる情報発信に関するウェブ調査のサンプル構造 4 . 0 % . タブレット端末が 1 7 . 6 % . スマートフォンが 41 .8%. なお,回答者が利用している機器は. PCが 9 携帯電話が 41 .2% (複数回答なので合計は 100%を超える)となっている. 3 . 自治体から発信される情報の入手の現状 自治体からは,住民に向けて,さまざまな媒体を通じて,様々な情報が提供されている.本研究では,自 治体が住民向けの情報を発信する媒体として,①広報紙,②議会だより,③チラシ・新聞折り込み,④回覧 板,⑤ホームページ,⑥ツイッター,⑦フェイスブック,⑧防災行政無線,⑨テレビ・ラジオ,⑮地域のケ 1の媒体に分類し,自治体から提供されている情報を,①市区町村の総合計画・ ーブルテレビ,⑪新聞,の 1 施策情報,②財政情報(予算や決算など).③議会情報(開催日・議決事項など).④イベント情報,⑤保険 情報(健康保険や介護保険). @福祉情報(高齢者や児童の福祉の制度など).⑦戸籍・住民票情報(申請・ 届出など). @統計情報(地区別人口など).⑨健康情報(インフルエンザ発生状況など).⑮安心・安全情報 (ひったくりや痴漢など).⑪平時の防災情報(消防・救急を含む).⑫災害時の防災情報(警報や避難情報 など).⑬公共工事入札情報,⑭教育情報(幼稚園・小中学校関係の情報).⑮文化・歴史情報(文化財や郷 土資料など).⑮ごみ収集情報(回収日や回収場所).⑪公共施設情報(開館日や場所).⑮観光情報(観光ス 0の分野 ポットの紹介など).⑮公共工事実施情報,⑫地域情報(新聞・テレビ報道も含む地域の話題).の 2 に分類して,情報の入手状況を設問している. 自治体においては,広報・広聴活動の主たる媒体は広報紙(議会に関しては議会だより)やチラシ(回覧 板,新聞の折り込みチラシ,ポストへ投函される案内チラシなど)であり,インターネットの普及に伴って 公式のウェブサイトを設けてホームページからの情報発信も行われている.そして,近年のソーシヤルメデ ィアの利用の広がりに合わせて,ツイッターやフェイスブックでの情報発信を行う自治体も増え始めている ‑ 9 8・

109.
[beta]
,I
市町村ワx7
1
t
イトの閲覧祇況

;市町柑か6の知8世

     鍋底

i

一一一一一一一一一一一一一一一一一一一一一
8 見にいかない

6.配布されていない

? 災害発生時・イペン

6 見はい

5
. 見ない
6 ほとんど毘ない

4
. たまに目を;aす

4 ほとんど目を過さない

5
. 1ヶ月に 1回程度は見る

3 目を過すこともあれば目を過さ怠

4. 1ヶ月に 2・3固は見る

いことちある

止と智どき目を過す

3 週に 2回は見奇
2 ほとんど目を過す

2
.I
まぽ毎月、目を過す

2 週に 2 ・3聞は見る
1.いっち目を通す

1.毎月、目を過す

1
.1
まl
ま毎日見る


1

度積

由.

水..ど、

鹿.て

し朝、前町

1954 0.39166
1126 0.22570
800 0.16035
495 0.09922
329 0.06595
142 002846
143 0.02866
4989 1
.00000

2
.1
まぽ毎月主由季連防



'1'.ときど開明?と

4.  1
;
:自を湾、
寄.目を通さ怒川ごとが多も k

6
.見怠い



 4

β



7
.a
:
;
績低が配布寄れてい怠い

 ;
欠澗値 N




;



会園舎

1409 0.30184
1212 0.25964
1088 0.23308
256 0.05484
61 0.01307
642 0.13753
.00000
4668 1

7
. 1)1奮発生時 ψイ

肘可思!ユゑ投獄収
合計予

1
6

  値N

7水準


"
'

制合

71 0.01422
102 0.02042
137 0.02743
416 0.08330
728 0.14577
1712 0.34281
1253 0.25090
575 0.11514
.00000
4994 1

11

R

図 2 自治体からの情報の閲覧状況(広報紙・チラシ・ホームページ)

F

654
はは

12

11

審問削制調書
'
S
E
E
‑
‑
z

j

・
時'

ど

鵬るる
ト見見

︑J

い引蜘曜日

+6

に

な時見
か生どにに
い発ん月月
に寄るとケケ
見災見ほ

r3

n
u

7

民草紙Eeムヤ‑
bhHhu茸E悟

87

津信自浄吟φ
岳N日
E
よj
切望号ー

吟

5 わからはい
4. SNS
による情報発信 l
a
行っていな

、

L

3 ツイッタで情報発信

2 フェイスブックで情報発信

1.フヱイスブックとツイツターで情
報発信

f
直
面γ一一一一一一一一…一一………
柳川 ぷ》デ学内ィ弁.隊、帥
ι

時フI.':f':J..,::{\)li:!c.~.þ~,併で情開価
ι
2与フェイスブ沙クで情線発信
3
らそツイッタで情報発信
'
4
'
. SNSIこよる情緒発信は行ってい訟い
5むねか6はい必 ト … ぷ £ い ゆ

265 0.05295
133 0.02657
146 0.02917
837 0.16723
3624 0.72408

飾品小叩…刊で…ふい

5005 1
.凹 回O

尽

出

r
、

欠測値 N

広報紙閲覧鎖度

0

5水 揚

図 3 広報紙の閲覧頻度とホームページの閲覧状況との関係

図4

S Mでの情報提供の認識

のが現状である.これらの 5つの媒体(広報紙,チラシ,ホームページ,ツイッター,フェイスブック)の
うち,広報紙とチラシとホームページを通じての情報入手の有無や頻度に関しての回答結果をまとめたのが
図 2であり,自治体から住民へ届けられるという意味でプッシュ型の紙媒体である広報紙において「毎月,

.7%,閉じくプッシュ型の紙媒体であるチラシを通す」
目を通すJ と「ほぽ毎月,目を通すJを併せると 61
6.1%であるのに対して,住民がアクセスをしなければならないという
と「ほとんど目を通す Jを併せると 5
意味で、プル型のホームページは「ほぽ毎日見る Jから r
1ヶ月に 1回程度は見る Jまでの比率を併せても 29.1%
であり,広報紙の閲覧頻度とホームページの閲覧状況との聞のモザイク図である図 3に示すように,広報紙
をよく見る回答者がホームページもよく閲覧するという補完的な関係が窺える結果となっており,ホームペ
ージが紙媒体を代替するには至っていないというのが現状である.このような状況に対して,ソーシャルメ
ディア (SM) を通じての情報入手に関しては,図 4に示すように,居住している自治体がフェイスブック
またはツイッターあるいはその両方によって情報発信をしていると認識している回答者は 10.9%であり,自

‑99・

110.

表1 2 0の地域情報の分野別の情報入手状況(上は回答者の属性別,下はメディア別) 13710一79193一70)84一5w27836‑4 11t11⁝ιιι止し一札止nhL一生一t4.141一7 88787n76677一7j63)56‑87647‑l 抽 ‑ 只 守 e i q d ⁝ つ 白 唱 白 ) A 崎 山 勾 i⁝nd⁝Qfnhu⁝Q1GU)RMaunvQd一 s Mq白組崎司t‑ηL t4.一11ι⁝L1一旦げ止一丘一1t1L‑一弘ι11t一辺 auponbQUFhduaU4(A崎⁝po⁝民duFbjnbつha po‑ntFDFDqopa‑F︑ か 5﹄JA﹄一13﹄⁝3一1一5⁝J3jFbf一︐A﹄‑A一︒4A一一引 34184⁝9208r3H51451一636一7274 75574一4444⁝4H445234一754一2j5一し ヴ 幽 ﹄2243一1﹄5﹄A一五五A﹄﹄一11J﹄一﹄一一出 b(4⁝14‑qU FbjnbjnuauqLuρb'白にdj dqdU03QU一今白円tFD由民U A 可n 6 4 4 7 4 一 4 4 3 4 j 4 3⁝4⁝233一75425‑L ト ︽ JIB‑﹄A一J﹄﹁JbJ一J一五一﹄35一nnB(1一J⁝nb一位 U 向υ1hkd内bound崎nun4Fb'luRuqL)勺GQd1A自のu 良 υkuzd⁝QO O 64374一4434j44t u一4 23(3一744j2j4‑L リ ト 一 一 ヴj マ‑auauqdnbnauQU勾tqdn︐白川マ﹄一nu ヲ n o ‑ bFhdQuphu⁝FO‑‑A et QUL‑‑t⁝ιιιι1一1jh札止正Q山一正弘4丘一1一一4 斗 dq︐ ρhuqd quqdqG4nJHqdqd勺ゐ円 δ ワ之内04A崎︒︐U4‑zU 8q ︽ A﹄﹄21⁝ARJA(﹄J一aA3⁝J﹄﹄一︒J﹄Aj﹄一J一円 57)207⁝267一28日2一9⁝5ι2j9‑7518⁝5‑4 6一4⁝4一84一5¥4一3 5 4⁝44243一755一25一丸 ト!?:↑ j } ; ; ! ; ト ; 十 4412 };f: AJ﹄JA一J⁝﹄⁝J A⁝A一﹄1)﹄AA一1dAZ⁝﹄A一部 Qd1i bFbn︐tFO(au Qo⁝区d一1Antiヮ!qd4⁝QOF‑‑Qoqo向︒Qd‑F0 65474一4一3 3⁝4一4⁝44 233一74424一qh AJ(﹄﹄﹄一五(5Jー﹄一﹄一﹄﹄⁝A53一23AjAj‑‑一山 ヲ sQJA叫勾tFDM069白aujQdA崎問︒ゐQu⁝A‑auau司泊地(1Anf(円tqG‑nυ 64474一44344一44一233一7542)5‑FL ⁝)一一一題一 ー一日一一)一劃一 一なj))一ど駒山J一の一 一度一宮円J一一な一ー剤以一域一 r M一 ¥っし州一治判脱出一慨ー制一︑即日ん同一 地畑一配捌一祉制状醐⁝拾鵬臨時一場)一な剖一 昨つ一軌跡一福出⁝性一対創明ー棚一慰問所一介ー⁝酌一 一 問 問 朝 団 一 の 尽 山ω一時一例⁝⁝開問一判一時一四時紹一時一 嶋一日刊日阿部品⁝静市一点間一時一階一村一剛一刻印同⁝市一 間一軒催一糊⁝齢一一一一剛一川駅⁝紘一何情一畑一献一問問削情舟一 説明器開町一紘一昨⁝報開一紘一 時一附輔間一開閉山山知設一山間⁝開一担問耕一一⁝一 叫川一日明報開捕⁝輔ー師報一報一封一明開芳明刷一澗同報一事報一主 即⁝他県佐川一情 ι 静 111情一情ゆ⁝引時一主管町一収痴情一午滑一教 ヴ AA J ャ ー ー 一 ︒ ︐ u ⁝ q d ) A ‑ F U F p b tQQQJ⁝nUHE且⁝︒ゐqd泊斗RUFβb円tiau⁝QRnυ‑AM j⁝中1HIll‑‑ 1 1 1 一 1 2 ‑ザ ト ︑み‑46j司⁝目︑J‑kd‑ t A 2 一 2 4 J ‑ 9 9 0 4・5M7!7761Lごb60374A‑o‑ ロ E F弘正日一向 山内乱1m1⁝白411ιt一1111ω‑A‑ 叩 L J11j﹄⁝J一nb一nfJ一J A一Z一﹄⁝5⁝﹄﹄一五﹄A﹄﹄一山山一 l I l I一 C 一⁝ FI ⁝⁝ 1 ⁝ l 一 I 2 一一 40 一E 一ll l l一 一0 f12 2E 0E 6 一一 F日 U一 EE 一 lj 4一4 F一 L 一 0 一︒ ⁝︒ 一 2 0一 ⁝E 0 一 L ふ一 一一二三二⁝⁝ー3一 P b 向 4 y q ︐ U ) Q d 一 t・ dn︐!H‑oυ‑ P 1 A 1Aqd⁝qd⁝auF14⁝勾4⁝oyq︐創刊OMTiQd 広 ιJ1⁝L一ω一1一1一L1⁝ι一ι一tt⁝1一1一LL一1Lm一切一 11 仲 幽 ﹄J⁝J⁝JiiA一2⁝111一﹂一Z⁝﹄一J22一5432﹄一一川一 O ⁝ 一︒ 01 一︒ ︒一 一︒ 一2 3一 一︒ ⁝︒一︒⁝00一ou︒一町一 b E 一︒ ⁝ り⁝山 内 一⁝m 吋︒町 ⁝ ⁝一一 A5h E ⁝⁝一一一⁝一一一一一一一一5一 G υ 一 1 A ⁝ 1 4 ⁝ t A n u ‑ q & 竹 内 ︐ h 一 n 4 吋 q u h q u 目 ︒⁝ 凋 守 ⁝ ' A ( q L q 白 h q 白 q d R u q ' U P U ‑ n u 目 札⁝弘一角比一札し一札一札一札一札一札一仏一札一札止札一札止札札止‑A一 山一‑一一一一日叫⁝hEFhd‑ ⁝⁝⁝ ll一⁝一:一ー⁝ ⁝ ー ⁝ 一一ー一⁝lillー一5一 41⁝I⁝2 8一1一1⁝27u⁝6一4l⁝oYA一31⁝23516‑山一 札一札一札一札札一仏一臥 弘一肌一札一札一L一札一札止一札凪仏札札‑A一 ⁝⁝ 一一⁝叩⁝一一⁝⁝一一一一5一 8i⁝i⁝‑14一!⁝ELF⁝}⁝}一2一 γ 一L843Jh'一目一 川 一 山日一 U一日⁝ル一日⁝山日一町一日一 M⁝U⁝ U一即日一出町出 U M 一 り 士b djF3hnd 4H'i'ijEDaH‑n40406cot‑nq︐ujFhuO白Fhυn4haHphun4P︒aaz‑AUm 日正j正⁝1崎山一4ιL(丘ぼ一1jF札一LR山正一市川111t‑nJ‑ 一日j一ル‑Fhd‑ ヴ kuQUQてQ d t H 一 ︒ ︐ u dqd4Fhυ qゾqd⁝1Aヮ 守主4!?'4Fbod‑AE au‑A1AE且Li一quq41Aη4qu一内4q︐ 一︐且︒︐ n︐白山口Hqt A斗tiAmfA‑ ﹄﹄一﹄⁝nb2一83056⁝6⁝6⁝084一26410一日山一 HHjUjm正一L11LL一L一L(1LL一1LjL11一ゆ一 ﹃ 宝 弓 J一A一AAA一1⁝3j一﹄一﹂一Jj一ZA1⁝315﹄J一ω一 つ白nhvnbqo74ワゐFhuauQdjηGMFbj4Fbnb︒OMFDA噌守t勾dau‑nv‑ 53一325一332一2j2一2一2一122一43212‑5 弓 A1⁝﹄﹄﹄一55i一﹄﹄一﹄﹄﹄五﹄一23AA2一一山一 dnda‑円tkd‑︒︒︒400一n3A崎町︒︐uo︒A崎QUOOUA崎︐Rnt守4︒︐u‑nu‑ FU4⁝4勾44‑44qd44uA Aワ‑qu内dH dFba‑q'‑po‑‑‑ 一料品一畑一臨剛一品⁝報畑一情説⁝個同町一間断一一 WL 一)一一一ー一一一題一一 一ど一一一)一一υ一話‑一 一一均一つ⁝vf一和的一⁝⁝初一一 一一一度j一乞つ一ιなん以一一!ん域一一 )一一哨)ソ⁝脱却一日山輔副一般)一つ一地一一 世一的約一同校一均衡一間一億山町一所一いぜ一地一一 槻一位盟山中剛一出醐⁝時師団一期)去一知山一一 情つj樹保精一拙う性規制吋岨榔一昨剛一所介一酌一一 開閉朝団制晴間⁝時一日救一附学一切⁝叫場紹輔一一 町一刊時j中間引開同⁝湘一一 伯比嗣サ一直静比一 一一 叫一明一諮問山口⁝ 品報山一町駅 υ 4 哨明一明報崎一湖澗畑山蛸⁝巾日開問ー幼信一報報観輔棚一一 仰駅間開附一附田川町⁝恥針⁝山川端臥(則一緋捕時時時一一 山中点一組畑中盟問問中叩⁝古一一防叫市紘一町一集一盟主事一主一 川河畔一指⁝叫円滑一品砕け骨一昨ベ一の一時在情 J ⁝ J 脳指静江昨一敬一 宮崎一臨調一社籍清⁝晴町一め一噂一定洪清北一 Mmt 一一味士一峨一切一 唖敬一 A 巾財一議や保一福戸統一健一安一平災公教一文一ゴ}公一観一公地一ヅ一 L2‑nJ(45一6978r9 一 口 吋 152J34一5アかヂ4ijg 90一︑一 ‑100‑ 60歳代 70歳以上 5 0歳 代 40歳 代 3 0歳 代 n暖味勲会一ん議ぺ中倒誠一一福地一鳴一計戸謙統一)戸飽⁝心安一一鳴割注⁝目災公教清(識文別一一也ご︑公光観一一也公︑⁝⁝誠地一一hプw 3 l M ー│す l i i │訪問レ│新聞 │広報誌 怠│品│吋土二 全体 \~ 年齢 │ 性別 I 20歳代 i 女性 男性 全体 一 一 一 一 一 一 一一一一一一一一一 治体のフェイスブヘJ ノクに登録して閲覧している回答者は1.3 % .登録はしてはいないがフェイスブックを閲覧 .9%. フォロワー したことがある回答者は1.0%. 自治体のツイッターのフォロワーになっている回答者は 0 ではないがツイッターを閲覧したことがある回答者は1.1 %にとどまっており,インターネットやスマートフ ォンの積極的ユーザと考えられる本ウェブ調査の回答者の間でも,ソーシヤルメディアを通じて自治体から の情報を入手している回答者の比率は非常に低いというのが現状となっている. また,表 1には. 2 0の分野に分類した地域情報の分野別の情報取得状況を回答者の属性別(性別と年齢別) と1 1のメディア別にまとめて示している.表 1から,住民がよく入手している情報は,①イベント情報(77.9 %).②ゴミ収集情報(回収日や回収場所) ( 7 4 . 2 % ),③市区町村の総合計画・施策情報 ( 6 7.4%).④地域情 報(新聞・テレビ報道も含む地域の話題) ( 5 2 . 2 % ) . ⑤公共施設情報(開館日や場所) ( 51 .9%) の順であり, 一番低い公共工事入札情報でも 24.0%の回答者が情報を入手していると回答している. 入手する情報に性別と年齢別で差があるかどうかについては,性別に関しては F i s h e rの正確検定を,年齢 別に関しては P e a s o nの χ2検定を適用して検定を行った.その結果,年齢別では,表 1からも年齢が高くな 0の全ての情報分野で. 1%有意水準で有意差が認め るにつれて情報の入手率が高くなる傾向が窺えるが. 2

111.

利 ( 1 用 ) コ 。 可否 提 情 供 報 媒 の体 す 土 提 情 供 報 内 の容 提 情 供 報 費 め用 i J ; i j 誌 日 手 用 す る1 1用 手 な し 1 1 、 L 重油画付き 2 フェイスブック 文字情報のみ 1 ∞円/月 2 0 0円/月 3 ウェブサイト 静止画付き 担料 ツイッ合一 文字情報のみ 無料 5 フェイスブ、yク 静止画付き 1 口口円/月 6 ウェブサイト 動 画f 寸き 2 ∞円/月 ツイッ台ー 静止画付き 2 0 0円/月 8 ウェブサイト 文字情報のみ 1 0 0円/月 9 フェイスブック 動画付き 無料 4 7 性別については,統計情報,平時の防 災情報,災害時の防災情報,公共工事入 札情報,文化・歴史情報の 5分野で有意 差は認められなかったが,公共工事実施 、 L ツイッ合一 られている. 。 。。。 。。。択 選 。。。。。。。 選 択 。。。。。。。択 選 。。。 。 。。。 選 択 。。。。 。。。択 選 。。 。。。択 選 。。。択 。。。。 選 。。。 。。。。 選 択 3 。。。。 。。。 選 択 ' . v v ,、 v 》 010 有意水準で,それ以外の情 情報では 5% 報分野では 1%有 意 水 準 で 男 女 間 の 情 報入手率に有意差が認められている.な お,男女間で有意差が認められた 1 5の 情報の分野の中で男性の入手率が女性 v の入手率を上回っている分野は,市区町 》 村の総合計画・施策情報,財政情報,議 図 5 選択実験の 9つのプロファイルと回答画面 会情報の 3つの分野だけとなっている. 分野別の情報を入手するかどうかに は,性別や年齢だけでなく,家族構成や 職業などの属性も影響を及ぼすと考え られるが,本稿では紙数の関係で割愛する. 4. ソーシヤルメディアによる情報発信のメリットとデメリットの評価 自治体でのソーシヤルメディアを利用しての広報・広聴(公聴)活動は,谷本 ( 2 0 11)が指摘する即時性, 公開性,双方向,コスト削減というメリットに加えて,情報漏洩・プライパシー侵害・信頼性損失・風評被 害や住民間での情報格差の拡大などのデメリットも存在する.しかし,これらのメリットとデメリットが定 量的に評価されたことはなかった. C o n t i n g e n t そこで,本研究では,メリットについては選択実験の手法を適用し,デメリットについては CVM( V a l u a t i o nMethod,仮想、市場評価法)の手法を適用して.メリットとデメリットの定量評価を試みることとし た. 具体的には,メリットの評価に関しては,①プラットフォーム(フェイスブック,ツイッター,ウェブペ ージ),②提供情報の内容(テキストのみ,写真やイラストなどの静止画付き,動画付き),③費用分担(無 料,月額 100円,月額 200円)の 3属件: (各属性の水準数は 3) による選択実験により,全部で 27の組み合 わせの中から実験計画法のカスタム計画を用いて選択した 9つのプロファイルを提示し,各フ。ロファイルに 対して I 利用する」と「利用しなしリの 2項選択型の選択肢と「非常に良し、 J ,I まあまあ良しリ も言えなし、 J ,I あまり良くなしり Iどちらと I 良くなし、」の 5段階評価法の選択肢に回答してもらうとともに 9つの プロファイルに対して 1位から 9位までの順位づけを行ってもらい,これらの回答データを用いて各属性・ 各水準の部分効用値の推定を行うとともに,金銭評価を行った.なお,提示した 9つのプロファイルと質問 の形式は,図 5に示すとおりである. 効用関数の推定に際しては,土木学会土木計画学研究委員会(1 9 9 5 ) を参考に,回答者の固定効果の存在 を考慮して,条件付ロジットモデ、ルを適用して推定を行った.推定に際しては,まず,プロファイル j が「利 うとして,次のように確率効用関数を定式化する. 用する」として選択されたときの効用を E ‑101‑

112.
[beta]
L

,
f
's
jX 匂キ'f, YIZ I ‑lヤ匂

1F

二

︐
.
︑〆直置︑

K

u
j ‑ f
j キ e
j

ここで,ちはプロファイノレj から得られる効用の観察可能な部分を ,XI
g はプロファイルj の k番目の属
性のダミー変数 , ZIは l番目の回答者の個人属性のダミー変数,め ,YI はそれぞれの推定パラメータを表
す.誤差項 Ejは効用の観察不可能な部分であり,プロファイルと個人について互いに独立なガンベル分布に
従うものと仮定する.このとき,プロファイルj が選択される確率巧は,

f
う =exp(巧)/,
f
'je
x
p
(巧)

(
2
)

と表わせる.この確率をパラメータの関数と見なして尤度関数を作り, JMPの名義ロジスティック回帰を適
用することにより,最尤法によりパラメータを推定する.なお,プロファイルに関する属性のダミー変数の
,情報の提供
基準としたのは,プラットフォーム(情報の提供媒体)では「ホームページ(ウェブサイト)J
内容では「テキスト(文字情報)のみ J,情報の費用負担(提供費用)では「無料」である.また,回答者の
固定効果の候補としてモデルに組み込んだのは性別,年齢,職業の 3つの属性であり,性別は「女性Jを
,
年齢は r40歳代Jを,職業は「公務員」を基準としている.

9つのプロファイルへの利用の可否質問および 3つの固定効果に関する個人属性に関する質問の全てに回
,
8
9
9サンプルを用いた係数の推計結果を示したものが表 2である.表 2より,固定効果を組み
答のあった 4
込まないモデ、ル 1,性別と年齢の固定効果を組み込んだモデル 2,職業の固定効果を組み込んだモデル 3の
いずれにおいても,提供内容の「動画付き j を除く全ての属性の水準が 1%有意水準で有意となっている.
プラットフォームとしては,ウェブサイトと比較して,ツイッターもフェイスブ、ックも推定された係数はプ
ラスとなっており,利用を阻害する要因として効いていることがわかる.提供内容に関しては,静止画付き
の係数はマイナスで,利用を促進する要因として
表 2 選択実験の係数の推定結果
項
モデル 1
モデル2
媒体
内容
費用
性別

‑
0
.
8
2
5
:梓
1
.4
39,
"
1
.3
72噂傘

切片
ツイッター
フェイスブック
静止画付き
動蘭付き
1
0
0円/月
200円/月
男性

F

咋ー

‑
0
.
6
8
5戸
事
1
.4
53制
1
.3
8
6
'
*
*

ふ
p

0
.
4
4
7
5
j
!帥
‑
0
.
0
3
3
.
7
6
7"
*
4043?
日

ト

叩

2
0歳代
3
0歳代
0
歳代
年齢 5
60歳代
7
0歳以上
会社員・団体職員
公務員
自営業
パート・アルバイト
職業
学生
無職
退職後年金生活
その他
最大対数尤度
決定係数
唱作

効いている.負担費用に関しては,推定された係
モデル3

‑
0
.
0
4
0
3
.
8
0
4
4
.
0
8
2
"
*
‑
0
.
1
1
5
i
柿

‑
0
.
6
8
3帥
1
.4
45,"
1
.3
79山$

数はプラスの大きな値となっており,利用を大き

0・
455(*
0
.
0
3
7
:
3
.
7
9
1
:
'
*
4
.
0
7
1,
,
*

らの結果は,固定効果を入れないモデル 1でも,

く阻害する要因となることが示されている.これ

固定効果を入れたモデル 2 とモデル 3でも,いず

/
/レ
‑
‑
‑

…

柑

-0 貝71,r.~_

‑0.331'"
0
.
1
7
2
0.153:"
‑
0
.
0
6
4

‑
‑
‑

の「静止画付き」は 11
.9円/月の効用(あるいは

p
t
g
p
F
r
T

0
.
1
0
9
6
1
‑
0
.
0
8
0
.
0
7
3
57*
.
1
.0
0
.
0
1
4
;
0
.
0
9
8
0
.
1
6
7
1
2
1
2
4
.
5
0
.
4
2
1
4
1

ー1
2
2
5
9
.
7

ー1
2
1
2
5
.
5

0.
41
7
8

0
.
4
2
4
1

ない.なお,モデル 1では,費用負担の 1
0
0円 /

月の水準の係数が 3
.
7
6
7であるから,係数が ‑
0.
4
47

柿

目

れも共通しており,係数にも大きな違いは見られ

推定された係数は, (利用しなし、) / (利用する)の対数オッズ
有意水準で,勺ま 5%
有意水準で
に 対 す る も の で あ り . * は 1%
係数が有意であることを示す.

‑
1
0
2・

メリット)をもたらすと評価されているのに対し

て,ウェブサイトからの情報提供と比較して,ツ
イッターによる情報提供は 3
8
.
2円/月,フェイス
ブックによる情報提供は 36.4円/月のマイナスの
メリット,すなわちデメリットとしてしか評価さ
れていないという結果となっている.
モデル 1に,性別と年齢の固定効果を組み込
んだモデル 2では,男性の係数が 1 %有 意 水 準

113.
[beta]
Q19‑1 もしも身に覚えがないのにもかb
、わらず、ゴミ出しのルールに違反して

ゴミ収集日以外 l
ニゴミ出し在したとして、あむたの名前が市区町村が情報発信を
している公式の / 1イス7ックのコメント欄に書き込まれ、 1時間後{こは削除され
ζ載とは特定できまぜんが、何人かの人々には間賞された
ましたが、 T時間の間 {
主します.
よ二のよう屯杭況を想定して、あむた(;1フェイス/"ヲを管理している市区町村に
慣害賠償歪求めますか.

K
a
p
l
a
n
‑
M
e
i
e
r
詰によるあてはめ
生存分析フロット

1

。〔一一一一つ

0求め札、一一一一→ Q19‑3
‑
ヘ
O求める一一一一一→ Ql9‑2へ
Q わから仏、一一一→ Ql.ー
③
ヘ

盤副温画調.盛溢溢孟睡画画審車醤誼歯薗・・・・・・・・・・
‑ 市g町村に求める傾害賠償の金額はし、くらですか。
01万円以上

0
.
0

→05
万円以上
05
方円未満 1
J→ 具 体 帥 輔 補 眠 鍋 ま !1一 方 向

吋

o 5000

_~."",c_'m ,"",_...

→05
05
干円以上 1
"
体蹴個酬の金融{
千円未満
J‑
l
~~.",", c__ , C"'_'"

15000

25000

35000

45000

賠償金額

01万円未満

イベントまで由時間.賠償金面

千円

時間ゼロにおける故障
グループ
組み合わゼ

図 6 中傷被害への賠償額を問う質問

ーー…九
ゼ

;
一一一

曲陣碑温民情圃 >
o
'
30

0.978182

極値パラメータ指定値
軸曲揮置
植霊値 下圃 95軸}上園95
λ 1 0 . 6 8 3 6 8 2 10.658522 10.708644 1375

パラメータ

でマイナスで有意である.これは,女性よりは男性の

δ 0
.
4538164 0.
4315522 0.
4775691

1375

Weibull
パラメータ推定値

方がインターネットやソーシャルメデ、イアを通じた

。
=
=
e
x
p
(
λ
),
s=1
月叩ときの橿個に等しい

情報提供を利用するとし、う傾向を示すものである.年

。

パラメータ

蝿定値 下~9~~ ," .
.
.
t
圃95
怖植田置
43637.948 42553.717 44740.941 1375

齢については, 70歳以上を除いて推定された係数は

s

2.2035341 2.0939377 2.3172169

E約

1 %有意水準で有意であり, 40歳代を基準にすると,
40歳未満の若い世代はデジタルによる情報提供を享

グJ
トプ山離間:打開り圏
組み合わぜ

向が示されている.また,モデル 3は,性別と年齢の

平均主制削

0 38236.
4 509.015

分位点
グループ

受しやすく, 5
0歳代以上はデジタル媒体を好まない傾

1375

1375

組 h合わぜ

申央個時間下圃 95
軸」ヒ個95
軸
,
1
25崎 膏 命 75
怖‑
50000

10000

50000

あてはめた分布

j

0.00002

代わりに職業を固定効果として組み込んだモデルで
あるが,家事専業を基準とすると,会社員・団体職員
と学生の係数が 1 %有意水準で有意でマイナスであ

岨
Z
E
6
5
}
Z

0
0
0
0
0
0
0
0
0
0
1
5
1

語
函

。

000005

ることから,職場や学校で PCやデジタル端末に慣れ
親しんでいればデジタル媒体での情報取得への抵抗

0
'

が小さいことが示唆されていると考えられるが,詳細

図 7 生存時間分析による W
T
A曲線のあてはめ

な分析が必要である.
以上から,インターネットならびにソーシャルメデ、イアを通じての自治体からの情報提供に関しては,静
止画付きの情報提供はプラスに評価されるが,現時点では,フェイスブックやツイッターによる情報提供は,
即時性や公開性や双方向性といったメリットがあると言われてはいるものの,多くの住民にはそのようなメ
リットは評価されておらず,逆にマイナスの評価となっているという,我々の予想とは異なる結果が得られ
ている.
一方,ソーシャルメディアを通じての自治体からの情報提供に関するデメリットの定量評価については,
情報漏洩や風評被害が発生した場合の補償額としての支払い限度ならびに被害者となった場合の受け取り希

i
1
lingnesst
oP
a
y
)と WTA(W
i
1
lingnesst
oAccept)を聞くことで推計を試みた.
望額を,それぞれ CVMの WTP(W
具体的には,ソーシャルメディアへの書き込みによる軽微な中傷による名誉棄損に相当する仮想の状況に
対して,損害賠償を求めるかどうか,損賠賠償を求めるとすればいくらを求めるかを,

2段階 2項選択法を

適用して設問し,図 6に示す質問を回答者に示して回答を得た.自治体への損害賠償を求めるとの回答は,
28.2%の 1
,
409サンプルで,そのうちで賠償金額に関する 2段階 Z項選択法による質問に回答している 1
,
3
7
5

‑
1
0
3
‑

114.

サンプルの回答データに生存時間分析を適用して自発的受入額 (WTA:W i l l i n g n e s sToA c c e p t ) 曲線を推計し 236.4円と推計されており,この金額は決して小 た結果を図 7に示している.図 7から,賠償額の平均は 38, さい金額とは言えないことが分かる. 4 . おわりに 本稿では, 2013年度末に全国を対象に実施した 5, 000人規模の「自治体からのソーシャルメデ、ィアによる 情報発信に関するウェブ、調査」の回答データを則Pで解析することから,一般の住民と比べると比較的にイ ンターネットやソーシヤルメディアの利用頻度が高いと考えられるセグメントの自治体から提供される地域 や生活に関わる情報の利用状況と明らかにし,選択実験によるソーシヤルメディアのメリットの定量評価と CVMによるソーシヤルメディアのデメリットの定量評価を試みた.その結果,デメリットについては調査前 の仮説に沿う結果が得られたが,ソーシャルメディアの即時性や双方向性や公開性といったメリットについ ては,現時点ではメリットとは認識されず,ウェプサイトからの情報提供よりもソーシャルメディアによる 情報提供は低い評価しかされていないという結果が得られた.ただし,これらの結果は予備的分析の段階で の結果であり,今後も,回答者のソーシヤルメディアの利用状況などを加味した分析を行うとともに,ソー シャルメディアを活用して広報・公聴活動を行っている先進自治体を訪問して調査結果を提示してのヒアリ ング調査を行い,自治体からの反応も踏まえて,研究を深化させていきたいと考えている. 謝辞 本研究は,公益財団法人電気通信普及財団の平成 25年度の研究調査助成の助成金が授与されて行った「自 治体からのソーシャルメディアによる情報発信の効果の定量的評価に関する研究」の一部である.ウェブ調 査に協力いただいた回答者の方々に感謝し、たします. 参考文献 有馬昌宏・加藤優希・藤田目弘, r コンジョイント分析による官民連携地域ポータルサイトの住民評価 j,W2009 SAS ユーザー総会アカデミア/テクノロジー&ソリューションセッション論文集~, p p . 2 3 1・242,2009 財団法人地方自治情報センター, W フェイスブ、ツクやツイッター等を活用した行政サービスの充実について~, 2013 庄司昌彦J人間関係ベースの消費 一地域 SNSが地域生活化に貢献するために j, W智場~, No.114, p p . 1 2 2126, 2009 総務省, w平成 25 年版情報通信白書~ ( h 即: l l w w w . s o u m u 伊 . j p / j o h o t s u s i n t o k e i l w h i t e p a p e r I h 2 5 . h 加 1 ) , 2013 谷本晴樹, r 自治体は facebookをどう使うべきかー武雄市の事例から考える J ,h t t p : / / w w w . g r a n d ‑ d e s i g n . o r g l / i c t l c a t l 7 / 6 f a c e b o o k . h t m,2 0 1 1 b l og 谷本晴樹, r 自治体の SNS利活用 一国内外の「先進 J事例に見る課題と展望 j,ICT 将来政策研究会報告 ( h t ゆ: l l w w w . s l i d e b o o m . c o m l p r e s e n 旬t i o n s / 5 1 3 1 8 5 / ),20日 土木学会土木計画学研究委員会, w非集計行動モデルの理論と実際~,土木学会, 1995 藤尾俊幸・鯵青・黒田佳代・田中有紀・)1向肇・有馬昌宏, r J M Pを利用した C V Mによる政策評価 J ,WSAS Forum ユーザー会学術総会 2005 論文集~, pp . 41 5・424,2005 104・ ー

115.

│臨政府醐以長持議機務ら ~9 最近の公的統計ヂータの利用について 二次的利用の取組と統計のオープン データの高度化を中心に 高部勲 総務省統計局統計調査部経済基本構造統計課課長補佐 │医僚政府関大学問コ以テムの実証…ー綿 要旨: ‑ミクロデーヲの二次的利用に関する制度の概要 ‑匿名デ‑‑j及びオーダーメード集計の概要・利用実績 ・統計のオープンデー舎の高度化の概要 ・ 第 E期基本計画における関連施策の概要 ・公的統計デ ヲの高度利用に関する今後の動向 鳴 1 0 5 ‑ ~9

116.

‑ w f 一 一 事 ︐ A立 在 日 野 晶 下 心 乍 持39R 7dvL ーノ 1uq‑ ︐ 一 ♂ 一 一J γVH 也 一お 栴 MTe議 融 uh ︑ LU宇 ゐ 1'lIvav‑け ゐ 一 J :1U ム AhjFケ リ つ dfS 噌 敏憲 十ぷ働・世 JrE 曙川 e p a h e議凶問 川も手﹄島一帯 AJMJ ﹄哩﹄F 叫町かま n L : も ! : 一 ι調 説 錦 繍育担ぷ謹塁線機初場轟轟轟叩 岨持 主総務川沿穂霊園寝込議 識 叫 増強制謡選 UMY 12 2J J M 骨駅議議官ぷ 将棋みれ 1 ウペ竺丘︑区築ぷ耀綱引巴翁ぽ時 骨 崎ソ器時 勺JM m号る一パ 81J hue崎 鰍 有h もにい併﹄}匹 6桜鐙竹議畑︑十euiレソ 笠正一けりで仏い U んA ペ引いン︑志議申ルi W

119.

│臨政府関大学問一弘の実証一総会 9 W l J 大学と企業における統計教育と SAS 山之内直樹 第一三共株式会社データサイエンス部主幹 堺伸也 EE 冨醤盟盟監護盟理E圃 要旨: SASユーザ会世話人の我々は、医薬品業界のユーザとして企業が 求める統計解析担当者として必要な知識と経験、素養について、ア カデミアの指導教官、学生と懇談した。製薬企業の研究開発業務の 統計と S ASの有用性を紹介するとともに、大学と企業の統計教育と SASについての情報交換も行った。まず2 0 1 2年は、医薬品メーカー、 CRO( C o n t r a c tR e s e a r c hO r g a n i z a t i o n)と統計教育及び SASの 有用性について各大学の統計教育の担当教官と交流会を開催した。 さらに 2 0 1 3年は、医薬品、 CR015 社で実施したアンケートから企業 内の教育を紹介した。これらの内容を通じて、企業が大学に求める べき統計家のコンビテンスとしてどのような教育が必要となるのか、 そして SAS をどのように広げて~ ¥<か等の議論が必要があると考え、 全国の大学で、統計学の指導教官、学生と座談会を行い、医薬品業 界で必要とされている統計学的、 S ASの知識、スキル、また企業が 求める人材要件等について交流した。今回はその内容を報告し、統 計教育と S ASの議論を行う。 ‑ 1 0 9 ‑

120.

科学的マーケティング手法による 大学マネジメント・サイクルの持続的発展 山形大学EM 部の「学生を知り抜く JIR への挑戦 福島真司 山形大学エンロールメント・マネジメント部 S u s t a i n a b l eDevelopmentofU n i v e r s i t yManagementC y c l ew i t ht h eS c i e n t i f i cM a r k e t i n gApproaches ‑AC h a l l e n g eoft h eI n s t i t u t i o n a lR e s e a r c ho f" L e a r 百i n gS t u d e n t s 't h e m s e l v e s " a tD e p a r t m e n to f E n r o l l m e n tManagement, YamagataU n i v e r s i t y ‑ 吋iFUKUSHIMA S h i E n r o l l m e n tManagementD e p a r t m e n t/YamagataU n i v e r s i t y 要旨 エンロールメント・マネジメントは、大学の持続的発展を目的とする、科学的マーケティングを用い た大学マネジメント手法のことである。大学におけるマーケティングとは、学生募集や寄付募集等だけ をさすのではない。私たちの学生の価値を創造し、その価値の最大を実現し続けるための、組織一体と なった活動が、大学におけるマーケティングである。 大学マーケティングを実現するためには、学生を知り抜くための I n s t i t u t i o n a lR e s e a r c h (以下、 I R ) が欠かせない。入学前の接触情報から、入学時点での期待感や満足度、入学後の GPAl 、学生生活や教 育サービスへの満足度、授業評価のスコア、目標の達成感、課外活動や奨学金の履歴、就職、卒業後の 大学教育への満足度や要望等を調査、分析することなしには、私たちの学生を知り抜くことはできない。 山形大学では、入学前から卒業後までの情報を一貫して分析するための ITインフラである「総合的 学生情報データ分析システム」の構築に 2 0 1 0年度より着手し、真のマーケティング志向の組織運営を めざし、 IRに取り組んでいる。その要諦は、組織文化の醸成に他ならない。 本発表は、山形大学における IRの取り組みについて、そのコンセプトと業務の実際を報告し、組織 文化の醸成に、ビジュアル・アナリテイクスがどのように寄与しているかの実践的事例を報告するもの である。 キーワード:エンロールメント・マネジメント、マーケティング、 IR、総合的学生情報データ分析シス テム 1G radeP o i n tA v e r a g e:合格した科目の成績の評定を S, A, B, Cの 4段階で行い、その成績を平均化したもの。 ‑ 1 1 0 ‑

121.

1 はじめに 近年、日本の大学においても、エンロールメント・マネジメント(以下、 EM)の重要性が説かれているが、 その定義は、どのようなものであろうか。 EMは 、 1970年代に米国ボストン・カレッジに、アドミッション・セクションのディレクターとして従事 し、母校である当該大学の危機的状況をターン・アラウンドさせたジョン・マグワイヤ博士が、最初に提唱 したと言われる。大学の経営的な危機は、学生数に見合わない過剰な投資と、何より、学生数の減少による 収入の減少が最も大きな要因となる。 学生募集において、多岐に亘るプロモーションや奨学金に大きな投資することで学生をかき集めても、退 学や転学により学生を失えば、学生募集にかけたコストは無駄になる。また、教育内容に関しでも、ただ高 度なレベルの学問を提供しでも、コースに集まった学生とアンマッチした内容であれば、不満につながる。 大学が提供する諸教育サービスに対し、不満を持つ者が多くなれば、退学・転学者数の増加による収入の減 少や大学の評判の低下による大学ブランドの聖堂損につながる。 EM はこのような背景の中で考えられたメネ ジメント手法である。 2. EMとはイ可か 1 9 7 0年代のボストン・カレッジは、 「カソリックのハーバード大学をめざしていた j と邦検される状態に あった。教授たちは、最優秀な学生だけを教えたがり、高いレベルの研究をすれば入学者は自然と集まって くると考えられ、当時の社会的な評価とアンマッチした学生募集戦略や教育内容の提供をし続け、入学者数 の減少、退学者数の増加、寄付金の減少、さらには社会的な評価の下落という負のスパイラルに陥っていた。 マグワイヤ博士は、その状態をマーケティング調査により、わかりやすく可視化し、ボストン・カレッジの 採るべき戦略を明確にし、大学全体を改善するという意志決定へとつなげた。 この過程の中で、マグワイヤ博士は、大学の永続的な発展には、組織一体となったダイナミックなマネジ メント・サイクルの重要性を認識する。上記の通り学生をかき集めても、不満足な学生は退学してしまうた め、その場合、様々なコストが無駄になる。そこで、一旦、ボストン・カレッジに興味を持った学生を、効 果的なプロモーションにより出願までつなげ、入学許可を出した学生を奨学金の最適な配分により入学まで つなげる。入学した学生に対し、その学生の期待に見合った教育サーピスを提供することで、満足した教育 的な経験や学生生活を提供し、卒業後の社会で希望の職業や満足感のある生活を得られるように価値を付加 する。卒業生となった後にも、大学との継続した良好な関係を築き、卒業生の子や孫の入学につなげたり、 大学に対する遺贈も含めた寄付募集につなげるまでをマネジメントする。この個々の学生との一生涯のつな がりを、大学が組織一体となって、科学的なマーケティング調査をもとにサイクルさせ続けるマネジメント 手法が、エンロールメント・マネジメントである。 日本では、 EMの定義を「学生支援策 Jや「教育の考え方J等とする向きもあるが、 EMは、科学的マーケ テイング手法を用いた大学マネジメント手法のことである。当然ながら、ここで言うマーケティングとは、 売り込みの術をさす狭義のマーケティングではなく、顧客価値の創造やその最大化を、組織一体となって実 現するための活動をさす。大学におけるマーケティングセクションは、学生募集や寄付募集、学生担当窓口 担当部署だけをさすのではなく、総務や人事、会計部署などのパックヤードの部署も含めた組織一体となっ た活動が大学マーケティングである。 ‑ 1 1 1・

122.

2. IRの果たす役割 科学的マーケティング手法には、大学自体に関する調査分析が欠かせない。学生に関する調査もここに含 まれるが、個人的な考えや憶測をベースに学生の実態を掴んだつもりで、大学マネジメントを行うことは、 科学的な態度とは言えない。ここで必要となる大学自体に関する調査分析は、 IRと呼ばれる。 ボストン・カレッジを例に挙げると、ボストン・カレッジに興味を持ってパンフレット等の資料を請求し た者、オープンハウス(日本でのオープンキャンパス)に来場した者等のプロファイルを精徽に行い、その 後、実際に出願した者と出願しなかった者をセグメントに分けて分析し、なぜ出願し、なぜ出願しなかった のかの要因を探る。また、入学許可を受け取った者のうち、実際に入学した者と、入学しなかった者をセグ メントし、なぜボストン・カレッジを選び、なぜ他の大学を選んだのかの要因を探る。この調査結果を、わ かりやすく可視化し、必要な学内の会議で共有し、学生募集戦略の策定、奨学金の設計、教育プログラムの 改善等のプランニングに活かす。 学生募集に関する調査項目では、 SAT等の大学進学適性試験の成績、出身高校のタイプ、学生の自宅と大 学までの距離、大学寮への入寮希望、人種、保護者の支払い能力と奨学金の希望内容の詳細、学問的な志向、 サークル活動やボランティア活動の経験等の多岐に亘る要素が対象となる。大学での教育的な経験への期待 を把握することは大切で、ある。同様に、入学前の期待と入学した後の満足が見合っているかを確認するため、 学生満足度調査は重要であり、アンケートだけではなく、インタビューも加えながら実施される。 入学者数を増加させることだけで、大学の収入状況が改善され、経営的な危機が回避されるわけではない。 米国の大学では、日本の大学に比較して転学のためのシステムが整備されており、入学した大学が期待に見 合わないもので、あった場合、学生は他の大学へと転学する。転学を含めた退学を阻止し、在籍率を向上させ ることも、入学者獲得と同様に、大学経営上は重要である。不満足を理由に退学していく学生から、情報を 得ることには困難が伴うが、転学を支援する部署において、当該学生が転学に至った経緯を情報収集し、進 路先に関する情報を提供し、転学を成功させるためのサービスを提供することで、当該学生から情報を得る 退学率を下げるために転学の支援をするという、一見矛盾を苧んだ取り組みの効果は大きかったとのことで ある。このようにボストン・カレッジでは、学生に関する多岐に亘る情報を収集し、分析した結果を、大学 マネジメントに活かしている 膨大なデータ量を扱う IRには、データベースやデータ分析の ITインフラの構築が欠かせない。 IRに係る データは、入学前の接触情報から、入学時点での期待感や満足度、入学後の GPA、学生生活や教育サービス への満足度、授業評価のスコア、目標の達成感、課外活動や奨学金の履歴、就職、卒業後の大学教育への満 足度や要望等多岐に亘っており、しかも大学が継続する限り、データ量は増え続けることとなる。一定以上 の学生の数を持つ大学が、学生の様々な情報をクロスして分析し、その変化を経年的に見るような場合、手 作業による分析は、時間コストが掛かり過ぎ現実的とは言えない。クライアント PC 上で動くアプリケーシ ョンだけでは、データの格納、分析、結果の共有、セキュリティへの配慮、閲覧権限の制限等の要求が満た されない場合も出てくる。 3. 私たちの学生を知り抜くこと 米国と、日本の高等教育を取り巻く環境は異なっており、マネジメント手法も、それぞれの環境に適合 ‑ 1 1 2 ‑

123.

する形で発展してきた。すなわち、米国の EMのあり方を、そのまま日本に適用することに必然性はない。 山形大学 EM部 2は 、 2 0 0 6年 7月 1日に、日本の大学初の EM専任部署として発足して以来、マーケティング 志向のセクション運営を行ってきた。 山形大学 EM部は、学生の大学入学前は学生募集活動を、入学後は学生満足度調査を始め様々な学生に関 する IRの諸活動を、卒業後はニーズ調査を始め卒業生の大学へのロイヤリティ向上のための諸活動に関する 業務に責任をもっ O 設置経緯には、学生募集の危機的な状況が関係していたため、学生募集活動に業務の中 心があるが、近年は、 IRの諸活動に業務の中心を移しつつある。 2 0 1 0年度から 3年間の期間で採択された文部科学省概算要求事業「学生の大学への期待、満足度、成長の 自覚、目標達成感等を向上させることを中心においた教育改革マネジメント・サイクルの実現 j によって、 「総合的学生情報データ分析システム」を整備し、 IRにより一層重視する体制が整いつつあるが、コンセプ トは「私たちの学生を知り抜くこと」である。学生の入学から卒業後までを、一連のデータとして保有し、 様々な切り口で分析し、常に見える化し、 トラックし続け、その結果を元に改善する仕組みをマネジメント のフローにピルトインすることで、大学は永続的な発展を遂げる可能性が高まる。 山形大学 EM部が扱うデータは、学生の出身高校や受験前の大学との接触デー夕、入試に関するデー夕、 履修状況や I Cカード型学生証による出欠状況、成績、授業評価、就職状況、入学前・在学中・卒業後の満足 度アンケート等の各種アンケートのデータと多岐に亘っている。これらの学生データを利用し、各学部等が 必要とする分析を実施し、レポートを行うサービスを各学部に対して提供している。当初構築したシステム では、データ・プレゼンテーションのためのダッシュボードやテンプレートの作成に対し、限られたシステ ム担当者や I Tベンダー企業の S E等のマニュアル作業に依存していたため、時間コスト、経費的なコスト共 に、大きな負担があり、即時的な分析やレポート提供が困難であるという課題を抱えていた。 SASV i s u a lA n a l y t i c sの導入によって、 ITベンダー企業の SEへの依頼がなくとも、データ・プレゼンテー ションを行うことのできる環境が整い、時間コスト、経費的なコストを大幅に縮減することができることと なった。また、容量の大きなデータも短時間に分析可能とするインメモリ・アナリティクス機能によりデー p a dなどでも閲覧可能であり、ユーザ タのメモリ上への読み込みゃ処理の高速化が実現される。分析結果は i ビリティがよく、素早く、美しく見られるビジュアルによって、これまで使用感や操作性の悪さから、使用 を忌避されていた分析システムへの期待感が高まり、従前よりも、 IRの学内認知が高まった。 IRは、特定の専門家が、専門家以外には解釈が難解な統計を駆使して行うものはなく、データ分析を必要 とする部署の担当者が、自分自身の手で、簡易に、操作性よくデータを扱い、わかりやすく、美しい分析画 面を見ながら、諸業務の評価や改善策の立案、意思決定に役立てることにその要諦がある。これがないと、 IRが組織文化に浸透することは難しい。システム担当者にしか使いこなせないシステムや、難解でわかりに くい分析画面では、データ分析結果を閲覧しようとするモチベーションにも影響を与えるからである。 IRの 目的は分析自身にあるのではなく、データ分析を意志決定の業務フローのビルトインし、科学的な調査結果 に基づいて、マネジメントの PDCAサイクルを回すことにあるため、システムの仕様にも、誰もが使いたく なるシステムであることが要求される。山形大学の従来のシステムには、柔軟性や拡張性にも課題があり、 常に時間的・経費的なコストが膨らみ、各学部等の分析要望にも即時的に応えることができず、 IRの浸透に i s u a lA n a l y t i c sの導入によって、諸業務の意志決定や事後の評価がこれまでよりも支 困難があったが、 SASV 援され、 EMの質の向上が期待できる可能性が高まった。 2 EM部の設置当時は、 EM室て、あった。その後、部に昇格した。 ー 1 1 3 ‑

124.

4. おわりに マーケティングの潮流にも変化が見られる。マーケティング手法にフレームワークはあっても統一手法は ないため、個々の大学が個々の大学のやり方を、トライ・アンド・エラーで見つけながら、個々の大学の目 的に叶った業務活動での精度を上げる続ける必要がある。常に、私たちの学生を知り抜くことが、そして、 社会の期待を知り抜くことが、学生の価値を創造し、その価値を最大化し続けることに直結する。 EM を支 える IRでは、データという FACTをもとに意志決定を行うという組織文化の醸成が重要となる。 I Tインフ ラが大学マーケティング、大学マネジメントに与える影響は大きい。 参考文献等 J o h nMaguire I T ot h eo r g a n i z e d, gof o rs 同d e n t s JW B o s t o nC o l l e g eB r i d g eMagazine J ]BostonC o l l e g e( 1 9 7 6年) 2 0 0 6 ダ ニエル・ピンク、大前研一((翻訳)Wハイ・コンセプト「新しいこと」を考え出す人の時代』三笠書房 ( 年) J o h nM a g u i r e、LawrenceBu t 1e r、M a g u i r eA s s o c i a t e s WEm ニC 2 :A NewFormu1af o rE n r o l l m e n tM a n a g e m e n t l l T r a n s w o r l dPub ( 2 0 0 8年) フィリップ・コトラー『コトラーのマーケテイング 3 . 0 ソーシャル・メディア時代の新法則』朝日新聞出版 ( 2 0 1 0年) "エンロールメント・マネジメントの国内スタンダード"創造に向けた新しい情報基盤の構築へ。 400項目 e r v e r2 0 0 8 を中核とするソリューションを採用 を超える要求に応える最適解として SQLS h t t p : / / w w w . m i c r o s o f t .c o m/ j a ‑ j p / c a s e s t u d i e s / y a m a g a t a ‑ u . a s p x( 2 0 1 1年 9月掲載) i s u a 1 A n a 1 戸lCSの導入でより的確な意思決定とエンロールメント・マネジメントを加速 山形大学、 SAS⑧ V 直 感的ユーザーインターフェイスで各学部担当者による即時的データ抽出と柔軟なレポーティングを可能に h t t p : / / w w w . s a s . c om/o f f i c阿 部 i a p a c i f ic/j a p a n/n e w s / p r e s s / 2 01 3 1 2 / 1 9 . h t m 1( 2 0 1 3年 1 2月掲載) ‑114 岨

127.

インターネット時代の医薬品営業に関する考察 武藤猛 MarkeTechC o n s u l t i n g代表 P h a r m a c e u t i c a lS a l e si nI n t e m e tE r a nohu ‑ ‑ t l U 同 U 民 03 n n v 0C Mh M ・ lF jM引 ‑nE ・ 3υMVE 免凶 03 'bh TF QO ρ l v r且 P A t n c ・ d ・ ‑ 要旨 患者、医療従事者、医療機関、製薬企業など、医療に関連したあらゆる分野でインターネットが活用 される時代となり、医療用医薬品の情報に関しでも、医師が積極的にインターネットから直接情報を入 手し、活用することがごく普通となっている。このため、製薬企業にとって、従来の M R (医薬情報担 当者)に依存した営業戦略の見直しが迫られている。本論文では、数種類の医薬品について、医師に対 して M Rおよびインターネットで情報提供した場合の効果を定量的に分析した。目的変数を各医師の処 方量(医薬品売上高)、説明変数を M Rまたはインターネットによる情報提供回数とし、これらの交差 項を含め、重回帰分析を行なった。その結果、いずれの医薬品についても、 M Rに加えてインターネッ トによる情報提供は売上高を押し上げる効果があることが分かつた。一方、交差項は 1種類の医薬品に ついてのみ有効であった。このような交差項(つまり M Rとインターネットの相乗効果)が有効な条件 について考察を行った。限られた事例ではあるが、今回の分析結果を踏まえ、医薬品営業において、イ ンターネットを効果的に活用する条件について検討した。 キーワード:医薬品営業、インターネットによる情報提供、効果測定 1.医薬品マーケティングとインターネット 1 .1 医 薬 品 マ ー ケ テ ィ ン グ に お け る イ ン タ ー ネ ッ ト 活 用 の 現 況 患者、医療従事者、医療機関、製薬企業など、医療に関連したあらゆる分野でインターネットが活用 される時代となった。医師に対する医療用医薬品の情報に関しでも、医師が積極的にインターネットか ら直接情報を入手し、活用することが日常的に行われている。このため、製薬企業にとって、従来の人 的方法、つまり M R (医薬情報担当者)に依存した営業戦略も見直しを迫られている。また、国民医療 費の適正化のために、製薬企業の M Rに依存した高営業コストに対して厳しい眼が向けられつつあるこ とも、製薬企業におけるインターネット活用の方向を加速している。 ある調査によれば、医師のインターネット利用時間は一日平均 2 . 9時間である(1)。別の調査によれば、 医師が情報収集に費やす時間は、インターネットと M Rがほぼ同じである (2)。これらの調査結果を総合 すると、医師の視点からも、また製薬企業の視点からも、医療用医薬品の情報に関するインターネット の活用が不可欠な時代となっている。 ‑ 1 1 7‑

128.

1 .2 医薬品マーケティングにおけるインターネットの役割 eプ インターネットによる医師への医療用医薬品に関する情報提供(leデイテーリング j あるいは l ロモーション Jなどと呼ばれるが、本論文では前者を用いる)も商業ベースで、盛んになった。医薬品は、 適切な処方をしないと(あるいは適切に処方しでも)患者に予期しない副作用をもたらす可能性がある。 一般消費財と異なり、この点が医療用医薬品の場合に、 M Rから医師への直接情報提供(ディテーリン グ)が欠かせない理由である。このディテーリングにおいては、単に当該製品の特長や適用対象患者、 適正処方量だけでなく、安全性に関する情報の提供が欠かせない。従って、医療用医薬品の場合は、す べての情報提供をインターネットだけで行うことは現時点では考えにくく、製薬企業にとって M Rチャ ネルとインターネットチャネルとを使い分けあるいは併用して相乗効果を考える必要が生じてくる。 M Rと eディテーリングとを比較すると、前者は効果(処方への影響度)が高いが、効率(情報提供 l回当りコスト)が低く、一方 eデ、ィテーリングは、効率は高いが効果は低い、というのが「通説 j で ある。この「通説」は、各種情報の情報源と処方への影響度を調べた調査結果からもある程度は推察さ れる (3)。そこで、インターネットによる情報提供と M Rによる情報提供が共存するとしづ現実的な条件 ( lM R十 e J と呼ばれる)下で、両者の効果を定量的に検証することが重要となるが、そのような研究 はほとんど公開されていない。なお、医師の医薬品情報入手時の行動を調査した結果によると、医師は、 インターネットからの情報を M Rに確認し、 M Rの情報をインターネットで確認することが判明してい る(4)。このため、 IMR+eJ の効果測定には、両者の相乗効果の有無を考慮することが重要となる。 1 .3本論文の目的 本論文の目的は、医師に対して M Rおよびインターネットで情報提供した場合の効果(処方量、つま り医薬品売上)を定量的に分析することである。医師に対して、 M Rおよびインターネットで情報提供 した場合の各々の効果を評価するとともに、両者の相乗効果が存在するかどうかについても検討する。 2. 各 情 報 チ ャ ネ ル の 効 果 測 定 の 考 え 方 医薬品マーケティングにおいて、製薬企業から医師への情報提供チャネルには、 MRだけでなく、講演会 や研究会、 MS (医薬品卸企業のマーケティングスタッフ)、製薬企業が設置している医療関係者向けコール D i r e c tToCustomerの略で、新聞やテレビにおける疾患啓蒙広告 センタ一、 eディテーリング、および DTC ( を意味している。これを見た潜在患、者が医師を受診する可能性があるので、製薬企業から医師への間接的な 情報提供チャネルと考えられる)などがある。これらの情報提供チャネルが、「効果対効率」のトレードオフ 曲線上に位置していると考えられる。なお、このトレードオフ曲線は、「効果×効率 =1処方当り獲得コスト ( R O I ) =一定」の曲線である。ただし、データが限られている現状では、このトレードオフ曲線はあくま で作業仮説に過ぎない。 各情報チャネルの効果測定の考え方は、次の通りである。 ①各情報チャネル別の訪問・参加・アクセス回数を医師単位に記録し、データベース化する ②一定期間(半年・ l年)のデータを用いて、目的変数=処方量(売上高)、説明変数ニ情報チャネル別訪 問・参加・アクセス回数として、回帰分析する ③各情報チャネルの偏回帰係数から、各情報チャネルの効果を評価する データベースのイメージを図表 lに示す。 ー 1 1 8 ‑

129.

図表 1各情報チャネルの効果測定のためのデータベース ぶし 情報チャネル見J I 訪問・参加・アクセズ囲 数 (2013年4月‑9月) i D 医師 I MR MS コール (卸営業) センター 講演会 。 。 。 。 。 。 。 。 。 。 。 。 1000001 20 1000002 1 5 1000003 2 3 1000004 20 1000005 1 3 4 8 3 1000006 1000007 20 1000008 6 2 1000009 1 5 3 1000010 . . . 20 . . 町 .. 3 2 .. で信品 F~ セミナー 。 eリ T イ ン ナ グー 製薬企業 ウェフ、 。 。 サイト 。 。 。 。 。 。 。 。 。 。 。 。 。 2 3 3 2 2 2 2 3 . . .. 2 . . . .. このような各情報チャネルの効果測定用統合的データベースを構築している製薬企業はまだ少数と考えら れる。本論文では、 M Rと eディテーリング(し、わゆる rMR+eJ) に限定して、図表 lに相当するデータベ ースを構築し、効果測定を行った結果を報告する。 3. IMR+eJ の効果測定例 3 .1 効 果 測 定 の 方 法 分析対象とする eディテーリング ( reDTLJ と略称する場合がある)は、 5種類の薬剤について、登録され た医師に対して、一定期間行われたものである。 5種類のうち 4種類はマス領域(広範囲の診療科の医師が 処方する薬剤)、 1種類は非マス領域(特定の診療科の医師が処方する薬剤)である。 eディテーリング実施 時において、各薬剤は、上市後かなりの年数が経っている。なお、以下に示す効果測定結果は、実施例を参 考にして作成した、あくまで仮想的なもので、実施例そのものとは異なっている(ただし、結論には影響し ない)。 効果測定の方法は次の通りである。目的変数は、 eディテーリング実施期間中の売上高(処方量と同じ。 元の分布は偏りが大きいので 5段階の順序変数に変換)、説明変数は、同期間中の M R訪問回数および cディ テーリング視聴回数である。効果測定のための重回帰式(交差項を含む)は次の通りである。 y =。 戸 +sMRXMR十戸'eXe+sMR同 XMRXe+E ここで、 y 売上高 XMR,x e :M R訪問回数および eDTL視聴回数 so,sMR' se' sMRxe :パラメータ(偏回帰係数) t 誤差 ‑119‑

130.

3 . 2 効果測定結果 5種類の薬剤に対する rMR+eJ の効果測定結果を図表 2に示す。ただし、表中の偏回帰係数は、各回帰 式において、 M Rの効果を表わす偏回帰係数を1.0とした場合の、 eディテーリングと rMRXeディテーリン グ]の交差項の偏回帰係数を示している。 図表 25 種類の薬剤に対する rMR+eJの効果測定結果 伊重回帰分析ホ 、 デ 件 ー 数 夕 、会 対 製 象 品 k ト j 分 ( 散 F値 分 ) 析 p値 分 ) 析 分 ( 散 h 噌制 偏回帰係数 (eDTL1 s e / s M R ‑ A 45, 000 0 . 0 0 6 9 1 3 0 . 4 < . 0 0 0 1 3. 41 6 B 5 . 0 0 0 0 . 5 9 5 1 1 9 3 3 . 9 く. 0 0 0 1 0 . 1 7 7 C 30, 000 0 . 0 2 7 9 4 1 9 . 7 く. 0 0 0 1 2 . 5 4 8 D 45, 000 0 . 0 3 7 1 9 3 5 . 3 < . 0 0 0 1 2 . 1 8 2 E 40, 000 0 . 0 1 1 1 2 1 7 . 7 く. 0 0 0 1 5 . 9 6 5 (平均) 33, 000 ふ 偏 (M 回 RX 帰e係 DT数 L ) T !x . I P I 1 R I J P M 。 0 . 2 7 5 。 。 。 2 . 8 5 8 キ)偏回帰係数は、 MR訪問回数の偏回帰係数に対する比率を表示している;偏回帰係数はすべて有意である (pく0.05) 図表 2に示す重回帰分析結果において、モデル全体および偏回帰係数はすべて有意であった。ただし、 rMR XeディテーリングJの交差項は、非マス領域の製品 Bだけが正の値で、他はすべて Oである。この理由に ついては後述するとして、製品 B について、重回帰式を記す: y( 製品 B売上高) = ん +1.0x (MR訪問回数) + 0 . 1 7 7 x( eディテーリング視聴回数) + 0. 27 5 (MR訪問回数) X ( eディテーリング視聴回数) 製品 B についてのみ、 rMR+eJ の相乗効果が観測された理由をまとめる: ①専門医が処方する製品(非マス領域製品)であり、あらかじめ rMR+eJ の戦略を検討した ②専門医も満足する、専門性の高いコンテンツを開発した ③対象医師の中で、 eディテーリング視聴率が比較的高かった(約 2 5%) ④対象医師の約 60% は M Rが訪問し、フォローした ⑤上記のように、 M R訪問と eディテーリングを効果的に関連付けたことが相乗効果に繋がった ⑥以上の結果として、平均売上高アップなどの効果が得られた 3.3 fMR+eJ の 通 年 効 果 の 推 定 と そ の 意 味 eディテーリングは通常、キャンベーンとして行われ、期間は限定される。そこで、 rMR+eJ の通年効果 の推定を行う。そのため、 eディテーリングは 3か月間実施されたと想定し、それ以外の期間は、 eディテー 島 1 2 0 ‑

131.

リングの効果はゼロと仮定する。このような想定の下で、図表 2の結果をマス領域と非マス領域に分けて、 年聞の平均売上高に及ぼす効果を推定したのが図表 3である。表中の「平均売上高比率 j は 、 M Rのみが訪 問した医師の処方量(売上高)に対する、 M R訪問に加えて eディテーリングも視聴した医師の処方量(売 上高)の比率である。 図表 3rMR+eJの通年効果の推定 期間 eDTL期 間 1年間 薬効領域 の分類 平均売上高比率: マス領域 平均 1 . 48 製品 B以外 非マス領域 平均 3 . 8 2 製品 B マス領域 平均 1 . 1 2 1 + ( 1. 48‑1 )‑ ; ‑ 4 非マス領域 平均 1 .7 1 1+ ( 3 . 8 2 ‑ 1) ‑ ; ‑4 備考 (MR+eDTL )/ (MR) 図表 3によれば、年間の効果は非マス領域製品の方がマス領域に比べて大きい。この結果は、従来「医薬 品マーケティングにおいて、インターネットはマス領域製品に対して効果がある」とされる「通説」を否定 するものである。 このような、マス領域製品と非マス領域製品に対する効果の違いは、医師ターゲティングの考え方から解 釈することが可能である。医師ターゲティングとは、販売ポテンシャル(患者数)の高い医師のセグメント (HP=High P o t e n t i a lセグメント)にディテーリングを集中することで売上への効果が高まる、とするマーケ ティングの基本的な考え方であるべ大勢の患者で極めて多忙な HPセグメントの医師が、時間を割し、て eデ ィテーリングを視聴したくなるようなコンテンツと、視聴前後の M Rによるフォローが不可欠で、ある。この 点に関して、マス領域製品の場合は、対象医師数が多いことから M Rによる密接なフォローが難しい。他方、 非マス領域製品の場合は、対象医師数が限られ、元々 M R がすべての医師に対して密接なフォローを行なっ ている(特に HPセグメントの医師に対して)ところにインターネットが情報提供チャネルとして追加され たため、 iMR+eJ の相乗効果が得られたのではないかと考えられる。今回の効果検証では、非マス領域製品 が唯 lつだ、けなので、現段階ではあくまで作業仮説である。今後、 eディテーリングは、 M Rによるディテー リングと同様に、ターゲティングの観点から効果を検証する必要がある。 3.4 iMR+eJ の 売 上 高 へ の 効 果 シ ミ ュ レ ー シ ョ ン かなり大胆ではあるが、 3 . 3 の結果を用いて、 iMR+eJ の効果が製品売上高に及ぼす効果をシミュレーシ ョンする。図表 4の iMR+eJ の通年効果の指標と、ターゲティングとを組み合わせ、非マス領域の製品お よびマス領域の製品の売上高への効果シミュレーションを行った結果を図表 5および図表 6に示す。なお、 これらの表で、 LP、MP、および HPは、販売ポテンシャル(当該疾患の患者数)に応じて医師を分類(セグ メント化)したもので、 LP=LowP o t e n t i a l、MP=MiddleP o t e n t i a l、および HP=HighP o t e n t i a lを意味する。 戸 1 2 1 ‑

132.

図表 4 マス領域における rMR+eJの効果シミュレーション ‑製品売上高 :500億円 .対象医師数:90, 000人 ' M R 訪問 : H Pセグメントの医師のみカバー 図表 5非マス領域における rMR+eJの効果シミュレーション ‑製品売上高 :100億円 ・対象医師数 12, 000人 ' M R 訪問 : L P .MP.HPの金セグメントの医師カバー 図表 4に示したように、マス領域では、①視聴医師の比率が小さいこと、②MR訪問が可能なのは HPセグ MR+eJの相乗効果が限定的であること、の 2つの理由で、全体売上高への効果は小さ メントのみであり、 f いと考えられる。一方、図表 5によれば、非マス領域では、①視聴医師の比率が大きいこと、②全医師に MR が訪問し、全セグメントで f MR+eJ の相乗効果が期待できること、の 2つの理由で、全体売上高への効果 はかなり大きいと考えられる。 まとめると、多くの前提条件はあるが、マス領域製品に比べて、非マス領域製品の方が eディテーリング の売上高の押し上げ額が大きく、従って eディテーリングの費用対投資効果 (ROI) も大きいことが分かる。 3 . 5 医薬品市場全体に対する fMR+eJ の 効 果 の 評 価 さらに大胆ではあるが、現在の医療用医薬品市場全体に、 f MR+eJの効果はどの程度あるのかを推定して みた。結果を図表 6に示す。 ‑ 1 2 2 ‑

133.

図表 6 医薬品市場全体に対する rMR+eJの効果の評価 億 項目 医薬品市場規模 ①2 0 1 2年(億円) IMS ジャパン発表(薬価ベス) ② MR総数(人) ③ MR生産性(億円/人) 1 .5 0 ①÷② ④ MR人件費(億円/人) 0,2 0 1 2, 76 9 ②×④ 7 . 5 ①÷⑤ @MR総人件費(億円) MR ⑥ MRの ROI(倍) MR白書 想定 1 . 0 0 0 「有効」ディテーリングは 5回/目、稼働日は 2 0 0日 6 3,8 4 6,0 0 0 ②×⑧ ⑦年間ディテーリング回数(回/人) ⑧年間総ディテーリング回数(回) feJ 備考 9 5,6 0 0 6 3,8 4 6 ⑨1デイT リング当り売上品(万円/回) 1 5 . 0 ①÷⑧ ⑨1ディテーリング当りコスト(万円/回) 2 . 0 ⑤÷⑧ ⑩医師向け feJ市場規模(億円) 2 0 0 f eJサービス企業の売上品から推定 ⑪ afeJの推定 ROI(倍)一歳め推定 7 . 5 3 . 7 MRの ROI(⑥)の半分と推定 ⑪ bfeJの推定 ROI(倍)ー低め推定 fMR+eJの効果測定例を参考にした推定(=⑥) ⑫b feJでもたらされた売上晶(億円) 低め推定 1 , 49 7 7 4 9 f e Jの市場への ⑫ a市場全体への feJのインパクト(%) 高め推定 16首 ⑫a ‑ ; ‑① インパクト ⑬b市場全体への fejのインパクト{首)ー低め推定 0 . 8 " ③ゐ÷① ⑫ afeJでもたらされた売上品(億円) 高め推定 圃 複 数 ⑩×⑪a ⑩ x⑪ b 図表 6に示したように、インターネットは、現時点で医薬品市場全体の 1%程度に影響を与えていると考え られる。製薬企業によっては、売上高の数%程度に達している可能性がある。これは、特に専門領域で効果 的なインターネット活用を行なっている製薬企業の場合である。 4. M R活 動 の 質 を 高 め る た め の イ ン タ ー ネ ッ ト 利 用 の 考 え 方 4. 1 売 上 ア ッ プ の 3要 素 か ら 見 た IMR+eJ の 最 適 化 医薬品営業の観点、から、売上高を決定する要素は、重要な ) 1買に、「ターゲティングの精度」、 IMR活動の質」、 および「ディテーリング回数」の 3つで、あるべインターネットの効果もこの 3要素に分けて考える必要が ある。 まずターゲテイング?の重要性については、 M R もインターネットも変わらない。ただし、インターネット の場合は、科学的な根拠からターゲティング医師が選定されているとは必ずしもいえないので、今後改善の 余地がある。 次に、 M R活動の質であるが、インターネットが医薬品マーケティングにおいて主に貢献できるのが、こ の点であると考えられる。つまり、 MRから提供される製品情報や疾患、症例情報をインターネットで補い、 医師の個別の医療ニーズに対応することで、結果として MR活動の質を補完するということである。 最後に、デ、イテーリング回数については、最近 MRに対する訪問規制を行なう医療機関が増え、 M Rが医 師に面会しにくくなっているので、インターネットが M R訪問を部分的に代替できる可能性がある。ただし、 cディテーリング視聴 l回分が、 M R訪問 l回分と比べてどの程度の効果があるかについては、マス領域と非 マス領域の違い、イコンテンツの質と更新頻度、上市後の年数、当該疾患に対する治療ニーズの変化など、 影響する因子が多く、今後さらに研究する必要がある。 以上を、 IMR+eJ の最適化として、図表 7にまとめた。 ‑ 1 2 3 ‑

134.
[beta]
図表 7売上アップの 3
要素から見た rMR+eJの最適化
売上アウプの3要素:
⑤ディチーリング回数

(
A
)
M R単独

‑MR活動の効果を最大化する肪問先

卜教育訓練・ OJTで維持・改善可能

I‑MR活動の効果を最大化する肪問回数卜歯車戦略として実施可能

‑製薬企章側で股定可能

‑MRアンケートや医師アンケートで測定卜 MRが股定可能

‑効果が実恒されている

‑f
3x3
Jマトリッヲスの HPセグメント
oeDTL視聴医師は結果として決まる

‑改善のためのツールが充実
卜視聴コンテンツの置で決まる

卜ワンショットは 3か月以内が多い

卜効果はあるが安定していない

(
日
)
.l‑eOTL案内を行う医師は事前に決定で │・専門/非専門医師向けは分ける必要│・継続するには、コンテンツを更新する
I̲*BB ""j~_BB=""~I..I. I"" .l.\_,...1.':L.JY_iIIIi I̲̲̲....:
z.‑r+ .
.
.
.
.
.
.
=
,
.
.
.
.
+
'
i
I
S
.
m
:
:
.
.
.
.
.
.
:
z
: I
。ディテーリング│きる
卜継続実施にはコストが掛かる
(eOTL)単独 1
‑‑
1
1
[MR
活動との ト精密な9ーゲティンゲは困難である
トブッシュ型コンテンツには限界がある トリピート視聴には魅力が必聾
積極的連携なし]
‑プル型コンテンツI
こは魅力が必要
‑HPセグメント中心の MR訪問が基本
(C)
I
̲..̲̲.....̲
e
D
T
L
:
MR
訪問を補強
rMR+eDTLJ 卜
'
.
e
U
I
L
;
M
.
.
.
.
.
M
IIlJ<:rTIIIl!ll

の

積極的連携

│ トゲティンゲ戦略を阻害しない

卜MRとeDTLで得意分野を纏み分ける

I‑MR:HPセゲメント中心に訪問計画

̲ ~_. ~_.__
I
I ‑MR
‑m";症例、安全情報
t
l
t
.
1
'
7
'
l
.
.
:
K
.
:
I
:
.11
'
I
'
R
l
t

│一医師のニーズに合わせる
I -lZi þlP".I --^I_ r::l.,....l:!~

│司
I fMRX eDTLJの相乗効果

I ‑eOTL:疾車、薬剤に関する情報

・
│eDTL 定期的に発信

I‑MR主導で安定効果を期待

回

‑reJ視聴医師比率在高める

I

̲̲̲

~.

̲.

̲

卜fMR+eOTLJ回戦略が不可欠
I

目

‑アヲセス分析でコンテンツ評価・改善

│ 定期テヲアヴセスがあるよう更新

4̲ 2 イ ン タ ー ネ ッ ト 活 用 の 落 と し 穴
最後に、医薬品マーケティングにおける「インターネット活用の落とし穴 j について述べよう。医薬品マ
ーケティングにおいて、インターネットは有用ではあるが、当然のことながら万能ではなく、特に下記の点
に留意する必要がある。
①多忙な高ポテンシヤル医師 (HPセグメントの医師)はそもそもインターネットから情報入手する時聞が
限られており、優秀な M Rから、短時間で要領よくまとめた情報を入手する方を望む可能性が高いこと
(また、このような医師に対しては、各社とも M Rが高頻度で訪問しているので、直接聞く機会が多し、)
②感情のないインターネットだけでは、営業活動の基本である医師との信頼関係を構築することは困難で
あること
③eディテーリングのコンテンツ視聴には意外と時間がかかるので、限られた医師のインターネット利用
時間を獲得することは、 M Rの面会時間獲得以上に競争が激化する可能性が高いこと (MRの訪問回数を
競う SOV=ShareOfVoiceの時代から、インターネットの視聴時間を競う SOI=ShareOflntemetの時代へ?)
④ほとんどの製薬企業がインターネットで情報提供するようになると、他社より優れたコンテンツを継続
的に提供するためには、コンテンツ開発のために、多額の費用が掛かる可能性があること

⑤ rMR十 ε」の効果を高めるには、 rMRXeJ、つまり相乗効果を発揮できるような薬効領域の製品(非マ
ス領域)の製品を対象にする方が望ましく、どのような製品でも eディテーリングが高い ROIを発揮
するとは限らないこと
⑥ IMR+eJ において、相乗効果を含めた効果を期待するならば、当面、 l
e
J が M Rを代替する(つまり、

eディテーリングで M Rが不要になる)ということにはならなし、;逆に言えば、 l
e
J の積極的活用は、

現状の M R人数を維持した上でコンテンツ開発費用が掛かるという具合に、製薬企業の営業コストの
アップをもたらす可能性もあるので、 ROIに十分留意する必要があること

5
̲ まとめ
①インターネットによる情報提供 (
eディテーリング)も、 M R活動と同様に、「ターゲティングの精度」、
IMR活動の質」、および「ディテーリング回数」の 3要素で、各々の最適化を考えればよい

‑
1
2
4
‑

135.

② 5種類の製品について、 IMR+eJ の効果測定を行ったところ、いずれの製品でも IMRJ および I e Jの 効果が認められたが、相乗効果 IMRXeJ は 1種類の製品でのみ認められた ③上記の相乗効果は、非マス領域の製品に対するものであったが、この結果が一般的であるかどうかに ついては、今後の検証が必要である ④医薬品マーケティングにおけるインターネット活用は、慎重な戦略の下で実施することにより、売上高 アップをもたらす,しかし、 IMRXeJ の相乗効果がないと安定した効果は期待できないので、当面は インターネットが M Rに代替する可能性は小さいと考えられる 参考文献 ( 1)社会情報サービス:医師メディア調査 S‑DMR 2014年 版 ( 2 0 1 4年) ( 2 )熊西弘.医師多忙時代の医薬品情報源を探る、 Monthly ミクス ( 2 0 1 0年 3月号) ( 3 ) 医療情報の情報源と処方影響度、 Monthlyミクス ( 2 0 1 2年 1 1月号) (オリジナルのデータは、シード・プ 0 1 2 J ) ランニング「医師による医療情報の入手動向 2 ( 4 )020で進化する IMR+eJ モデル 医師の志向・行動に応じたチャネル戦略を、 Month1y ミクス ( 2 0 1 3年 1 1月号) (オリジナルのデータは、 M e d i c a lC o l l e c t i v el n t e l l i g e n c eC o ., L td . ) ( 5 ) 武藤 猛 :MRの生産性に関する考察、 SASユーザ総会 2 012 ( 2 0 1 2年 8月 2日) ( 6 ) 武藤 猛 :MRの生産性アップと最適配置戦略、アンドテック社 ( 2 0 1 2年) ‑125‑

136.

l 医鏡、政府・自繍 二l::J:I~7~~i~;~' SAS~-tf-ø. 2 0 1 4 マーケティングとデータ解析研究会 朝野県彦 中央大学 StudyGroupo fM a r k e t i n gand DataA n a l y s i s H i r o h i k oAsano,ChouU n i v e r s i t y │;yu 医療、政府・自治体、大学によ紅:ミステムの実証 SAS~-tf-ø. に 要旨: マーケティング活動を効果的に実行するために、データ解析は貢 献できているのだろうか?困難はどこにあって、どうしたら解決で きるのかを検討しよう、という趣旨で研究会を開いた。昨年度の活 動結果を報告する。 キーワード:因子分析、コーホート分析、ベイズ推定 ‑ 1 2 6 ‑ 2 0 1 9 I

137.

l d W 以 内 山 ¥ 脳 幹 い 陣、政府備体均向紅一務持.ザ蝕 W l J 9 │ G2:因子分析とクラスタ一分析 藤居誠 株式会社東急工ージェンシー G2:Af a c t o ra n a l y s i sandc l u s t e r a n a l y s i s MakotoF u j i i TokyuAgencyI n c 町田・自治体点均五五梅雨..問[9 l アジェンダ 1 . 利用の前提と実務上の対応 一 一 一 実務的前提 因子分析のフロー 実務上行っていること 2 . 因子分析の具体的手続き ー ‑ ケース 1 ケース 2 3 . 因子の回転 ー ー バリマックス回転 プロマックス回転 4 ‑ 1 2 7 ‑

138.

関政府自体 1.利用の前提と実務上の対応 実務的前提 ・なぜ因子分析なのか 一生活者の潜在意識を理解する ‑詩寒具Z F 意識山ない価値観は、変数として直接観測するこ .害額誌編襲酷甥盟主親2 設定し、その回答結果から、 .なぜクラスター分析なのか 一因子分析だけでは、対象者のボリュームを把握しづ、らい ー「分ける」ことはしばしば「分かる」に通じる ‑稗鍔払礎伊きかけるため、管理しやすい数に市場を細 各クラスターと消費者属性とのクロス集計により市場の理解が促進 さりれる 5 l 医療、政府師、榔よ勾戸均一…プ触 ~9 因子分析のフロー 定 出転推 抽匝の のll← の li+点 子子得 困因子 国 (朝野 2012) 6 圃 1 2 8 ‑

139.

!一自治以車両当標額p‑ 2 8 1 9 2 . 因子分析の具体的手続き 分析データ概要 一ネットリサーチ・パネル属性調査コライフスタイルクラスター ケース 1:ごく普通に・・・ 一因子分析 ・ステップ 1 棺関係数行列を分析対象にする .ステップ2 主因子解で因子抽出 ・ステップ 3 因子の数は固有値 >1で決める .ステップ4 因子をパリマックス回転する ・ステップ 5 アンダーソン・ルービン法で因子得点を求める ークラスター分析 ‑クラスター間の分離評価 ケース 2 :変数をスクリーニングして・.. 因子分析 ークラスター分析 医 癒 政 府 … 字I 説経縁日ム. o2 0 1 9 l データ概要 ・ネットリサーチ・パネル属性調査 ‑調査地域 東名阪エリア ‑調査対象者 主婦 一回収標本数 5, 629人 ー調査方法 インターネット調査 一調査時期 2012年 6月 ・分析データ ーネットリサーチ・パネルをライフスタイル別に分類するため の 質 問 項 目 約 80問 8 司 1 2 9・

140.

l開 府 開 大 学 は る 出 ス テ ム の 実 証 ユ ー SAS ~II~9 因子分析(ケース 1) スクリープロット 1 3 1 2 1 1 1 0 固有値 76 0 135791113U"HllDDV~nnHDWU~UQ~Ð~~Ð~U~~D~nnHn 国子白書骨 │医療政府関知よる一弘の実証…ー蝕 w9 因子分析(ケース 1主因子解・バリマックス回転) ; . . 盟 問 問 10 幽 1 3 0 白

141.

問 、 政 府 自 治 体 均 一 む 2 0 1 9 クラスター分析(ケース 1) 『句 ‑ ・司 ‑ ̲ . ,・ ' クフスヲ 1 クフス:92 クフスヲ 3 クフスヲ 4 クフス:95 第 1因 子 第 2因 子 第 3因 子 第 4因 子 第 5因 子 第 6因 子 第 7因 子 │ 第 8因 子 第 9因 子 │ 第 10因 子 第 1 1因子 第 12因 子 第 13因 子 第 14因 子 第 15因 子 第 16因 子 第 17因 子 ‑P.Ol 0.18 P 35 0.16 3重 量 0.99 自1 1 0.09 03 D03 長0.16 週 日 22 1 ) .08 日b.17 O .07 O .05 00 .30 団O 。 o 閣P 27 1 J32 D.ll ~23 直J26 L 蚤 38 i 週 0.53 0.08 自 09 i 選0.28 23 O .00 団b.24 06 ぬ 14 D .02 聴塗ヱ o 1 6 07 07 巳 週 60 区量5 07 震品 1 03 1124 医霊7 04 54 出0 国 25 国O .24 ‑ t J.08 l l l .15 04 態通1 1123 P 10 1 1 > .16 I J 32 重~ 医五B 。 遇 。 。 。 34 画 1 1 1 2 2 1 1 0.03 匿 19 0.03 国 2 1 監且 1 1 1 05 20 医 6 l > D ll 霊 { 30 [.)40 ー 23 島 17 ‑0.01 際 . . 51 首 15 園 25 ~.28 1] 36 医J35 じ遡 66 11 臨政府関、大学一一一両いや儲 9 W l J クラスター分析(ケース 1) n J ヲフスイ旨 自由度 平均平方 第 1因 子 第 2因 子 第 3因 子 第 4因 子 第 5因 子 第 6因 子 │ 第 7因 子 │ 第 B因 子 │ 第 9因 子 第 10因 子 │ 第 11因 子 │ 第 12因 子 │ 第 13因 子 │ 第 14因 子 第 15因 子 │ 第 16因 子 第 17因 子 71 .4 4 41 .2 1 6 9 . 0 4 3 0 6 .3 2 4 8 3 .1 3 1 3 7 . 1 8 27 7 .1 6 1 2 4 . 0 1 5 4 . 4 0 1 3 3 . 4 2 1 1 5 . 7 4 1 1 . 6 5 1 5 3 . 0 1 4 6 . 0 0 4 2 . 2 3 5 0 . 3 5 4 7 6 . 1 6 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 誤差 平 均 平 方 自由度 0 . 9 5 0 . 9 7 0 . 9 5 0 . 7 8 0 . 6 6 0 . 9 0 0 . 8 0 0 . 9 1 0 . 9 6 0 . 9 1 0 . 9 2 0 . 9 9 0 . 8 9 0 . 9 7 0 . 9 7 0 . 9 6 0 . 6 6 5,6 2 4 5 . 6 2 4 5 . 6 2 4 5,6 2 4 5 . 6 2 4 5 . 6 2 4 5,6 2 4 5 . 6 2 4 5 . 6 2 4 5,6 2 4 5,6 2 4 5 . 6 2 4 5 . 6 2 4 5 . 6 2 4 5,6 2 4 5 . 6 2 4 5 . 6 2 4 F値 7 5 . 2 0 4 2 . 4 2 7 2 . 5 5 3 91 .2 9 7 3 5 .2 5 1 51 .8 9 3 4 4 . 9 1 1 3 5 . 9 0 5 6 . 5 5 1 4 7 . 3 0 1 2 6 . 0 3 11 .7 4 1 7 15 5 4 7 . 5 2 4 3 . 5 1 5 2 . 1 9 7 1 9 . 2 2 有意確率 o00 0 . 0 0 0 . 0 0 0 . 0 0 0 . 0 0 o00 0 . 0 0 o00 0 . 0 0 o00 0 . 0 0 0 . 0 0 0 . 0 0 0 . 0 0 o00 0 . 0 0 o00 各クラス告のケース数 クフスタ 1 1.346 クフスタ 2 1,116 クフスタ 3 1.183 クフスタ 4 953 1,031 クフスタ 5 有効 欠損値 。 5,629 1 2 ‑ 1 3 1 ‑

142.

│医療政府間大学問問弘の実証…ー帥 ~[1 因子分析(ケース 2主因子解・バリマックス回転) スヲリープロット SA 勾 留有薗 │竺一…ロシステムの実証… 因子分析(ケース 2主因子解聞バリマックス回転) ‑ 1 3 2 ‑

143.
[beta]
2
0
日

戸、政府間均ぷ員層構'~:~S':1--4J-.a
クラスター分析(ケース 2
)

'
1
'
'
'
;
;
;
'
'

因子 1
因子 2
因子 3
因子 4
因子 5
因子 6
因子7
因子 8
因子 9
因子 10

"
'
,
、r .
,
‑
.
.
.
.
,
.
.
・
、
"
.
.
.
.
.
.
.
.
"
.
,
クフスタ 1 クフスタ 2 クフスタ 3 クフスタ 4 クフスタ 5
46
じ
菊 ‑0.
濁 0.56
~-0.15
園陸通J
1
‑
0
.
0
3 L
!
‑0.
u
1
‑0.05
じ0.24
l
遇
一 0.32
自0.13
.
0
1
齢 J4 」遺骨 1
む0.16
団 0.22
J
]0.26

ロ

0
.
0
3
‑0.26
‑
0
.
5
1
一0.65
‑0.35
0
.
0
7
‑0.05

1
‑
0
.
0
3
:
‑
0
.
0
1
[
)‑0.28
‑0.12
じ
週 0.66
[
1‑0.27
I0.04

1‑0.13
‑0.03
‑0.10

国
一 0.28

0
.
0
7
0
.
0
1

I0.03
~-0.14

0
.
0
1

盤議記
霞函.8l 己蓮ー 0.66
1
]
0
.
3
0
感ls4

1
1
l.39

1
U
0
.
2
9
1‑0.08
~ 0.20
0
.
1
1
0
.
1
0
U0.14

1
5

医療政府目点点字持娯務長?ー

l

~n

クラスター分析(ケース 2)
分 散 分 析表

クフスヲ
平均平方

因子 1
因 子2
因 子3
因子 4
因 子5
因子6
因子7
因 子8
因子 9
因子 1
0

5
7
5
.
9
3
5
1
.
3
2
4
8
0
.
2
5
6
9
.
1
2
4
4
.
7
1
3
9
8
.
8
4
5
9
8
.
3
5
2
9
1
.
2
6
2
6
.
7
2
1203

誤差

自由度 │平均平方

4
4
4
4
4
4
4
4
4
4

0
.
5
9
0
.
9
6
0
.
6
6
0
.
9
5
0
.
9
7
0
.
7
2
0
.
5
8
0
.
7
9
0
.
9
8
0
.
9
9

自由度

F1
直

7
4
.
3
5
5
.
6
2
1 9
5
.
6
2
4
5
3
.
2
3
2
8
.
6
0
5
.
6
2
4 7
7
2
.
6
4
5
.
6
2
4
5
.
6
2
4 4
6
.
1
5
5,6
2
4 5
5
6.
23
0
4
0
.
3
4
5
.
6
2
4 1
5,6
2
4 36703
2
4
2
7
.
2
1
5,6
1
2
.
1
3
5
.
6
2
4

有意確率

0
.
0
0
0
.
0
0
0
.
0
0
0
.
0
0
000
0
.
0
0

。
。
0
.
0
0
。
。

各クラス告のケース数
1
.
13
9
クフスタ 1
,
1
1
5
1
クフスタ 2
1
.
2
1
2
クフスタ 3
1,
007
クフスタ 4
,
156
1
クフスタ 5
有効
欠損値

。

5,629

0
.
0
0

1
6

‑133‑

144.

切実証純一.. 紅 2 0 1 9 因子得点の計算因子得点平均と分散 度数 │因子 1 │因子 2 │因子 3 │因干 4 │因子 5 因 子6 │因子 7 │因子 8 │因子 9 因子 1 0 5 . 6 2 9 5 . 6 2 9 5 . 6 2 9 5 . 6 2 9 5 . 6 2 9 5 . 6 2 9 5 . 6 2 9 5 . 6 2 9 5 . 6 2 9 5 . 6 2 9 A‑R f a c t o rs c o r e 平均値 分散 0 . 0 0 0 . 0 0 0 . 0 0 。 。 00 。 。 日 0 . 0 0 0 . 0 0 0 . 0 0 0 . 0 0 1 . 0 0 1 . 0 0 1 .0 0 1 . 0 0 1 . 0 0 1 . 00 1 . 00 1 . 0 0 1 .0 0 1 . 0 0 REGRf a c t o rs c o r e 平均値 分散 。 。 0 . 0 0 0 . 0 0 0 . 0 0 0 . 0 0 0 . 0 0 0 . 0 0 0 . 0 0 0 . 0 0 0 . 0 0 0 . 8 2 0 . 8 3 0 . 7 4 0 . 7 6 0 . 6 9 0 . 7 4 0 . 7 3 0 . 6 2 0 . 6 8 0 . 5 9 日ARTf a c t o rs c o r e 平均値 0 . 0 0 0 . 0 0 0 . 0 0 000 0 . 0 0 0 . 0 0 0 . 0 0 0 . 0 0 0 . 0 0 0 . 0 0 分散 1 . 2 7 1 . 2 2 1 . 3 8 1 .3 4 1 .50 1 . 3 8 1 . 4 2 1 . 6 7 1 . 4 8 173 17 |即日付学問~.5."fJß弘ゐ実龍一雌 . 18 ‑ 1 3 4 ‑

145.

│ 医 療 、 政 府 開 、 大 学 問 口 以 弘 間 ‑ o * SAS:L‑"f 2 0 日 │ 因子分析のフロー 出転推 抽回の ←の││←点 のll 子子得 因因子 定 因 1 9 │同一府ト時期!とよ志向ギゐムー m[ 9 3 .因子の回転 ‑バリマックス回転 ‑相聞がゼロという直行条件を付けて回転を行う直交回転 一因子負荷量が‑1‑+1の閉までの値を取り、理解しやすい ‑縦横 90度に回転するので、グラフの表示が簡単 ーマーケテイング等で、使用されやすい ‑プロマックス回転 因子間の相関を許容する斜交回転 一因子の解釈度が高くなる 一共分散構造分析のために探索的に因子分析をする際は 良い 一心理学などア力子、ミックな分野で使用されやすい (朝野2 0 1 2 ) ‑ 1 3 5 ‑ 20

146.

医制同省悶こよ苧ヂテム持 : 1 ‑ f J " . SAS 2 0 1 9 因子分析の手順 データ:ネットリサーチ・パネル属性調査 .因子抽出:主因子法 .因子数:固有値 > 1 ・回転 :1ミリマックス回転とプ口マックス回転 (k=4) .因子得点:回帰法、 B a r t l e t t法 、 AndersonRubin 法 幽 ・それぞれの回転と因子得点計算法によって、因 子得点毎の相関行列を求める 21 l 医療、政府間、大学による工以均一r.~蝕 ~9 バリマックス回転後の因子例 " 主因 H 回融 K."" . . 闘 岨 " " 長 崎 東 ιまし 22 ‑ 1 3 6 ‑

147.

ω実証一齢 [医療政府開大学問問ステ W J 9 バリマックス回転での因子得点の相関行列 遣国干 I I 2 I 3 I 4 Anderson‑Rubin1A~醐醐醐醐剛醐醐醐剖 1 。 ω 0 0 0 1 . 0 0 0 0 0 0 1 . 0 0 0 0 0 0 1 0 0 0 調 邸 。 ω 1 1 0 ∞ 0001 000 。 剛 。 明蹄 倒~ 民~ 。∞似~ 倒閣 副蹄 倒閣 町旭 国岡 倒閣 000 倣~ 0 0 0 1 0 0 0 1 0 ω 0 0 0 1 側~ 脱却 倒抱 0 0 0 1 制~I 0 0 0 0 0 0 叫 飢~I 0 0 0 1 0 0 0 0 0 0 ω 低 調 " 飢悶 。 ∞ ∞ 。 。 。 調 邸 。 ∞ 。 ω 。 加 0 0 0 1 ∞ 。 000 側~∞。 ~悶 0 0 0 1 1 1 0 0 0 0 0 0 創刻 1 000ω 0 0 0 1 0 0 0 0 0 0 1 . 0 0 0 。 0 0 0 1 縦割" 0 0 0 戸、政府自… プロマックス回転後の因子例 24 ‑ 1 3 7・

148.

医寵、政府・自治体、大学による工コシステムの実証~トト総会 ~I]]] プロマックス回転での因子得点の相関行列 ~韮 図手 3 4 2 1 1 ,3 5 2 ‑ 58" 8 2 1 3 5 2 ‑ 1 1 5 2 5 ‑ 1 1 2 " 31.458" 5 1 1 ,5 2 5 " 4, . . 512‑ 1 4 制~8 5 " 0 2 8 " 5 1 . 3 7 ' ‑ 0 7 5 " 0 1 5 6 1 3 0 7 ‑ 0 8 3 ・ 286‑ 1 4 3 ‑ 0 2 1 1 7 1 . 0 2 8 0 1 ' S 1 1 2 1 1 ,1 (3" 9 1 4 7 1 ‑ 3 7 0 " 5 9 8 " 5 3 2 0 1 1.571 0 3 5 ‑ 2 1 6 " 3 3 8 . 。 ∞ 。 ∞ 帽 B a r t l e 仕法 2 図予 1 1 2 1 2 8 1 3 2 " 3 1 ,3 4 1 4 6 9 51.259 61.238" 7 1 0 1 5 7 8 91.310" 1 0 1 3 6 9 輔 回 ∞ 咽 Anderson‑Rubin遺 5 6 7 9 8 1 1 . 4 7 7 " 0151‑143" 1 ¥ . 3 7 0 ・ ' ・ 0 1 6 0 8 3 ‑ 5 9 8 " 目 , , ' 2 0 21 1 1 2 司瞳 5 3 2 " " . 01'" 2 32 1 m" 2 0 S 40‑ 1 31I 2 4 1・ 2 1 ' " 3 1 7 ‑ 2 0 8 1 1 2 4 ( l " ω7 ・ 2 4 1 1 1 . 1 2 5 " 2 3 2 2 4 0 0 7 1 ‑ 2 ' 1 1 ' ‑ ω f ↑25" 4 2 8 ‑ 319‑ 2 0 3 2 ' 1 ,2 8 6 " 4 0 ∞ " 37'‑ J < " ‑ 028 3 1 2α~ 。 嶋 , " ∞ 2 ωf 0 0 4 1 0 8 8 " 3 4 7 ‑ 2 2 3 ' 1 6 1 1 3 4 ‑ 。 ,1 2 図手 刷~ 1 白 0 4 ' ‑ ∞ 償却 1 1 ∞ 飢~ 4 1 5 6 7 8 9 0 0 0 民.ぽ. 0 1 1 縦 訓O ぽ. 。 到 低 ∞ 。 脱却 。 調 低 0011 ぽ拘 。 刻 依 000αm 。 刻 側 000 ∞o 以~ 1 0 1 0 0 0 脱却 0 0 0 ,, 5 飢氾 似~脱~ α. α. 脱却 0 0 0 ∞ 7 1 S 000 。∞制)Q 創 . 側~倒)Q 目)Q 1 似~ α. 1 1 0 0 0 ぽJ O 以O 制 . , 似J O I 0 0 0 1 1 0 ∞ 0 1 ∞o 9 白 償却 ∞ a ω 1 3 5 ・ '114" " " 1 1 97 ' 1 1 3 0 ・・ 056" 149" 6 1 1 0 5 9 ‑ 1 3 0 " 0 5 9 ‑ 1 ↑,," 0 5 5 1 4 9 ‑ 6 1 5 8 ‑ 似~ , 000 。 ∞ α J O 0 0 0 7 0 1 5 1 1 0 5 ・ 1 ) 0 3 5 ‑ 2 1 6 * * ・・ 3" 4 2 S ・・ 3 1 9 " 2 4 0 " 0 32 ' 2 8 6 " ∞7 310・ 369" 一 " , ‑ ∞4 223" 016 一 ∞2 OBS 347 134 。 ωωf 3 2 0 1 9 = " 1 1 3 6 " 也3 4" 1 2 2 6 ‑ 1 1, 田 3 1 4 償却 0 ∞ ∞ , . , ‑ 胃 5 6 2 5 9 2 3 喝" 4 6 9 ‑ ̲ 0 1 3 0 5 9 3 1 0 3 5 " " 防「 1 1 0 1 2 2 1 6 0 1 2 1 1 2 1 5 ‑ 2 1 6 2 7 5 " 1 1 四珂 1 1 1 ‑ ↑,," 0 5 3 ‑ 1 3 6 ‑ 1 1 6 0 ‑ 3 4 ' 1 ,1 3 5 ‑ 3 2 0 " 0 "5 ・・ 22'" lB同" 3α~ 0 0 0 1 沼 , " 4 2 81 " ' 3 3 2 " 1 1 3 7 2 . ‑ 3 7 2 ‑ 1 1 ・ 354" 3 1 0 0 5 9 " 1 3 0 5 ' 。 0 8 5 0 7 5 ‑ 似~ 0 0 1 1 1 側~以~ 9 I 1 0 ωo o 0 0 1 1 0 0 0 ∞ 000 ∞ . 側~ α~ , α~ 償却 臥 . は . 0 0 1 1 0 0 0 ω 似J O 0 0 0 ∞o 1 側~ 氏 . , ∞ " ∞ 0011 ∞ ∞0 。 α~ 似J O │医療政府開大学によるエコシステ邸主主一触 クラスター分析 K 叩 ~9 ns 最終クラスター中心 パリマックス回転 プロマックス回転 ヲラス~ 因子 10 国平構占は.f-れ子:れ An_d_~r墨田主盟副且遺 26 " 1 3 8・

149.

! 物引がか行 竺 医癒政府関大学問ヱコ均の実証一齢 . クラスター分析 ι 各クラスター聞の距離 合計 ノ【リマックス 1 のクラスタ Z 3 4 5 合計 27 │時政府間却による却ステムの実証一一総会 P I I ] I 回転ごとのプロット図 プロマックス回転 パリマックス回転 5 柑 ; T 凶育亨 .パりマヅタス輔府内一 28 ‑ 1 3 9 ‑

150.

|医癒政府間大学間以弘の実証f.ß~総会 9 W J ] 重ね合わせ 29 i 医療政府間大学問防ステムの実証~総会 G4:コーホー卜分析 田村玄 株式会社ビデオリサーチ G4:Cohorta n a l y s i s GenTamura VideoResearchL t d . ‑ 1 4 0・ W J 9

151.

l医 療 政 府 聞 大 学 問 吋 ム 尚 一s日目絡会 ~I][1 時代のトレンドをとらえる コーホート分析概要 .トレンドを年齢・時代・コーホート(世代)に分解 .トレンドの構造が明らかになる ・長期間、年齢別に観測されたデータが必要 コーホート分析アルゴリズム ・ベイズ型コウホートモデル、簡易推計、軍回帰 ・ SAS/IML を用いた簡易推計はベイズ型コウホートモデルと 著しく異なるわけではない ・重回帰は、多重共線性をどう回避させるかが課題 コーホート分析による将来予測 .コーホート分析はフィツティング重視 ・単純な自己回帰の方が誤差が少ないケースもある 31 │医療、政府眺大学による工コ対一一一絡会 ~[1 「マーケティング分野におけるベイズ統計 の活用事例に関する一考察」 中見真也学習院大学経営学研究科博士後期課程 松本和宏{株}富士通研究所ナレッジプラットフォーム研究部 As t u d yo ft h ea p p l i c a t i o ncaseo f Bayesians t a t i s t i c si nt h emarketingf i e l d . ShinyaNakami,GakushuinU n i v e r s i t y l くa z u h i r oMatsumoto,FUJITSULABORATORIESlγD. KNOWLEDGEPLATFORMSLAB. ‑ 1 4 1 ‑

152.

ES 肌甲山会 W J 9 AGENDA 1 .ベイズ統計の概要 ‑1 ‑1.ベイズ統計の基本的な考え方 ‑1 ‑ 2 .頻度主義とベイズ統計の遣い ‑1 ‑ 3 .ベイズ統計のメリット・デメリット • 2 .ベイズ統計を理解する上で重要なキーワード ‑2 ‑ 1 .マルコフ連鎖モンテカルロ法 (MCMC法) ‑2 ‑ 2 .複雑な統計モデルに対応する階層ベイズ法 3 .分析事例 階層ベイズと線形回帰の遣い • 4 .課題と展望 実務への応用について 33 │医癒政府間大学問工コシス弘の実証…一齢 p m l 9 ベイズ緯計の革本的な考え方 ・そもそもベイ3 だって? 18 世紀後半スコットランドの長老源敏会の故鱒ト マス・ベイズが者案した「ベイズの定理 J が由来. (つまり、アマチzアの敏学者) L 竺竺! m ‑ベイズ'fD..と肱? P(BI . . 4 )= P( . 4 1B )P(B) 事.Aに闘す畠allM畢{デー~)が得畠れたとすると.それ豊原聴し、主..RAIB) の. . によっτ .事.8の.寧雄司"事情耳111'&事後積率へ邑震.寄れ轟. ( . 4 ) 嚇蝿事前彊寧吋楊デーダ吋輔たな磁ヨ瞬時 得たデータが前の殖.に作用して続たな積率が算出される(ベイズ更新) 深刻閥幹有制;"制.。制緩験締結むことがで均〉 ‑ 1 4 2・ a

153.

l‑ 自治両議聾離種隆・ 2 0 1 4 ベイズ統計を使う理由〈メリット/デメリット〉 <メリット> ⑨柔軟かつ自然なモデリングが実現できる ⑧小サンプルでも,妥当なパラメータが推定できる ※標本数が少ないことに起因する不適解を回避できる場合がある ⑧誤差分散が負になるといった、計算上のエラーを避けられる <デメリット> ⑨計算が結構大変 ⑧事前分布の設定により客観性を損なう恐れがある EE 霊塑盟盟鞠輔覇盟 国国と思量 ・今回、実務上、ベイズ統計の考え方をマーケテイング活動に利用して いる事情は正直少ないのが現状。 →まずは、ベイズ統計と頼度主輯を併用してみて、どちらが有効かを 蹴してみることが重要! ! ..遭難、サービス S 障を中心に、膨大な副書データを今後どうビジネス に活用すべきか、正にピックデータ時代のマーケテインタを考える上 で、ベイズ統計の考え方は、時代にフィットする可能性を秘めている。 ・消費者視点で鴎慣行動を見た障にも、現在スマホ、 PCの昔:&により、 リアルとネットを自由に行き来する「オムニチャネル』が今後普及 していくことが予調される.その際に、個人の膚買腫躍をベースに、 企蝿倒は関連販売(リコメンデーション)を推進していく慣にも ベイズ統計は有効だと考えられる。 1 4 3 ‑ ー

154.
[beta]
(
o
f
¥
"
l
i
,
%I
<
j
;
λ,
' , ~t:

;
コ
'
寄
与
宵

百

t
:
'

c5建す詩嚢勾ち‑.", ̲
,~ ~'7;';;

'.~ r~> ,
'
‑
̲
¥
̲̲
.
:
;霊
悉 j

九アマ口:司、

ssす寧韓首始め問、そ斗'~,~\,律事‘
‘:角、泊者撃や宇 'f鶴間~輔察本~::曾民簿二日‘ rイ!約J斗:
?主:.r件4叫子-;聾態~f.ρ
…リA ぞ'玄支E
岱勺士ヨヨ
1i略輯誌

5
.,
,
i
.i
食持者暴行手黙ァモ

;

一れ

ぺ 冷線接税イ丸

a

も
今
一
回
」 一
一

,
什j土
紅
.
:
/
乞J
r
;
":.,.t:
民
Lf》内ゆ叩
?2
靖詰 l.~ 晶正J ζ
f
t

手;-~.;;

,

J バ烹~~せ

士
予
子
空
町
ゴ

a

け

1~'?~諸島。斗

叫

r

島

v

、白ふ

~~::j, 当証

;
己
、
"
"
.
.

少な i/~

r
.J 努~) ,~~: ..~

小、い"宅

a

z

嬉縛躍喰鴎 サ
FJ
喜
忠
元t
滋
亀寵
監j
五
1
;
.
,;パ♂付ペぷ、→~,湾昔熊堅善議革長必~

、
一J長,燭字企毛主炉事雪上完全i
l
ぷ
g

‑

z
v

ii
f
吉
川
島

ε
:

J

'
.
ゴ
え寝台喝 S
Ft J Fそ司距離多大事 JJ正予担全鱒
孟君臨棒、ぐ噌そ't‑.
̲
.'V(¥)卦輯守山:c勺‑...t 二
i
訟
,
i
.'
;:
¥
i
.!
j
.'
i
i封
型
車 r?"
I
i
',_き ~'f

ヨ
ペ
;
込
;
辺
渇i
必
訴
守
禄
号z
お
D
:
;弓

ぷ

d
φ
之
奈
弘
句
句
E 丈掛欝

s
l

:

A

x
d
t

で e‑f将司や
p

d

z

"~ ;
;
.
t
難
渋思
農ヨ
参
書
鱒
?
詰
官
誠翻
語
ち
守
為
魚
!
旬ず
f
妥
、
,
繁
艶
境
〆
、
♂
?
吻

つ

痕
z
E 今ね芯量議盛争司喰~ .
t~l~. 意掌,怠喝宇 4長寄;二ニ,å.色余、 7 尋
守
1
"
'
諜
電
努
5
主狩71
柔f
良
4
?
芳
Fイ 、ふよ沢 バ
r

ベ~\ ̲.わ撃事空襲翼輯 Q 人諸島.詰樹齢:Jo ,,*,.fをな輯.jf'~ :
.
5
,
ム
ヘ1

九二a 警察予 r!『 J 務省略まいよ底、~-,冒号、.: ~U:: V)聾難蕗灘*'聖母?付与

"~ ,噴と会理降る 2忠誠司'.tJ f~;誌に;7'''γ ー

'
"
'-""-,‘竺...~'"
~..

守
二
'
;
:
"
:
‑
:
'
̲~船主)(~ ~

三、託料ユF一国主山内、

γ'
:
"
'
"
'
.
‑
:
:
;
;
"
,
‑
i .'~~:~r: ニ嘘送、:,,;_,=:;丸>-""~一拍て視員長、:~~祭主要事必 EKきょ二九九 β

157.

D o m i n a t i o n 理論によるリスク管理標準 中西美紗 統計数理研究所リスク解析戦略研究センター Dominationt h e o r yong e n e r a lg r a p h sf o rr i s kmanagement MisaN a k a n i s h i 司 . r T hei n s t i t u t eo fs t a t i s t i c a lm a t h e m a t i c s Riska n a l y s i sr e s e a r c hc e n t e 要旨 リスクマネジメントは、予期しない事象の影響を評価し、資質の効用を促進する。その標準モデルとして、 o m i n a t i o n を一般化する。これは、 s e tc o v e r i n gp r o b l e m と関連し、本論では SAS 組織体をグラフ表現し d programmmgによる計算を記述する。 o m i n a t i o nt h e o r y、g r a p h i c a lr e p r e s e n t a t i o n、SQLp r o c e d u r e キーワード:リスクマネジメント、 D 序論 リスクマネジメントは、予期しない事象の影響を評価し、資質の効用を促進する。その標準モデルとして、 組織体をグラフ表現する。構成要素をノード(頂点)化し、その聞の関係を辺にすることにより、グラフを 定義する。グラフの d o m i n a t i n gs e tは、頂点集合の部分集合であり、全ての頂点を c o v e rする。信用リスク、 情報ネットワーク、災害政策など、現実のシーンへの応用は多様だ。 d o m i n a t i o nt h e o r yは s e tc o v e r i n gp r o b l e m と関連し、本論ではこの問題への解を与えることを主旨として、 SASp rogrammingによる計算を記述する。 e tc o v e r i n gp r o b l e mは、集合の部分集合からなる f a m i l yのうち、集合全体の要素を 位相空間を基礎として、 s c o v e rする最小数の部分集合を求めようとする。これと同値な表現として、 b i p a r t i t eg r a p hへ写像し、 d o m i n a t i o n P ‑ c o m p l e t eとして同等な任意のグ numberを与えることが、中心的な命題である。よって、その聞の帰結は N ラフの d o m i n a t i n gs e tを導く。 D o m i n a t i o nmodelにおけるリスク管理 リスクマネジメントにおいて、組織体の要素を覆う集合を扱う標準モデルを構成し全体をi 府鰍することが求 められる。グラフ表現による D o m i n a t i o n性の付与は普遍的である。 ‑ 1 4 7 ‑

158.

t h ee f f e c tofu n c e r t a i n t y ono b j e c t i v e s " と記されたリスクマネジメントは、 ISO31000 により 3 つの場面 i d e n t i f i c a t i o n、a s s e s s m e n t、p r i o r i t i z a t i o n を定めている [ 1 ]。全てのリスクの存在を評価するのは難しく、資質 を均衡を保ちながら配置するのに多くの失敗を伴う。構成要素のつながりの上で、それらを網羅する集約点 をそれぞれに形成し、全てのリスクに適応することが基本的である。経費を最ノl 、とし、さらにリスクの負の 巾 n i t yc o s tの考え方に通じている。 効果を最小にするのは、 oppo 適応する現実のシーンとして、次に例を挙げる [ 2 ]。 p r o j e c t management s e c u r i t y e n g i n e e r i n g i n d u s t r i a lp r o c e s s e s f i n a n c i a lp o r t f o l i o s a c t u a r i a la s s e s s m e n t s p u b l i ch e a l t hands a f e t y 最近には、 I n t a n g i b l er i s kmanagementと呼ぶ、必ず起こる事象が i d e n t i f i c a t i o nの欠如により組織に見落とされ るリスクの型が提唱されている。 Domination性の付与は、これまで見落とされてきたそれらの資質を有効化 する。 グラフ表現 一般にグラフは頂点集合と辺集合から定義する。辺集合は頂点、の二項関係からなる [ 3 ]。 G=( V , E) 頂点集合 V と辺集合 Eを SASd a t a s e tとして保持すると次のように表される。 d a t avertex v a r l a a b b b c d d e f f d a t aedge var2 b e c d e e a f f a b 図 1 グラフの頂点集合と辺集合 O . Dominationmodel 一般にグラフにおける d o m i n a t i n gs e tとは、その補集合の頂点を全て c o v e rする頂点集合である。つまり、グ o m i n a t i n gs e tXは V の部分集合で v‑Xの頂点はそれぞれ Xの頂点と隣接している。 ラフ G に対して、 d o m i n a t i n gs e tを図 2に示す。 図 lのグラフを例に、ひとつの d ‑ 1 4 8 ‑

159.

d a t avertex v a r 1 a a b b b c d d e f f d a t aedge v a r 2 b e c d e e a f f a b 図2 d o m i n a t i n gs e tXエ { a,c } グラフの d o m i n a t i n gs e tの頂点とそれぞれの隣接頂点は元の頂点集合を形成する。それにより、 d o m i n a t i n gs e t であるかを確かめる。図 2において、 SQLp r o c e d u r eを用い、次の(1)と ( 2 )から成る d a t aは( 3 )の d a t aと等しい。 ( 1 )s e l e c tv a r 2f r o me d g ewhereva r 1=γorva r 1=γ; ( 2 )s e l e c tv a r 1 合ome d g ewherev a r 2= a 'o r v a r 2= c ' ; ( 3 )s e l e c tv e r t e xf r o mv e r t e xwherev e r t e x八 = a 'a n dv e r t e x^ ニ c ' ; d o m i n a t i n gs e tのいくつかの特徴的な例を次に示す。 0 ‑ 1 . Connecteddomination グラフが c o n n e c t e dであるとき、任意の 2頂点は辺でつながった頂点を経由 しながら互いに移りあう。 d o m i n a t i n gs e tに対しでも同様に、 c o n n e c t e dである o n n e c t e dd o m i n a t i n gs e tは、例えば m o b i l ea dh o cn e t w o r kの r o u t m g という。 c の考察に利用され、 c o m m u n i c a t i o nの基幹にある [ 4 ] 0 図 lのように、頂点集合と辺集合の d a t a s e tを作成し、 d o m i n a t i n gs e tを X とおく。 ( 4 )s e l e c tva r 1 ,v a r 2f r o me d g ewherev a r 1i nXa n dv a r 2i nX ; これは、 X の間の辺を表す。 c o n n e c t e dであるならば、 X の頂点の隣接点の 図 3 グラフの c o n n e c t e dd o m i n a t i n gs e t 集合 Y に対して、 ( 4 )の t a b l eに繰り返し ( 5 )、( 6 )を適用し、 X の全ての頂点、 を抽出する。 ( 5 )s e l e c tv a r 2f r o m( 4 )wherev a r li nY; ( 6 )s e l e c tva r 1from( 4 )wherev a r 2i nY; 0 ‑ 2 . Independentdomination d o m i n a t i n gs e tが i n d e p e n d e n tであるとき、その任意の 2頂点は辺をもたない。これは、 0・1の( 4 )の施行による o b s e r v a t i o n数が 0であることと同等である。 ー 1 4 9 幽

160.

domination 0 ‑ 3 . k‑ 自然数 kに対して、 Xが k ‑ d o m i n a t i n gs e tならば、 v ‑xの頂点がそれそ'れ Xの少なくとも k頂点、と隣接する。 図 lのように、辺集合の d a t a s e tを作成し、 d o m i n a t i n gs e tを X とおく。 Xの補集合の頂点 vに対して、 'a n dv a r 2i nX ; ( 7 )s e l e c tv a r 2f r o me d g ew h e r ev a r l=v d g ew h e r ev a r 2=v 'a n dv a r li nX ; ( 8 )s e l e c tv a r l合ome を施行すると、 ( 7 )と( 8 )の o b s e r v a t i o nの総数が k以上である。 構成 グラフの d o m i n a t i o nmodelを構成する。図 lのような、頂点集合と辺集合の d a t a s e tに対して、 SQLp r o c e d u r e を施行する。 ( 1 )s e l e c tv a r 2仕ome d g ew h e r ev a r l= ' a ' ; ( 2 )s e l e c tv a r l企ome d g ew h e r ev a r 2= a ' ; d g ew h e r ev a r l= ' a 'o rv a r 2= ' a 'o r( v a r li n( 1 )a n dv a r 2i n( 1 ) )o r( v a r li n( 2 )a n dv a r 2i n( 2 ) )o r ( 3 )d e l e t e合ome 紅 1 i n( 2 )姐 dv a r 2i n( 1 ) ) ; ( v a r li n( 1 )a n dv a r 2i n( 2 ) )o r( v v e r t e xaについて、 ( 3 )の t a b l eを決め、それに対して繰り返し 0になるまで同様に v e r t e xを取り出す。その頂 点集合は d o m i n a t i n gs e tである。 b‑e‑GEEd‑e‑e‑a‑f‑f‑a 一 b 山 E b ‑ ‑ D 一 bEc‑‑d aa 一 d‑e 一 f‑f o m i n a t i n gs e t{ a, b, c }の構成 図4 d Aminimumdominatings e t 一般のグラフにおいて、頂点数が最小の d o m i n a t i n gs e tを構成するのは、 N P ‑ h a r dであるとされる。 d e c i s i o n p r o b l e mのひとつで、次のような関連する同等の問題を示している向。 岨 1 5 0・

161.

D o m i n a t i n gs e t‑f o rb i p a r t i t eg r a p h s 図5 N P ‑ c o m p l e t eproblemの関連 o m i n a t i n gs e tの位数を d o m i n a t i o nnumberとし、い、 γ(G)と記す。 グラフ G の minimumd Minimums e tcoverと Dominatings e t 集合 S={ a ̲ l, … , a̲m} の部分集合 C 1, … , C nが与えられ、それらのある和集合が Sを覆うとき、それを満 たす部分集合の最小数を求める。その最小数がある値未満で、あるか、 Minimums e tc o v e rは提起する。これは、 o m i n a t i o nnumberを導くことに帰着する [ 6 ]。 次のグラフ GO において、 d GO= (VO, EO) v , w} U { C̲I, … , C̲n} U {a̲l, … , a̲m} VO= { ( v , w)} U { ( v , C ̲ i )I i= 1 , … , n} U {(C̲i, a ̲ k )I a̲ki nC̲i, i= t , … , n} EO= { a1 a2 a3 a4 C5 三 ミ ; ‑ ; 図 6 Minimums e tc o v e rの m s t a n c eのグラフ表現 i p a r t i t eg r a p hを構成している。 i n d e p e n d e n tで互いに素な 2つの頂点集合からなる。 このグラフはひとつの b b i p a r t i t eg r a p hの i n d e p e n d e n td o m i n a t i o n number の 解 法 が こ れ ま で に 示 唆 さ れ て い る [ 7 ]。 グ ラ フ G の i n d e p e n d e n td o m i n a t i o nnumberは 、 i n d e p e n d e n td o m i n a t i n gs e tの最小位数であり、 i ( G )と記す。 解法 Minimums e tc o v e rの i n s t a n c eのグラフ表現について、 d o m i n a t i o nnumberを与える方法を概略する。グラフ GO について、次の過程を経る。 v ,w,C ̲ i }と Ciの隣接点を縮約する。 (Gl) l . グラフ GOに対して、 Ciを選び、 { 2 . Glの i n d e p e n d e n td o m i n a t i o nnumberを求める。 ( k l ) n d e p e n d e n td o m i n a t i o nnumberと比較する。 ( k 2 ) 3 . さらに、ある Cjを縮約したグラフの i ‑ 1 5 1 ‑

162.
[beta]
4
. k
l>k2ならば、 01から Cjを縮約する。 (
0
2
)

。

.
.
.
.
.
.
a
̲
l
C_l ・.....:.~ニー一

。

C
ム.
4
(
)
.
,
,
̲
.
句
‑
‑
̲
、Oa̲5

ひ

よも a7

。

o

C̲20‑てに一一‑‑03

く)

正 〉 、 、'Oa̲4

Oa5

C̲
4Q
.
"
,
.
.
̲
̲

ひ a6

C̲50
‑
‑
‑
̲ ....ー
、''Oa7
h

H
‑

二
"
, ‑‑'Oa̲650‑‑̲

け一一一一吋一吋一

、、 、 、

C
l

。

つ

0 斗也︑ー一 も

‑
"
.
.
,
二
'
Oa̲4
、、

J亡
二
3
‑
{
h
;
.
̲

た一一¥一九九¥

可/ー¥、、ー

mG

。
.
一
一
w

ハ出血

c
̲
?
‑・
ひ
ど
三
一 ‑‑‑‑{)a̲3

口‑U‑M‑ 日一

・

一
二2 a̲2
.
.
.
‑
'

〉
仁

t
r
a
t
e
g
y(00,
01,
02)
o
m
i
n
a
t
i
o
nnumberを与える s
図7 d

図 7について、 SASprogrammingは次のような例になる。
(
1
)d
e
l
e
t
efromedgewherev
a
r
l=w o
rv
a
r
2=vo
rv
a
r1ニ C 1o
rv
a
r
2ニ a 1o
rv
a
r
2=a2
;
(
2
)d
e
l
e
t
efromedgewhercv
a
r
l= C̲3;

(
3
)i
f
k
l>k2t
h
e
no
u
t
p
u
t(
2
)
;e
l
s
eo
u
t
p
u
t(
1
)
;

(
1
)d
e
l
e
t
eedgest
oG1

園 8 SASprogrammingの s
t
r
u
c
t
u
r
e

これらにより、最初の Ciについて Cjの集合が決まり、これを差集合として、任意の iにおける最小の被覆
集合が導かれる。

リスクマネジメントの原則の留保
ISOによるリスクマネジメントの原則 [
8
] に鑑み、 Dominationmodelを標準どする。 modelの適用は、リスク
への対応に処する資質を制限し、全ての要素への分配や、未知なる創造性への投資を促進する。組織体を術
搬することを可能にし、組織過程の支柱である。全体の同時的な把握により、意思決定に付加価値を与える。
仮説や不確実性に対して、全てをカバーする。構造的に安定した戦略化を可能にする。常時存在からの発信
を通じ、その中から最良の情報に基づく。 model は任意に適合可能でらある。要素聞の関係を記し、コミュニ
ケーション過程を説明する。 model化により透明性と、包括性を保つ。全ての要素の資質に対する近接から
その変化を動的、段階的、反映的に扱う。常時性により継続的な改善と増進を可能にする。互いへの経過に
より、継続的かつ周期的に再評価する。一方で、組織におけるリスクマネジメントを一様化するものではな

し
、
。

‑152‑

163.

参考文献 [ 1 ]ISO/IECG u i d e7 3 : 2 0 0 9( 2 0 0 9 ) .R i s kmanagement?V o c a b u l a r y .I n t e m a t i o n a lO r g a n i z a t i o nf o rS t a n d a r d i z a t i o n . [ 2 ]ISOIDIS31000( 2 0 0 9 ) .R i s kmanagement?P r i n c i p l e sa n dg u i d e l i n e soni m p l e m e n t a t i o n .I n t e m a t i o n a lO r g a n i z a t i o n f o rS t a n d a r d i z a t i o n . [ 3 ]R e i n h a r dD i e s t e l( 2 0 1 0 )GraphT h e o r yF o u r t hE d i t i o n .S p r i n g e . r [ 4 ]Wu1 .a n dL iH .,"Onc a l c u l a t i n gc o n n e c t e dd o m i n a t i n gs e tf o re f f i c i e n tr o u t i n gi na dh o cw i r e l e s sn e t w o r k s ", P r o c e e d i n g so ft h e3 r dI n t e m a t i o n a lWorkshoponD i s c r e t eA I g o r i t h m sa n dMethodsf o rM o b i l eComputinga n d C o m m u n i c a t i o n s, ( 1 9 9 9 )ACM, p p .7 ‑ 1 4 . [ 5 ]M.R .Gareya n dD .S .J o h n s o n( 1 9 7 9 )C o m p u t e r sa n dI n t r a c t a b i l i t y‑AGuidet ot h eT h e o r yo f N P ‑ C o m p l e t e n e s s . S a nF r a n c i s c o . Freeman, [ 6 ]A l a nA .B e r t o s s i," D o m i n a t i n gs e t sf o rs p l i ta n db i p a r t i t eg r a p h s ",I n f o r m a t i o nP r o c e s s i n gL e t t e r s,1 9( 19 8 4 ),p p . 3 7 ‑ 4 0 . ,R e a d i n g . [ 7 ]H a r a r yF( 1 9 6 9 )Grapht h e o r y .A d d i s o n ‑W e s l e y [ 8 ]" C o m m i t t e eD r a f tof ISO31000R i s km a n a g e m e n t " .I n t e m a t i o n a lO r g a n i z a t i o nf o rS t a n d a r d i z a t i o n .2 0 0 7 ‑ 0 6 ‑ 1 5 . ‑153‑

164.
[beta]
,
、
今 ,
貫一、,、~.

';(, II.~: .

,
! H~ 畑

i
"
'
1、j
t
'
}・
"!

し
っ .

,
;

ι
"・(
'
11
0

り

,'

!
i1 d
) :け.ij
,
[
'1
¥)"

て
わl
i
r
l
l
;l
:
Jι
1
1
[
1
1t
,日企符'lh
J
'
i
‑!
:
! ~.l !
刊
門
(
!
:j:f'j~:üf

J Li
I

‑
!
j

,'
‑
¥•'1 可 1/;') ,、 υ)~."
μ
?
:
U
i
:
.
:
'
.Jt'
j

3

(
!
f、i
:
J.
f
i
!:
.
o
.
!
J
:

t

︐

O~ , I:d ,'~・!! l
l
;,
d
i
"

'
:
;
:
l 1;' I

ES

,
'
1
'r!;lh什,/4

pf

l
i
l
a
?
F ,
t
下町.'¥j
(
!J
'
,
‑ ~,/ t}ql~ 叫目, hi';o理1 ̲
A
. )):rIaer(1 r
l
!
,

}

υ
J可
,:
1
1
0

~) r
p

,
:
"
.
'
.
:,' "
}
!
‑
i L 低 :~1 ~'1((i~dt)1 Jfl~, i:,IÌß , 1σi j
!
J
昌
司(
(
!
l
畠
f
UmQb "')1守:
>
f
ll
T
f
.
γ
J ぷr
:
L

与
..
t

~;

l~'Jn が

t
︑

,"~,h ,

戸

4

f
l
︑
ー

e t

ヨdi1l1o]て1(;:ri、;:ii:;J

可'J ~~nilq2 nQilib

a
t
︑
I

.
︐

!~., dÐ'\:rl!.:':号、川日、, Iir 仁 川 I 'i') ・ ~t.fi ,
;
:l
'
l
f
r
:f
T
l
I (J(i時OI l:lbill~J booa
,
;
:I
Q
I
'
j日I
ザIr
,
" ;
n川町;",)1'
..
;
{
'
.
;
.
.
I
'ハ れ "

'
J
>
'1;

̲
,
.
!~ i

I

•.

ノ ~:í!b')"j'.J(J

_.~rF I
J
} 什 .'-i~ ,')

U
l
i
:
irι. :

川崎iJ

J
i"
:
‑
,
/
i;
r

.
;~ .
i
lf
.
;~ r
;
"
;主少。
:
'
吟

f
I
日¥
.
i
[
'
1 0 : 〆 色町 .
1 .~附

1
'
"
:
,'
1
.;
1
.i
r
f
:
:
r
.
r
u;tni

I.
、 J! :1
'
. rけ

、
趨
向
品1副首lIr1i

r

︐
14

︐
官

過融画面比~:...oo、品品

(
)
.
‑
:
!1
"!
i,
'
;
(
J

t

aιci

ゅ"
φ
1
"

・

,

!Wulll;m:
o
l
l
f
l
l.
"ln m 叫,;['un温'

3

r

ム
F

︐
t

︐

,
時0

(
)'
1
;
‑
、J 出 ;";;;1>1れ 11;ψ1;;'1
[
1
n
l
i「 f

i

書
目 Ibc:
,
j
J.
'
(
:
;
1
.
.
で
;H~n(J r: ~bbi" .
(H叩
fI! i
円、 1
1;
'I

I

1
︐
.
︐

•

167.

[医療以悶治体、鳩山手口玖記長会E ム 生物学的同等性試験における例数設計: 正確,近似と漸近 張方紅・安藤英一 グラクソ・スミスクライン(株)バイオメディカルデータサイエンス部 Samples i z ef o rb i o e q u i v a l e n c et r i a l s : Exact, approximateandasymptotic methods FanghongZhangandHidekazuAndo BiomedicalDataScienceDepartment, GlaxoSmithKlineK . K . |医療政府自即学によるヱコ妨ム保証~内会 要旨: 生物学的同等性試験の症例数設計について.TwoOne‑Sided 分布, T e s t法における検出力の計算に焦点をあてる正規分布.t 非心t 分布,またはOwenのQ関数を用いた検出力の算出方法を 説明する. POWERプロシジャの指定法を例示する. キーワード:生物学同等性試験 • TOS , T POWERプロシジャ, OwenのQ関数, t 分布 幽 157・ ~9

168.

l 、 j 台、 シま こ E… ー 髄 D 背景 ( 1 / 2 ) .日,米,欧で生物学的同等性 (BE)試験のガイドラインが 存在 ・同等性の統計的な判定方法は古くから研究されてきた 一信頼区間法:Westlake( 1 9 7 2 ) 一検定法:Shuirmann( 1 9 8 7 )のTOST(TwoOne‑SidedT e s t ) ‑症例数設計の方法は多く存在し, SASで利用されている 手法を含め,初心者にとっては混乱しやすい ‑複数の SAS指定方法が存在 一府叫大…ェー実~iE . : I ‑ ,‑ojt SAS 2 0 1 9 背景 ( 2 / 2 ):手法分類 ・ 正 確 法 :OwenのQ関数を利用して2変 量 非 心t の分布 の確率を計算 ‑POWER プロシジャ ‑近似法:1 変量で2変量の分布の確率を近似する 一中心t 分布を利用 .近似検出力:浜田・臨床評価研究会 (2005); .近似症例数:ChowandWang(2001) ー非心t 分布を利用:Julious(2004)の式 (59) ‑漸近法:漸近正規分布を利用,近似症例数 ‑J u l i o u s( 2 0 0 4 )の式 ( 6 0 ), ( 6 2 ) ー1 58‑

169.

!一時; 目的 ・TOST法における検出力を計算する数理を 整理し, SASでQ関数を利用する正確法と 複数に存在する近似法,および漸近正規分 布を利用する漸近法を説明する • POWERプロシジャの指定法を紹介し例示 する l 医療町治体ぷ誠子議潟 s;;:~~-øa 2 0 1 9 後発医薬品の 生物学的同等性試験ガイドライン .試験計画:クロスオーバー ・評{面 PKパラメータ :AUCとCmax 0 ・統計解析:対数変換して, 90 / 0信頼区間,ま / 0の2つの片側検定 Ctwo たは有意水準 50 平 { 面 one‑sidedt e s t s .TOST)で5 ・許容域:l o g ( 0 . 8 ) ‑ l o g ( 1 . 2 5 )ー ,0.223‑0.223 ‑ 1 5 9 ‑

170.

l‑ 白 : …1 1 当 却 さ : 手I ト o* 2 0 1 4 クロスオーバー試験:記号 • X=log(AUC),または, X=log(Cmax) .μ:母平均, μ=EX ・添え字TとR:試験製剤と標準製剤を表す ・L1:許容限界値 群:i 被験者:j 1 :TR 2:RT 2 時期 : k 差 XT1(X111) XR1(X1 1 2) XT1 XR1 XR2(X221) XT2(X222) XR2XT2 ・ ・ 同志向… 薬剤効果の検定 : t ‑ t e s t ‑ f . , ‑X 札 吋 」ι γと ーf d ; σd 干 Var(dij~ 嶋 緋 中明時懇綴 N=2n, nは1群における症例数 Chowa n dwang( 2 0 0 1 ) ‑ 1 6 0 ‑

171.

(医療、問自主ぷ蒜培務韓併弘一 ~9 クロスオーバー試』験:データ 図表 8.4最大血中濃度 Cmax rSASによる実験データの解析」 1 : ) 1 r . : . 1 群 R:被験者 k I . : B 第T 掴目 R1 R2 R3 R4 Rs A . 1 : 32:第2回目 C1 新 C2 従 製 来 品 ロ ロロ R6 R7 Rs Rg R 1 0 C1 華 万 製 品 319 580 347 303 465 397 316 325 302 医療一、規向機長ん 。inSASoutput w2 procm i x e d ; modelcmax=abc ; randomr ; odso u t p u tcovparms=cov; CovarianceParameter E s t i m a t e s CovParm E s t i m a t e modelcmax=abc ; repeatedc / s u b = rtype=CSR ; odso u t p u tcovparms=cov; CovarianceParameter E s t i m a t e s CovParm S u b j e c t CS 内 I 警 σW=Eyar(yz‑Y2) S u b j e c t E s t i m a t e 6781.90 1080.22 modelcmax=abc : repeatedc / s u b = rtype=UNR ; odso u t p u tcovparms=cov; ‑161‑ ~9

172.

‑ i m ‑ ‑ 9 │医問自治体、矧一一一向 倣 w l ] 同等性仮説 ‑帰無仮説 1:H01: μT‑J . 1 R壬 ‑Ll .対立仮説 1:H1 μァ 一 向 >‑ L l 1: ‑帰無仮説2 :H02:μT一μR>L l .対立仮説2 :H12:μT‑J . 1 R<L l z │闘政府臨大学による 訪問持…哨 TOST:検定統計量 H01:‑ L l H02:L l μT‑μR U 科 長 X XR:~式験製剤と標準製剤の標本平均 p XT1,XR XT , XRN:N人の被験者に対する観測値 1,…, N ‑ 1 6 2 ‑ 9 w l ]

173.
[beta]
│
医
錨
問
問
‑
み1
1
1
ヤ識あ…

.

T05T:有意水準

トヰ

)L d
T=X -XR+~

H20:1
:
1

H
1
0:
‑
1
:
1

九>t,
α

T
t
'
‑
aN‑2
u <‑
,

t
,
α,
N‑2

│医痕政府・開均とよなみ私一
T05T:検出力
対立仮説 ‑
s壬μT- μR 三~ßの下で、
一

け
一2 N

X7lv

一
VA一

一

u‑4

Power=P{T
nd九 < ‑
t1‑aN‑2μ
IT ‑ ,
u
R}
L >ιN‑2 a
,

ー

1
6
3
‑

174.
[beta]
l 医積政府明大学はる工コシス弘の実証 SAS~-"'-齢

W
J
9

検出力:1変量ヘ変形
.対立仮説‑
l
l
<μT‑μR<ll
の下で
XTX‑‑(μT‑μR
)

九= I f d k t(N2)
Power
σ'
wvdμ … 4

=ptA+(μT一μR)T
く‑
t

A‑(μT一μR
)

矢船 (
2
0
0
0
),Chowa
n
dWang(
2
0
0
1
)

~~, ~ffj.l3;盆

こ

シ テ 証 一 議

検出力
UH

l4

C2=
一(
μ
T一μR)+d

C 一一 (
μr ‑μR)+d

む
長

c
9h

1
6
4
‑

ー

n
y く一

一 Taμ
=く一

d

rV1

efL
川
側

Dl=



W
J
a

175.
[beta]
│医療問jdU
手当糟響評…

~[1

近似検出力:中心t
分布
Power=p
{
c
}三九壬 C2}
""PROBT(C
2)‑PROBT(C},
N‑2)
2 N‑
ラ

c
.=̲1μμ)+s.

九
存

一

Z414N2

C

今 一

回

lα N‑2

(
μ
T μR)+L
l
一

浜田・臨床評価研究会 (
2
0
0
5
)

│医療蜘開足以響機務長一

~[1

近似症例数:中心t
分布

・
μ戸内の場合, s
1=
s
2
=
s
/
2,‑
C1
=C
t N
‑
2
2=
‑
1
s
/
2,

一

μ
ι
ι
, ι
h

N一
一2
σよ
机(
仏
ο
q
t
ト
一αωN
t
'
一
‑
‑
s
釦
β/
/2.N‑2
一
/
)
,
.
L
.

・
μ J
.
l >0の場合, s
1
=
0,s
2
=
s,C2=
ts,N
‑
2
T‑ R

1
・

,

N‑2σよ
(
t 仏 N‑2+
t
]β.N̲2)2
(
/
)
,
.
ー (μTμR)
)
2
ChowandWang(
2
0
0
1
)

‑165‑

176.
[beta]
医障政府間…る土問弘知Eム1
1
1

l

鵬

~rn9

症例数:漸近正規分布
‑大標本の場合,

‑
μI μR

,

t α,N 2 Z l G

,

N2σ;(Zlα +z β12)2
2
1
1

‑
μァ
ーμ
R>O

,

N =科 (
z α +Z'̲s)2
(
1
1
‑
(
μT‑μR
)
)
"
"
J
u
l
i
o
u
s(
2
0
0
4
)の式 (
6
2
),(
6
0
)

│閥、政府関均一一以九一一一個 W
l
J
9
近似検出力:中心t
分布の問題点
• C1とC2が確率変数九を含んでいるため,定

分布は,ぬの変動を考慮
数ではない.中心 t
していない.
Power=p
{
C
]三九壬 C2}
"
'
"PROBT(C
N ‑2)‑PROBT(C],
N ‑2)
2,

H'

,
c=
̲
i
μT一μR)+L
hit
l
む
01α N‑2

c 一(
μ
T一μR)+A t
し

‑166‑

一九

2

177.
[beta]
1

医臨政府間均一戸五福山一

W
J
9

v

検出力:非心t
分布
A 一主一

一

ζ一
2 N)

σ

ぷ

一
﹁
fHMJFZ
N

一一的一ー
一一一例一一

︐
h

61=

A一
一け一τ 一
N)
XJ
一l
vmq

x一 一 ル

対立仮説‑/j.<
μT‑μRZ
三Aの下で

σwA

..
毅竺1
1
♂マル
l 医療、政府・自治体、大学によるエコジスア保証 ~ß~糊

近似検出力

R

一

tpEJ
︑E・

‑R

μ

'Td

一
︐
︐

U

約一B

九

引川

'
u
t

且

dAp

VA

dl 一
‑asa‑‑E
一
一
一
一

p且

e
w
o

Ijμ

• B
o
n
f
e
r
r
o
n
iの不等式

三l‑P(A1μTμR)‑P(Bμ
1T‑μR
)

A={
九 >t
1
‑
a,N‑J
,
B=
九
{<
‑
ι N‑2}
7; t(N‑2,
局
)

TL t(N‑2,
δi
)

‑
1
6
7‑

自由~

~J 1
1
1r
i
l

178.
[beta]
│医同府間均点字1
1
ネ
テ
ム
ム
担
:
一
一
会

~9

近似検出力
Power:

J
u
l
i
o
u
s(
2
0
0
4
)の式 (
5
9
)

=PROBT(‑
t
'
‑
a
.
N
‑
2
'N ‑2,
d
~)
)
‑P
R
O
B
T
(
t
'
̲
a
.
N
̲
2
'N ‑2,
2
Power:
1‑PROBT
(
t
'
̲
a
.
N
̲
2
'N ‑2,
d
,
)‑P
R
O
B
T
(
t
'
̲
a
.
N引 N‑2,
‑A)

この近似法が正確法より小さい検出力を算出
症例数を大きい方で近似

│鵬、政府間均点字乎説話十一

~9

川
一
広

川
区

正確な検出力

Sun(
2
0
1
0
)

Power=P{T
'
‑
a
.
N
‑
2心 < ‑
t
'
‑
a
.
N
‑
2I
μ
Tー
ん}
L >t

日
=f(ム 材 ゐ
D

D={
九> {1‑a.N‑2ι
<‑(1α N ‑ J

=
Q
N
‑
2
(
‑
t
l
‑
o
N
‑
2
J
2
;
O
,
R)‑QN2(t14N‑2司
,;
O,
R)

‑逐次積分で重積分を計算

‑
1
6
8
‑

179.
[beta]
l 臨政問自体ぷ幅議糟務院;;~ø*

2
0
1
[
1

Owen'Q関数
Power=
片TL>t1‑av
'九 <
‑
t
1
‑
avI
μ
Tー
ん}
,

二

,

Qv(
‑
t
1
‑
a.
v
'5
2;
0,
R)‑Q
v(
t
1
‑
a.
v
'~ ;
0,
R)

Q
v
(
t,
5
;
0,
R)=P~ Z< ~ S‑0
,
S
:
:
;R二
ト │φ(‑Ls)/(s)ds
L '¥}v
j o
v

、

S~f(s) , S2~X2(V)

R:以下 s
lこ関する方程式の解
口一‑

JV"

円

JV"

‑
円

│医療致問一高腎鞍鰻較的!? 加│
症例数設計 :
2つのデザイン

• 1標本デザイン:時期効果を無視,自由度 N
‑
1

・クロスオーバ:時期効果を考慮、,自由度 N‑2

J
u
l
i
o
u
s(
2
0
0
4
),2
.
2
.
1節

‑
1
6
9
‑

180.

l 医療、政府・問、大学院勾均五保証 ~ß'BS>..c=触 ~9 POWERプロシジャ指定法 : 1標 本 ( 1 / 3 ) p r o cpower;σ.~ =Var(Xr)‑2Cov(Xr, XR)+Var(XR) pairedmeanst e s t = e q u i v ̲ d i f fd i s t = n o r m a l l o w e r =l o g ( 0 . 8 ) upper =l o g ( 1 . 2 5 ) a l p h a =0 . 0 5 pairedmeans=試験製剤平均│標準製剤平均 p a iredstddevs=試験製剤標準偏差│標準製剤標準偏差 c o r r =試験製剤と標準製剤間の相関係数 n p a i r s =総症例数 power =検出力; r u n ; │臨政府・師、大町ょ初切ら均一一四蝕 POWERプロシジャ指定法 : 1標 本 ( 2 / 3 ) Hu v n H ・ ・ p r o cp o w e r ; =e q u i v ̲ d i f fd i s t = n o r m a l pairedmeanst e st l o w e r =l o g ( 0 . 8 ) upper =l o g ( 1 . 2 5 ) a l p h a =0 . 0 5 m e a n d i f f =平均値の差 Var(Xr)=Var(X よ R)=σ stddev=G w Cov(Xr, XR)=0 c o r r =0 n p a i r s =総症例数 σ~ =Var(Xr)+均 r(XR)=2σよ power =検出力; ‑ 1 7 0 ‑ ~llJ9

181.

│ 一 一 POWERプロシジャ指定法:1 標本 ( 3 / 3 ) p r o cp o w e r ; pairedmeanst e s t = e q u i v ̲ r a t i o = l o g n o r m a l l o w e r =0 . 8 .2 5 upper =1 a l p h a =0 . 0 5 平均値の比 m e a n r a t i o n =幾何I c v =被験者内変動係数 c v = σw c o r r =0 n p a i r s =総症例数 power =検出力; 浜田・安藤 ( 2 0 0 6 )p . 3 7 ‑ 3 8 r u n ; ぷにし 旬、政府・印式学!と手町ぷ均一…哨 W l J 9 POWERプロシジャ指定法:クロスオーバー procpower; twosamplemeanst e s t = e q u i v ̲ d i f fd i s t = n o r m a l lower =1 0 9 ( 0 . 8 ) upper =1 0 9 ( 1 . 2 5 ) (x‑Xni σ 2 alpha =0.05 meandiff=平均値の差 σd=同一」ー斗=ーι l 2 ) 2 stddev=σd ' ノ n t o t a l =総症例数 power =検出力; 今 一 市 Hu v n ・ ・ sun( 2 0 1 0 )の Example3 ‑171 幽

182.

I 芯政府自治体時限るー均一実証…嚇 ~Ij]9 参考文献 ( 1 / 2 ) ・小川幸男 (1997),生物学的同等性試験における例数設 計.KR研究会 ・高橋行雄,大橋靖雄,芳賀敏郎 (1989).SASによる実験 デ ー タ の 解 析 第 8章 東 京 大 学 出 版 社 2 0 0 6 ),POWERプロシジャによる ・浜田知久馬・安藤英一 ( 症例数設計, SASユーザー会総会 ・浜田知久馬/監修・臨床評価研究会 (ACE)基礎解析分 科会/執筆 (2005),実用 SAS生物統計ハンドフ、ツク,サイ エンテイスト社 2 0 0 0 ),生物学的同等性試験における信頼区 ・矢船明史 ( 間に基づく例数設計について,臨床薬理, 3 1 ( 6 ) │時、政府時点によるヱコホテム尚一一蝕 参考文献 ( 2 / 2 ) 'ChowS h e i r トC hungandWangHansheng( 2 0 0 1 ),OnSampleS i z e C a l c u l a t i o ni nB i o e q u i v a l e n c eT r i a l s .J o u r n a lo fPharmacokinetics andPharmacodynamics,Vo . l28,No.2 J u l i o u s,StevenA .2004.T u t o r i a li nB i o s t a t i s t i c s .Samples i z e sf o r c l i n i c a lt r i a l sw i t hNormald a t a .S t a t i s t i c si nMedicine,23:1921‑1986. Schuirman,D .J .( 1 9 8 7 ) .Acomparisono ft h etwoone‑sidedt e s t s procedureandt h epowerapproachf o rassessingt h eequivalenceo f averageb i o a v a i l a b i l i t y .J o u r n a lo fPharmacokineticsand Biopharmaceutics15,657‑680. SunPeng( 2 0 1 0 ) .UsingSASProcPowert oPerformModel‑based PowerA n a l y s i sf o rC l i n i c a lPharmacologyS t u d i e s .PharmaSUG2010 ‑PaperSP05 Westlake, W.J .( 1 9 7 2 ) .Useo fc o n f i d e n c ei n t e r v a l si nt h ea n a l y s i so f comparativeb i o a v a i l a b i l i t yt r i a l s .J o u r n a lo fPharmaceuticalSciences 3 4 1 . 6 1,1340・1 ・ ・ ・ ・ ‑172‑ W l J 9

183.

イヌテレメトリー試験のデザインと統計解析法に関する シミュレーション検討 橋本敏夫,中西展大,河口裕,武内喜茂 田辺三菱製薬株式会社研究本部研究企画部 MonteC a r l os i m u l a t i o nt oa s s e s st h es t u d yd e s i g nands t a t i s t i c a la n a l y s i smethodi nt h edogt e l e m e t r ys t u d y T o s h i oHashimoto,NobuhiroN a k a n i s h i, Y u t a k aKawaguchiandY o s h i s h i g eT a k e u c h i l a n n i n gDepa 巾n e n t , M i t s u b i s h iTanabePharmaC o r p o r a t i o n R e s e a r c hS t r a t e g y& P 要旨 医薬品の非臨床心血管系安全性評価の一環として,無麻酔無拘束下テレメトリー試験で,潜在的心毒性の 指標である QT/QTc間隔や血圧,心拍数などへの影響が評価される.テレメトリー試験では, 4群 X4期のク ロスオーバーデザイン ( W i l l i a m sラテン方格法. P e a c e用量漸増法)や用量漸増法などが用いられている. SASMixedプロシジャを用いたモンテカルロシミュレーションにより,群間差の推定値と推定精度を算出 し,それぞれの試験デザインにおける変動要因や統計解析法が群間比較に及ぼす影響を評価した. 試験デザインの検討では. W i l l i a m sラテン方格法が安定した推定精度を提供すること,および P e a c e用量 漸増法は推定精度が若干低下するが,群間差の推定への時期効果の介入を防止できることを確認した. 投与前値を共変量とした共分散分析の検討により, W i l l i a m s ラテン方格法では,投与前値の調整が不要と 考えられることと,用量漸増法では,投与前値を含む共分散分析によっても,時期効果による影響を十分に 調整できない可能性を示した.また,欠測の補充方法と推定精度の関係について,複数の補充ノ fターンを, シミュレーションで定量的に評価した. 多様な条件でのシミュレーションを行った本検討の成果は. QTcのみではなく,テレメトリー試験全般へ の適用が可能である. キーワード:テレメトリー試験,クロスオーバーデザイン. W i l l i a m sラテン方格法. P e a c e用量漸増法, 用量漸増法, 共分散分析,欠測と補充 1.はじめに 非臨床試験におけるテレメトリー試験では,イヌやサルを対象にして,無麻酔無拘束下で QT/QTc間隔 や血圧,心拍数などへの影響が評価される.日本製薬工業協会 統計 D M部会のタスクフォースは,非臨 2 0 0 7年)を作成し 床試験のデザインや QT補正の方法などを含む rQT延長の統計解析に関する解説書 J( たが,具体的なデータ解析法には言及されていない. 第5回日本安全性薬理研究会 ( 2 0 1 4 年)において,テレメトリー試験の統計解析に関する特別セッション ‑ 1 7 3・

184.

が企画され,試験デザインとデータ解析法の標準化に関して議論された.第2 期医薬安全性研究会安全性 薬理チームは,日本安全性薬理研究会の活動を支援するとともに,統計的な課題についての継続検討を行 4固定例会 ( 2 0 1 4 年)において,クロスオーバー試験に関する基礎的な解説や統計的な課題検討の い,第 1 結果を報告し,出席者と討論した. 我々は,これらの活動の一環として,少数例で実施されるテレメトリー試験の試験デザインと統計解析 法に関する検討を行ったので,以下に報告する.シミュレーション検討の前半部分では,試験デザインと 統計解析法の特性について,基礎的な事項の確認を行った.後半部分では,投与前値を共変量とした共分 散分析の性能を評価し,欠測が発生した際の補充法が群間比較に与える影響を評価した. 2. シミュレーションの方法 2 .1.試験デザイン シミュレーションで検討した試験デザインを図 lに示した. Wi 1 li a m sラテン方格法および P e a c e用量漸 e a c e漸増法と略す)はいずれもクロスオーバーデ、ザインであり,前者は各用量群の前後の 増法(以下, P 時期の群の配置がバランスするように工夫され,後者は動物ごとに低用量から順に投与されるように工夫 ) 慎に投与する試験デザインである. されている.用量漸増法は対照群から投与を開始し,低用量から 1 今回の検討は,動物 4頭で 4用量を評価する場合のシミュレーションとした. 図1.試験デザイン W i l l i a m s ラテン方格法 1 期 2 期 3 期 4 期 2 3 4 3 2 2 4 4 2 3 3 4 4 3 2 動物 番号 P e a c e 用量漏噌法 1 期 2 期 3 期 4 期 2 3 4 2 2 3 4 4 3 2 3 4 2 3 4 動物 番号 動物 書号 2 3 4 1 期 用量漏増法 2 期 3 期 4 期 2 2 2 2 3 3 3 3 4 4 4 4 1 :対照群 2 :低用量 3 :中用量 4 :高用量 2ユ 統 計 モ デ ル 以下のモデルにより発生させたデータを統計解析に使用した. Y件 = μ +d o s e i + perio0 + animah +e i j k μ 総平均 d o s e i 投与量の効果 ( i = 1ム3, 4 ) perio~ 時期効果 ( j= 1ム3, 4 ) a n i m a l k 動物間変動 ( k = I, 2ム4 )~ e i j k 誤差変動 N ( 0,(Janimal) N ( 0,σ e ) 2 . 3 .シ ミ ュ レ ー シ ョ ン の 条 件 シミュレーションにおける固定効果と変動の大きさは, Wi 1 li a m sラテン方格法で実施されたテレメトリ ) を参考に設定した.図 2に M i x e dプロシジャで解析して得られた最小 2 ー試験のデータ解析結果(図 2 乗平均の差(図 2上段),および共分散パラメータの推定値から求めた標準偏差(図 2下段)を示した. は3 0分ごとの QTcの解析結果であり,右側は S i v a r 司a hら( 2 0 1 0 )が提案したスーパーインターパ 図の左側l ルにしたがって, 2 4時間を 3区間 ( 1: 2 ・ 6時 間, 2: 7 ・1 4時間, 3:1 4 ‑ 2 4時間)に分割した場合の解析結果 である. ‑ 1 7 4 ‑

185.
[beta]
加恨

拠

定

設

剖H

の

条
ン

ヨ
.ノ

ユ

レ

7il

均を {
2
2
5,
230,
235,
250},すなわち μ=225,

l
世1
2

ン
︑

この結果を参考にして,各用量の母平

2
回

ハe l

d
o
s
e
;
=
{
O,5,1
0,2
5
}とした.動物間変動お

よび誤差変動は σanimalニ 5,
σe= 5 に設定し
た.

時期効果については,

日間変動として

1
0

"
'
"
‑
0
<
>o t ‑ O J
1
5

2
S
I

掬拠,

傾向的な偏りが介入した状況を想定して

クJ
ν‑;
1

同豚

剖強欄

d ‑
D
o
i
陣
・.
0

伽
一
。
。
馳
・ JO

F
ig
2A Lsme加の推移

p
e
r
i
o
d
‑
4
.
5,1
.5,1
.5,
4
.
5
}とした.
j={

さらに,各要因の影響評価のために,
QT延長作用がない帰無仮説条件 d
o
s
e
;
=
{
O,
O,
O,
O},時期効果がない条件 p
e
r
i
o
d
{O,
0,
j=

事

J弓 函

"
"
"
"
+

0,O
},および動物間変動と誤差変動を変

c
re=5),(σanimal
化させた条件 (σan;mal=15,
ニ

1
0

1
5

20

.
.
.
.
.
.
F
ig
2B 0

5,
c
r
.6
7
)についても検討した.
e= 1

I
<
O
l, a
.
<
+
l(]j推移

俗世抽

2.
4
. シミュレーションの方法
2
.
2
.統計モデルに記載した式に基づき, SAS9.2 データステップによりシミュレーションデータを作成し

た.各条件 10000試験分のデータセットについて,以下の Mixedプロシジャで解析した.なお,多群比較
においては Dunnett検定などの多重比較法が用いられるが,本シミュレーションでは多重性の調整は考慮、
しなかった.
表 1・1.データ解析プログラム
W
i
l
l
i
a
m
sラテン方格法, P
e
a
c
e漸増法
p
r
o
cmixedd
a
t
a
=
d
a
t
a
s
e
t

用量漸増法

,

p
r
o
cmixedd
a
t
a
=
d
a
t
a
s
e
t;

c
l
a
s
sa
n
i
m
a
lp
e
r
i
o
dd
o
s
e

c
l
a
s
sa
n
i
m
a
l d
o
s
e ;

modely=dosep
e
r
i
o
d/ddfm=kenwardroger;

modely=dose/dd
合n
=kenwardroger;

randoma
n
i
m
a
l;

randoma
n
i
m
a
l;

I
s
m
e
a
n
sd
o
s
e/p
d
i
f
f
=
c
o
n
t
r
o
l
(
'1
'
)t
d
i
f
fc
l;

I
s
m
e
a
n
sd
o
s
e/p
d
if
f
=c
o
n
t
r
o
l
(
'1
'
)t
d
i釘 c
l
;

r
u
n
:

r
u
n
:

2
.
5
. シミュレーション結果の評価
W
i
l
l
i
a
m
sラテン方格法についての Mixedプロシジャの出力例を表 1
‑
2に示す.試験デザインや変動要因

の影響等について, 10000回のシミュレーションの要約統計量により評価した. なお,評価には以下の指
標を用いた.
E
s
t
i
m
a
t
e
)
1
) 推定値 (

:各投与量と対照群の差の最小二乗平均 (LSMEAN)

2
) 推定精度(信頼区間幅)

:各投与量と対照群の差の推定値の両f
.
l
J
J
I95%
信頼区間の片幅
(上限推定値)

3
) Pr>l
t
I
4
) 共分散ノ fラメータ

.対照群との有意差
川m
n
i
Va
'

V
r
c
s
i
d
u
a
l

ー

175‑

186.

表1 ・ 2 . Mixedプロシジャの出力例 ( W i l l i a m sラテン方格法) 分類変数の水準の情報 水準値 分類 a n i m a l 4 1234 p e r i o d 4 1234 d o s e 4 1234 共分散パラメータ a n i m a l R e s i d u a l 固定効果の T y p e3検定 分子の自由度分母の自由度 効果 F値 P r> F d o s e 3 6 2 8 . 8 5 0 . 0 0 0 6 p e r i o d 3 6 1 . 8 5 0 . 2 3 8 6 最 小 2乗平均の差 効果 d o s e d o s eI 推定値 ,圃・・・・ 1上限 E d o s e 2 1 19 . 0 ⑩8 3 標 準 誤 差 自 由 度 t値 p r〉 I M F E B E a O O J レ O sフ ァ 下 限 3 . 5 4 2 9 6 2 . 5 7 10 . 0 4 2 410 . 0 5 0. 4 2 9 2 ~ 1 7 . 7 6 7 4 d o s e 3 1 1 1 3 . 3 4 0 5 3 . 5 4 2 9 6 3 . 7 7 10 . 0 0 9 3 10 . 0 5 4 . 6 7 1 4 122附 d o s e 4 .9842 1 1 31 5429 3. 6 9 . 0 3 10 . 0 0 0 1 1 0 . 0 5 2 3 . 3 1 5 1 t40.6533I i I 3 . 試験デザインに関するシミュレーション 3 .1.推定値と推定精度(表 2 ) W i l l i a m sラテン方格法, P e a c e漸増法および用量漸増法における,各投与量の作用の推定値と推定精度に 0 0 0 0回のシミュレーションの平均値を表 2に示した. ついて, 1 単調増加する時期効果を仮定したシミュレーションでは,用量漸増法は,推定値に時期効果がバイアス i l l i a m sラテン方格法および P e a c e として介入しているため,各用量の作用が過大に評価されていた.一方, W 漸増法は,いずれの条件においても,各用量の作用を偏りなく推定していた.推定精度は, P e a c e漸培法 1 li a m sラテン方格法よりも低かった(信頼区間幅が広かった).表には示していないが, P e a c e漸増法 は Wi の推定値は,低用量と高用量でばらつきが大きくなる傾向を認めた. 時期効果がないと仮定したモデルでは,いずれのデザインにおいても各用量の作用の推定値は,偏りな く推定されていた.推定精度は,用量漸増法 > W i 1 li a m sラテン方格法 >Peace漸増法の順で、あった. ‑176・

187.

dosei {0, 5, 1 0, 2 5) 0, 0, 0) {O, ∞ 回の平均値 1 0 o 3ユ共分散パラメータ(表 3 ) 共分散パラメータの推定値についての集計結果を表 3に示した .丸 V am 1 耐 m n 叫 m 叫 1 a 3 lと V剛 叩目 叩 町 問 2a ぞれ σamr 耐 n a lと σeの設定値の二乗より若干小さな値となったが,平均値は a弘 n 1 叩削 叩 剖叩 不偏推定量を与えることを確認した. 表 3 試験デザインと分散の推定値 訴験 dosei デザイン (1a n i m a l σ @ periodj periodj {‑ 4 . 5 ー ,1 . 5, 1 . 5, 4 . 5) {O, 0, 0, 0) V a n i m a l lean median 円 W i l l i a m s ラテン方格 5, 1 0, 2 5) {0, Peace 漸増法 用量 漸増 j 去 Williams ラテン方格 {O, 0, 0, 0) Peace 漸増法 用量 漸増法 5 1 5 5 5 1 5 5 5 1 5 5 5 1 5 5 5 1 5 5 5 1 5 5 5 5 1 .67 5 5 1 . 6 7 5 5 1 .67 5 5 1 .67 5 5 1 . 6 7 5 5 1 .67 2 5 . 1 2 2 2 . 9 2 5 . 1 2 5 . 1 2 2 3 . 0 2 5 . 1 2 5 . 1 2 2 3 . 0 2 5 . 1 2 5 . 1 2 2 2 . 9 2 5 . 1 2 5 . 1 2 2 3 . 0 2 5 . 1 2 5 . 1 2 2 3 . 0 2 5 . 1 V 守 . ,池 山l V, o i m ' , V, . o i n " ' , lean median mean median mean median l 円 1 8 . 3 1 7 4 . 7 1 9 . 7 1 8. 4 1 7 4 . 7 1 9 . 7 1 8 . 3 1 7 4 . 8 1 9 . 7 1 8 . 3 1 7 4 . 7 1 9 . 7 1 8. 4 1 7 4 . 7 1 9 . 7 1 8 . 3 1 7 4 . 8 1 9 . 7 24. 4 2 5 . 1 2 . 8 24. 4 2 5 . 0 2 . 8 2 4 . 7 2 5 . 1 2 . 8 24. 4 2 5 . 1 2 . 8 2 4 . 4 2 5 . 0 2 . 8 2 4 . 7 2 5 . 1 2 . 8 21 .9 2 2 . 5 2 . 5 2 2 . 0 2 2 . 5 2 . 5 2 2 . 9 2 3 . 5 2 . 6 2 1 . 9 2 2 . 5 2 . 5 2 2 . 0 2 2 . 5 2 . 5 2 2 . 9 2 3 . 5 2 . 6 2 5 . 1 2 2 3 . 5 2 5 . 3 2 5 . 2 2 2 3 . 5 2 5 . 3 2 5 . 1 2 2 3 . 5 2 5 . 3 2 5 . 1 2 2 3 . 5 2 5 . 3 2 5 . 2 2 2 3 . 5 2 5 . 3 2 5 . 1 2 2 3 . 5 2 5 . 3 1 8 . 4 7 7 .1 1 1 9 . 7 1 8 . 5 17 7 .3 1 9 . 7 1 8 . 5 17 7 .2 1 9 . 7 1 8. 4 17 7 .1 1 9 . 7 1 8 . 5 1 7 7 . 3 1 9 . 7 1 8 . 5 7 .2 17 1 9 . 7 2 4 . 3 2 5 . 2 2 . 8 2 4 . 1 2 5 . 1 2 . 8 2 4 . 5 2 5 . 2 2 . 8 2 4 . 3 2 5 . 2 2 . 8 2 4 . 1 2 5 . 1 2 . 8 2 4 . 5 2 5 . 2 2 . 8 21 .8 2 2 . 6 2 . 5 2 1 . 5 2 2. 4 2 . 5 2 2 . 8 2 3 . 3 2 . 6 2 1 . 8 2 2 . 6 2 . 5 21 .5 2 2 . 4 2 . 5 2 2 . 8 2 3 . 3 2 . 6 3 . 3 .試験デザインと検出力(表 4 ) 対照群と各用量で有意となった割合を表 4に示した.左の列は,単調増加する時期効果を仮定した場合, 右の列は時期効果を仮定しなかった場合の結果である.表の上段 ェ (dosei{0, 5,10, 25})は,各投与量(ム 5,10,25) の検出力に相当する.いずれのデザインも動物間変動の大きさには影響を受けず,誤差変動 司 1 7 7 ‑

188.

の大きさに影響を受けることがわかる.また, Williamsラテン方格法と, Peace漸増法において,時期効 果の有無は検出力に影響を与えなかった. 0, 0, 0})は,帰無仮説条件下における第 1種過誤率(危険率)に相当する. W illiams 表の下段 (dosei{0, ラテン方格法と, Peace漸増法の危険率が 5%に維持されていることが確認された.一方,用量漸増法で 1 . 1%~ 100%と,条件により 5%を大きく上回った. は,時期効果がある場合に, 1 dosei W i l l i a m s ラテン方格 {0, 5, 10, 25) Peace 漸増法 W i l l i a m s ラテン方格 { O .O .. o0) Peace 3.4.統計手法を誤用した場合の影響(表 5 ) 統計解析環境が整備されていない等の理由から,ラテン方格デザインで実施した試験結果を,一元配置 分散分析で解析するとしづ誤用が,まれに見受けられるようである.そこで, Williamsラテン方格法で実 施された試験結果に一元配置型の解析を適用した場合を,シミュレーションで検討した. 表 5に推定値,推定精度およびラテン方格分散分析で解析した場合の推定精度(表 2 )との比(信頼区間幅 の比)を示した.適切な解析法が採用されない場合には,推定値には影響しないが,推定精度が低下する. すなわち,一元配置型の解析を用いることにより,信頼区間幅は,時期効果ありで1.5‑3.5倍,時期効果 なしで1.3‑2.8倍となった.その傾向は時期効果ありで強く,特に動物間変動と誤差変動が日間imal>aeの 条件では,約 3倍と推定精度が大きく低下することがわかる. i l l i a l1l5ラテン方格法で、得られた試験結果に一元配置型の解析を適用した場合 表5 W p e同o di{‑ 4 . 5, ー 1 .5, 1 .5, 4 . 5} p e r i o di{0, 0, O .0} 獄験 d o s ei デザイン . σn i m a l σ 圃 推定値 ( E s t i m a t e l 推定値 ( E s t i m a t e l 推定精度 低用量中用量高用量 {0, 5 .1 0, 2 5} W i l l i a m s ラテン方格 {O . O, O, O } W i l l i a m s ラテン方格 5 1 5 5 5 1 5 5 5 . 0 1 1 5 0 . 0 22 5 . 0 3 5 5 . 0 01 0 . 0 22 4 . 9 8 . 167 4.99 9.99 24.99 5 0 . 0 1 0 . 0 2 0 . 0 3 0 . 0 2 5 0 . 0 0 0 . 0 2‑ . 167 ‑0.01 ‑0.01 ‑0.01 10000回の平均値 ‑ 1 7 8 ‑ 推定精度 低用量中用量高用量 、 1 2 . 0 8 : 8ぷ 設 2 3 . 5 8 ま : 1 グ 9 . 8 1 3 1 2 . 0 8D . . . . . l 釜 こ 2 3 . 5 8 9 . 8 1 S . 6 . . u 5 . 0 31 0 . 0 1 2 4 . 9 9 0 . 0 62 5 . 0 5 1 5 . 0 1 4 . 9 81 0 . 0 02 5 . 0 0 0 . 0 3 0 . 0 1 ‑ 0 . 0 1 0 . 0 5 0 . 0 6 0 . 0 1 0 . 0 2 0 . 0 0 0 . 0 0 1 0 . 5 0 2 2 . 7 5 、組総ム与一晴一 7 . 6 4 1 0 . 5 0 1 . 3 2 2 . 7 5 2 . 7 7 . 6 4 2 . 8 J 朗

189.

4. 投与前値を共変量とする共分散分析の評価 投与前値を共変量とする共分散分析の必要性と性能を評価するために, W i l l i a m sラテン方格法と用量漸 A n a l y s i s1 ),投与前値を共変量とした共分散分析 培法について,それぞれ,投与前値を考慮しない解析 ( ( A n a l y s i s2 ),および a n i m a lを変量効果に含めない共分散分析 ( A n a l y s i s3 )の 3種の解析方法についてシミュ レーションを実施した.投与前値は投与量の効果 ( d o s e j )を含まないデータとして,以下のモデルにより生 成した. o r e ) :Xι=μ 投与前値 ( + veriod , ,JL 」互控g k̲ 土 立 与 i l s . :Y i j k =μ+d o s e ; + perio~ + animah +e i j k 測定値 シミュレーションに用いた SAS プログラムを表 6に,シミュレーション結果を表 7に示した. . 解析プログラム 表6 W i l l i a m sラテン方格法 用量漸構法 A n a l y s i s1 (前値を考慮しない解析) A n a l y s i s1 (前値を考慮しない解析) p r o cmixedd a t a = d a t a s e t;c l a s sa n i m a lp e r i o dd o s e; p r o cmixedd a t a = d a t a s e t;c l a s sa n i m a ld o s e; modely=d o s ep e r i o d/dd 白n = k e n w a r d r o g e r; modely= 虫主主/d dfm=kenwardroger; randomanimal; random呈単型車l ; I s m e a n sd o s e/p d i f f = c o n 甘0 1 ( '1 ' ) t d i f fc l; I s m e a n sd o s e /p d i f f = c o n 仕0 1 ( '1 ' )t d i f fc l; r u n ; r u n ; An a l y s i s2 (前値を含めた共分散分析) An a l y s i s2 (前値を含めた共分散分析) r o cmixedd a t a = d a t a s e t ;c l a s sa n i m a ld o s e ; p r o cmixedd a t a = d a t a s e t;c l a s sa n i m a lp e r i o dd o s e , p modely =doseperiodpre/dd合n=kenwardroger; modely=dosep~ /ddfm=kenwardroger; randoma n i m a l ; randomanimal; I s m e a n sd o s e/p d i f f = c o n 仕0 1 ( '1 ' )t d i f fc l; I s m e a n sd o s e /p d i f f = c o n 汀0 1 ( ' 1' )t d i釘 cl; r u n : , r u n, A n a l y s i s3 ( p e r i o dを除いた共分散分析) A n a l y s i s3 p r o cmixedd a t a = d a t a s e t;c l a s sa n i m a lp e r i o dd o s e; ( a n i m a lを除いた共分散分析) p r o cmixedd a t a = d a t a s e t;c l a s sa n i m a l d o s e ; 白F kenwardroger; modely=dosepre/dd modely=dosep~ d d f r n = k e n w a r d r o g e r; random盟担乱; I s m e a n sd o s e /p d i f f = c o n t r o lぐ り t d i f fc l; I s m e a n sd o s e/p d i f f = c o n 汀0 1 ( '1 ' )t d i f fc l; r u n ; r u n : , 太字・下線部はモデ、ルに含めた要因で、ある( p r e " は投与前値). ー 1 7 9・

190.
[beta]
d
o
s
e
;

A
n
a
l
y
s
i
s1

,
51
02
5
)I
A
n
a
l
y
s
i
s2
(0
A
n
a
l
y
s
i
s3
A
n
a
l
y
s
i
s1
(000
,
O) I
A
n
a
l
y
s
i
s2
A
n
a
l
y
s
i
s3
p
e
r
i
o
dj (‑
4
.
5,
‑
151
.545)
目

目

1
0
0
∞回の平均値

W
i
l
l
i
a
m
sラテン方格法で実施された試験結果は,いずれの解析方法においても推定値に偏りが生じなか
a
l
y
s
i
s1で最も高かった.
った.推定精度は,投与前値を考慮しないAn
n
a
l
y
s
i
s1で,推定値は設定値よ
用量漸増法で実施された試験結果については,投与前値を考慮、しない A

り時期効果の分だけ大きくなるというバイアスが介入した.投与量と投与前値の 2要因としたAna
l
y
s
i
s3
a
n
i
m
a
lと Oeとの比が大きな条件で,推定値が設定値に近づいたが, W
i
l
l
i
a
m
sラテン方格法のよう
では, σ
a
l
y
s
i
s2は
, An
a
l
y
s
i
s1 とAn
a
l
y
s
i
s3の中間的
に時期効果の影響を完全に調整することはできなかった.An

な値を示し,時期効果の影響を調整しきれていなかった.
o
s
ei
{051
02
5}における高用量の推定値の分布を箱ひげ図とヒストグラムで示す(図
用量漸増法の d

3
)
. ヒストグラムの網掛けの部分は, Mixedプロシジャで a
n
i
m
a
lの共分散の推定値が 0と出力されたケー
n
a
l
y
s
i
s
lに比べ投与前値を共変量とした共分散分析(An
a
l
y
s
i
s2
)において頻度が高かった.Mixed
スであり, A

プロシジャでは,指定した変量効果が誤差変動に比べて十分に小さいとみなせる場合には,その変量効果
a
l
y
s
i
s2の綱掛け部分は, An
a
l
y
s
i
s3と同様の解析結果となり,投
をモデノレから外していた.このため, An

与前値による共分散分析の推定値がぱらついていた.

iiFLL
"M一
一
場"向1
̲
1 術酌婦:‑.2一
Iv場問1̲3一…一……………
Iv憎同'̲'''晴樹.
̲
21v
叫 醐J
J

σ
a
r
u1
= 5σe= 5
四

σ

l
ニ 1
5σeニ 5

醐 阻

‑180‑

。
a
n
i
m
a
l 5σe 1
.6
7
=

=

191.

5. 欠測が生じた場合の補充の方法と推定精度 Williamsラテン方格法で,欠測が発生した場合の補完方法について,シミュレーションを行った.傾向 4 .久‑1.5,1 .5, 4 . 5, 7 . 5})を設定し,動物 3の第 3期の高用量が 的な時期効果が発生している条件 (periodj { ‑ 欠測する 7つのパターンを検討した.検討したパターンを図 4に,推定値と推定精度(比較のために欠測 が発生しない状況でのシミュレーション結果を含めた)を表 8に示した. パターン①は欠測を補充しないケースである.パターン② ⑤は,欠測が発生した動物での再試験が可 能なケースで,第 5期に実験を追加している.パターン⑥,⑦は,欠測が発生した動物 3が,第 3期以降 の実験に使用できなくなるため,第 4期から動物 5を追加するというケースである. Eヨ動物3 第3期の高用量で欠測発生 表8 高用量の推定値と推定精度 欠測と補充 パターン d o s ei {O, O, O, O} 推定値 C E s t i m a t e ) d o s ei {O .5 .1 0, 2 5} 推定値 C E s t i m a t e ) 推定精度 1 5 5 5 1 5 5 5 5 5 5 1 .6 7 σe 8 . 1 3 8 . 3 2 欠測なし 2 5 . 0 3 24.98 2 4 . 9 9 9 . 6 2 9 . 9 6 2 5 . 0 2 2 5 . 0 0 2 5 . 0 0 ① 5 . 0 0 9 . 6 2 9 . 9 6 500 2 ② 2 5 . 0 2 2 ③ 8 .45 8 . 6 4 6 . 5 1 2 6 . 5 0 2 6 . 5 0 2 7 . 5 9 ④ 2 4 . 9 9 2 5 . 0 3 2 5 . 0 0 7 . 6 7 ⑧ 2 4 . 9 9 2 5 . 0 3 2 5 . 0 0 7 . 9 4 8 . 0 8 5 . 0 0 8 . 1 1 8 . 6 1 ⑥ 2 4 . 9 7 2501 2 5 . 0 1 2 5 . 0 0 8 . 5 4 9 . 3 0 ⑦ 2 4 . 9 8 2 1 0 0 0 0回の平均値 ー ,1 . 5 .1 . 5, 4 . 5, 7 , 5} p e r i o d;{‑ 4 . 5 (Janimal 司 5 1 . 6 7 2 . 7 7 3 . 3 2 3 . 3 2 3 . 7 5 2 . 5 5 2 . 7 0 2 . 8 7 3 . 0 9 5 5 0 . 0 3 0 . 0 2 0 . 0 2 1 .5 0 0 . 0 1 0 . 0 1 ‑ 0 . 0 3 0 . 0 2 1 5 5 0 . 0 2 0 . 0 0 0 . 0 0 1 .5 0 0 . 0 3 0 . 0 3 0 . 0 1 0 . 0 1 5 1 . 6 7 0 . 0 1 。 。 0 . 0 0 1 . 5 1 0 . 0 0 0 . 0 0 0 . 0 0 0 . 0 0 推定精度 5 5 8 . 1 3 9 . 6 2 9 . 6 2 8 . 4 5 7 . 5 9 7 . 9 4 8 . 1 1 8 . 5 4 1 5 5 8 . 3 2 9 . 9 6 9 . 9 6 8 . 6 4 7 . 6 6 8 . 0 8 8 . 6 1 9 . 3 0 5 1 .6 7 2 . 7 7 3 . 3 2 3 . 3 2 3 . 7 5 2 . 5 5 2 . 7 0 2 . 8 7 3 . 0 9 第 5期に得られた高用量のデータを第 3期とみなす,パターン③では,欠測が発生しない場合に比し推 定値が大きく,時期効果によるバイアスが介入した.その他のパターンでは,欠測が発生しない場合と近 似し,推定値へのバイアスを認、めなかった 欠測を補充しないパターン①で、は推定精度が低下し,信頼区間幅が 20%程度広くなった.第 5期に l例 だけを補充するパターン②は.補充なしのパターン①と同じ推定精度で、あった.第 5期に 4例を評価する ‑ 1 8 1 ‑

192.

パターン④の推定精度は欠測なしよりも高く(信頼区間幅が狭く)なり,第 5期に高用量と対照群の 2例 のみを評価するパターン⑤の推定精度は,欠測なしに近似した. なしの推定精度に 別動物で祷充するケースでは,第 5期に 4例を評価するパターン⑥の推定精度が欠演u 近似し,第 5期に 2例のみを評価するパターン⑦の推定精度は,欠測なしに比べて低下し,信頼区間幅が 10%程度広くなった. 6 . まとめ モンテカルロシミュレーションにより,動物 4頭を使ったテレメトリー試験の試験デザインと統計解析 法の特性を評価した. Wi 1 1iamsラテン方格法は,時期効果の影響を適切に排除しており,群間差の推定も安定する優れた試験 デザインであることを確認した.この試験デザインにおいては,共分散分析による投与前値の調整は不要 と考えられた. P e a c e漸増法は,群間差の推定精度の面で Wi 1 1iamsラテン方格法よりも若干劣るが,群間差の推定への 時期効果の介入を防ぐことができることを確認した.安全性を確保するなどで,各動物に低用量から順の 投与が有益なケースでは, Peace漸増法の選択が推奨される. 用量漸増法は,時期効果が群間差の推定に直接介入すること,その影響は,投与前値を共変量とした共 分散分析によっても調整が不十分となる場合があることを示した.よって,非可逆的な毒性の発現が懸念 されるなどで上記試験デザインが採用できず,やむを得ず本デザインで試験を行う場合は,時期効果を排 除するための配慮、が必要である. SASMixedプロシジャは,少数例のクロスオ}パー試験の解析においても,投与量の効果,動物間変動 および誤差変動等で,偏りのない推定値を与えることを確認した.検出力および第 l種の過誤の評価では, Wi 1 1iamsラテン方格法と Peace漸増法は時期効果の影響を受けず第 l種の過誤を 5%に保持すること,お よび用量漸増法では時期効果がある場合,第 I種の過誤を 5%に維持できないことを確認した.クロスオ ーバー法で実施した試験結果を一元配置型で解析するという統計手法の誤用を行った場合には,推定精度 が低下することを確認した.以上の検討により,テレメトリー試験の評価には,時期効果を考慮したクロ スオーバーデザインの選択と,投与量の効果,時期効果,動物の変動を考慮した統計解析法の使用が重要 であることを示した. Wi 1 1 i a m sラテン方格法で欠測が生じた場合の補充に関して 7つのパターンについてのシミュレーション を行った.欠測した群の 1例を第 5期に追加するパターン②,パターン③の選択を避けることを推奨する. 試験計画の検討にあたっては,欠測の発生要因,実施可能性に加えて,推定値や推定精度への影響を考慮 した検討が有用であり,多様な欠澱・補充パターンに関する更なる検討も必要と考える. 7. おわりに 本検討にあたり,第 2期医薬安全性研究会安全性薬理チームの高橋行雄氏,半田淳氏,山田雅之氏, 福島慎二氏,平田篤由氏,板東正博氏,金納明宏氏に,多くのご助言をいただいた.非臨床試験の試 験デザインの検討や適切な統計解析の使用には,非臨床研究者と生物統計の専門家の連携が必要と考える. 更なる連携の強化と検討の深化に期待する. 8. 文献 ー 182・

193.

[ 1 ] 医薬品評価委員会統計・ D M部会 ( 2 0 0 7 )、QT延長の統計解析に関する解説書、日本製薬工業協会医薬出版 センター [ 2 ]板 東 正 博( 2 0 1 4 ),覚醒テレメトリー犬における心血管系安全性評価 計手法の提案 試験デザイン,データ解析,統 ,第 5四日本安全性薬理研究会学術年会 [ 3 ]古 賀 正 ら ( 2 0 1 4 ),安全性薬理コアバッテリーの心血管系に関する統計解析の現状,第 5 回日本安全性薬 理研究会学術年会 [ 4 ]A .S i v a r a j a he . ta . l( 2 0 1 0 ), C a r d i o v a s c u l a rs a f e t ya s s e s s m e n t si nt h ec o n s c i o u st e l e m e t e r e ddogo fs u p e r ‑ i n t e r v a l st o e n h a n c es t a t i s t i c a lpower,JPharmaco. lT o x i c o lmethod,6212‑19 l .( 2 0 1 1 ),Reviewo f t h es t a t i s t i c a la n a l y s i so f t h edogt e l e m e t r ys t u d yPharmaceu . tS t a t i s ヲ . t 10236‑ 249 [ 5 ]M.A y l o t te ta 司 以上 ー 183‑

194.

ぷ守主‑三機. . 機烹禁議務機摺¥れ川 医積、政府・自治体、大学院よる孟~お場訟の 誕mIIト鎗会 ーいミ繊弱議議綴脳間磁桜山下 . 4 . ; 1 圃 ModelbasedL ib r a r yによる L o g i c a lCheckの自動生成 ーチェック仕様書作成業務の効率化, 三木悠吾 DOT インターナショナル株式会社データサイエンス部 AGenerationo fL o g i c a lCheckCodes byModelbasedL ibrary ForProductiveC r e a t i o no fCheckS p e c i f i c a t i o n s YugoM i k i D a t aS c i e n c eD e p t,DOTi n t e r n a t i o n a lC O .,L t d . 臨 要旨 医薬品開発において統計解析を実施するためには、 データクリーニングが必須であるがこの業務は決して 工数の少ないものではない。弊社では業務効率化のた めにmodelbased開発を応用したロジカルチェックの自 動生成を試みた。 キーワード:modelbased、Datamanagement、 l o g i c a lcheck、c a l lexecute ‑ 1 8 4 ‑ . ~jllrJ.

195.

[ 一 う そγJ 山 医療政府・自治体、大学!とよるヱコ以弘の実誌側日明 ヲ 日1 r J I 一 一 目 目次 PROPAGANDA ・ Check仕様書の構造② DM‑STAT ・ 基本的な構造 哲学ー t h eC o n s t r u c t a lLaw‑ 哲学一 t h eC o n s t r u c t a lLawf o rData ‑ • 社内における役割別 SAS 習得度 Check 仕様書作成において 条件分岐へ砿張 ・ 異なるデータセット同士の比較へ拡張 仕様書に関する問題点 モデルベース開発とは 実現可能性を探る チェックを抽象化してモデルをつくる L ib r a r y lこ格納されているモデルの紹介 TechnologySIDE L o g i c a lCheckの構造① L o g i c a lCheckの 構 造 ② Check 仕様書の構造① DM‑CRA エラーメッセージの出力 結果 DEMONSTARTION 実施例 考察 考察② 結論 Reference 3 │医癒政府関大…一弘の実証…一純 W J a ModelbasedL ibraryによる LogicalCheckの自動生成と チェック仕様書作成業務の効率化 PROPAGANDA 4 ‑ 1 8 5 ‑

196.

哲学 ‑ t h eC o n s t r u c t a lLaw‑ .コンストラクタ lレ法則 ‑有限の流動系が時間の流れの中で存続するためには、 その流動系の百三重は、流動抵抗を低減するように進化し なければならない「 FlowsystemsI na c t i o n t h ed e l t ao ft h eLena R i v e ri nn o r t h e r n S i b e r i a( I e f t ) andac a s to fahuman l u n g( r i g h t ) ( A .B句a n ) 1 木村繁男訳 1 1 1 ザふれ… │医制府・自治… ~[1 哲学 ‑ t h eC o n s t r u c t a lLawf o rData .情報伝達における進化の方向性とは ‑進化は効率的な方向へ進む e x . 絵→象形文字→文字(より明確に) 会話→電話→衛星通信(より遠くに) 手紙→電子メー jレ (より素早く) 紙→本→電子媒体(より多くの情報を) 6 ‑ 1 8 6 ‑

197.

I町一11,.溺議 ~~;s~-~-ø. 2 0 1 4 社内における役割別 SAS習得度 M o n i t o r SAS習 得 レ ベ ル 微 D a t aM a n a g e r SAS習得レベル中 S t a t i c i a n SAS習得レベル:高 個人差はあるが基本的に S T A Tチームが高い AS組み込みシステムなどは社内 SEでなく SASp r o g r a m m e r 社内で使用する S の上級者が開発している現状 !医療政府自治体均一尚喜一一 9 w l ] Check 仕様書作成において ‑エラーメッセージの作 成 ・チェックの妥当性確認 ?・チェック項目の策定 ・ CRA へ項目の確認 ・ !5 TAT へ委託 1.疑義に回答する j・ C h e c kp r o g r a mの作 i 成 .C5VorTest 仕様書に疑義 . C h e c k い訂正が発生したら・・・ を上げる DMの仕事量がすごく多い・... 開ゆ 疑義事項を挙げるプロセスだけでもけずれないか・・・? ‑ 1 8 7‑ 8

198.

│鶴、政府関雄一村長手 ‑ a . SAS: l ‑ < f 2 0 1 9 仕様書に関する問題点 ‑書き手の意思を読み手に確実に伝えることができない ‑何かしらの翻臨が発生する可能性を否めない 仕様書を書くコストは高くつく ・「正しく J • SASに関しての知識 ‑データベースに関する知識 ・臨床試験に関する知識など・・・・ ・完全な仕様を求められる ‑規制法の中なので仕方ない・・・ .たとえ checkが500個であっても 》必要なことではあるが、 checkの品質を担保するに は工数がかかりすぎる・.. . 9 医 膿 、 政 府 ・ 自 治 体 、 大 学 に よ る ー タ 吟 ー … 会 w l l 9 モデルベース開発とは ・組み込みシステムなどで発達してきた開発手法 ・直感的に理解しやすいモデルを仕様書とすることができる ・モデルベース開発の特徴 ・モデルによる仕様の表現・定義「実行可能な仕様書」 ・モデルのシミュレーションによる設計の詳細化、妥当性検証 .モデルからの自動コード生成による実装 ・テスト・検証におけるモデルの再利用 ‑紙の仕様書で不足する情報を補完するために「モデル』を用い ることで、 ・仕様を明確化する .開発プロセス全体のコミュニケーションを改善する .開発の上流工程を重視する ~ L o g i c a lCheckの作成に応用できないか? 参照 柴田克久サイパネットシステム, @ITMONOist .atmarkit.co.jp/mn/articles/0903/27/news109.html h t t p : / / m o n o i st ‑ 1 8 8 ‑ 1 0

199.

│陣、政府間i 元副議韓議蒜.山 ~9 実現可能性を探る ・モデルベース開発の特徴より ・モデルによる仕様の表現・定義「実行可能な仕様書」 》実行可能な仕様書を作成すれば出来る ‑モデルのシミュレーションによる設計の詳細化、妥当性検証 》シミュレーションの定義を状況の再現性ととらえる。 SASは再 現性のためのソリューションとしては高度なレベルにある。 ・モデルからの自動コード生成による実装 》マクロ関連の書籍に答えがありそう・・・ .テスト検証におけるモデルの再利用 》うまく開発して再利用すれば工数大幅削減! 圃 . 実現可能性は十分にある! 1 1 !戸干同町 チェックを抽象化してモデルをつくる ‑ 1 8 9 ‑

200.

医撮政府自治体大学によるエコ滞ム保証ふ~蝕 w l l 9 L ibraryに格納されるモデルの紹介 G e n e r a t o rModel:001 l f l l a I 置 置 . .冨盟国 E盟~ Then RESULT=1 GeneratorModel:002 I f 園田‑ 11E 盟国 国 Then RESUL T=1 I f I!D盟国=~・m圃 Then I f E 1 E国 E盟国 Then RESUL T=1 1 3 医療政府間熔ゆ ModelbasedL ibraryによる LogicalCheckの自動生成と チェック仕様書作成業務の効率化 TECHNOLOGYSIDE 1 4 ‑190‑

201.

rfjm! l シ 医療、政府・自治体、大学による工コシ文章ゐ実証 SAS.:l‑<j'‑紬 ~Ilj~1 ー L o g i c a lCheckの構造① 間関理問吟 1 . C l i n i c a lDBIこ対してチェック用の 変数を導出(手動) 司聞聞' 2 . L o g i c a lCheckProgramlj : Check仕様書から自分がチェック すべきデータセット名、変数名、基 準値などを読み込む 3 . 読み込んだ値に対してチェックプ ログラムを生成。 4 . C a l lExecuteで実行する 5 . 結果をR e s u l tへ格納する 1 5 … 蝕 ~Ij]9 l 医療政府自治体大学一コシステム関 s L o g i c a lCheckの 構 造 ② 園田 附 w x国 態 C heck 議 S p e c i f i c a t i o n J • 1 . CheckSpecからエラーメッセー ジを読み込み、フォーマットとして 登録。 2 . R e s u l tに対してエラーが検出さ れたものをquery 候補として別の DSへ移行する。 3 . QueryDSIこ対してフォーマットを 適応し、 L o g i c a lCheckの結果とし てエクセルへ出力 同岡国..明聞開園圃閉園周F町周周司・ ト均的長時 I ι 三.心‑ I 1 6 ‑ 1 9 1 骨

202.

D W l J ~m,iallR.Ê1治体大学によるJ::J~^弘の実証一齢 DM‑CRA ~ー---- / CRFのページ Check のS e q . 1 Number エラーメッセージ CRF 上の項目 I 、山一……一………ーと…一/ t 1 7 l医 療 政 府 間 大 学 問 飢 弘 の 恥 Check 仕様書の構造② DM‑STAT !-r;(~九の面垂範囲: I SDTMCT のDOMAIN名で i 標準化(拡張あり) 変数名の指定範囲: j 横型のデータセットに対応 …1画面孟f ~ 、ー・圃崎司拘輔ー喝ー抽抽回融ーーー~、、\ 、 Check の G e n e r a t eM o d e l を指 定 1 ドメイン名.変数名 の形式で指定 命名方法は出来る限り ICDISC の命名法に従う ! ODerator: I 》宵使用制や翻脳級二: SASが認識できるもの、毒 i なおかつ人も認識しやすいも のに統一 、、 4 1 1 8 ー1 9 2・

203.
[beta]
! 一 │
~u

医療、政府・自治体、大学による工訪米テムの実証[.'B".iザ蝕

基本的な構造
同胞

,

n蕊E引 d ぷ「寸

1 3 0 M
10
判

1 5 0 M
1
6 Dh
I
1 1 0 M
8DM
90
刷

,

酎宙

1

lVarl
̲
v
i
s
l
t

岨E
AGE

WE
拍
トr
r

<

明 柑

し二豆室主コ
2
0
4
5

>
=

<

,旺回ト打

}=

B
M
I
B
M
l
FAM
l
l
.Y

<

"

8
6
1
8
.
5
2
5

)=

DSN:Plan
仕様書を臨み込み、
ICheck
i変数と Data5etName
を分離。 i
1Model001の読み込み部分の i

実行筋県金吋…

d
a
t
a n
u
l
l
s
e
tp
l
a
n
;
statement=
・
Datatemp
̲
r
e
s
u
l
t
;
'
;
set'
1
I
d
s
n
1
11
LC5EQ='1
川
I
I
∞
c
ompr
悶e
s叫
s
(
'
叶仏
│
LCSEQII"
i
f'
l
Isvar11'
11
川
'
1
拘
o
叩p
er
悶
a
t
o
r
l
l
''
1
川
1
怜
∞
co打s
t
1
1
'
1thenresult=1
;
e
l
s
er
e
s
u
l
t冨 0
;
r
u
n
;
'
;
c
a
l
le
x
e
c
u
t
e
(
s
t
a
t
e
m
e
n
t
)
;
r
u
n
;

v

V
i
s
i
t
を考えない場合の生成 i
l文
。 Planの変数を読み込み、 i
変数を作成。
I
Istatement
Callexecuteでstatement

文を実行する。

H
目 吋目"
川

1
9

│医療政府自治体大学一コシー宗主…ー蝕

~II)]]

条件分岐ヘ拡張
寸民五丁蕊EQT
dSn
T
寸一
1 3 0 M
1 4 0 M
5DM
6DM
1DM
8DM
9DM

石下一一 7ゐ
;
‑
[
y
‑
.
s
i
t
‑
r 占両面一一一

AGE
AGE

WEIGHT
WEIGHT

B
M
I
B
M
I
FAh
4
1
L
Y

1<
1>
乞
<
>
=
<
)
=

両 i
,
‑‑
‑
1
2
0
1
6
5
0
8
6
1
8
5
2
5
1

s
t
r
1=
̲
r
e
s
u
l
t
;
'
D
a
t
atemp
'
;
'
;
set'
1
I
d
s
n
1
11
i
fV
a
r
1v
i
s
i
tNEn
u
l
lt
h
e
ns
t
r
2=
'wher
官 V
I5IT= I
I
V
a
r
1
̲
v
i
s
i
t
l
l
'
;
'
;
s
t
r
3=
LC5EQ='
l
Icompress(""IILCSEQII・
"
'
)
1
1
';
i
fI
l
'svar11'
1I
l
'operatorll'I
l
'const111'then陀 sult=1
;
e
l
s
er
e
s
u
l
t=0
;
r
u
n
;
'
;
statement=c
a
t
(
s
t
r
1,s
t
r
2,s
t
r
3
)
;
曲 1e
x
e
c
u
t
e
(
s
t
a
t
e
m
e
n
t
)
;
r
u
n
;

:
V
i
s
i
t
指定が入っているケー

スを考慮する。
:
V
i
s
i
t
を考える場合は、 V
i
s
i
t
の指!

定の有無で生成文を変更する。'
今回のケースでは、 where旬 の '
u
l
lの ;
みで十分な制御が可能。 N
場合は、長い空白が掃入される!
│が問題はない。
t

不思議な warning
文字列が262byteを越えると
warning
が出る。昔の名残らし
ないのかは様。
必カ態ぜ消去されp

t;"制油、γ¥
け;
20

幽

1
9
3・

204.
[beta]
1
1
ネ均読ム…金 W
l
J
9

l医積、政府儲体、大学による

異なるデータセット同士の比較
ドマクロ変数をsymgetで取得..
~ mvarc=s
ymget(compress("svar3
ー"
1
1
̲
n
一
)
)
;
:mvarn=i
n
p
u
t
(
m
v
a
r
c8
.
)
;
ドモデル式の中で使用するへ
i
fI
l
'svar11'
1I
l
'operatorll'mvarnthenresult=1
;

合結合する..
Procs
q
ln
o
p
r
i
n
t
;
Createt
a
b
l
et
e
m
p
̲
r
e
s
u
l
tas
s
e
l
e
c
ta.SUBJID, ,b.AESEQ,b.AEPTCD
fromDMal
e
f
tj
o
i
nAEb
ona.SUBJID=b.SUBJID
目・目

*構造がいつも同じであればよいのだが・・・。..

(
1 マクロ変数を利用する
[マクロ変数テーブルを一時的な;
変数格納庫として利用する。変 i
数l
まsymget
などで取得。
1
)
> 制御文が変数生成と値の比!
!較の二系統に分かれるので、生 i
i成順序などが心配。

i
2
.結合を利用する
比較するこつのデータセットを
結合し、比較する。
》安定しているが、二つのデー
タセットの構造の関係や結合
キーが安定して存在するかどう

│闘政府自治体大学中コ以テ峨証一綿

~llJ9

エラーメッセージの出力

1
1
2
Z
F1
i
J …
l
c
h
e
c
k
仕様書を Pr

at

でエラーメッセージ、 CRF項目
などをフォーマットとして保存。

p
r
o
cs
q
l
;
i
n
s
e
r
ti
n
t
oQuery
s
e
l
e
c
tLCSEQ,SUBJID,
STAGE,
VISIT
,
TRISEQ,
RESULT
,LCSEQasDOMAIN,LCSEQCas
ERRMSG,LCSEQasFLDCD
fromR
e
s
u
l
t
whereRESULT=1
;
q
u
i
t
;

‑
1

フォーマットは、 LCSEQをキ
にしておき、クエリデータセット
にかぶせておく
その後エクセ)1.:へ出力影
宅事

221
9
4
205.

1 一手雨量堅持…. 結果 ・システムとして構築することができた 一再利用する modelはCSV を実施し、 L i b r a r y へと登録して 再利用可能としておく。 一再利用しない modelは簡易 CSVを実施して利用。 ・エラーメッセージ、 CRFページ表示、出力、監査証 跡機能などを実装 ・拡張するときは modelを追加する。 一次期開発候補は CDISCの縦型データセットに対応で、きる modelなど 23 l 医療政府間大学問I::J~^弘の実証~~.<=絡会 W J 9 ModelbasedL ib r a r y lこよるしo g i c a lCheckの自動生成と チェック仕様警作成業務の効率化 DEMONSTARTION 24 ‑ 1 9 5 ‑

206.
[beta]
|臨政府開大学問一弘の実証~や齢

9

W
l
J

実施例
s鶴
薗 α伺 純 一 間W司 ! 園

‑臨床試験

通c閉 te‑̲I制措

・症例数 3
8

2
0
1
40
<
125:7ロ
2 SASS ぶ m
.
sS
'
.
,
‑
t
,η
r
OH041' ‑5' ,̲T

歯 切 眠 岨 1皿

2014 倒。一 :019

_OH04;~ 1l ~1
'
o>
'
‑
S
",' m T
2
0
1 42811斗9
mP
‑
01'>0428:152 、鼻、、,""'1.

画
,p句に 014盟

・
‑ DM担当者:新人 (OM未経験)

川島

議 町 個 2由
官量町民醐盟
国
書 5陶 陀 一 間 舗 霊
園崎町k̲
0
1
2盟
副
,p
同に叩描

(うち SASで処理するもの
2010)

SAS

0140;;11:0二

画面".̲.怯醐

歯切に酬閣

・Check数 :2173

.
.
.
.

"
O
t
毛
, Q:0
: :64 次 SS,:
.
t
.
.
m
P
1
<
,
t
c
,
.
.
.
.P
2014"408:0今S ̲

画
書 α四 回 一 岨 札 制V
岨

匝量園開'
‑
q
岨 V
錨S

• CRF:紙

要厳島崎

議咽司J
I
C
̲
O
l
S田
昌埴有限̲016描
画唱司~019 臨
樋咽aglC̲020臨
画咽司1C
̲
0
2
1踊

同

y~t~ f"1

。
毒

014:'毛

o><S ご~, "M P.

O
l
‑0
4
.0.Ul55 :AS5y.'em~
0140
4~8:3 2~ S
A
i
i‑
'
y,
‑
,
.
イ1
ι
{
1-04~6.324
S
A
'5
1
'
0
1
4042813.25 SA
:
S5 ,'"~、 F
01404:
?
I
!1
3
.
3
3 5
1
¥
.
:
:
と
白苧

一O
l4G4:
814 付

~A.~ ."
t, 吋
2
0
1 4,
‑S.63
4 SA:
,5
y、
.
1
:.
rnP
j

。
句

20140
4
.'8163
4 SI¥S‑:旬"

L
i
b
r
a
r
y
からコピーされた LogicalCheck
Program。今後はパッチファイル処理など
で効率的に実勉出来るようにする予定。

聞時

結果として憾のモデルで全ての Check
を生成!
25

l

医蟻政府間大学はる工コシステムの期…『齢

~9

考察ー工数変化とその他の変化・

• DM担当者にとっては無事に Check
仕様書が作成できた。
Checkの有り方はモデルが示すため作業自体は効果的に進
んだ。ただモデルを定める作業が入ってしまったため、若干
工数がかさんだ。しかしモデルが安定すればもう少し工数が
減ると予想。
• STATの工数は ProgramL
ib
r
a
r
y
lこ新規 modelを追加すると
きのみ増大するため、相当の工数が減少する予定。
‑部内のやり取りはモテ、ルベースで、行うことがで、きるため、仕
様書における変数や基準値の話題がメインに。 → I ?

26

白

1
9
6
‑

207.

EE 霊童盟霊鵠謹盟塑 2 0 1 4 考察 ② ーモデルが促進するコミュニケーシヨンー .従来の S ASプログラミング工程に m o d e lb a s e dの概念を持 ち込んで開発した結果、 DM および S T A T 担当者の物の見る 目が変化した。 一前:どういう Check を作れ l まよいか 一後:どういうモデル、変数を作れば、使えばよいか 》 いつの間にか変化が起こり、モデルを中心としたコミュ ニケーションが実施されていた 》結果としてモデルは明確な判断基準と翻甑のより少な いコミュニケーションを D M.STAT グループへ提供した 27 EZZ 器器盟関盟盟盟国圃 結論 ーコンストラクタル法則の観点よりー .モデルは 》結局のところ高次元言語のように振る舞った .モデルが加速させた業務プロセス 》情報伝達プロセス • Modelbased開発を組み込んだこと 》コンストラクタル法則が示す進化の方向と同等 聞ゆおそらく多くの場面で応用が可能と考えられる 28 ー 1 9 7 ‑

208.

i 臨篠崎自跡 油紅と かたち Reference • A d r i a n,Bejan,"流れとかたち一万物のデ l j j ザインを決める新たな物理法異' 柴田裕之訳 • A r t Carpenters,! C a r p e n t e r ' sComplete Guidet ot h eSasMacroLanguagej 署 • Robert,V i r g i l e,f S ASMacroLanguage M a g i c :D i s c o v e r i n gAdvanced Techniquesj • SA~もも .3SQL プロシジャユーザーガイド • SA~もも 3 マクロ言語:リファレンス 。 E$IGN IN NATURE 29 医 痕 政 府 開 ー や 一 一 一 一 一 一 一 ‑ ご静聴ありがとうございました Ands p e c i a lt h a n k st oA d r i a nBejan! 30 ‑ 1 9 8 ‑

209.

! 一 一 戸 自 治 PMDA への承認申請時 CDISC 標準電子データ提出に向けた 社内標準のリモデリング 神谷亜香里,坂井絵 E 旦惟高裕一, 北西由武,角谷伸一,小坂明子 塩野義製薬株式会社解析センター RemodelingS h i o n o g is t a n d a r d f o rc l i n i c a ld a t at omeett h erequirement o fPMDAbasedonCDISCstandard A k a r iK a m i t a n i,E r iSakai, Y u i c h iKoretaka, Yoshitake h i n i c h iK a k u t a n i,AkikoKozaka K i t a n i s h i,S LTD. B i o s t a t i s t i c sDepartment,SHIONOGI&CO., 問、蜘制点.マム舗民主ムー WE 要旨: PMDAへの承認申請時電子データ提出に伴い, Rawd a t a今 SDTM今 ADaMラ ーT L Fの流れで、効率的に 業務を行うために社内標準の手順を再構築中であるー 本発表では現行手順と検討ポイントを紹介する= D A . キーワード CDISC,SDTM,ADaM. PMDA. F 社内標準,効率化.C D I .SASマクロ ‑ 1 9 9 ‑

210.

⑦ 目 、 政 府 ・ 問 、 大 学iはる均点ゐ一一 r ' I 1 ] 9 シオノギでの解析手順の変遷のイメージ 調ta?tT出 (CSR) .' 10仰 : ぺ ; : 過鱗Anal問 雪よ E G 喧 1 " ' L O I 校 開 締 法jJ: ての試験 1 . * 1 マさで:一 』4~ 2 0 1 3年9月 PMDA ・ 約60% 1 (標準化に注力) 白 血 . ・ h 1 ・ 4 次世代審査・相談体制発表い j大きなきっかけは PMDA対応 lraw. J SOTM )品ヨ 閣 宮 司 直巴 2009! 2010 2 0 1 1 2012 !2015 !鳳町一泊、対同門戸時私一蝕 却 [ 9 本日の内容 古シオノギのこれまでの取り組み o.ミ , 坦 , 誌 DTM 。第一次 CDISC 標準化対応、 F orFDA(2010年) 》体制・作成方法の「確立 J 骨第二次 CDISC標準化対応 F orA I IOvert h eWorld( 2 0 1 3年‑) 》体制・作成方法の「リモデリングj 大日本独特の問題 大悩みの共有 2 0 0 ‑ ー

211.

E冨酉盟酷醒関盟盟置圃 ‑ 斗 確 同 判 の SOTM 市 町 @) 第一次 CDISC標準化対応 F o rFDA(2010年) 大要点とシオノギでの工夫 》体制の確立を最優先! パGの理解 〆フォルダ構造の工夫 . rSDTMの工夫 (SASプログラミングスキルのない人でも作成可能に!) . r ADaMの工夫 │医療…日!とぷ弱体;比一蝕 9 w l ] ‑eCTDを意識 FDAがeCTDで求める module5の構造 こえザ両元M 構造一コ フォルダ構造の工夫 • FDAが提示した構造に加え, TLFや SAP,丁目 s h e l l sを格 納するフォルダを追加した社 内独自のフォルダ構造を構築 今フォルダを t e m p l a t e化 ( 全1 1 5 f o l d e r s ) 。 園 " . . . . . J 格 t Jngs 泊 " ' 0 伽 I ¥ : : )出 血 畑 , . 語 1 0副加 臨む I託 I i ‑上記で構築したフォルダ別, 役割別にアクセス権を細かく 定義 面 白 叫 相S 密ゆ剖~" Source:FD A .StudyDataT e c h n i c a lConformanceG u i d e . ;February2014 ‑ 2 0 1 ‑

212.

町間一一 江川品 SOTM作成・ QCの工夫 ~II~9 @) 医癒政府開部品工均一言…唱会 i 1 . SDTMデータ仕様書の作成 1 . 1 3つの用途 1 . 2 作成方法 2 . SDTMの作成 2 . 1 SDTM作成用 SASマクロ・関数 2 . 2 CDIとSDD 3 . SDTM仕様書とSDTMのQC 3 . 1 チェックリストに基づ、く目視チェック 3 . 2 SASプログラムによるチェック 3 . 3 OpenCDISC 3. 4 DM担当者による目視チェック │臨…却は…弘の実詰.へ‑ 1 .5DTMデータ仕様書の作成 1 . 1 3つの用途 1 .d e f i n e . x m lの作成 2 . SOTM作成をサポートするメタデータの作成 3 . 空の SOTMデータセットの作成 ( C O Iでのアウトプットデータ) ‑202‑ 句 SEM

213.
[beta]
旬、政府関均一シ尚三~~"~AU-.,-Ø~
1
.SDTMデータ仕様書の作成
1
.
2 作成方法

sDTM委
一
吋
タ
│

↓

2
0
1
[
1

82M
鴎

'
l
覆
s
釦
$
叩
D
町TM
デ
一
タ
ゲ
幹
l
f

ISDTM
砂
デ
;斗
Lタ
│手 作 業 │ 仕 様 書

ISAS I 仕様書
(伽
t抱e釧
附
m眼1拡叫弘到|同pr~
。引皐.9.!"nl (
恒
n
町
伸r
ゆ
患
伊
町
f
t
列
9
)1
仕様書

↓

鱗

附

1
:
元E

~fi~iBlJi\f-Iã~itf*..;~tg~渋滞I 言索引

1
い
川
{
炉
F
inaIDr
a
誠
制
n
町}

医慮、政府・自治体ーた学によ~諸説切実髄ゆl.t;&S細
三i叩 説 経 安 、

2
. SDTMの作成
2
.
1 SDTM作成用 SASマクロ・関数

加剖

問訓哨

…

川 I~!

司

島町園圃

SDTM

[マクロ]

・decode:メタデータTERMINOLOGYを用いて,指定したコードリ
ストのコード値 (CODE)I
こ対応した CODEDVALUE列のデータ値
を格納する.
• sequence̲generator:指定変数(主にー SEQ)への連番の格

納に用いる

[関数]
t
oi
s
o
:1508601形式の日付を年,月,日それぞれの数字変
数から作成する
• d
i
江 day:1508601形式の日付同士の日数差を計算する
10

‑
2
0
3
‑

214.

1 医療政府間尚一場料) ⑦ 2 . SDTMの作成 2 . 2 CDIと500‑位置づけー SZM 四 C l i n i c a lDataI n t e g r a t i o n ( V 2 . 3 ) ~一一---、 ⑦ー SDTM ̲ ̲; ̲ ̲ T~CSR) SASDrugDevelopment ( V 3 . 5 ) 1 1 liJJfppcy;; …a 医療、政府・自治体、大学rI!i!よるヱiìi シス罰~実証~山や絡会 予 〆 ‑ て ~JII~! 昌国 a ・ 2 . SDTMの作成 ド包七 SOTM 2 . 2 CDIと500‑CDIによる SDTM作成ー¥ノ品副 •G U I 竺士三笠, SAS ‑:J型空三三記)jA杢庄が主王室土ι生 f i X :P J盤上 〈アウトプット〉 jを斗-生:~ ‑ l p 〈インプットデータ〉 1 2 ‑ 2 0 4 ‑

215.

1 医療政府自治吋!と問中文時‑紬 3 . SOTM仕様書とSOTMのQC 3 . 1 チェックリストに基づく目視チェック 3 . 2 5A5 プログラムによるチェック 3 . 3 OpenCDI5C 2 m J ⑦i s E M ~ 回 SASprogram d e f i n e . x m l て 〉 3 . SOTM仕様書とSOTMのQC 9 W J l 同吐 │医療政府間閣とよる口以前均一一齢 3 . 4 DM担当者による目視チェック 困 ll巾714 n v Compare E岨 tu A 四 nua ︐ itmll+ n v qM m qM A SDTMData Repo同 RawData Report {目視チェック} 1 4 ‑ 2 0 5・

216.
[beta]
w
l
]
品
7{

目同組

AOaM作成・ QCの工夫

電
・

9

|医積政府間耕一コシス弘の実証 S焔~:;~会
1
. AOaMデータ仕様書の作成
1
.
1 3つの用途
1
.
2 作成方法

2
. AOaMの作成
2
.
1 ADaM作成用 SAS
マクロ

3
. AOaM仕様書とAOaMのQC
3
.
1 チェックリストに基づく目視チェック
3
.
2 SAS
プログラムによるチェック

15

~I]9

│闘政府間大学による四ステムの実証…叩齢

1
.ADaMデータ仕様書の作成
1
.
13
つの用途

官~~記

1
. define.xmlの作成
2
. ADaM作成をサポートするメタデータの作成
3
. 空のADaMデータセットの作成

広p.~~ ~~o_~!a!'_l

E温 %
g
̲
a
t
t
r
i
b
̲
i
n
c
l
u
d
e
(社内標準マクロ)

目

keep,
l
e
n
g
t
h,
f
o
r
m
a
t,l
a
b
e
l,
空データセット
(メタデータ)

50,
同

&

お化粧直し"16

事

2
0
6
‑

217.

~9 場国 1 .ADaMデータ仕様書の作成 1 . 2 作成方法 町宮 臨政府関均一ーがふ手ふれ総会 曾 1 SDTMデータ 仕様書 謬 襲 鱗 ADa 陥ヂ欄間タ 笠仕様書切 品 l吟 L ( t 警 警F 手作業 料開繊 AD 逼Mデータ 仕様書 ミ 霊 祭 1 7 │ 臨 政 府 閥 均 時 過 労 務 員 試 み ' : ‑ . .2 0 1 9 2 . ADaMの 作 成 2 . 1 ADaM作 成 用 5A5マ クロ 官~~訪 [マクロ] • s d t m ̲ s u p p ̲ m e r g e :SOTMSUPPドメインを親ドメインにマ ージした SASデータセット作成 • s d t me n c o d es u b :テキスト値をコード値 l こ変換 i s 8 6 0 1 d t :<SOTMデータ〉内の IS08601形式で、作成された 全ての日付データ(文字型)を SAS日付値または SAS日時値 データに変換 18 ‑ 2 0 7‑

218.
[beta]
2
0
1
9
鴎
曾

時、政府関与伝性持品~ "::S~'_"9
2
. ADaMの作成
2
.
1 ADaM作成用 5A5マ
クロ

SZM

SDTM
[SUPPDM]

[DM]
'SUBJIDBRTHDTC SE
.

USUBJIDQNAM

123456 19500
10
1 M

123456 PPS
N
123456SUBJCLAS INEL
lGIBLESUBJEC

司

因SASprogra
<iso形式司 SA
sI日付>

QVAL

因s program

因s町 岬am

崎

くS
UPPXX
を転置して

くコード値の変数を作成>

さらに,コード変数には̲j$
S
E
X
.

$PPS.

SSUBJCLAst

フォーマットを当てて利用

|医額、政府自治体局長戸時三ヰム ~-a9
術 ; ザ ド

3
. ADaM仕様書とADaMのQC
3
.
1 チェックリストに基づく目視チェック
ー統計解析担当者,プログラム担当者,
バリデーション担当者によるチェックー
3
.
2 SASプログラムによるチェック

2
0
1
4
・

曾
コ
1

ダブルプログラミング"

因
Compare
バリデーション担当作成

‑208‑

20

219.

lJ‑‑ ~Il~j 医積、政府・自治体、大学によるロシステムの賄側刊明 第二次 CDISe 標率化対応 し一一一…E o rAJLQY~Llo"史的!?dtdm雄主L一二…一 lraw. l SDTM すべての試験をトつ. 子 つ 1 町で 仏 DaM) TLF 実施l 実現するための体制をリモデリング 大第二次標準化を行わなければならない課題および解決 ,(2 013年 9月 PMDA の発表「次世代審査・相談体制』 〆SDTMを介さずにADaMを作成する場合の問題 〆SDTM作成担当者の不足 コ 4 F J 手順の一本化 〆作成の工夫 〆リソースの補強 l医 療 政 府 自 治 体 大 学 問 工 コ シ ス テ ム の 実 証 … 山 僧 径百 ~II~9 正道か?オプションか? r 再考」 〆 CSR(TLF)から SDTMへのトレー 町う団事M 団;~~ サピリティを保つことが重要. . /SDTMは. ・とくに安全性の統合解析で役立つ. .海外とデータをやり取りしやすい ・申請時絶対に不要な誌験はない. 手順は一本のほうがよいトむ J 必要なときにSDTM を作成すれ ばよいので, CSR作成時に常 にタスクをかけなくてよい. 22 ‑ 2 0 9 ‑

220.

~1lJ9 m ムの実証一触 │一回政府自治体大学は紅コ 体制と作成方法のリモデリング o .EE ' SDTM DM担当者 + [ [ [ J ".話f L !とADaMとあ . . ーーーーーーーーーーー. 連携強化により, 品質の向上を . S DTM 仕様・プログラム担当者 悔しDaM庁 LF 一 一 一 一 一, 4ffノ , , 点空しているー F a J IE空!位~ 1齢 E仕様・プログラム担当者世出出詰出掛 1部 I ' 1丙E統計解析担当者 / 、 l 炎 . SAS での作成により ¥ 『 『 『 / 砂 一 一 ‑ ‑ 担当者の補強,仕様書の充実を 、 品豊主主いる 23 巴竺竺土竺竺竺竺土型! 9 日本独特の問題 • SDTM r オリジナル」は日 本語と考えるのでは? ー薬剤コーデイング辞書医療用医薬品名データファイルとWHO‑DDで 格納方法が異なる ‑ CRFや日誌の質問および回答が日本語の場合 • ADaM ‑帳票を日本語で作成する場合.SASのフォーマットで対応 .共通 一日本語などの 2バイト文字を利用しているとシステムがうまく動かな いものがある (JMPC l i n i c a lもその一つ) 。 cゃいなどの対応は? 2/¥イト文字を受け入れ可能なシステムで、あっても.SJISとUTF・8な ど文字コードが違っていれば,文字化けの可能性がある r ' S Jが r 痴」に化ける! 24 ‑ 2 1 0 司

221.

!一治…一一誠心… ~9 その他の悩み ‑局所最適化功全体最適化 一解析センタ一外とのコラボレーシヨンが必要 バージョン対応とその管理と更新 ‑ SOTMのI G ‑C o n t r o l l e dT e r m i n o l o g y • CDISC標準の社内教育 一解析センター内 (OM部門,統計解析部門) 一解析センター外 • PMDAの動向の Watch 25 l 医領政府自…ぷ謀議機影‑儲 W l J 9 女シオノギのこれまでの取り組み lraw J Cつ 勉 SOTM 仏 OaM) TLF ・?っ・町 。 第 一 次 CDISC標準化対応 ForFDA(2010年) 〆体制の確立を最優先 ( I Gの理解, COIの利用) 〆工夫点の紹介(テンプレート,マクロ,フォルダ構造) @ 第 二 次 CDISC標準化対応、 ForA I IOvertheWorld(2013年‑) ,(2 0 1 3年 9月PMOAの「次世代審査・相談体制」発表をきっかけ 〆すべての試験でSOTMを作成して,一本の手順で業務を行うため, 体制をリモデリング 女日本独特の問題 大悩みの共有 フ6 ‑ 2 1 1 ‑

222.

|臨政府間大学中コゅの実証…ø~ 2 0 1 9 参考資料 1 . FDA.StudyDataT e c h n i c a lConformanceG u i d e . ;February2014. . f d a . g o v / d o w n l o a d s / F o r l n d u s t r y / D a t a S t a n d a r d s / A v a i l a b l ef r o m :URL:h t t p : / / w w w StudyDataStandards/UCM384744.pdf 2 . PMDA.PMDAの次世代審査・相談体制に関する説明会.;September2013. A v a i l a b l ef r o m URL: h t t p : / ん ,v w w . p m d a . g o . j p / o p e r a t i o n s / s h o n i n / i n f o / i y a k u / j i s e d a i / f i l e l 20130910 ・p m d a ‑ j i s e d a . i p d f 目 3 . 北原孝志,東島正堅,北西由武,吉田祐樹.解析業務プロセスにおいて効率的な仕様 書作成と Define.xmlへの変換 .SASユ ー ザ ー 総 会 兵 庫 .2011. 4 . 惟高裕一,藤原正和,北西由武,吉田祐樹 .SASを使った情報管理事例 クをやっつけろ ‑.SASユーザー総会.東京 .2013. そしてリス 5 . 豊泉樹一郎,北西由武,吉田祐樹,平井健太.FDASubmissionのための d e f i n e . p d f 作成事例・SAS@ によるファイル変換の Automation化 ・ .SASユーザー総会.東京. 2013. i f e 6 . 渡遺慶 .SASソリューションを利用した臨床試験データリポジトリの構築.SASL ScienceForum.東京 .2011. 7 . HollandC, ShostakJ .ImplementingCDISCUsingSAS@:AnEnd‑to・EndGuide. SASI n s t i t u t eINC(NC);2012. 27 ‑212・

223.

SAS.CDISC.AND ' .‑ ̲ : : " : " : ' ̲ ‑ : : : ' : OVERVIEWANDINTRODUCTION CLINICALMETADATA A b s t r a c t : ,suchaspossibleintegrationwith SAS'sc u r r e n tandf u t u r esupportofCDISC ,andenhancedmetadatamanagementi nc l i n i c a ldata CDISCSHARE r e p o s i t o r ybasedoncustomers'usecasesandproductroadmaps. MainI t e m s : • I n d u s t r yandCDISCm a t u r i n g‑morethan10yearso fCDISCprogress • SASsuppo同 ofCDISC • Standardsupdatedf r e q u e n t l y‑updatesw i t h o u tnewSASv e r s i o n s • Roadmap( r e c e n t,n e x tr e l e a s e,n e x t3y e a r s ) : ‑ 2 1 3 ‑

224.

SAS.CDISC.AND' . ' ‑ ̲ , " : : : : ' , " : ' ̲ ‑ : ' ' : :CDISCISMAKINGGREATPROGRESS 帥刷 CALMETADATA CL eCDISCS,~".<h l.""仰向' • I n d u s t r yandCDISCmaturing‑morethan10yearso fCDISCprogress • Muchhaschangedi nthel a s tdecade‑ • S t a r t i n gw i t hc r e a t i o no fCDISCi t s e l f • Soonf o l l o w e dbySDTMandODMs t a n d a r d s • Throught h eCDISCSHAREp r o j e c tandD a t a s e tXML SAS.CDISC.AND ' .‑ ̲ : : " : ' : ' ' ' : : ‑ ' : : SASSUPPORTSCDISCANDOURCUSTOMERS CL lNICALMETADATA o rmanyCDISCs t a n d a r d s : • SASprovidesf o r m a lsuppo同 f 3 . 1 . 2, 3 . 1 . 3and3 . 2 • SDTMversions3 . 1 . 1, • ADaM2 . 1 ・SEND3.0 • d e f i n e . x m l(CRT‑DDS1 . 0andDefine2 . 0 ) • ODM3 . 1and3 . 1 . 1 • Suppo同. e di nSASDrugDevelopmentandSASC l i n i c a lDataI n t e g r a t i o nv i a SASC l i n i c a lStandardsT o o l k i t CDASH, andSHAREsupport∞mingsoon • DatasetXML, m お ‑214・ . .

225.

SAS.CDISC.AND . ' ‑ . ‑ ; ; ; " : ' : " " : ; : ' ; ' : CLINICA L M E T A D A T A HOWTOMANAGEFREQUENTUPDATES • Standardsupdatedf r e q u e n t l y‑updatesw i t h o u tnewSASv e r s i o n s • LoadingODMtermsf i r s tsupportedi nC l i n i c a lStandardsT o o l k i t1 . 5 • Downloadd e s i r e dt e r m i n o l o g yl i s tfromCDISC/NCIi nCDISCODMformat • Useprocessd e f i n e di nLexJansen'sPharmaSUG2013paper. t ! 工E 企宣企宣 • CDISCSHAREw i l lp r o v i d ed a t astandardss t r u c t u r e sando t h e rmetadata x t r a c t sw i l lbei m p o r t a b l ei nas i m i l a rway • Oncea v a i l a b l e,CDISCSHAREe • CDISCSHAREt op r o v i d ed e f i n e . x m landODMf o r m a t swhichcanbeusednow 同 215‑

226.

SAS, CDISC, AND ' ̲ " : ' ' ' : ' : RECENTRELEASES CL lNICALMETADATA • C l i n i c a lDataI n t e g r a t i o n2 . 5releasedi nMarch,2015 ・ClinicalStandardsToolkit1.6releasedi nFeb, 2015 • Keynewf e a t u r e s • SDTM3 . 2S u p p o r t • D e f i n e2 . 0S u p p o r t • V e r s i o n5T r a n s p o r tF i l eH a n d l i n g .C r e a t i n gM e t a d a t af r o mDefine‑XMLF i l e s • I n c r e m e n t a lUpdateo fD a t aS t a n d a r dM e t a d a t af r o mCST S均 一 I SAS.CDISC.AND ' .‑ ̲ : : " : ' : ' ' ' :: ‑ . . : . : NEXTRELEASE CL lNICALMETADATA • C l i n i c a lDataI n t e g r a t i o n2 . 6andC l i n i c a lStandardsT o o l k i t1 . 7 • Plannedrelease2015Q1 • Completiono fd e f i n emetadata( 1 . 0and2 . 0 ) • Supportf o rCDISCDatasetXML .SASpa凶 c i p a t i n gi nFDAp i l o tf o rD a t a s e tXML( r e p l a c e m e n tf o rSASV5Transpo仕 ) • I n c o r p o r a t i o no fCDISCCDASHdatac o l l e c t i o nstandard 泊 ‑ S ‑216‑

227.

SAS.CDISC.AND lNieAL‑NIETAOATA NEXT3YEARS(ORBEYONDNEXTRELEASE) CL ifeScienceAnalyticsFramework • ReleasingnewSASo f f e r i n g2015,Q2‑L • Combinedfeatures e tw i t hnewmetadatamanagementc a p a b i l i t i e s • S w i t hCDASH‑SDTM/SEND‑ADaMd e f i n i t i o n st oSASd a t a s e t • A b i l i t yt oc r e a t ed e f i n e . x m l( 1 0 / 2 . 0 )f o ra p p r o p r i a t es t a n d a r d s A I Iv e r s i o n e dandc o n t r o l l e d • M o d i f i c a t i o n smadev i ar u l e ‑ b a s e dw i z a r d s( I i k ei nCDIt o d a y ) • C l e a ru n d e r s t a n d i n go fs t u d y ‑ s t u d yl i n k a g e s / p o r t f o l i oo fs t u d i e sac o r econcept ト s 回 S 恥 SAS.CDISC.AND ' ̲‑ ̲ ‑ : : ' : " ' ‑ : ' ' : : ‑ ̲ : : : END‑TO・ENDANALYTICS lNICALMETADATA CL SAS@ L if eSciences A n a l y t i c s Framework s [ : ! ; ' 1:l恥│ ‑217‑

228.

EXAMPLE:DATAFLOWAUTOMATEDFROMSTUDYMETADATA 一 ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー 川 誼 , . , . ,. .,...<<・'1~ 1I:{・I ・圃 2 ・・・:::I ~"l'III~'1 刷 E・1官官川園圃圃圃圃圃圃圃圃圃圃圃圃圃圃圃・ ~ S錨 SI" SAS.CDISC.AND . '‑ ̲ : : " : . : : ' ' ' : : ‑ ' : ' : IMPORTANTITEMSCOVERED lNICALMETADATA CL • CDISCmaturing‑e x i s t i n gstandardschangings l o w l yb u tnewonesadded • SASsupportsCDISCandcustomersu s i n gt h e i rstandards • Updatestandardsw i t h o u ti n s t a l l i n gnewSASv e r s i o n s • SASp l a n smanynewc a p a b i l i t i e sf o rf u t u r es o f t w a r er e l e a s e s I ‑ 2 1 8 ‑

229.

‑ 2 1 9 ‑

230.

l 臨吋1 1 1 通韓正月額瞬静i ト ヤm9 【企画セッション】欠測のあるデータに対する各種解析手法と 欠測メカニズムに対する感度分析 ( 1 )セッションの概要と基本事項の整理 土居正明 1)2) 藤原正和 1)3) 横山雄一 1)4) 1 )日本製薬工業協会医薬品評価委員会データサイエンス部会タスクフオース4 欠測のあるデータに対する解析方法論・ S A Sプログラム検討チーム 2 )東レ株式会社 3 )塩野義製薬株式会社 4 )持田製薬株式会社 Theoverviewo ft h es e s s i o nandt h e i n t r o d u c t i o nt od a t aa n a l y s i sw i t hm i s s i n gd a t a . MasaakiD o i1)2),MasakazuF u j i w a r a1)3), Y u i c h iYokoyama1)4) 1 )Theteamf o rs t a t i s t i c a lmethodologiesandSASprogrammingo fdata t a s kf o r c e4, d a t ascienceexpe吋 committee, drug a n a l y s i sw i t hm i s s i n gd a t a, s s o c i a t i o n . e v a l u a t i o ncommittee,JapanPharmaceuticalManufacturersA n c .3 )S h i o n o g i&Co.,L td . 2 )Torayi n d u s t r i e s,I td 4 )MochidaPharmaceuticalCo.,L 問、政府時点合議場鰹鞍議Iミー ~9 要旨: 欠測のあるデータの解析の基本的な用語を整 理しつつ,企画セッション全体の概説を行う 特に,欠測メカニズム, LOCFの使用に対する 検討, MMRMの導入,感度分析の大まかな枠 組み等について述べる. キーワード:欠測メカニズム,感度分析, LOCF,MMRM, 選択モデル,パターン混合モデル,共有パラメータモデル ‑220‑

231.

~m,i&Iß'ÊJ;~í*,;t;:~I;:d;QJ::r:,戸川 坊の実証一…会 医 癌 政 府 自 治 体 大 … エM ~9 発表内容 1.セッションの概要 2 . 記号の整理と状況設定 3 . 欠測メカニズムの解説 4 . 解析に用いるデータ・プログラムの紹介 5 . 主解析について ( LOCF.MMRM"その他) 6 . 感度分析の概要 7 . まとめ ~~,iBlm' Ë1;お こ シテ証… 1 .セッションの概要 ‑ 2 2 1・ ~m

232.

1 ネ均組一一 医長政府・開相こよる工 l ~9 セッションの概要:背景 欠測のあるデータの解析の現状とよくある疑問 (経時データを扱う臨床試験を想定) ① LOCFは使つてはダメ? 今どういう状況でも使えない? ‑7主解析としてはダメ? ②主解析に MMRMも使われるようになってきた 今 MMRMの厳密な定義は? →MARであることの妥当性は? 今他の解析方法は? ③感度分析は何をすればよい? 今そもそも「何に対する J 感度を検討するべき? ④S A Sで容易に実行可能? →自分で膨大なプログラミングが必要? l ω均一関山一 医穣政府師、熔 ~9 セッションの概要:本セッションの目的 N a t i o n a lResearchC o u n c i l( 2 0 1 0 )"TheP r e v e n t i o nandTreatmento f M i s s i n gDatai nC l i n i c a lT r i a l s . "(通称 NASレポート) →考え方・試験計画・主解析・感度分析に対する提言 本セッションでは, N RC( 2 0 1 0 )をベースに, ‑欠測のあるデータに関する基本的事項を整理する .主解析となる解析やその他の解析方法を整理する .欠測メカニズムに対する感度分析の方法を紹介する 。理論の理解と SASでの実行方法をみる. ‑ 2 2 2 ‑

233.

目 、 政 府 ・ 自 治 体 ¥ 込I 精髄甲山会 W l J 9 セッションの概要:セッションの構成 ( 1 )セッションの概要と基本事項の整理(本発表) ( 2 )解析手法の解説1 (選択モデル・ MMRM) ( 3)解析手法の解説2 (パターン混合モデル・共有パラメータモデル) ( 4 )欠測メカニズムに対する感度分析 ( 5 )まとめと質疑応答 │一一ーによるロシス弘の実証一一腕 W l J 9 2 .記号の整理と状況設定 ‑ 2 2 3 ‑

234.

i 医療政府明大学はる工コ以テムの実証~付金 9 W J ] 略語一覧 (欠測メカニズム) "MCAR:M i s s i n gCompletelyAtRandom " MAR:M i s s i n gAtRandom "MNAR:M i s s i n gNotAtRandom (解析方法の名称) "SM: S e l e c t i o nModel(選択モデル) "PMM: P a t t e r nMixtureModel(パターン混合モデル) "SPM: SharedParameterModel(共有パラメータモデル) ・ MMRM: Mixede仔e c tModelsforRepeatedMeasures "MI: M u l t i p l eImputation "IPW:I n v e r s eP r o b a b i l i t yWeighting [闘政府関蝉同工コシス弘の実証…山総会 W J 9 注意点:用語・記号が紛らわしい .MAR:文献ごとに定義が異なる ・感度分析?感度解析? ・ MMRMの厳密な定義は? ・ 欠 浪 . l J 識別変数は Rtj?Mu?欠測のときに 0717 1 0 ー2 2 4 ‑

235.

一政府関i 夫氏系砧議議ぷ一 ~[1 2 .記号の整理と状況設定 対象となるデータ:経時データ(連続値) IY il ¥ T ti 被験者 ¥I i町 / Yf 観測データ Y z = lJ ト (お) N : tの(計画された); l I J 1定時点 被 開 Y ; 凡欠測データ ( i=1 γ・ , N) 一 数 一1 0 t 一変了︿ 一別一一一 一識一ワ 一 測 一 R 一 欠 一 被験者 iのj時点でのデータが観測された 被験者 iの 3 時点でのデータが欠測 ト ( ; ) 単調な欠測(後で定義)の場合, Di LRij+1 → 被験者 tは時点 D iで脱落, 完了例は Di=r t i+1. 二 │ 時I甲府自向字I ミ完封み私心 s . J . ‑ " f ‑oa 1 1 i l ] [ 1 データの種類と尤度 F u l ld a t a ) ・完全データ ( (Y , Ri )= ( Yf, Y i ¥Ri) i I L ( θ, ψ)= @Y i ' ιは手に入らない I 1f(Yi,Y, アR i l θ, ψ ‑観測データ (Observeddata) (Yf, Ri) 。手に入る M ニ d ρ ( Y 川 1 2 ‑ 2 2 5・

236.

医揮政府関大学 ω ロシステムの実証…一触 9 [ ( j ] 欠測のパターン 単調な欠測 : 1回欠測した後は,全て欠測. →中止など →本セッションでは,単調な欠潰,IJを仮定 非単調な欠測 : 1回欠測した後 l こ,再度観測データあり. ーうある時点の来院の不備など 時点 1 時点 2 時点 3 時点 4 ? 史 認 症例 1 0 0 x x I ト 調な欠測 症例 2 0 0 0 x J 症例 3 0 0 x 0 非単調な欠測 13 |医療却前向…るエームの実証 SAS~, < ‑ g11 l , i 3 .欠測メカニズムの解説 1 4 ‑ 2 2 6・

237.

問、政府開示ん. . 弱点一一 欠測メカニズム ‑ 扱いやすい I │MCAR(MissingCompletelyAtRandom) f(RiIY , ψ)ニ f ( R i lψ) i I lMAR(Mi馴 9AtRandom) f(RilYi 1 ψ )ニ f(RiIYf, ψ) I lMNAR(MissingNotAtRandom) f ( R i I Y i, ψ)i ‑f(RiI Y f, ψ) 一般的 15 │医積一…によーマギみトー a* 2 0 1 4 欠測メカニズムの例(脱落確率のモデル) 。 (Yi,Yi 2時点 2 ) ベースライン C} il)は常に観測される l I MCARI f(R =明 必 ψ)=ゆ ※全て単調な欠測を仮定 i 2 π ττ1f(Ri2=O " t ̲ , . e x p ( ψ。 + ψ 1Y id I MARI IY i l , Y i2, ψ 0, ψ 1 )= P fn ( " ¥1 ' l . . T ̲ 1 ̲ ¥ Rt2= 0のとき欠演I1 I MNARI ‑ 一 一 司 位以内 +ψ1 九十 ψ 2r 叫) f(R I Y , I iY i2 ψ0, ψ 1, ψ 2 ) = h y i 2=O ぅ 。 1+e x p ( ψ +ψlY il+ψ2 1Yi~ l ψ 2子五 0) ‑ 2 2 7 ‑ 16

238.

片手、政府自治体点同口氏以主.総会 w l l 9 S A Sによる欠測のあるデータの発生方法(例) 1.完全データを発生させる. 2 . 欠測識別変数を発生させる. ‑脱落確率のモデル+B e r n o u l l i乱 数 3 . 欠測識別変数の値が oとなったデータを欠測にするこ とで,観測データを作成する 1 7 [聞、政府自治体均時 欠測メカニズムの注意点 。定義が文献によって異なる .共変量を考慮する? .共変量をデザイン変数と補助変数に分ける? .変量効果を考慮する? ‑MAR"という表現では不正確 (Seaman,2 013) " r e a l i s e dMAR eve叩whereMAR 圃 ※本セッションでは扱わない 1 8 ‑ 2 2 8 ‑

239.

欠測メカニズムの注意点 。 。多くの場合 MCARは非現実的 MARか MNARは観測データからは区別できない 。欠測理由の調査が重要 ‑転居による脱落ならMCAR? ・原疾患の悪化や有害事象なら MAR, MNAR? MAR, MNARが異なる →症例毎!こMCAR, →理論的には.MNARの症例が1例でも存在すれば 全体としてMNAR O試験デザインも重要 ‑原疾患の悪化による中止の場合 ‑応答変数の測定を頻繁に行う→ MAR? ・応答変数の測定が稀 → MNAR? 19 一問点ーシス間三.ユ一一 ~o 4 .解析対象データ・プログラムの紹介 20 ‑229・

240.
[beta]
[医瞭政府間大学問工肌弘の実証[:J'.;l:lトト綿

~9

解析対象データ
。うつ病の第
1
1
1相試験を想定したシミュレーションデータ
一 字

3
0,

....実薬群 ‑.̲プラセボ群
‑主要評価項目 :HAM‑D
→スコア低下:改善

2
0 "

(解析には変化量使用)
1
0

・実薬群 v
sプラセボ群
・
1
群1
00例(ベースライン時)

(平均土 s
o
)

o …一一一一
ベースライン

時点 1

時点3

時点 2

平均
霊平均議伊l
(
5
0
) 例数 (
5
0
)
数

平均ぷ

数泌 (
5
0
) 事例数

2
0
.
0
1
8
.
1
93
89
(
4
.
1
)
(
4
.
2
)
2
0
.
1欄
議
際
1
7
.
5銭 87
(
4
.
2
)
(
4
.
2
)

l

。単調な欠測のみ

時点4

1
4
.
9
(
5
.
4
)
4
1
5.
(
4
.
6
)

平均

平均幾

(~i;í

~J勢[議I (50)

84

11
.0
(
6
.
3
)

83

85

13
(
6

持 80

1
1
問均一峨

医療政府関大学による

8
.
5
(
6
.
8
)
.0
11
(
6
.
1
)

2
1

~9

使用するプログラム
MNARの解析には, M
i
s
s
i
n
g
d
a
t
a
.
o
r
g
.
u
kの
D
I
Aw
o
r
k
i
n
gg
r
o
u
pの公開マクロを使用
くMissingdata.org.uk>
!
!
.
u
k
/
h
t
t
o
:
/
/
m
i
s
s
i
n
g
d
a
t
a
.
or

<マクロ>
h
t
t
o
:
//
m
i
s
s
i
n
g
d
a
t
a
.
l
s
h
t
m.
a
c
.
uk
/
in
d
e
x
.
o
h0?view=categorv&id=61%3Amnar
methods
皇豆凶豆旦三回世よo
ntent&ltemid=137

く窓口>
JonathanBartlett,
JamesCarpenter
,MikeKenward
2
2

‑
2
3
0
‑

241.

~~,~1fi'lêr盆 こ シテ証…註 ~a 5 .主解析について 2 3 l医 癒 政 府 自 治 体 大 学 に よ る 出 ス テ ム ゐ 実 証 … 一 蝕 ~a LOCFに対する検討 ・単一の{盲による補完抵法は欠測データに対する主 要なアフローチとしてE在でも広く使用されている 一実行が容易 24 ‑ 2 3 1・

242.

… i医 積 政 府 自 治 体 大 学 問 工 コ 双 羽 詰E LOCFに対する検討 • LOCF 使用上の注意 ‑N R C( 2 0 1 0 ) ・仮定が正当化できない限り,主要解析として使用すべ きではない. ‑EMA ガイドライン ( 2 0 1 0 ) ・明らかに保守的な場合,説得力のあるエビデンスとな り得る ガイドラインのように欠測データの取り ・ 日本においては, EMA 扱いに関する規制当局の考え方を示したガイドラインは存在 しない. 2 5 [闘政府関熔はるエコシス均実証~叩蝕 ~9 主解析の全般的な傾向 ‑欠測メカニズム "MARを仮定することが多い. "MARを仮定することは正当化できるか? ‑解析手法 ・MMRMを使うことが増えてきた. "MMRMの厳密な定義は? ‑他の解析方法は? → ( 2 )解析手法の解説 1(SM.MMRM) ( 3 )解析手法の解説2(PMM.SPM) 26 ‑232・

243.

EZ 器離宮盤盟皿 MMRM(MixedeffectModelsforRepeatedMeasures) V =Z iD Z;+~i Yi N(Xtβ ぅV)ぅ ‑厳密にどういうモデル? 共変量にベースラインは入れる? ベースラインと時点の交互作用は? .相関構造は? ・変量効果は? ・"MMRM"という言葉を使うことに対する批判も ( M a l l i n c k r o d t,2013) a → ( 2 )解析手法の解説 1(SM.MMRM) 27 EZ 霊童霊童聾盟塑豊里霊園 。 MMRM以外の解析方法は? MMRMは色々仮定したもとで妥当 ‑応答変数の正規性 .欠測が MAR ーう他のモデル・解析方法は? 。選択モデル (SelectionModel,SM) @ M u l t i p l eImputation( M I ) 。パターン混合モデル (Pattern‑MixtureModel,PMM) 。共有パラメータモデル (SharedParameterModel,SPM) → (2)解析手法の解説 1 CSM,MMRM) ( 3 )解析手法の解説 2CPMM,SPM) 28 2 3 3 ‑ ー

244.

l医 癒 政 府 間 大 一 一 弘 の 実 証 一 一 紬 ~I]9 6 .感度分析 2 9 m u ‑ ‑ ‑ z i ‑ ‑2019 i医療、政府自治体 感度分析 ・欠測のあるデータに対する解析は仮定が多い. 一歩仮定の妥当性を検討したい ーラ「何の仮定に対する感度を見ているか J が重要 • NRC (2010)Chapter5の 記 載 感 度 分 析 に は ( a ) 完全データの分布に対する感度 ( b )外れ値・外れた症例に対する感度 ( c ) 欠測メカニズムに対する感度 などが考えられるが, ( c )に注目. @ Type( i )検証不能な仮定 @感度パラメータ ( s e n s i t i v i t yp a r a m e t e r ) Type( i i )検証可能な仮定 → ( 4 )欠測メカニズムに対する感度分析 ‑ 2 3 4 ‑ 30

245.

│医療政府間 Type( i )の仮定と Type( i i )の仮定 仮定には観測データから「検証できる仮定 jとF 検証できない 仮定 jがある以下,用語は NRC(2010)参照. 例) ・観測されたデータの分布に正規分布を仮定 →観測データから妥当性が確認できる → Type( i i )の仮定 ・欠測したデータの分布に正規分布を仮定 →観測データからは妥当性が確認できない i )の仮定 → Type( 。「どういう仮定をしているか ?Jによって, 「どういう感度分析が必要か ?Jが変わる → ( 4 )欠測メカニズムに対する感度分析 l医 衛 政 府 間 … る 一 弘 の 実 証 s … 意 P I I 1 l [ 1 7 .まとめ 32 ‑ 2 3 5 ‑

246.

臨時・自i自主将持続捕特~j'iA~~:"-.. 2 0 1 9 本セッションの目標 欠測のあるデータの解析の ①考え方の理解 ②S A Sでの実行方法の理解 ( a )SM ,MMRM ,M I,PMM,SPM ( b )欠測メカニズムに対する感度分析 33 即時町一一切話辛子一.却[9 セッションの構成 ( 1 )セッションの概要と基本事項の整理(本発表) ( 2 )解析手法の解説 1(選択モデル・ MMRM) ( 3)解析手法の解説 2 ( 1'¥ターン混合モデル・共有パラメータモデル) ( 4 )欠測メカニズムに対する感度分析 ( 5)まとめと質疑応答 34 ‑ 2 3 6 ‑

247.

│医疲蜘占有両議響議院ム W l J 9 参考文献 1 . EuropeanMedicinesAgency( 2 0 1 0 ) .G u i d e l i n eonmis引 ngd a t ai nconfirmatory c l i n i c a lt r i a l s http://www.ema.europa.eu/docs/en̲GB/document̲1i b r ar y / 5 c i e n t i f i c̲gui d e li ne/ 2010/09/VVC500096793.pdf 2 . M a l l i n c k r o d t, C .H .( 2 0 1 3 ) .P r e v e n t i n gandT r e a t i n gM i s s i n gDatai nL a n g i t u d i n a l 旧I s .CambridgeP r e s s C l i n i c a lT r . l( 2 0 1 0 ) .T heP r e v e n t i n gandTreatmentafM i s s i n g 3 . N a t i o n a lResearchCounci. 1 i n i c a lT r i a l s .NationalAcademiesP r e s s . Datai nC 4 . 5eaman,5 .,G a l a t i,J .,Jackson,D .,andC a r l i n,J .( 2 0 1 3 ) .VVhatI sMeantby M i s s i n ga tRandom"? 5 t a t i s t i c a l 5 c i e n c e, 2, 2 5 7 ‑ 2 6 8 . 3S ‑ 2 3 7‑

248.

l医 同 府 自 治 体 大 学 に よ る 四 ス テ ム の 実 証 SASユ 十 綿 W J D 【企画セッション】欠測のあるデータに対する各種解析手法と 欠測メカニズムに対する感度分析 ( 2 ) 解析手法の解説 1 ( S M,MMRM) 大江基貴 1)2) 土居正明 1)3) 縄田成毅巾) 1 )日本製薬工業協会医薬品評価委員会データサイエンス部会タスクフオース4 欠測のあるデータに対する解析方法論・ SAS プログラム検討チーム 2 )株式会社大塚製薬工場 3 )東レ株式会社 4 )杏林製薬株式会社 T h er e v i e wo fa n a l y t i c a la p p r o a c h1 ( S M,MMRM) MotokiOe1)2), MasaakiDoi1)3), ShigekiNawata1)4) 1)Theteamf o rs t a t i s t i回 Im e t h o d o l o g i e sandSASprogrammingo fd a t aa n a l y s i s w i t hm i s s i n gd a t a,t a s kf o r c e4,d a t as c i e n c ee x p e r tcommi 悦e e,d r u ge v a l u a t i o n h a r m a c e u t i c a lM a n u f a c t u r e r sA s s o c i a t i o n . committee,JapanP 2 )OtsukaP h a r m a c e u t i c a lF a c t o r y ,I n c .3 )T o r a yi n d u s t r i e s,I n c 4 )K y o r i nP h a r m a c e u t i c a lCO.,LTD . 政 府 関 大 … 要旨:解析手法の解説 1 SelectionModel(以下.SM)及び MixedeffectModelsfor RepeatedMeasures( 以下, MMRM)を概説し解析例を 示す. キーワード:LMM. MAR. Mixede仔' e c tmode . l MMRM. MNAR .Repeatedmeasure.Selection model 2 2 0 14/6 1 2 6 ‑ 2 3 8 ‑

249.

1 医療政府自治体大学による工コシステムゐ実話…儲 . Contents ‑尤度を用いた方法 S e l e c t i o nModel(SM) ‑ MARの場合 ‑ MNARの場合 ・MMRM(Mixede汗'ectModelsforRepeatedMeasures) ーモデルの概要 一用語の混乱について ー特定が必要なもの ・ シミュレーション・データの解析 ーマクロの紹介 一解析結果 3 2014/6/26 │闘訓吟体大…m ス弘ゐ実証…柏 ~9 尤度を用いた方法 ・欠測を伴うデータの尤度 一応答変数 一欠測識別変数 Yi= ( Y f, Yア) T L 両方の尤度の寄与を 民 j 考えなくてはならない .完全データの尤度 ( F u l lDataL ikelihood) N L * (θ , ψ)αIIf(Y;,R; θ 1, ψ ) 一完全データの尤度は,欠測データ Yアも含む ・観測データの尤度 (ObservedDataL ikelihood) N L ( θψ)=IIf(Y?,R;1 8, ψ) Z冒 l 立J f(Yf, Y同 1 8, ψ) 町 ‑尤度を用いた方法では,観測データの尤度に基づいて推測を行う. 2 0 1 4 1 6/ 26 4 ‑ 2 3 9・

250.
[beta]
│医制府白山学尚子守尚一…哨

w
l
l
9

SM(
S
e
l
e
c
t
i
o
nModel)
• SM(
S
e
l
e
c
t
i
o
nModel)とは
完全データの尤度が,以下のように分解されることを想定

f(Yi,
R
i
lθ ψ)=f
(
Y
i
lθ
).
f(RiIY
,
ψ)
i
=f
(
Y
f,
Yア1
0
)
.f
(RiIYf,
Y,
アψ)'‑‑v‑‑‑"'‑一一γ 一一一ノ
Type(
i
)の仮定

Type(
i
)の仮定

ー 第2
項が r
観測された集団」または「欠;J!
J
Iした集団」への個人の選択を
モデル化していると解釈できるため, S
e
l
e
c
t
i
o
nModel"と呼ばれる

• SMにおける観測データの尤度

rIf(Yf,ア f(RilYげ れ ψ) ア
N

L
(θゆ)=

Y │
θ
).

dY

2
0
1
4
1
6
1
2
6

1

医療、政府自治臥学問印文弘ゐ類一儲
MARの場合の SM
.観測データの尤度
判

)1ffh
ア
d
釘
f
肌 叩?
:
"1
9

│
θ
)附

Yf皇 制 昨

Y 仰
的
θ
)
.f
(
R
i
l川

土

=

}
T
Iリ
{
f
川
(
何
Yf
m
引
川
!
川
附
的
0
)
.六
f(
民
R
d
川
Y
Y
?ψ
桝
州
け
)
甲
乙

1=1

‑観測データの対数尤度
N

玄l
o
g
f
(
Y
i
l
θ
)
+乞 l
o
gf(RiI
Y
f,
ψ)

l
(θ
,
ψ)=

。の推定に必要な部分
2
0
1
4
1
6
1
2
62
4
0[
1
]
9

251.

一、附時点伝説雨量主. . 加9 会 MARの場合のSM • I g n o r a b i l i t y ‑尤度の枠組みで推測を行うことを前提として, MARのもとでは, 。に関する推測を OI 8 ) に基づいて行うことができる 欠測過程を含めない尤度 f(Y 直接尤度 ( D i r e c tL i k e l i h o o d .DL)と呼ばれる 一欠測データを「無視」するという意味ではないことに注意 ‑他の接近法での I g n o r a b i l i t y ‑ Bayes流接近法でも同様に成り立つ ‑頻度流の接近法(最小2乗法, GEEなど)では, MCARの場合でない と成り立たない CVerbeke& Molenberghs,1997). 2 0 1 4 / 6 / 2 6 I 癒臨悶台…一五当時読ん雌 ~II]]9 MNARの場合のSM .観測データの対数尤度 N I 〆 局 Y r 、 l ( θ, ψ)=乞 l o g( f(Yf, Yア│ θ ) .f (RiIYf, , ψ) dY r ) 。を推定するためには,積分計算が必要 測定過程に関する尤度 欠測過程に関する尤度 f(Yf, Yア│ θ ) f(~IYf , Yア, ψ) I g n o r a b l eではない 1 両方をモデル化しなくてはならない 8 2 0 1 4 / 6 / 2 6 ‑ 2 4 1 ‑

252.

│医療政府自治体大ねるエコシ杭の実証一一 9 W l J MNARの場合の SM ‑欠測過程のモデル化 ( T y p e ( i )の仮定) ーここでは.D i g g l e& Kenward( 1 9 9 4 )のモデルを紹介する 一単調な欠測,ベースライン測定値は欠測がないことを仮定 l o g i t {Pr(Rij= O l R i 1 ニ 。, i Y ψ +ψl 1 γ ・・ , Ri, j ‑ l 二 二 j‑l+ ゆ2 1 , Yi, ψ)} Y i j 一 時 点 Jにおける測定値が欠測であるか否かが,その 1 時点前の測 定値とその時点の測定値に依存して決まるモデル 欠浪I J ? 22'‑‑‑'‑‑ ベースライン 時点 j‑1/ 時点 J QIU) く む 日1 9 2014/6/26 │医療政府間大学問工コシス問実証…ー触 ~9 MNARの場合の SM ‑モデルの解釈 l o g i t {Pr(Rij=O l R γ ・・ ,~,j-l ニ 1 , Yi, ψ)} i 1 =1 , i Yj‑l+ ψ2Y i j = ψ o十 世1 'Jψ2チoMNAR r一 守 lψ2=。 :fψ1#0 MAR MCAR但 圃 i ψ 1=0 ‑感度分析との関係 ーモデルを信じる立場 ‑T y p e ( i )の仮定であることを強調 2014/6/26 :ψ0, ψぃψ 2を推定 :ψ2は解析者が設定 10 ‑ 2 4 2 ‑

253.

医 療 、 政 府 ・ 自 治 体 、 大 学 │γri??! i [ i l i !; & l i . .ØL~テムd 実証~刊一総会 ' P J1 1r H ー.‑‑‑‑‑‑‑‑‑‑‑‑‑‑ MMRMの位置づけ • SMの一つの形式 ‑ MARを仮定したもとで .DUこ基づいて推測を行うことができる ー • SMの中での位置づけ j ( Y ;,R τ I X ;,O,ψ)=j(YiIX , O ) j ( R i I Y ;,Xi , ψ) i J ' ( Mイ CM A ψ ) ψ) ARR ~ f(RiIY~ 江川 l MNARの場合は,そのまま 欠浪) 1 過程を含まない 観測データの尤度 (DL) 最大化により. ()の一致 推定値を得ることができる 警j ( Y f I X i, O ) ~.MMRM 2 0 1 4 1 6 1 2 6 1 1 │臨政府自治体点字l1li誠心一 9 W l J LMM( L in earMixedModel) • LMMC L inearMixedModel)C L a i r d&Ware,1982) Yi= X i β 十 Zibi+E i t 被験者を表す添え字 ーここに. bi~ N(O, D).εi ~ N ( O .~i) ‑ D は,変量効果関の共分散行列 一 見 は , 被 験 者 Zの 誤 差 の 共 分 散 行 列 一般的な欠測を伴うデータ(ni個の繰り返し測定)の解析では... β +l Yi=Xi n ; b ε t i+ b (O, ν2). fi ~ N (O, σ2In,) i~ N ・変量効果は 1変量(被験者)のみ ・誤差は被験者間で共通かつ,測定値問で独立と想定 ーここに • 1 2 2 0 1 4 1 6 / 2 6 ‑ 2 4 3 ‑

254.

l医療政府間大学によるヱコシステムゐ実証 S 純一総会 W J 9 MMRMの位置づけ • LMMの周辺モデル Yirv N(Xiβ , V), V = ZiDZT+~i ‑周辺モデルから示唆される重要な特徴 一変量効果のバラつきを,周辺分散 V の一部と解釈することができる の構造としてまとめてパラメータ化すれば,変量効果を明示的 にモデリングせずともよい. ・周辺モデルでは,多変量正規分布が想定される. .v • M a l l i n c k r o d te ta . l( 2 0 0 1 )は,上記のように解釈した LMMを MMRM"と日乎んだ. 2 0 1 4 1 即' 2 6 1 3 一 一 一 … 一 一 一 一 一 一般的な SMとMMRMの違い ‑簡単のため, b a l a n c e dデータで、同 =3とする. Yi= X 1 3 b i+Ei i β+ bs N(O , d), E N(O, σ 2 1 ) 3 ‑周辺分散 V ベiiト4 : j ) ;ーーー時田・・四 ' MMRM・也幽・ 周辺分散(誤差分散)を 直接にパラメータ化 I ' = C I T E i J 0・ ゅ( 5 2 3 ) │ CompoundSymmetry 2 0 1 4 / 6 / 2 6 例えば .U附 悶 伽 陀d i 1 4 2 4 4 ‑ ー

255.

!臨時向指務稽勝裕一 ~9 用語の混乱 MixedModel"という言葉を含んでいるが・.. 一変量効果(変量切片)を明示的に指定しない ‑ SASによる実装で,一般に RANDOMSTATEMENTは使わない l u s t e r ( e x .r e g i o n )は変量効果として組み込むことがで ーただし他のC きる ‑ ど三からど三までが MMRM"か ? 額面どおりに用語を解釈すると MMRM"とは解析モデルの大きなク ラスのーっと考えることができる. ‑M a l l i c k r o d te ta. l( 2 0 0 1 )が示したモデルは MMRM"のひとつに過ぎ ず,さらに言うとこれは解析方法を示すものではないー 一実務的には,より詳細な仕様の特定が必要 1 5 2 0 1 4 1 邑1 2 6 2 0 1 9 |戸、政府自治時iこ一一議謬町一~...,_.. 特定が必要なもの:平均構造 ‑応答と固定効果の関係 約 紗占 m da 繍州側 時 一 機 織×叫 雌 山繍欄 ]3 m一 j邸 ぱ答議=弐ピス手ィン地治療 時 機 ‑欠測を伴うかどうかに関わらず,一般の回帰モデルで明示的に特定さ れる 一一般的には,以下のような想定が多い(と思われる) ーベースライン×時点を組み込むかどうかなど領域によってはさらなる 議論がある (Dinh&Yang,2 0 1 1 ) ‑感度分析の立場 ‑R e s t r i c t i v eModel:試験デザインに関する因子のみ(+重要な共変量) ‑I n c l u s i v eModel 脱落に関連する多くの共変量(補助変数)を含める 2 0 1 4 / 6 / 2 6 16 ‑ 2 4 5 ‑

256.

l医 躍、政府・自治体、大学による工飢均実トー.. 2 0 1 4 I n c l u s i v eModel I n c l u s i v eModel:補助変数を組み込んだモデル ー 欠 測 が MNARであっても,適切な補助変数をモデルに組み込めば, 解析上,欠測は MARIこ近づく. ‑ Randomize後の変数 I t .補助変数として有用な情報をもつことが多 いが,治療と交絡するおそれがあるため,一般に解析モデルに組み 込むことは出来ない (ICHE9) ・感度分析としての利用 ‑解析モデルには組み込めないが.MI( M u l t i p l eI m p u t a t i o n )や wGEE (weightedGEE)ならば,以下で利用できる ・M I 補完モデル • wG巨E: I P W ( l n v e r s eP r o b a b i l i t yW e i g h t i n g )モデル ー解析モデルは. R e s t r i c t i v eModel ‑ MARかどうかの感度分析に有用な情報を与える可能性がある 1 7 2 0 1 4 / 6 / 2 6 i z ‑ ‑11…WIJ9 l医号、一政問… 実 特定が必要なもの:周辺モデルの分散共分散構造 ‑様々な構造を選択することができる. ‑ CS.AR(1).T o e p l i t z . UNなど 誤特定の問題 MARのもとでの DLに基づく推測の妥当性には関わらないが・.. 一共分散構造を誤って特定すると,一般に推定量の一致性が失われる .誤特定に対する処方 ーサンドウィツチ分散(ロバスト分散)の利用 ・漸近不偏な分散推定量だが,欠測が MCARでない限りパラメータの点推定 L u&M e h r o t r a, 2 0 0 9 ) 値はバイアスをもっ己とがある ( • SASでは,併用可能な自由度の計算法が限られる. ‑ UN 無構造(U n s t r a c t u r e d )を指定する (多少)推定効率を犠牲にし収束に問題を抱える三とがある 1 8 2 0 1 4 / 6 / 2 6 ‑ 2 4 6 ‑

257.

戸、一品説務縮 i7~i~:_.. 2 0 1 4 特定が必要なもの:周辺モデルの分散共分散構造 • UNを指定した場合 l こ収束しなかったら ‑ Newton‑Raphson;: 去の初期値を, Fisher'sscore法で、与える i s h e r ' ss c o r e法で推定を行つてはならない ・「初期値」である点に注意 F .欠測を伴う場合,期待情報量からは分散の一致推定量が導かれない( Verbeke&Molenberghs,1997) 一別の推定アルゴリズムを利用する ・逐次単回帰法 (Lu&Mehrotra,2009) それで、も収束しなかったら 一共分散構造を少しずつ特定する o e p l i包 司 HCS= 今A R(1)司 CS司 VC)は,事前に決 ・特定の順序(例えば, T めておく 収束に失敗した際のこれらの処方はあらかじめ取り決めておくことが推奨される 19 2 0 1 4 / 6 / 2 6 E 号、一 特定が必要なもの:自由度の計算法 ‑自由度の計算の必要性 一欠測を伴い,データが Unbalancedの 場 合 は 検 定 統 計 量 (F統計量) の分母の自由度が一意に定まらない ‑ SASでは,いくつかの計算方法を選択することができる ・文献で多く適用が見られるのは, SATTERTHWAITEと KENWARDROGER • KENWARDROGER:KR法 (Kenward&Roger ,1 997 ) ーパラメータのモデル分散(漸近分散)は,それ自体に分散共分散行列 の推定量を含むため,その推定に伴うバラつきを考慮しない場合にバ イアスをもつことが知られている KR法では,このバイアスを調整したモデル分散を利用して SATTERTHWAITEの近似法を利用し分母の自由度を計算する 20 2 0 1 4 / 6 / 2 6 ‑247 噂

258.

問 、 一 一Iき完全脅婚やL 2019 ,.‑ a . MMRMで特定が必要なもの:まとめ .平均構造 一変量効果を組み込むかどうかも含む ・推定方法:制限付き最尤法 (REML)が第一選択 . (周辺モデルの)分散共分散構造 ‑収束しなかった場合の対応(構造の特定順など) .自由度の計算方法 これらは,統計解析計翻書に事前明記することが望ましい 2 1 2 0 1 4 / 6 / 2 6 l E 5政府間足I ミザ弱移民一 2 0 1 4 SASによる実装 • MMRM ‑ PROCMIXEDを利用して,簡単に実装することができる ープログラム例 PROCMIXEOOATA=インプット OS名; CLASS 治療時点被験者1 0 ; 応答=ベースライン治療時点治療*時点 100FM=KR; MOOEL 治療脅時点; LSMEANS REPEATEO 時点 ISUBJECT=被験者 1 0TYPE=UN; RUN; • SM ‑ MNARの場合の S Mを実装するためのマクロが, DIAworkinggroupに より公開されている ーここでは, Type(i)の仮定の感度分析に使用するマクロを紹介する 22 2014/6/26 ‑ 2 4 8 司

259.

問 、 政 問 点 ゐ ぷI 足場議員長い m マクロの紹介 (SM,Type(i)の 仮 定 の 感 度 分 析 ) .欠測過程のモデル 一 Diggle&Kenward(1994)のモデルを利用 ・群ごとに異なるパラメータを設定 実薬群・ プラセボ群 l o g i t { P r ( m i s s i n g ) }=ψ1+ψ31 i.j‑1+ψ昌1 i J l o g i t { P r ( m i s s i n g ) }=ψ2+ψ41 i.j‑1+ψ'61 i j ‑欠測メカニズムに応じて,モデルを選択する仕様 • MCAR,MAR,MNARに加えて, MNARS"を選択できる ・モデルl まMNARと同じで, ψ5, ψ6のみ固定値を割り当てることができるー ・解析モデル 感度パラメータ 一平均構造は, MMRMと同じ指定とする. ー非線形最適化により,数値的に最尤推定値を得る ‑パラメータの初期値には, MMRMの推定値を利用 23 2014/6/26 … │医一台体点.樹事I ~~ マクロの紹介 (SM,Type(i)の 仮 定 の 感 度 分 析 ) %macroSM̲GridSearch( =1番目のdrugの感度パラメータの指定(ぺ ‑1の範囲) p s i 5 g r i d =2番目のdrugの感度パラメータの指定 (‑1‑1の範囲) p s i 6 g r i d =インプットDS名 , INPUTDS =共分散構造 (UN, TOEP , TOEPH, ARH, AR,CSH,CS) COVTYPE =応答変数, response =平均構造の指定 (MMRMの指定と合わせる), MODL =カテゴリカル変数, CLASVAR = MNARS mech 3‑8), =数値積分の積分範囲に関係する値 ( c o n s t =数値計算に関するフラグ(0, 1), d e r i v a t i v e =非線形最適化の方法 method (NR:NewtonRaphsonr i d g e,QN準ニュートン法), =アウトプットDS名(パラメータの推定値), o u t 1 =アウトプットDS名(差の LSMEAN), o u t 2 =アウトプットDS名 (LSMEAN), o u t 3 DEBUG =0 24 2014/6/26 ‑249 司

260.

~9 i医制府問、鳩山工平均一…ー儲 マクロの紹介 (SM, す べ て の パ ラ メ ー タ を 推 定 ) %Selection̲Model2( INPUTDS =インプット DS名 , COVTYPE =共分散構造(UN, TOEP , TOEPH, ARH, AR, CSH, CS) =応答変数, response MODL =平均構造の指定 (MMRMの指定と合わせる), CLASVAR =カテゴリカル変数, mech =欠;Jl j l メカニズム (MCA , R MA , R MNAR) =数値積分の積分範囲に関係する値 (3‑8), c o n s t d e r i v a t i v e =数値計算に関するフラグ ( 0,1 ) , method =非線形最適化の方法 (NR:NewtonRaphsonr i d g e,QN:準ニュートン法), =アウトプット DS名(パラメータの推定値上 o u t 1 =アウトプット DS名(差の LSMEAN), o u t 2 =アウトプット DS名 (LSMEAN), o u t 3 DEBUG =0 2 5 2 0 1 4 1 6 1 2 6 1 W l J [ 1 医療政府自治体大学によるエコシステムの実証一総会 解析対象データ 3 0 。 う つ 病 の 第1 1 1相 試 験 を 想 定 し た シ ミ ュ レ ー シ ョ ン デ ー タ →ト実薬群 ‑Jrプラセボ群 .主要評価項目 HAM‑D 2 0 →スコア低下.改善 (解析には変化量使用) 1 0 . 実 薬 群 vsプラセボ群 . 1群 100例(ベースライン時) 。 ・ ・ ・ ・ ・ 彊 ・ ベースライン 時点 1 時点2 時点 3 @単調な欠測のみ 時点 4 EM 掴岡田1m連盟圃 例数 議 100 100 都 咽 ‑ 2 5 0 ‑ 市 , ' J : 7 ' J . i ‑ h 吉宗津 平均 伊平均警捜民的平均込 伊j 数 例数後 ザ例数 ( 5 0 )議議ね糊 縦 ( 5 0 ) 議議論制時 ( 5 0 ) 2 0 . 0 ̲ ̲ 1 8 . 1 1 4 . 9 :-.-~~ 93 ~:-~~ 89 ~_ ".~ 84 ( 4 . 1 ) ‑ ‑ ( 4 . 2 ) ‑ ‑ ( 5 . 4 ) ‑. 2 0 . 1 1 7 . 5 1 5. 4 . ̲̲ . 90 . .̲ . 87 . .̲ . 85 ( 4 . 2 ) ‑ ‑ ( 4 . 2 ) ̲ . ( 4 . 6 ) ‑ ‑ 平均 妥平均 ヲ例数a ( 5 0 ) "'~, ( 5 0 ) .0 8 .5 11 ( 6. 3 ) ‑‑ ( 6 . 8 ) 13,3 会制 11 .0 :-_-~~ 80 ( 6 . 3 ) ‑‑ ( 6 . 1 ) 審 2 6

261.

誠 一 一 医療政府駒大学問; 泣込書訂←齢 ! ? ‑ f j ¥ 解析結果 1 w l l 9 p s i 5 g r i d=ψ5 ‑マクロ "SM GridSearch"での解析結果 ーここでは, . d=psi5grid=psi6grid=0を指定 (MARを仮定) E司君胃!r宮司開閉曹関冨冨 2 実薬群すも烹プラセボ群後ぉ 一11 .2 2 ( 0 . 6 9 ) ‑ 8 . 9 6 ( 0 . 7 0 ) ‑ 2 . 2 6 0 . 9 8 0 . 0 2 2 • MMRMでの解析結果 ‑ PROCMIXEDによる実装,解析モデルは S M GridSearch"と閉じ 田郡!?詞司欄寓羽田│ 得議実薬群 1 1 . 2 2 ( 0 . 6 9 ) きプ三戸f‑群M ‑ 8 . 9 7 ( 0 . 7 0 ) ー 2 . 2 6 0 . 9 9 0 . 0 2 4 一感度パラメータ =0のS Mの解析結果とほぼ一致 27 2014/6/26 戸、政府自綿均一一伝説九千綿 ~mJ9 解析結果 2 ‑マクロ Selection Model2"で、の解析結果 ‑感度パラメータも含めて,すべて推定 ‑ MNAR(Diggle& Kenwardの欠測過程モデル)を仮定して解析 -1話題Iíll;i軍事 U~団関~J. 定機:漬薬群議鱗粉プラセボ群 ‑ 11 .3 7 ( 0 . 7 0 ) ‑ 9 . 2 5 ( 0 . 7 0 ) ‑ 2 . 1 2 1 .0 1 0 . 0 3 7 一感度パラメータの推定値 ・実薬群 ・プラセボ群 p s i 5 g r i d=‑0 . 1 3 p s i 6 g r i dー = 0.16 .感度分析 ‑ MARを仮定した解析との違いは? 一感度パラメータを動かすと解析結果はどう変わるつ 28 2014/6/26 ‑251‑

262.

a a t~ i I 5 l J f . J.IÊH8f$~;~(一 風 一 2014 参考文献 1 Diggle,P .&Kenward,M.G.( 1 9 9 4 ) .I n f o r m a t i v edrop‑outi nl o n g i t u d i n a ldata a n a l y s i s .A ppliedS t a t i s t i c s .43(1),49・93 Dinh,P .&Yang,P .(2011).Handlingbaselinesi nrepeatedmeasuresa n a l y s i sw i t h missingdataa trandom. J o u r n a lofB i o p h a r m a c e u t i c a lS t a t i s t i c s,21,326‑341. 2 0 0 8 ) .L o n g i t u d i n a l Fitzmaurice,G.,Davian,M.,Verbek,G.& Molenberghs,G.( DataA n a l y s i s .Chapman&HaII/CRC. ,J .H .( 1 9 9 7 ) .Smallsamplei n f e r e n c ef o rf i x e de f f e c t s Kenward,M.G.&Roger i o m e t r i c s,53,983・997 fromr e s t r i c t e dmaximuml i k e l i h o o d .B .M.&Ware,J .H .( 1 9 8 2 ) .Random‑effectsmodelsf o rl o n g i t u d i n a ldata L a i r d,N B i o m e t r i c s,38(4),963・974 L it t l e,R .J .A .&Rubin,D.B .(1987) S t a t i s t i c a la n a l y s i sw i t hmissingd a t a .John 目 Wiley& Sons.NewYork .(2009).Specificationofcovariancestructurei nl o n g i t u d i n a l LuK .& MehrotraD .V dataa n a l y s i sf o rrandomizedc l i n i c a lt r i a l s .S t a t i s t i c si nM e d i c i n e },29,474‑488. 29 2 0 1 4 / 6 / 2 6 臨政府自治体持点字場議員長ム. 82 0 1 9 参考文献 2 M a l l i n c k r o d tC .H .,ClarkW.S .& DavidS .R .(2001).Accountingf o rdropoutb i a s usingm i x e d ‑ e f f e c t smodels.J o u r n a lBiopharmaceuticalS t a t i s t i c s,1 1,9‑21 目 M a l l i n c k r o d t,C.社 , Lane,P .w . , S c h n e l l,0 .,Peng,Y .& Maucuso,J p ( 2 0 0 8 ) . Recommendationsf o rtheprimarya n a l y s i so fcontinuousendpointsi n l o n g i t u d i n a lc l i n i c a lt r i a l s .DurgI n f o r m a t i o nJ o u r n a l,42,303‑319. 目 目 C.H .( 2 0 1 3 ) .P r e v e n t i n gandT r e a t i n gMissingDatai nL o n g i t u d i n a l M a l l i n c k r o d t, C l i n i c a lT r i a l s .CambridgeUniversitypress N a t i o n a lResearchCouncil( 2 0 1 0 ) .TheP r e v e n t i o nandTreatmento fMissing Datai nC l i n i c a lT r i a l s .Washington,DC:TheNationalAcademiesPress Verbeke,G目&Molenberghs,G.( 1 9 9 7 ) .L i nearmixedmodelsi np r a c t i c e :aSAS o r i e n t e dapproach,NewYork:Springer‑Verlag. 2 0 1 4 / 6 / 2 6 30 幅 252‑

263.

EZ 塁塁塁盟理聾盟. . 圃 ご清聴ありがとうございました 2 0 1 4 / 6 / 2 6 3 1 ‑ 2 5 3 ‑

264.

医療、政府・自治体岬によ紅コシステム尚一s斗融 ~II~9 【企画セッション】欠測のあるデータに対する各種解析手法と 欠測メカニズムに対する感度分析 ( 3 )解析手法の解説 2 高橋文博問藤原正和明大浦智紀 1 1 4 1横山雄一明 1 )日本製薬工業協会医薬品評価委員会データサイエンス部会 タスクフオース4欠潰1 1 のあるデータに対する解析方法論・ SASプログラム検討チーム 2 )田辺三菱株式会社 3 )塩野義製薬株式会社 4 )日本イーライリリー株式会社 5 )持田製薬株式会社 T h er e v i e wo fa n a l y t i c a la p p r o a c h2( M I,PMM,SPM) 1 2 1,M 1 3 1, F u m i h i r oT a k a h a s h i1 asakazuF u j i w a r a1 1 4 1, 5 1, TomonoriOura1 Y u i c h iYokoyama1) 1 )Theteamf o rs t a t i s t i c a lm e t h o d o l o g i e sandSASprogrammingo fd a t aa n a l y s i s a s kf o r c e4 d a t as c i e n c eexpe吋 committee d r u ge v a l u a t i o n w i t hm i s s i n gd a t at h a r m a c e u t i c a lM a n u f a c t u r e r sA s s o c i a t i o n committee,JapanP , , , ,, , , td .3 )S h i o n o g i&C o .L td . 2 )M i t s u b i s h iTanabePharmaC o .L 一一;自Iらみど持議機長~~--ø*. 2 0 1 9 要旨: 多重補完法 C M u l t i p l eI m p u t a t i o n ),制約条件を a t t e r nM i x t u r emodel,及び、 Shared 用いた P ParameterModelの理論的解説,並びに シミュレーションデータに対する SASの実行結果 を提示する. キーワード , , , , , , , , PMM I d e n t i f y i n gr e s t r i c t i o n s CCMVACMV NCMV NFMV M u l t i p l eImputation SharedParameterModel MNAR NLMIXED , ‑ 2 5 4 ‑

265.

回一体、元長持減量五三ふ会 ~9 発表の流れ 1 . M u l t i p l eImputation 2 . P a t t e r nMixtureModel. 砂醸蜜暫控璽盟塑欝醸警華 麗;吾輩童謡部誼陸認跡誕二乱調 1 . PatternMixtureModelとは 2 . 制約条件を仮定した P a t t e r nMixtureModel 1 . CCMV.NCMV.NFMV 2 . 実行方法, M u l t i p l eI m p u t a t i o n,マクロ 3 . SharedParameterModel 1 . SharedParameterModelとは 2 . 位置づけ 3 . マクロ 4 . シミュレーションデータを用いた解析例 │医療一体大学一 解析対象データ 3 0 。うつ病の第 1 1 1相試験を想定したシミュレーションデータ 4 炉 実 薬 群 時i rプラセボ群 ‑主要評価項目 HAM‑D 2 0 →スコア低下:改善 (解析には変化量使用) . 実 薬 群 vsプラセボ群 . 1群 100例(ベースライン持) 。 ベースライン 時点 1 平均 ' 9 l J 数 鮒 ( 5 0 ) 例数 100 線 100 2 0 . 0 ( 4 . 1 ) 2 0 . 1 ( 4 . 2 ) 時点 3 時点 Z 93 90 平均 (~~í 1 8 . 1 ( 4 . 2 ) 1 7 . 5 ( 4 . 2 ) 。単調な欠;Jl I Jの み 時点 4 平均 ' 9 l J 数議 ( 5 0 ) 例数 89 8 7 ‑ 2 5 5 ‑ 1 4 . 9 ( 5. 4 ) 1 5 . 4 ( 4 . 6 ) 84 85 平均 ( 5 0 ) 例数 1 1 . 0 83 ( 6 . 3 ) 1 3 . 3 80 ( 6 . 3 ) 平均 ( 5 0 ) 8 . 5 ( 6 . 8 ) .0 11 ( 6 . 1 )

266.

. 瞭 政 府 間 熔ω 以 弘 の 実 い ー M u l t i p l eI m p u t a t i o n ( M I ) ‑ 2 5 6 ‑ ~9

267.
[beta]
~1.i.iBClffi'I3~~f*.*~Ii:d:QJ::::JV ~~i~;iiE

医額、政府・自治体、大学!とよる工コジズデムの実証 S純
一
倣
AS;
t
‑
+
f
‑'
Ut

9
日i
r
JI
2
0

;
;
.
.
M
u
l
t
i
o
l
eI
m
o
u
t
a
t
i
o
n(
M
I
)
Rubin(1978,
1987)によって提案された方法
であれば, MARIこ基づく MIの
,欠測メカニズムがMAR
解析(主解析)は妥当
‑複数回の補完を行うことで,欠測値の補完に対して
不確実性を考慮
・ M
Iにおける解析モデルと補完モデルが尤度ベースのモデルと同
じならば, MIの結果は尤度ベースの結果と
類似. (
M
a
l
l
i
n
c
k
r
o
d
.
t2013
開

補完モデル:欠測値を補完するための統計モデル
解析モデル:多重補完された完全データを用いて解析するための統計モデル

‑MIが有用な状況 (
D
m
i
t
r
i
e
n
k
oe
ta
l,2005):
共変量の欠測を補完
PMM(MNAR)の枠組みでも適用可能
非単調な欠測を補完

1

医痘政府関大…工おかふ実証,‑"fi.l'lトト制

;
;
.
.
M
u
l
t
i
o
l
eI
m
o
u
t
a
t
i
o
n(
MI)の SASの実行種類
ー単調文は非単調欠測パターン仮定
‑表 1P
r
o
cM
Iにおける補完方法 (
Y
a
n
gY
u
a
n,2011)
Ph
伽 m
o
f
m
i
s
s
i
n
伊
,e
s
sT
y
p
eo
fi
m
p
u
t
e
dv
a
r
i
a
b
l
e Av
a
i
l
a
b
l
em
e
t
加d
s
蜘 即t
o
n
e
Co
n
t
i
n
u
o
U
l
!
I
M
o
n
o
t
o
n
er
暗 闇i
叩│
Monoωnep
re<ll低回四叩 m
a
t
c
h
i
n
g
M
o
n
o
t
o
n
ep
r
o
p
e
悩 i
t
ys
c
o
r
e
M
o
n
o
t
o
n
e
M
o
n
o
t
o
n
e

C
l
蹴 i
f
i
c
at
i
o
n(
o
r
d
泊叫)
C
l
蹴 i
f
i
c
a
t
i
o
n(
n
o
m
i
n
a
l
)

M
o
n
o
t
o
n
el
o
g
i
s
t
i
c時 間S
l
o
n
M
o
n
o
t
o
n
ed
国 nmm
叩 t
f
u
n
c
t
i
o
n

A
r
b
i
t
r
a
r
y

Co
n
t
i
n
u
o
l
l
S

MCMCf
u
l
l
‑
d
a
t
ai
m
p
u
t
a
t
i
o
n
争d
a
t
ai
m
p
u
匂t
i
o
n
MCMCm
o
n
o
t
o
n

T
a
b
l
e1
:I
m
p
u
t
a
t
i
o
nm
e
t
h
吋 si
nP
問 CM
I
.

帽

2
5
7
・

9

w
l
]

268.

測値 Yiを補完するY こめ,観測されたデー夕日?… , Y j を用いて補完モデルを構築 巧 ェ βb+βlX l + . . .+β'kXk 回帰パラメータの推定値 β ニ C s o,β1ぃ., sk) 共分散行列好 Vj Y jは (XX)‑lより導出 パラメータの事後予測分布から下記をサンプル β =(β*0, β*1, β 2 β吋 ) ,σ 分散 :σ?=03j(nj‑k‑1)/g, g χnj‑k‑.P 牢 牢 む ヲ … ヲ n , は Yfi~観測されているデータ数 V T j ZV = VhjV'[j 回帰係数仇=念 + σ勺 Z :k+1の長さの独立正規変数 ラ 欠測値を下記の式で補完 β牢 0 +ふ lX l +ふ 2X2, • 一,ふた Xk 十三Z4σザ 医額、政府・自治体、大学による口減切点 E O H : i i l S J:I齢 ~IljJ9 》単調回帰の MIによる SASプログラム(例) ① MIの実行 p r o cm id a t a = X X X X s e e d =シード番号 n i m p u t e = 補完回数マ補完されたデータセットの作成個数) o u t =多重補完後の出力データセット名; by薬剤群変数; m o n o t o n em e t h o d = r e g (単調回帰の場合); v a rv Ov a l 1v a l 2v a l 3v a l 4(解析対象変数); r u n : ②多重補完後,多重補完によって得られた複数のデータセットの それぞれに対して解析モデルを適用. 例) M i x e dプロシジャーによる ANCOVAモテ)レ 最終時点の値=治療効果+ベースライン値 1 0 ‑ 2 5 8 ‑

269.
[beta]
│医積、政府

1
1
ム
ム
総
倉

j
時点!とよ託手続尚三

~lllJ9

》単調回帰の M
Iによる SASプログラム(例)

③解析モデルで得られた複数の解析結果より
M
I
A
N
A
L
Y
Z
Eを用いて解析結果の統合
pro
cmianalyzedata=XXXa
l
p
h
a
=
O
.
0
5
;
m
o
d
e
l
e
f
f
e
c
t
se
s
t
i
m
a
t
e(対象推定値の変数);
s
t
d
e
r
rs
t
d
e
r
r(標準誤差の変数);
odso
u
t
p
u
tParameterEstimates=統合結果;
r
u
n
;

1
1

》

①及び③で得られる 5A5
データセット
l
f
倒

•
"恨協調2

.
.
""誠艇

.
.

,
.
.
醐.

岨

i

.到針醐

四 抑 制
1
旬
開

2
:
2i
i
6
5
6
1
3
5
2

刺市6
ト

附
"
'

d

同組

.'I~馴,.

3側諸 3
1

4nn
刷‑6',, 1:
52

則 1殴
,

"
ι
8
63
:
:
"
:

鵬盤輯l

引 制1

'"片隅刊拙1 芳

5-J;;

19~ 濁岡崎

"巾:3i
l調

.

8
.,'姻唱

十例鉱山

必

,.局 W

側

コ
ゴ

減

姻

鍋

o . 師 湖 : 引8
4
1
'"

4附 f
0
'問 r
酬

臼円相.,刷",.帥川似

"l&
X
l
1
l
2

幅制

:
'
1

‑
<
12
4
¥棚

十
悶 ω
釧

マ2
3 ‑
2河口7沼

吻 叩 " 唱 Z叩 刷 棚 州 川 淵 叩 咽

附

噛

1

l~附 '6

‑ , 引 酬 7 寸 酬'
‑
1

-6~'~ 1
m
渇

J

罵珊

悶卯臆

,
‑
3
I
l'
1
州畑叩川副嗣
棚4
間関
ι鈍飢

6
披1
5
)
1
8

幅
"
'

"'~5H'

川
,
.
,
柄
J

と伊

7引 溺

-~‑ ‑ .
-4~1~81W

̲
"
1
]
2
2
{
t
2
:
'

隣徳一,印刷.
w T
I
!
5
!
t
f
'

i
.
m
to

叩 7 川 崎 間5
附

"‑

jul1

リ出山

‑
2
5
9
‑

1
1
"
'
'
'
"
̲

‑,1,]咽."備補佐

却 :~n8'2:i
羽
,随想9IIß.19~性
(
1
6 '
9
0
1
3
6
1
‑) 2 ィ 阿 川
l
'
‑C
1
(
1
j;
'
J

̲
̲
̲
!
L

,‑

刊
,
.
.

6
2
引

仰 刻 略

1
灘 4
矧4'9)l!il
j
'
S

置宜盟璽盟理璽想望室溜証ü;温冨記mmlfi'~[諸民謡岨E胆
ど

喝"四

;矧泊3'[6

",鎌倉 4 う
ー 別
措 2
8 ‑
1
1
拠
'
.
穂
町 市 醐 作 酬 却'
7誌
,

"

‑
1
"網 棚

幅

捌 醐 判 明 位 。 町 一 " 引 脚
悶 F 笥3

7

一.
.
.
!
.
L

'163~刻抱

7 附",!8~

4
5
9
"
!
'円

制

m

‑
‑
1

吋 町 ‑ 止 『

品己竺~

3~515醐~, "仰仰

.

み

叩 珊 叩m ̲ "

1
8
1
1間 前

マ

句 町

13

1:
:
l
/

‑
L~υ

Uuljど

Uに
わ

~-{),

̲
,
,
'

RlJ..

"
"
"
車
砲
.
日開;
柵

270.

~m, i B l : 1 f f l . e I;~f*, ~!j! r i : 医療、政府・自治体、大出じ司令羽 三 . . I実証内 ブャ ~tI~ 》M I(単 調 回 帰 )+ANCOVA:解析対象データの解析結果 匿盟轟轟覇軍調掴 実薬群 プラゼボ群 ‑ 11 .2 6 ( 0 . 6 8 ) ‑ 8 . 7 5 ( 0 . 6 7 ) ‑ 2 . 5 1 0 . 9 6 0 . 0 0 9 多重補完後の解析モデル :ANCOVA procmixedd a t a = / * 補完後データセットヴ; b y̲Imputation̲; c l a s st 吋; modelval4=xOt 同 ; Ismeanst r t l p d i仔= c o n t r o l ( " 2 " )c la l p h a = O . 0 5 ; odso u t p u td i f f s = / *群間差のデータセットワ; 台各群の推定値のデータセットワ; odso u t p u tIsmeans=1 r u n : l 医療政府間大一一弘の実証…哨 1 3 9 [ i ] P a t t e r nM i x t u r eModel (PMM) 14 ‑ 2 6 0 ‑

271.

丹 ニ ~ (yot.R¥Xl Pr(R¥X)P r(Yo.y M¥R.X) 二 十r( R¥ X )Pr(yO¥R.X~r主M\Y:R yO:観測されたアウト力ム yM:観測されなかった(欠測)ア R :欠測識別変数 X:観測されている共変量 》欠測パターンの例 圃盛EIlE!I窟霊園盟国盟E 墨画霊室霊童 ①脱落時点に基づく脱落λターン 例 ) 観 測 O 未観測× ②中止理由に基づ、く脱落パターン 中止理由 1 有害事象により中止 中止理由 2 効果不足 中止理由 3 :被 験 者 の 同 意 撤 回 な ‑ 2 6 1 ‑

272.

1 1 1 │ 医 長 政 府 自 治 体 、 大 学 に よ る 工 コ 実証Iiムトザ哨 P I i J J 9 》制約条件と欠測メカニズムの関係図 M i s s i n gd a t ai nc l i n i c a lt r i a l spage3 7,M o l e n b e r g h se ta . l( 2 0 0 7 )より S E M :M C A R cI 胤 RI cM N F O cg e n e r a lM N A R t I tI L t 附 M :M C A R c ~ACMV J cN F M V Ic g e n e r a lM N A R : c #ψ i n t e r i o r 日g u r e3 . 1R e l a t i o n 金i pb e t w 悶 n e s t e dfam伽削蜘恥副削iωm耐~ ( 組 問 a n dp a t t e m ‑ 則x t u r em o d e l( P 泊 町f 岨由民側C A R .m i s s i n gc o 叫l e t e l ya tr a n d o m ; M札 凶s 幽 ga tr a n d o m ;刷 A R ,凶減n gn o ta tr a n d 側;掛aJ), m i s s i n gn o n ‑ f u l 附 d e p e n d e n c e ;A 制V .a v a i l a b l ec a s e凶s s i n gv a l u e s ;N F M V, n o n ‑ f u t u r em i 蜘g v a l u e 出 i n t e r i 民 間 なi c t i o n sb a s e d∞ac o 帥i n a t i o no ft h e加知m a t i o na v a U a b l ef o r悦h e r p a t t e m s .T h eCs y 曲 。1 h e r e凶 c a t e s' i sas 附a l c 蹴 o , ' fT h et s y m b o li n d i c 飢餓 ω r r e s p o n d e 削 除t w e e na c l a s so fS 邸 側e l sa n da l c 踊 r oPMMm o d e l s ) , │問、政府間矧こ点以テム保証一一 1 7 ~[[1 》告Ij約条件(CCMV, NCMV.ACMV)を仮定した PMM T h u se ta . l( 2 0 0 2 )は上記の制約条件を統一的に示す形 でPMMを提案 ~=-:::::'-~:;;--';;-l"1_ 脱落パターン γ =1, …I 》制約条件 (CCMV, VCMV, ACMV) 五( ν ' s l Y h 品 = 主 因f(附1 Ys 1).s t+1....T 1 ) J 句 ー ニ この重み ω匂 ( s :補完対象時点, J :どのパターンの分布)の 設定により,制約条件 CCMV, NCMV, ACMVを表現 つの制約条件を完全データの分布関数に代入 以上, 3 引JbJ 州 制 = 州1,, .y t ) ‑ 2 6 2 ‑

273.

1 一 1 1 1 町 ; ! ? ? 川 鴎 政 府 関三 鳩叩 山紅均誠意尚一総会 ~Irn9 》制約条件 1(CCMV:CompleteCaseM i s s i n gV a l u e ) ωT , T=ωT ‑1 .T=ω T ‑ 2, T ...ωt 十l.T=1 かつその他 ωsj=O, j= fT のとき 五(Ys1Yl1一、 Y s ‑I )= f T ( Y s I Y I ・ぅ Y s ‑, ) t s= t +L… 今 宅 二 最後まで観測された Completer(例,パターン1)の 情報から欠測の情報を補完するもの.完全パターン のデータを利用し,多くの被験者が Completerのパ ターンの場合を満たしている場合に有用.また, Non‑ monotoneのときにも利用が容易. 例 ) 観 測 O 未観測× t ターン 1 時点 1 0時点 2 0 パターン2 時点 1 0時点 2 0 パターン 3 時点 1 0時点 2 とよ.ぷ弱エム儲 一 一 加9 医癒政府自:弘元三i i 》告J I約 条 件 2( NCMV:NeiqhborinqCaseMissinqValues) ωT, T‑ωT‑LT‑l= ωT ‑ 2 . T ‑ 2= … =ω件 Lt+l= 1 かつその他 ωsj = O . j= fsのとき 五(YsIYl, …, Y s ‑ l )= ! s ( Y s I Y l, ...,仇-l ), s=t+l , …、~ 欠測時点で測定された一番近いパターンの情報から欠測の 情報を補完するもの.たとえば,下記の例司パターン3の│ │時点 3を補完したけ場合,一番欠測パターンが近いパターン 2のデータの分布から補完 例 ) 観 測 O 未観測× パターン 1 時点 10時点 2 0 時点 3 0 時点 4 0 パターン2 時点 10時点 2 0 時点 3 0 時点4× │ 〉 パターン3 時点 10 ー 』 且 ( 20 ‑ 2 6 3・

274.
[beta]
i

医療政府間大学による工羽弘の実証…ー紬

~9

》制約条件 (NFMV)を仮定した PMM
Kenwarde
ta
.
l(
2
0
0
3
)はMNAR
を仮定した PMMを提案
ACMVの結果と NFMV+CCMV文は NFMV+NCMV
の結果比較することは,
MARの欠測メカニズムからの事離を評価
f(仇 … .
Y
r.
r=t
) = f(札…,州 r=t
)f(
r=t
)

五(
Y
l,
…,
YT)f(r=t)
五(
Y
l
..
.
.
.Y
t
)五(
Y
I
削 I
Y
1ぃ・訓)f
t(
Y
t
+
2ぅ
.
.
,Y
T
l
yt
....品+
1

2
1

|医療政府間熔による出ステムの実証 SAS~-~-Ø*

1
9

》制約条件 (NFMV:Non‑FutureM
i
s
s
i
n9
:V
alue)

s>t+2に対して
f(
Y
s
I
Y
l
' Y
s
‑
l,r=t
)=f(
Y
s
I
Y
lぃ., Y
s
‑
l,r三s‑1)
"'1

一脱落が今現在観測されていないデータに依存し,
未来に観測されていないデータには依存しない

一欠;Jt
J
Iメカニズム (
S
e
l
e
c
t
i
o
nModelのM
i
s
s
i
n
gNon‑Future
Deoendent:MNFD)に 対 応
臨調薗酉阻臓部制限眉宣車掴
f(
r=t
l札 制 = f(
r=t
l
Y
l ...,ぶ~

,

一完全にデータの分布が特定できない,すなわち下記の
条件付き分布のみが特定されていない
=〉制約条件にCMVや NCMV)の追加が必要
f(ys¥YP'
,
.
・y山

r=s‑l)ー
…

‑
2
6
4・

275.

│医癒政均叩;属議鰐持率I 子1m 9 》 PMMマクロ(参考:M issinadata.ora.ul く ) %macro%patternmixture(analyset=XXX,/*データセット名 V I c o n s t r a i n t = X X X,/*補完モデルに使用す CCMVorNCMV*I I 約として NFMVo rALL*I Itype=XXX,戸時点帝J seedgen=XXX,numberimputations=X,/*シード数と補完数V *目的変数 * 1 YVAR=%STR(XXX),1 MODEL=%STR(XXXX),1 * 補完モデルワ modvars=%STR(xxx), classvars=%STR(XXX),i d =,1 *補完モデルの質的変数ワ MODEL2=%STR(XX),/*解析モデル,補完モデルと同一でなくてよい V classvars2=%STR(XX),/*解析モデルの質的変数 V 1 othervars=%STR(XXX),I*Lsmean算出に必要な連続変数 * TITLE=%STRO, FOOTNOTE=%STR() ) ; 23 本 c o m p l e t ec a s e 略/ ) I 1 t t e r n m i x t u r d analyset~D7 I co n s t r 百i n t = C C M V t I y p eニN F M V . s e e d g en = 8 85 '7 95 4 n u m b e r i m p u t a t l o n s二5 Y V A R =日S T R ( V AL ) MODEL 二日T R ( b a s et 悶 t m en tv i st ib a s e竹内 a t m e n tb 脚 本V I S l tt 陀a t問 n 村V l s i tb a s e村 r e a t附 l t * v i si t ) m o d v a間 二 時T R ( s u b j i dt 陀a t m e n t凶s e ) c l a s s v a同=日T R ( t r e a t m e n tv i s i t lほ i d 二 M οD E L 2 =拡 附 S T R 阿 ( 凶5 e勾 d g r o u pt 陀悶 a 計t m e n tV I 侶 5 1 崎 t d 勾 g r o u 叩 l 巾 p 凶 仲 向t r 陀 . e a 抗t m e n tt n 陀 . e a 抗t 附 me n t' V ハ 川 l 巴 5 旧 引 問l は td g ru p 凶1 t 陀問 a 拭t m e n t1 川 ' 叩 V 山i 巴 S l 咋 i t ) c l 凶制 s s v a悶 2 = 1 匝 i 応 S 訂 悶 T 刊R 所 附 ( [ 臼 d 如 J 0 ω t h e r 問 v ヨ陪=日T R (凶s e ) T I T L E二日TR(CCMVP a t t e r nM i x t u r eM o d e lA n a l y s l s ) FOOTNOTE二日T R ( ) 刊 件 功 * 刊 ‑ 2 6 5 ‑ , 閃 口 3 ヰ 本 , ド ヤ 件 ヰ 本

276.

i医 療 政 府 帥 … こ よ る 工 コ 溺 ム 保 証 W ] [ 1 ユ+僻 SAS ~pMM マクロ(データ :MNAR ,欠 5.R1J 確率 Low) の SAS output NFMV+CCMV CCMVPattemMixtureMo delAnalysis 罰abilityGonstraint UsingCCMVi d e n t i odelwithEffectsfor0町 田 ut向 ttern Byv i s i tLSMEANSusingM V i s i t (Week) V i s i t1 V i s i t2 V i s i t3 V i s i t4 Ove旧 1 1 Treatment IN γ LSMEAN Change SE D r U i 9 3 19 7 044 P l a c e b o 90 246 044 Dm亘 8 9 501 052 P l a c e b o 8 7 ‑458 053 D r u g 84 ‑872 068 P l a c e b o 8 5 ‑659 067 D r u g 百3 一1128 074 P l a c e b o 8 0 885 072 D r u a 9 3 675 049 P I呂 田 国 90 ‑562 049 LSmean D i干ference SE Lower CL Up田 r CL P‑value 049 063 0. 74 17 : ' 4329 042 073 186 1 0 1 5 6 2 1 ‑213 097 ‑404 022 0288 243 102 443 043 0 1 7 1 ‑ 11 2 069 248 0 . 2 3 1 0 4 6 NFMVo b s e r v a t i o n su s e ds u b j e c t白 I d e n t l朽a b l eco悶 ' c 司l 門T I ¥ A od e lb a s ed a r o u pt r e a t m e n tv i s i td g r o u同 t r e a t m e門 tt r e a t m 剖 世v i s i td a f O U p 本t r e a t m e n t * v i s i t ~~,iBlJ1ij'ÊV白 こ シテ 証…一時註 ~9 SharedParameterModel (SPM) 26 ‑ 2 6 6 ‑

277.

一即時点ム域諸試み… W l J 9 SharedParameterModel f (} i ,R i 'b )=f (只I R i, b i ) f ( R iI b i ) f ( b ) i i t 被験者 bi=(九… , b i q) bi‑ N(O , L ) .測定過程に対するモデル,及び脱落過程に対する モデルの両方に影響する潜在変数(変量効果)を 考える. ‑変量効果の条件付きで,測定過程と脱落過程を表 す密度関数は分離できると仮定する. 揃ι 定義 f (九 R i 'b i )ェ f (} iO Iん) f (} imI b i ) f ( R I b i ) f (ん ) i 飢 迫1 1 主湾煽持I ム ー 2 0 1 4 │ 臨 政 府 自j SharedParameterModel f (九 R i 'b )=f( } i0 I b i ) f (} im I b )f(R I b i ) f ( b ) i i i i .ある時点における脱落が,アウト力ムではなく,アウト 力ムにも関連する個々人の潜在的な特性の影響を受 けると考える. ( L it t l e,1 9 9 5 ) ・共通の変量効果が測定過程モデルと脱落過程モデル に含まれると考える場合,欠測メカニズムが MNARの 場合に対応する • SM( S e l e c t i o nM o d e l )との違い f (丸 Ri )= f (} iぺ} im ) f ( R i l} iO う れT n ) 28 2 6 7 ‑ ー

278.

I 問問・自治献学問工場降格.‑ 加 9 尤度の計算 f 即刻 = i λ m 1 肌?h 帆附 、 1 川叫 r i ラ t れ =LjFrMfヤ 州 制 仇d}i i r n 1 = 1 附 二 i)附 I b i) I b 川 州 品 川 I b i ) ! ( r i l b i )州 ! ( } i 附 = l m ! ( } iO I州 ( 1 m mlbi)d mい } i I b r i i) !( b i ) d b も SASのNLMIXEDプロシジャを用いることで実装可能である. 29 │医療、政府自跡 SharedParameterModelの位置づ、け .感度分析としての SPM 一欠測が MNARの場合において, S e l e c t i o nModel,及び P a t t e r nM i x t u r eModelと並ぶ感度分析の方法である. ・アウトカムの測定誤差が大きく,脱落するかどうかにアウ ト力ムの値が依存すると考えるより,症状や病態の進行度 合いのような個々人の潜在的な効果が関係していると思 われる状況において,有用なアプローチと考えられる ( L it t l e,1995) 回 f(} i ,R i,bi )=f (川 ) f (川 ) f (川 ) f ( b i ) 囚 f (日 )=f ( 何 只 r O γ ぺ? 回 f 六 (巴 } 丸 i ,九 R 町 i )=f (} i, } im I R i ) f (九) O 30 ‑ 2 6 8 ‑

279.

[闘志向一一品議踊.ふ糊 ~9 マクロ:%shared̲parameter • DIAworkinggroup公開マクロを参考 I こして作成 ι 目share parameter( I N P U T D S=t e m p ̲ s i m l, インプットデータ S U B J V A R= i d, 被験者 薬剤 T R T V A R=D r u g, 時点 T 1M E=ti m e M O D L二 測定過程に対するモデル 弘S T R ( v a l =x OD r u gt i m eD r u g * t i m e ), に含まれる固定効果 L I N K = 弘S T R ( C L O G L O G ) 脱落仮定に対するモデル R A N D O M ̲ S L O P E目 =S T R( L IN E A R ) 変量効果の選択 31 │ 医 療 、 政 府 自 治 体 均 一 一 点 展 ム ム 紬 ~9 マクロの仕様 ・マクロでは4パターンのモデルが表現可能 モデル 1 モデル2 測定過程のモデルに含めた 変量効果を脱落過程モデ ルは含まない 測定過程のモデルに含 めた変量効果を脱落過 程モデルも含む R A N D O MS L O P E二 首S T R( N O N E ) 可 各モデルに対して・. 変量効果は切片しか含まない R A N D O MS L O P E= 出S T R(L1N E A R ) 変量効果は,切片,及び時点に対する効果も含む 32 ‑ 2 6 9 ‑

280.

I療政府間鳩山由ステムの実証~斗総会 マクロ:%shared̲parameter ~9 .測定過程に対するモデル [同通;ヨ曲目一一 i 変量効果は切片しか含まない ; } ' ; j=so+s 11 'imei p, +s31 'i m e ' jxCrOUPi+b i J j+s2CrOU i O+e R A N D O M ̲ S L O P E= 首S T R(L1N E A R ) 変量効果は,切片,及び時点に対する効果も含む r o l l Y i j=so+βl 1 'i l ηe i j+s 2G p, +s3TimeiJxGr01tPi+bi i l T i m f i J+e i J O+b 33 臨時府自治体大学問山ステムの実証一儲 9 W l J マクロ :%shared̲parameter .脱落過程に対するモデル • Complementaryl o g ‑ I o gl i n k モデル 両 玩 耐 二 時T R( N O N E )I 一丁寧型担問些盟、J Pr(Di=jlDi三j )=1‑exp(‑exp(αOj+γ1b ) i O) R A N D O MS L O P E= 首S T R ( L I N E A R ) 変量効果は.切片,及び時点に対する効果も含む b Pr(Di= j l D i三j )=二 1‑e x p (‑exp(αOj十守l iQ十 r 2bil)) ‑ロジットモテ、ルも使用可能 34 ‑ 2 7 0 ‑

281.

o │医療、政府間大学尚一一一一ムー W 1 J シミュレーションデータを用いた解析例 ( 1 ) …@一一五日[ e r c e p tI I I 必 五F一一一 一一一一一一 N oL ir ホar. P . r 置 1 0 1 : . , (由問 tv a r yb y廿珂切削1.) 績le s ts t de r r o r a l u e o ‑ ‑ v 胤 ・o ts t d町 r o rp ‑y a l l 泌 , ‑ 1 .0 5 0 21回 ‑ 07 2 6 1 . 6 9 3< . ∞1 0 . 8 8 7 0 8 6 0 . 2 5 1 <∞ 1 0 . 1 7 8 <∞ 1 ∞1 0 . 0 7 8く 1 41 8 5 15 1 9 ‑ 1叫 3 ‑2133 ‑ 0 . 7 2 5 1685 < . ∞1 o888 白書9 0 . 2 5 1 <∞1 0 . 1 7 9 <∞ 1 0 . 0 7 8 <∞1 a D rUl , 1t a [ ) i n t ‑ 00 1 5 9 7 2 0制 7 . ‑ 00 1 0 0 . 1 1 2 羽田 mtt r td i f f . r . , 福 田 , nt廿 tdiff Oh混同検焔剖〉 ‑2667 ‑2668 1761 〈∞1 7 6 1 <∞ 1 ‑ 2 .6 5 2 14205 b O b Du g b D r咽 h開 b t 冊 , 1532 b副 円 1 涜8re泌仁i ヲ涜這正一 ( v a r yb yt,闘を鴨川} 舗l. . t. t d肝 r o rp時 i 国 1 4 . 1 5 0 1 .5 0 6 ‑ 1 .0 1 1 ‑lla ~. 7 2 3 1倒 3 < ' 0 0 1 9 2 0鵠 9 0 0 1 o2 5 2 <0 . o179 <∞1 0 . 0 7 8 <∞1 0 . 0 7 3 . 1 2 9 9 8 2 ‑ 03 時8 0031 0 . 1 7 9 o569 0ω宮 o .158 0 . 7 6 2 <∞ 1 ‑ 25 3 9 0.770ω1 o452 5 8 9 7 5 4 2 5 1 唯詩型掃口 3 5 片 手J 同点…る1 1 坊主主ムー ~o シミュレーションデータを用いた解析例 ( 2 ) 川 町 明Z吋 T I 通子笥ゐZηγ寸n tc ‑ r c 叩tandI I楠 町 8 1 0 脚 I i n k暗 . 蜘 l i n 往時@ 137 剖 I4 9 1 ‑ 1 .0 2 2 ‑ 07 0 5 14 8 昔〈∞1 0 . 6 9 5 0 お 0281 <∞1 ∞ 〈 ∞1 0 . 2 0 . 0 1 唖〈∞ 1 ‑ 0 . 0 1 5 o447 ‑ 2 1お . D r u g . I n t , S l p a D i n t 9 7 3 }輔自〈∞ 1 0 . 6 8 8 1 7 2 0 . 2 9 1 ∞3 0 . 2 0 7 <∞ 1 . ∞1 0 . 0 7 0< 2 . 5 9 6 ‑ 2 . 5 9 6 o939 o939 制J6 曲6 1 21 4 7 0 . 9 4 3 ~. 8 7 5 ‑ 2 . 1 6 7 ~. 6 1 6 ∞ 倒46ω 2 . 0‑148.10 1 7 ー2倒 。 ‑ 1 41 1 7 2 2 .3 舗 3 4 70 3 9 1 位 協5 0 2 8 2 2 . 3 6 8 1 41 1 7 2 2 . 3 6 8 ‑ 2 .5 5 9 0 . 9 7 6 加9 ‑ 2 .5 5 9 a O al p ・幅四 I n tt r td ! f f 世田 I n tt r td i仔 酬 は 剖 除 由 1 ) . r ~酔 ( v a ' yb yt r・‑包橿n t ) e s ts t de r r o rp ‑ v a l u ・ 鼠 8 S ts t de rr o rp ‑ 咽l u o 73 5 7 S 4 7 e o‑ 8 1 6 b O b D r u g b O r 曙t i帽 b t i隅 b x O ( d o間 企 四 吋 b yt,..む糊吟) 胤 ロM444 税 制 定 坑de r r o rp‑刊!岬 ‑ P a r . 輔 也V I岨 1 <∞ 1 0677 1 師 O .1 7 3 <∞ 1 01 1 4 <∞1 0 . 0 7 0 <∞ 1 1 .3 3 4 ( . 0 0 1 R A N D O MS L O P E目 =S T R ( L I N E A R ) 変量効果は,切片,及び時点に対する効果も含む 36 ‑ 2 7 1 幽

282.

!医療政府間均ω 参考文献 • Dmitrienko,A .,Molenberghs,G .,Chuangδtein, c . , Q仔en,w . ,( 2 0 0 5 )Analysisof ,NC:SASI n s t i t u t eI n c . C l i n i c a lT r i a l sUsingS A S :AP r a c t i c a lGuide. C a r r y • Kenward,M.G.,Molenberghs,G .&T h i j s,H .( 2 0 0 3 )Patternmixturemod巴I swith propertimedependence.B i o m e t r i k a .9 0 ( 1 ), 5 3 ‑ 7 1 • M a l l i n c k r o d t, C .H .( 2 0 1 3 ) .PreventingandT r e a t i n gMissingDatai nL o n g i t u d i n a l C l i n i c a lT r i a l s .CambridgeU n i v e r s i t yp r e s s . • Molenberghs,G .,Kenward,M.G.( 2 0 0 7 )MissingDatai nC l i n i c a lS t u d i e s . C h i c h e s t e . rUK, JohnW i l e y . 2 0 1 0 ) .ThePreventionandTreatment01Missing N a t i o n a lResearchC o u n c i l( Datai nC l i n i c a lT r i a l s .Washington, D C :TheN a t i o n a lAcademiesP r e s s . • R a t i t c h,B .,Q ' K e l l y ,M.,T o s i e l l o ,R .( 2 0 1 3 )Missingdatai nc l i n i c a lt r i a l sfrom c l i n i c a lassumptionst os t a t i s t i c a la n a l y s i su s i n gp a t t e r nmixturemodels. P h r a m a c e u t i c a l S t a t i s t i c s .1 2, 337‑347 2 0 1 4 / 6 / 2 6 37 │医癌政府関大学問工均ム句会話一… ~9 参考文献 • RubinDB( 1 9 7 8 ) .M u l t i p l巴 I m p u t a t i o ni nsamples u r v e y s ‑ AphenomenologicalB a y e s i a napproacht ononresponse.Imputationand D C : U . S .Department E d i t i n go fF a u l t yorM i s s i n gSurveyD a t a .Washington, ofCommerce RubinDB( 1 9 8 7 ) .MultipleImputationf o rNonresponsei nS u r v e y s .John Wiley&S o n s . YangYuan( 2 0 1 1 ) .MultipleImputationUsingSASSoftware.Journal01 5 ωt i s t i c a lS o f t w a r e .4 5 ( 6 ), 1 ‑ 2 5 . ・Thijs,H.,Molenberghs,G.(2002)Strategiestofitpatternmixturemodels. B i o s t a t i s t i c s .3 ( 2 ), 245‑265 • Follmann, D .andWu, M.( 1 9 9 5 ) .Anapproximategeneralizedl i n e a rmodel withrandome f f e c t sf o ri n f o r m a t i v em i s s i n gd a t a .B i o m e t r i c s51 ,151‑168. L it t l e, R .J .A .( 1 9 9 3 ) .Pattern‑mixturemodelsf o rm u l t i v a r i a t eincomplete d a t a .J o u r n a lo ftheAmericanS t a t i s t i c a lA s s o c i a t i o n88 ,125‑134. ヨ 8 ‑ 2 7 2 ‑

283.

[一明語縄戦縄平!ふ齢 ~9 参考文献 . L it t l e, R .J .A .( 1 9 9 4 ) .Ac l a s so fp a t t e r n ‑ m i x t u r emodelsf o rnormal incompleted a t a .B i o m e t r i k a81, 471‑483. ・Lit t l e, R .J .A .( 1 9 9 5 ) .Modellingthedrop‑outmechanismi nr e p e a t e d ‑ measuress t u d i e sJ o u r n a lo f t h eAmericanS t a t i s t i c a lA s s o c i a t i o n ,90, 1112‑1121 . 目 • WuM., & Follmann, D . A ."Useo fSummaryMeasurest oA d j u s tf o r 恒 s s 引i n g n e s si nRep巴a t e dMeasuresw i t hRandomE 仔e c t , s ピ I n f o r m a t i v eMi B i o m e t r i c s,( 1 9 9 9 ) ;557 5 ‑ 8 4 39 ‑ 2 7 3 ‑

284.

竺政府自治体大学問コ均ゐ規制一 9 W l J 【企画セッション】欠測のあるデータに対する各種解析手法と 欠測メカニズムに対する感度分析 ( 4 )欠測メカニズムに対する感度分析 駒寄弘 1)2) 高橋文博明)横溝孝明日 4) 1 )日本製薬工業協会医薬品評価委員会データサイエンス部会タスクフォース4 欠測のあるデータに対する解析方法論・ SASプログラム検討チーム 2 )マルホ株式会社 3 )田辺三菱製薬株式会社 4 )大正製薬株式会社 S e n s i t i v i t ya n a l y s i sf o rt h em i s s i n g m e c h a n i s m . H i r o s h iKomazaki1)2),F u m i h i r oTakahashj 1 ) 3 ) , T akaakiYokomizo1)4) 1 )Theteamf o rs t a t i s t i c a lmethodologiesandSASprogrammingo fdata a n a l y s i sw i t hm i s s i n gdata,t a s kf o r c e4,d a t as c i e n c ee x p e r tcommittee,drug JapanPharmaceuticalManufacturersA s s o c i a t i o n e v a l u a t i o ncommittee, 2 )MaruhoCo.,L t d .3 ) M i t s u b i s h iTanabePharmaC o r p o r a t i o n4 )Taisho t d . PharmaceuticalCo.,L i 医積附・52-li--均単語!日~~-a. 2 0 1 9 要旨: S e l e c t i o nModel及び、 P a t t e r nM i x t u r emodelを用いて, 欠測メカニズムに対する感度分析の方法を説明する.ま た , SASによるシミュレーション結果を提示する. キーワード.欠測メカニズム,感度分析, MAR,MNAR,T y p e ( i )・ T y p e ( i i )の仮定,感度パラメータ, S e l e c t i o nModel,P a t t e r n M i x t u r emodel, ‑ 2 7 4 ‑

285.

同一 Contents ロ NRC (2 01O)で、提案された感度分析の種類 ロ欠測メカニズムに対する感度分析 J 感度分析を行う理由 rMNAR? 》主要な解析は MAR?o ~ T y p e ( i ),T y p e ( i i )の仮定と感度パラメータ 〆SMを用いた感度分析 MNARの仮定 》モデルの説明,感度パラメータによる MAR, 》シミュレーションデータを用いた解析例 . /PMMを用いた感度分析 MNARの仮定 》モデルの説明,感度パラメータによる MAR, 》シミュレーションデータを用いた解析例 ./SMとPMMの感度分析の違い l 医癒政府間…る一弘の実証…縦書 Contents 日本感度分析の結果の考察方法 ‑NRC (2010)の内容より 2 7 5 ‑ ー W J 9

286.

(匿療政府自治体大学問工コシステムゐ実証 S純 一 齢 . 記号の整理 ( S e l e c t i o nModel) 対象となるデータ:経時データ(連続値) /Y i I¥ I I Yi= I : I ニ ¥Y ini J T ti 被験者 iの(計画された)測定時点 ty~ふ ) N I ,,"0 、 守 ¥ 被験者数 Yf:観測データ , n: 欠測データ Y i ( i=1, . . ., N) 欠測識別変数 Rij= { ~ 被験者 zのj時点でのデータが観測された 被験者 iの 3時点でのデータが欠測 ト ( ; ) パラメータ θ :応答変数モデルのパラメータ ψ :欠 iR.モデルのパラメータ J 1 .m テムゐ実証一儲 医額政府自治体大学問Ii 記号の整理 ( P a t t e r nMixtureModel) 対象となるデータ:ある測定時点のデータ(連続値) Y f ‑被験者iの未観測データ Y Z O 被験者i の観測データ μo 来観測データの平均 μ1 観測データの平均 欠測識別変数 R =J ~ ‑) 0 デー矧測 データが欠現J I 7r観測割合 パラメータ β=(β~ , ßI)T :応答変数モデルのパラメータ ‑ 2 7 6・ 9 w 1 ]

287.

│臨時叩忌弱 i務欝響評I ら ~II~9 NRC(2010)で提案された感度分析の種類 ロ完全データの分布の仮定 口外れ値の影響 口欠測メカニズムの仮定) ← (MAR~r 本セッシヨンで取り上げる感度分析 M N A R ; ‑ ‑ ‑I. NRC(2010)で『最も重要』と指摘 1 医療ぷ府部長訪韓拶欝淳一 W l J 9 主要な解析は MARo rMNAR? ロ MARを仮定した解析 〆途中脱落が多いと想定される臨床試験では,周到に計画された上で,欠 測が MARとなるよう十分な情報を収集できる試験デザイン考えるべき J しかしながら MARの仮定はデータからは確認できない 〆実際のデータは欠測メカニズムが MARや MNARの混合である可能性も ある ロ欠測が MNARの仮定の下で解析する際の問題点 J 応答変数モデルまたは欠測モデルの仮定を窓意的に置く必要がある 〆妥当性の検証できない仮定をしている J 仮定が誤っていた場合の結果の頑健性は脆い * M a l l i n c k r o d t( 2 0 1 3 ),N R C ( 2 0 1 0 )より抜粋 ‑ 2 7 7 ‑

288.

l ~9 医療政府開大…一弘の実証…一融 ロ欠測メカニズムに対する感度分析を含む解析手摘の提案 1 . 主解析は MARを仮定した解析 2 . 感度分析として, MNARの仮定の下で解析 3 . MARを仮定した解析の結果の頑健性を確認し,試験結果の妥当性を 述べる. 口三れら感度分析はSM及びPMMより実行可能. 欠測メカニズム SM MNAR MMRM ' . SM(MAR) ← → SM(MNAR) DE M M 応 答 変 数 モ 4Tル MAR i医 癒 政 府 関 大 学ω PMM( M I ) ←ー→ PMM(MNAR) 口システムの実証…ー齢 T y p e ( i ),T y p e ( i i )の仮定と感度パラメータ 欠測を含むデータの解析を行う際,モデルは部分的 l こt y p e ( i },( i i )の 二種類の仮定に分けられ,それぞれ感度分析の方法は異なる. Type( i i ):観測データの分布に対する検寵可能な仮定 →仮定の正しさ(モデルの適合度など)をみる ] 9 & 1 コ 1 Type( i ): 1欠測データの分布に対する検甚不可能な仮定 l )→観測データの分布情報+感度パラメータを用いることで, 解析者が欠測データの分布を任意に仮定する (MNARの仮定の下 での解析が可能となる) →欠測メカニズムがMARの仮定から離れることに対する (MARを仮定した)主解析の結果の頑健性を確認する. 示 七7 3 シ ムJ也記 NR玩記干O)面介品五L 扇 永 準 拠 し , SMと問M ゐ1 モデル及び感度パラメータを用いた欠測メカニズム (MARo rMNAR)に対する i 感度分析の方法を紹空九:一一一一一一一一一 ‑ 2 7 8・ ̲ ̲ ̲ J

289.
[beta]
!
医
療
府
自
治
体
均
一
手
工
コ
シ
え
誠
実
証
…
‑
齢

9

W
l
J

解析対象データ
3
0

。うつ病の第 1
1
1相試験を想定したシミュレーションデータ
4・ー実薬群

‑Irプラセポ群

‑主要評価項目 :HAM‑D

2
0 '

→スコア低下・改善
(解析には変化量使用)

1
0

.実薬群 vsプラセボ群
.
1群 100例(ベースライン時)

(平均 :
:
!
:
5
D
)

。
l

ベースライン

時点 1

園 圃 ・ ・E臨 画 自

時点 Z

平均

見奇襲撃(~;í ~WJ数
100
100

2
0
.
0
‑
̲
.
‑
(
4
.
1
)
2
0
.
1
:-.-:~
(
4
.
2
)

時点 3

己抑

̲
̲
93
‑
‑
̲
̲
9
0
‑
‑

平均
(
5
0
)
1
8
.
1
~~~~
(
4
.
2
)
1
7
.
5
‑
:
:
:
‑
:
(
4
.
2
)

@単調な欠測のみ

時点 4

止抑

止知一一一一司"'''''一一

平均

平均

審
議
羽
曳i恒 例 戸 数 字 ( 町 村 議 例 数
̲
̲
89
‑
‑
̲̲
8
7
̲
.

1
4
.
9
~_..~.
(
5.
4
)
4
1
5.
-:-:~:
(
4
.
6
)

̲
.
84
‑•
̲
̲
8
5
‑
‑

.0
11
~~~~
(
6
.
3
)
1
3.
3
‑
:
:
:
‑
:
(
6
.
3
)

̲
̲
83
‑
‑
̲
̲
80
‑

平均
回)
8
.
5
(
6
.
8
)
1
1
.
0
(
6
.
1
)
11

│
医
寵
政
府
自
跡
大
学
時
一
一
お
ら
お

SASユ + 齢

W
l
J
9

SMを用いた感度分析

f
(
Y
i
lR i1
8,
ψ)= f(Y
1
8
).
f(R
IYi,
ψ)
i
i
=f
(Yf,
Yilθ
).
f(RiIYf,
Yれ ψ)
Type(
i
)の仮定

R
t
f
O
i
R
1
4
4
;
;
7
4
1
4
ψ
)
}

山ベ
口

ψ01れ,
j‑1+@九
感度パラメータ:値を解析者が設定
色々な値を代入して結果の頑健性をみる
1
22
7
9
290.

1 尚 喜 2 0 1 [ 1 │医療、政府開均とお土 SMを用いた感度分析 ロ SMでは,欠測モデル,応答変数モデル共にT y p e ( i )の仮定であるー ロ応答変数について,群間差が評価できる範囲で,可能な限りモデル 法:I n v e r s e を仮定しないセミパラメトリックな方法もある (IPW P r o b a b i l i t yWeightning) ロ SMの感度パラメータは,現在測定された応答変数の大きさが欠測 の有無に与える影響度合いを表している を意味している ロ ψ2=0 のとき MAR それ以外の場合, MNAR 1 3 ; 持問 i ふ れ総会 ~li~iBllf.j.E!~é;f*,Ä 二ふ屍 Pllj~1 2014 陸制問錦、引 シミュレーションデータを用いた解析例 ‑‑SMによる感度分析の結果 己引 行 ロ群間の差の点推定値 +SE ロ各群の点推定値 +SE 一 Uい 什 打 一 γlllLV Ti寸 l l ‑ T │ │ 十 │ τ11ふlllム 1 ナI T ‑ ‑→l I 1 1十l ilji 1十i T ←l [11T 一群 一ボ群 一一ア薬 一プ実 4 一 一 一 寸 一 一 一 一 ψ 2 一 1 .0‑0.8 0 . 6‑ 0. 4‑ 0. 20 . 00 . 2 0. 40 . 6 0 . 8 1 .0 日 感度パラメータ 感度パラメータ ψ 2 14 ‑ 2 8 0 ‑

291.
[beta]
│
医
療
、
政
府
時
¥
元
手
伝
説
J蒜手 ~~AS:1-<f-.fl 2
0
1
[
1
PMMを用いた感度分析

f(~O ,
~m ,
R
i¥Xi
,
s
)

レ

)f(~o ¥RiX β (
γ
¥~O , Ri'Xi,β)

= f(R
¥Xi
i

ラ

i'

未観測のデータのモデルに対する感度
をみる

【目的】
制約条件を置くことに加えて,未観測のデータの応答変数の
分布と観測データの応答変数の分布の軍離を評価することで
欠測データのメカニズム MARの事離を評価する.
1
5

問、政府叩相よるふ活福ムムー

~[1

じ員二解析では全ての来観BlIータに対してほ付加 1
PMMの経時測定モデ J
五(仇...YT) 二五 (
Y
l Y
t
)五
ν
(t
+
l
l
Y
ト .
.
.
.
Y
t)五(
Y
t
+
2 ν
r
1
Y
1,
….
Y
t+1)
・

=

f
九
パ
t
,
ν
ω
(
仇l

.

ω
岬ド
)
れ
ω
{
加 リ
出
I
Y d
j員│
い
五
仰
ν
ω
(1
.
'
拍
凶
I
y
ν y1
}
抜

吃主 t
s
件+2

NFMV
の制約条件
s>t+2fこ対して,

・ e ・守

U
鋭
制
州
t
++
刊
叶
1U
仇1,.
.
.
,
品
叫
鋭

仇叫叫
仇
附
札
1,.
.
.
, ト
,
8‑
叫

合同 合
2

経時測定データにおける
来観測のデータの感度対象

l
f(
y
s
l
y
!
'
" 払̲}, r t
)卜f(品 I
Y
l
.,
'
"y
s
‑主主ゴ)
・
7

=

た だ し 上 記 のr
=
s
‑
1のときの条件付き分布と下記の分布

16

‑
2
8
1
‑

292.
[beta]
戸、政府叩、大学によるヱコ以均実証 SA
-闘."冒~司置哩~l鎖直L号eì・

興味あるパラメータ:yの平均料
未観測の人 (R=Q)の平均と観測されている人 (R=1)の平均の
軍離を感度パラメータAで単純に表現

,
.

単純ケースでは

Yの平均ドは下記のように表現

J
r
̲
t
g(g(J
4
)+企)]

)
x刈 +Pr(R=O
)
x片 = 明 +(l‑
μ=Pr(R=l

1

VaεRに対しない )
=
αの場合, μニ 明 +
(1π恥 +δ)
1
7

│闘政府開示一一一一証ふれ綿

w
l
l
9

ある範囲の感度パラメータ企に対して, MNARのもとでの感度
解析のーっとなる.

ニ
ド O<=>μ=

日 脳R

~*O<=>μ*μl<=> ル1NAR

欠測メカニズム MARの仮定から事離した μにどの程度影響
が出るか調査

【
PMMの枠組み】
ー観測されている同じ測定時点のデ一空主gをもち,未観測の人
と観測されている人の Y
1の分布を特定

g
(
E
(
只¥九 R 0
)
)
=g
q
E
'(
Y
,
¥
九 R=1~+ 企
ニ

関数g及びAを含めたモデルを規定が必要.ここでは単純な
回帰モデルを示す.
1
8

‑
2
8
2
‑

293.

W J 9 l 医療政府自治体大学はるロシスー実証 SAS~-"f-総会 ・ E̲Fil こζ で は 単 純 な 回 帰 モ デ ル の 場 合 を示す‑ E ( 只¥九 , R=l)=β。 +β1九のモデルを仮定すると .1 E ( Y ;¥ 九 R=0 ) =E ( Y ;¥ 九 R=l)+L 1=β。 +βl九+囚 欠測データの分布の平均は回帰予測の標本平均により推定 ‑得られたβ ,。βlはR=1において.Yoを与えたうえでの Y1への 回帰により得られた推定値 19 2 m I (問点目;目点均一一‑コシステムの実証…一蝕 シミュレーションデータを用いた解析例 , . PMM(NFMV‑NCMV+d)による感度分析の結果 ロ各群の点推定値 +SE ロ群聞の差の点推定値 +SE : 1 F f Till l ー 1 . 0 ー1 . 5 ‑ 2 . 0 ‑ 2 . 5 企 タ 0汚 十 一介 3 感度パラメータA 一度 一寸感 lili 1寸 n U 1 2 2 ‑‑ 3 1 1 20 ‑ 2 8 3・

294.

a 臨蜘叩均一 授陣I さ ー ~9 SMとPMMの感度分析の違い 園 f ( Y ゎR ilθψ)=f ( Y f, Yア│ θ )1 . f (民 I Y f, Yi, ψ)1 匝日 脱落確率のモデルに対する 感度をみる f ( Y , Ri1 8, ' O )= f ( R iI ψ ). f ( Y i IRi , 8 ). 1f ( Y アI Y i, Ri, 8 )1 i 欠測データのモデルに対する 感度をみる 21 片 手 ¥ 白 府 ・ 自 治 体 均 一 手 当 挺 弱 ! 九 一 P I I ] 9 本感度分析の結果の考察方法 ロ欠測メカニズムに対する感度分析を含む解析手順の提案(前スライドより) 1 . 主解析は MARを仮定した解析 2 . 感度分析として, MNARの仮定の下で解析 3 . MARを仮定した解析の結果の頑健性を確認し,試験結果の妥当性を述 ベる ロNRC(2010)では3種類の頑健性の確認方法が提案されてい る(あくまで一案であり,今後も研究が必要) 22 ‑ 2 8 4 ‑

295.

1‑自治同I 字詰議議 2 0 1 4 ①感度パラメータに関して妥当な範囲(下限値 上限値)を指定し,この範囲内で 点推定や 95%信頼区間を算出 (ここでの 95%信頼区聞は,標本のばらつき+モデルの不確実性におけるぱら つきを意味しているため, 95%ConfidenceRegionと呼ばれることもある) 群 固 間困 の ‑ 2 叫才血十十血咋←一斗:1:‑‑+←いい一……‑一… … ‑ + 一 … 叩 十 … ト ト ト … … 叩 … 骨 → … … ベ 即 ぺ 十 ← ← い 一 … 司 一 ‑ m 差 感度パラメータ ψ 2 2 3 [医制問台体ボふ均持母二均一 ~9 ②感度パラメータに関して妥当な範囲(下限値 上限値)を指定 し複数の点推定値に対して平均や SEを求め,一つの結果に まとめる. ι 何 ︐ 群聞の差 1 1個の点推定値の平均士 SEは I̲ . . . . H ・2.24: t :O.252であり,この推定量 ι i l l ̲ ̲ ̲ ̲ L I ロコ土木↓ を基に考察する ‑ 3 ‑ 1 .0‑ 0 . 8‑ 0 . 6‑ 0 . 4‑ 0 . 20 . 00 . 2 0. 4 0 . 60 . 8 1 .0 感度パラメータ ψ 2 24 285‑ ー

296.

医療政府自問学問問杭保証…一紬 ~I]9 ③MAR に基づく推測を行い, MAR の結果が変わるような感度パ ラメータの値を特定することもしこの値が妥当な範囲に含ま の結果が疑わしい可能性がある れているならば, MAR 4 群聞の差がOになる感度パラ メータ1p2の値が科学的に妥当 な範囲であるか考察する 群 2 間 。 の 差 司 2 4 ‑ 3 . 5 ‑ 3 0 感度パラメータ ψ 2 2 5 医癒政府間大学吋ロシ切実証f-'f!J.~ 1~NRC(2010) では,以下のコメントも残している (主解析及び感度分析の解析結果のどちらを重視すべきか Eコ .極端な仮定をおいた場合の感度分析の結果はあまり重視され ないが,主解析での仮定と同等の範囲内で行われた感度分析 の結果は重視される 主解析の結果が感度分析の結果と反対になることがあったと しても,そのときの感度分析の仮定が極端なものであるならば 主解析の結果を支持するのは合理的 =>極度な仮定ではなく妥当な仮定の範囲で主解析の 結果が支持されていることが重要 26 ‑ 2 8 6 ‑

297.

旬、蜘問、大学によるロシス均実証…目制 2 0 1 4 参考文献 ~ ~ ~ ~ N a t i o n a lResearchC o u n c i l(NRC).TheP r e v e n t i o nandTreatmento f T r i a l s .Washington,DC:TheN a t i o n a l M i s s i n gDatai nC l i州 国 I 2010 AcademiesPress, C r a i gH .M a l l i n c k r o d t( 2 0 1 3 ),P r e v e n t i n gandT r e a t i n gMissingDatai n L o n g i t u d i n a lC l i n i c a lT r i a l s :AP r a c t i c a lGuide,CambridgeU n i v e r s i t y Press BohdanaR a t i t c h,MichaelQ ' K e l l y ,andRobertT o s i e l l o,Missingdatai n c l i n i c a lt r i a l s : f r o mc l i n i c a lassumptionst os t a t i s t i c a la n a l y s i su s i n g pa 性e r nm i x t u r emodels,Pharmaceutica . lS t a t i s t i c s .2013,12,337 ・3 4 7 . SASmacro.m i s s i n g d a t a . o r g . u k. h t t p : / / m i s s i n g d a t a . l s h t m . a c .u k l i n d e x .php?view=category&id=61%3Amna r ‑methods&option=com ̲c o n t e n t & l t e m i d =137 27 ‑287・

298.

│ 臨 政 府 ・ 自 治 体 却 に お 丹 治 経E i ‑ ‑ ~Ij]9 金 【企画セッション】欠測のあるデータに対する各種解析手法と 欠測メカニズムに対する感度分析 ( 5 )まとめと質疑応答 土 居 正 明1 ) 日本製薬工業協会医薬品評価委員会データサイエンス部会タスクフオース4 欠 ;~IJ のあるデータに対する解析方法論・ SASプログラム検討チーム 1 )東レ株式会社 Summaryo ft h es e s s i o na n d Q&A MasaakiD o i1) Theteamf o rs t a t i s t i c a lmethodologiesandSASprogrammingo fdata a n a l y s i sw i t hm i s s i n gd a t a, t a s kf o r c e4, d a t ascienceexpeは committee, druge v a l u a t i o ncommittee,JapanPharmaceuticalManufacturers A s s o c i a t i o n . 1 )Torayi n d u s t r i e s,I n c . [鴎政府間大学叩羽弘の実証…一純 要旨: 本セッションの内容をまとめ,質疑応答を行う キーワード :SM, MMRM, P I, PMM, SPM,感度分析, 感度パラメータ ‑ 2 8 8 ‑ W J 9

299.

│関、政府点以諸説場務長一* 2 0 1 4 本セッションの目標 欠測のあるデータの解析に対する ①考え方の理解 ② SASでの実行方法の理解 ( a )S M,MMRM,M I,PMM,S P M ( b )欠測メカニズムに対する感度分析 ! 鴎 一 一 自 引 ‑ 治 j …自 r 示 彰 竺 m臼川 ぶきふ.努I 出‑ … m ‘"'l'~.J 本セッションのまとめ 。 。 MAR を仮定する方法 . MMRM,M I,PMM( A C M V ) ※単調な欠測を仮定 MNAR を仮定する方法 . S M,PMM(ACMV以外), SPM │主解析では M ARを仮定することが多い│ ARかMNARかは、ヂータからは確定できない がM →感度分析が必要 喝 2 8 9 ‑ a 4

300.

│ 医療政府自治体大学による工コシステムの実証…叩綿 ~I]]9 <欠測メカニズムに対する感度分析> 'Type( i )の仮定→データから仮定の妥当性が確認できない →色々なモデルを当てはめて頑健性をみる ・ Type( i i )の仮定→データから仮定の妥当性が確認できる →モデル診断など 。 MARかMNARか?はType( i )の仮定 →感度パラメータを用いたSM,PMM ‑m l 医 療 一 一 一 一 実 話 … 検討できていない点 1 .その他の解析手法 今 wGEE, Bayes ,IPW, AIPW(DoublyR o b u s t ) . . . e t c . ‑感度分析の結果の要約方法 ーシ主解析と感度分析で結果がある程度以上異なる場合など 一般的な状況でコンセンサスのとれた要約方法はまだない. 今統計家の役割が大きい. ‑ 2 9 0・

301.

i 当時為誕二一 医療政府制点 ~9 検討できていない点 2 ・主解析の検討方法 │ ‑欠測メカニズム以外に 対する感度分析 戸一 • Estimandの選択? │ .完全データの分布? .外れ値の検討? →続きは「欠測のあるデータに対する 総合的な感度分析と主解析の選択Jで. 2 9 1 ー 幽

302.

欠測のあるデータに対する総合的な感度分析と主解析の選択 土居正明 1)2) 大浦智紀 1)3) 大江基貴 1)4) 駒 寄 弘 1)5) 高橋文博 1)6) 縄田成毅 1)7) 藤原正和 1)8) 横溝孝明 l)9),横山雄一 1)10) 1 ) 日本製薬工業協会医薬品評価委員会 データサイエンス部会タスクフォース 4 欠測のあるデータに対する解析方法論・ SASプログラム検討チーム 2 )東レ株式会社 3 )日本イーライリリー株式会社 4 ) 株式会社大塚製薬工場 5 )マルホ製薬株式会社 8 )塩野義製薬株式会社 6 )閏辺三菱製薬株式会社 7 )杏林製薬株式会社 9 )大正製薬株式会社 1 0 )持田製薬株式会社 Comprehensives e n s i t i v i t ya n a l y s e sandc h o i c eo fp r i m a r ya n a l y s i swhensomed a t aa r em i s s i n g . 州、 ) 2 )T omonoriOura1州、 MotokiOel ) 4 ) , H i r o s h iKomazakil ) 5 ),F u m i h i r oT a k a h a s h il MasaakiDoil 司 J 8 JT S i g e k iNawatal ) 7 )M asakazuF u j i w a r al a k a a k iYokomizol ) 9 ), Y u i c h iY o k o y a m a l ) I O ) ラ ー a s kf o r c e4 1 )Theteamf o rs t a t i s t i c a 1m e t h o d o l o g i e sandSASprogrammingo fd a t aa n a l y s i sw i t hm i s s i n gd a t a,t 司 d a t as c i e n c ee x p e r tc o m m i t t e e,d r u ge v a l u a t i o nc o m m i t t e eJ a p a nP h a r m a c e u t i c a lM a n u f a c t u r e r sA s s o c i a t i o n 弓 今 2 )T o r a yT n d u s t r i e s,I n c .3 )E l iL i l l yJ a p a nK . K .4 )O t s u k aP h a r m a c e u t i c a lf a c t o r yI n c .5 )MaruhoCo,L t d 司 6 )M i t s u b i s h iTanabePharmaC o r p .7 ) K y o r i nP h a r m a c e u t i c a lC o .,L t d .8 )S h i o n o g i& C o .,L td . L td .1 0 )MochidaP h a r m a c e u t i c a lC o ., L t d . 9 )T a i s h oP h a r m a c e u t i c a lC o ., 要旨 欠測のあるデータに対する,主解析・感度分析を含めた解析の全体像を M a l l i n c k r o d t( 2 0 1 3 )をもとに検 討する.各解析手法は,応答変数や欠測メカニズムに対する様々な仮定のもとで妥当性が保証されてい i ) 他の解析を行っても結果が変わらない, ( i i )仮 る.そのため,主解析の結果の妥当性を示すためには ( 定の妥当性を確認する,等の感度分析が必要となる.欠測のあるデータに対する感度分析の方法として 2 0 1 0 )で検討はされているものの,欠測メカニズムに対する感度分析に限定されており,主解 は NRC( 析・感度分析を含めた解析方法を選択する上での具体的な指針とはなりにくい そこで本稿では, NRC ( 2 0 1 0 )を発展させた M a l l i n c r k o d t( 2 0 1 3 )に従い, e s t i m a n d等も視野に入れた総合的な解析の検討を行う. また, MAR を仮定した場合,主解析として複数の解析方法が考えられる.計画段階で主解析を選択す る際の,シミュレーションによる性能評価も行う. i ) の仮定, T y p e ( i i )の仮定, MMRM,MI,wGEE, キーワード:感度分析, Estimand,MAR,MNAR,Type( SM,PMM,SPM,pMI 1.はじめに 欠測のあるデータに対して,欠測を考慮した解析が必要であることは広く認識されてきている.その結果, 個別の手法に対する知識は広まってきたが I 主解析を選択する際に何が重要であるか J Iどのような感度 ‑ 2 9 2 ‑

303.

分析が必要かJ等の基本的な聞いに対しては,一般に合意された考え方は存在しなかった.そのような中, NRC( 2 0 1 0 )では,主解析・感度分析に対する考え方が提案されたが,扱われている感度分析が限定的である こと,解析の全体像が見えにくいことなどから,実際に解析を実施する際の十分なガイドラインとは言い難 かった.その後提案された M a l l i n c k r o d t( 2 0 1 3 )では,主解析・感度分析を含めた解析の全体像が示された.そ こで本稿では主に M a l l i c k r o d t( 2 0日)に従い,欠測のあるデータの解析の全体像を示すことを目的とする. なお,本稿では単調な欠測のみを扱うこととする.また,解析プログラムとして M i s s i n g d a t a . o r g . u k (~ww.missin!!data.of!!.uk) にて公開されているマクロプログラムを適宜用いた. 2 .感度分析と解析の全体像 2 . 1 NRC( 2 0 1 0 )の感度分析 NRC( 2 0 1 0 )では,感度分析の種類として ( i ) 完全データの分布に対する感度分析, ( i i )外れ値・外れた症例に 対する感度分析, ( i i i )欠測メカニズムに対する感度分析,が挙げられている.そして,最も重要なものは ( i i i ) 欠測メカニズムに対する感度分析である,として, ( i i i )に対してのみ具体的な方法の提案がなされた. 2 . 2 Mallinckrodt( 2 0 1 3 )の感度分析と解析の全体像 (AnalyticRoadMap) M a l l i n c k r o d t( 2 0 1 3 )は NRC( 2 0 1 0 )同様,欠測メカニズムに対する感度分析が最も重要と指摘した上で, NRC ( 2 0 1 0 )では扱われていない感度分析についても十分に記載し,主解析・感度分析を含めた解析の全体像を示し た"Ana 1 y t i cRoadMap"を提示した.図 lはAn a l 戸i cRoadMapを微修正したものである. 欠預y メカニズム (MAR 共変重 /ぺ R e s t r i c t i v e Model 〆 図 1 .A n a l y t i cRoadMap (著者らによる加工あり) 本稿では,図 lをもとに,主要な解析と感度分析を含めた解析全体に対する検討を行う.特に, e s t i m a n d, 欠測メカニズム,完全データの分布(共変量・モデル診断含む)に注目する. 2 . 3 Type( i )・ Type( i i )の仮定とそれぞれに対する感度分析 欠測のあるデータの解析に限らず,各統計手法は一定の仮定が正しい場合の正当性が示されている.その ため,得られたデータが仮定を満たしているかどうかを確認するのは極めて重要である.一方,特に欠測の あるデータを扱う場合, I データが欠測しているため,仮定の正しさを検討することができなしリという状態 も生じうる.このような状況を受け, NRC( 2 0 1 0 )では,仮定を以下の 2通りに分けた. .T y p e( i ):検証不能 ( u n t e s t a b l e )な仮定 • Type( i i ):検証可能 ( t e s t a b l e )な仮定 293‑ ー

304.

それぞれに対して,感度分析は以下のように定義される. • Type( i ):色々なモデルを当てはめ,パラメータ推定値が安定した値となっているかどうかを検討する ・Type( i i ):モデル適合をみる統計量を用いて,仮定が妥当であるかを検討する つまり Type( i ) の仮定に対しては「仮定の正しさ」は考えず, I 結果の頑健性 Jの担保に専念するのである. 2 . 4 何に対する感度分析か? たとえば主解析として MARを仮定した MMRMを選択し,感度分析として同じく MARを仮定した MI, wGEEを行ったとする (MMRMという用語の使い方は,大江ら ( 2 0 1 4 )と同様とする).この場合,各解析で仮 定している分布の違い等に対する感度分析は行えるが, NRC( 2 0 1 0 )や M a l l i n c k r o d t( 2 0 1 3 )で「最も重要J と指 摘されている,欠測メカニズムに対する感度分析は行えていない.そのため,実際の欠測メカニズムが MNAR であった場合,感度分析と合わせても楽観的な結論となる可能性が否定できない.このように,感度分析を 行う際は「主解析でどのような仮定をしているか Jを把握した上で, Iどの仮定に対する感度を検討している か」に注目することが重要である.本稿では特に I E s t i m a n d JI 欠測メカニズム J I 完全データの分布」に対 する感度分析を検討する. 3 . E s t i m a n dに対する感度分析 欠測のあるデータに対しては,様々な解析手法がある.各手法が「本当にその試験で知りたいものを推定 できているか」を考えるためにも,試験の目的をより明確化することが望ましい.そのために e s t i m a n dを考 s t i m a n dとは,一般には " w h a ti sb e i n ge s t i m a t e d "のことであり えることが役に立つ. E I 推定の対象」程度の a l l i n c k r o d t( 2 0 1 3 )は経時データを扱う試験の e s t i m a n dの要素として「パラメータ(例. 非常に広い意味をもっ.M 平均の群間差) J I 時点または曝露期間(例.投与期間 8週目) J I アウトカム(例 拡張期血圧) J I 対 象となる集団(例.高血圧と診断された,患者) J I 中止後に治療 ( r e s c u em e d i c a t i o n )が行われた場合,その後 に得られたデータは解析に含めるかどうかj 等がある,と述べている. e s t i m a n dの種類として, NRC( 2 0 1 0 ) では 5種類が提案され,これに lつ追加した 6種類が M a l l i n c k r o d te ta . l( 2 0 1 2 )や M a l l i n c k r o d t( 2 0 1 3 )で提案さ a l l i n c k r o d te ta . l( 2 0 1 4 )には,その中の 3種類が記載されている. れている.また, M 3 . 1 efficacy と effectiveness E s t i m a n dについて考える際, e f f i c a c yとe f f e c t i v e n e s sの区別を認識しておくことが重要である. M a l l i n c k r o d t ta . l( 2 0 1 2 )によると, e f f i c a c yとは,計画通りに投与された場合の薬剤j の影響であり, p e r ‑ p r o t o c o 1e s t i m a n dと 巴 も呼ばれる.一方, e f f e c t iv e n e s sとは,実際に投与された薬剤l の影響であり, ITTe s t i m a r ほとも呼ばれる. 3.2 Mallinckrodte ta l .(2012),Mallinckrodt(2013)の 6種類の estimand 以下, M a l l i n c k r o d te ta . l( 2 0 1 2 )で,慢性疾患の臨床試験を想定しつつ,精神疾患,痛み,糖尿病等にも使用 可能なものとして提案された 6種類のむt i m a n dについて述べる. E s t i m a n d1 全てのランダム化された症例に対する,計画された時点でのアウトカムの改善具合の差 E s t i m a n d2:最初の治療に耐えられた症例のアウトカムの改善具合の差 E s t i m a n d3:全症例が治療を完了できたと仮定した場合のアウトカムの改善具合の差 E s t i m a n d4:治療を継続できた期間のAr e aUndert h eoutcomeCぽ v eの差 E s t i m a n d5:治療を継続できた期間におけるアウトカムの改善具合の差 E s t i m a n d6:全てのランダム化された症例に対する,計画された時点での,最初に割り付けられた治療 によるアウトカムの改善具合の差 咽 2 9 4 ‑

305.

表1.6種類の e s t i m a n d( M a l l i n c k r o d te ta , . l2 0 1 2 ;M a l l i n c k r o d t,2 0 1 3 ) E s t i m a n d 仮説 推測の対象 被験者 R e s c u e 時点 M e d i c a t i o n後の データ E f t 巴c t i v e n e s s 2 3 E f f i c a c y E f f i c a c y 割り付け群 全被験者 E正 f e c t i v e n e s s 主解析に 時点 含める 最初に割り付け 最初に耐えられ 計画された 主解析に られた治療 た被験者のみ 時点 含めない 最初に割り付け 全被験者 計画された 主解析に 時点 含めない 未定義 主解析に られた治療 4 計画された 最初に割り付け 全被験者 られた治療 5 E f f e c t i v e n e s s 含めない 最初に割り付け 全被験者 未定義 主解析に られた治療 6 E f f e c t i v e n e s s 含めない 最初に割り付け 全被験者 られた治療 計画された 補完することが 時点 望ましい 各e s t i m a n dの特徴は以下の通りである. E s t i m a n d1は,実際に投与された薬剤ではなく,割り付け群の影響をみる.中止後に r e s c u em e d i c a t i o nが行 われ,その後にデータが得られた場合,そのデータも解析に利用する.しかし, ( 1 )多くの場合,臨床試験で 興味があるのは最初に割り付けられた薬剤の効果であること, ( 2 )最初に割り付けられた薬剤l の効果が r e s c u e m e d i c a t i o nによって過大評価もしくは過小評価されること,などから M a l l i n c k r o d te ta . l( 2 0 1 2 )では今回の状況 では e s t i m a n d1は主要な e s t i m a n dとして適切ではない,と指摘されている. E s t i m a n d2はランダム化前の r u n ‑ i n期間に全員に実薬を投与し,治療に耐えられ,継続できた被験者にの f f i c a c yの評価に役立つ みランダム化を行い,治療効果をみる.中止症例が減るため, e 一方で注意すべき点 1 )この e s t i m a n dで評価できるのは全患者集団のうち初期の治療に耐えられる部分集団に対してである には, ( 2 )実際の治療の際にはどの患者が初期の治療に耐えられるか分から ため,一般化可能性に疑問が残ること, ( 3 )ランダム化前の run‑m期間を設定していなければ本 e s t i m a n dを検討できないこと,などがある. ないこと, ( E s t i m a n d3は,全症例が治療を完了したと仮定した場合の群間差を評価するものである.これは理想的な 状況であるため,中止症例がどの程度有効性に影響を与えるかを別途評価することが必要である.具体的に s t i m a n dを主解析とした場合, e f f e c t i v e n e s sをみる感度分析を行うべきである. は,この e E s t i m a n d4,5は最初に害J Iり付けられた薬剤の e f f e c t i v n c s sを評価するもので,アウトカムの大きさと治療に 耐えられた期間を合わせて数値化する.従って,中止によるデータの欠測は生じない.一方,中止後も治療 f f e c t i v e n e s sを過大評価する傾向にある. 効果が持続する場合でなければ,計画された評価時点での e E s t i m a n d6は e s t i m a n d1と似ているが,中止後に r e s c u em e d i c a t i o nを行った後のデータの取り扱いが異なる. E s t i m a n d1はそのままデータを使用したが, e s t i m a n d6ではこのデータにはバイアスが入っているものとして, 補完した値を解析に用いるのが望ましいとされる.これは,興味の対象が「計画された評価時点での,最初 に割り付けられた治療の効果」であるからである.そのため,中止後に r e s c u em e d i c a t i o nが行われた場合は, ‑ 2 9 5 ‑

306.

その影響を取りのぞき,中止後は無治療であった場合の推定を行う.なお,補完の方法として, M a l l i n c k r o d t . l( 2 0 1 2 )では pMI( p l a c e b oM u l t i p l eI m p u t a t i o n )が推奨されている. pMIはプラセボ群の推移をもとに,中止 e ta 後のデータの予測分布を構成した上で, M u l t i p l eI m p u t a t i o nを行う方法である.詳細は M a l l i n c k r o d te ta l .( 2 0 1 2 ), M a l l i n c k r o d t( 2 0 1 3 )等を参照. なお, NRC( 2 0 1 0 )では e s t i m a n d1 ~ 5が提案され, M a l l i n c k r o d te ta . l( 2 0 1 4 )では, e s t i m a n d1が e s t i m a n dA,e s t i m a n d3が e s t i m a n d8,e s t i m a n d6が e s t i m a n dC と呼ばれている. 3 . 3 主解析に対する Estimand と Estimandに対する感度分析 E s t i m a n dは,疾患領域・薬剤の特性・治験の状況等を考慮して,試験毎に設定すべきである.なお,異な るe s t i m a n dに対する解析は目的が異なっているため,厳密には感度分析と考えるべきではないかもしれない. しかし,結果を比較した上で解釈する,という観点から,本稿では感度分析に含める. 以下,一例として M a l l i n c k r o d te ta . l( 2 0 1 2 )で検討された慢性疾患の第四相試験の e s t i m a n dについて述べる. s t i m a n dは e s t i m a n d3とした.これは,興味の対象が最初に割り付けられた薬剤の巴 f f i c a c yであ まず,主要な e s t i m a n d3は上で述べた通り全症例が治療を完了したと仮定した場合の治療効果であ るからである.ただし, e る.そのため,欠測症例の影響を評価するための感度分析として e f f e c t i v e n e s sを検討することが推奨されて いる.これより, e s t i m a n d6の検討も行った.解析方法としては, e s t i m a n d3 に対応する主解析としては MMRM, e s t i m a n d6に対する解析としては pMIが用いられた. また,今回の状況は慢性疾患であるため,中止後に治 療効果が弱まることが想定された.従って, e s t i m a n d4,5は望ましくないと考えられた. 4 .欠測メカニズムに対する感度分析 一般に,主解析の際は欠測メカニズムとして MARを仮定することが多い.しかし,これは MARが多くの 臨床試験で実際に成り立っている,ということを必ずしも意味するものではない. M a l l i n c k r o d te ta l .( 2 0 0 8 )に よると「計画段階で MARとなるように十分に計画を立てておくべきである JIMNARを仮定した解析は,仮 定が間違っていた場合に MAR を仮定した解析よりも大きなバイアスが入りやすしリなどを考慮、した上での 取り扱いで、あり,欠測メカニズムが MNARである可能性は否定されていない.また,欠測メカニズ、ムが MAR であるか MNARであるかは Type( i )の仮定であり,観測データからは検証できない.そのため, MNARであ る可能性は常に考慮しておくべきである. 以上より,主解析に MARを仮定した解析を用いた場合,感度分析として MNARを仮定した解析を行うこ とは大変重要で、ある.先にも述べた通り, NRC( 2 0 1 0 )や M a l l i n c k r o d t( 2 0 1 3 )では,感度分析全体の中で欠測メ カニズムに対する感度分析が最も重要であると指摘されている. 具体的な解析方法の詳細は大江ら ( 2 0 1 4 ),高橋ら ( 2 0 1 4 ),駒寄ら ( 2 0 1 4 )参照. 5 .完全データの分布に対する感度分析 5 . 1 完全データの分布 M a l l i n c k r o d t( 2 0 1 3 )に従い,完全データに対して,共変量の検討・残差診断・影響診断・分散共分散構造の 検討の 4項目を考える. [共変量の検討] まず, NRC( 2 0 1 0 )に従い,共変量を 2種類に分ける. ‑ 2 9 6 ‑

307.

‑デザイン変数:投与群やベースライン時に得られる共変量で,全ての症例に対して観測され,主解析に 用いられる共変量. ‑補助変数 :欠測したデータに対する推測に利用できる変数.投与前のものもあれば投与後のものも ある.コンブライアンスや副作用など,主解析の共変量には用いられないが脱落確率や 欠測データの分布のモデリングに役立つ共変量. e s t r i c t i v eModel,補助変数まで、含めたモデルを I n c l u s i v eModel ここで,デザイン変数のみを含めたモデルを R と呼ぶ. 主解析には Res住i c t i v eModelを用いた解析を行い,適当な補助変数がある場合は,感度分析として I n c l u s i v eModelを用いた解析を行うことが考えられる.なお, M a l l i n c k r o d t( 2 0日)は,ランダム化後に得られ, 薬効と交絡する変数であっても,欠測確率の予測に用いる補助変数とすることができるものは存在しうる(た だし,このような補助変数は応答変数のモデルには含めるべきではない) ,と述べている. I 残差診断 1 モデル適合度をみる方法として,残差診断はよく用いられる方法である.主解析として MMRMを用いる 場合, SASの MIXEDPROCEDUREのモデルステートメントの RESIDUALオプションで様々な残差を出力で 2 )闇値を決め,関値を超えるも きる.算出された残差に対して, (1)全体的なプロットを眺めて傾向をみる, ( のを外れ値と考え,それを除外した上で主解析を再度行うことにより,外れ値の推定値に与える影響を評価 する,などが考えられる.なお, M a l l i n c k r o d t( 2 0 1 3 )では S t u d e n t化残差の絶対値が 2以上の場合を外れ値と 考え,除外した解析との結果を比較している. 【影響診断】 次に,影響の大きい症例や施設など,影響の大きいクラスタの探索方法について述べる.以下,主解析と して MMRMを想定する.容易に実行できるのは, Cookの D統計量を用いる方法である.これは, MIXED PROCEDUREのモデルステートメントの INFLUENCEオプションで算出できる. Cookの D 統計量の値が大 きい症例や施設を影響の大きい症例・施設と考え,それを除外した上で主解析を再度行うことにより,影響 の大きい症例や施設の,主解析の結果に与える影響が検討できる. o c a li n f l u e n c eを用いる方法があるが,現段階では実行が難しいため,本稿ではこれ以上 別の方法として, l 2 0 0 0 ),M o l e n b e r g h sandKenward( 2 0 0 7 )などを参照. 触れない.詳細は VerbekeandMolenberghs( [分散共分散構造の検討】 分散共分散構造の違いが結果に与える影響についても,感度分析の対象となりうる. MMRMでは,分散共 u n s t r u c t u r e d )を指定する場合が多い 分散構造として,仮定が少なくあてはまりのよいことが想定される無構造( が,これ以外の分散共分散構造を用いた場合の結果と比較することで,結果の頑健性を確認することができ る.また, AIC等のモデル評価基準を用いて妥当な相関構造について検討することもできる. 6 .主解析・感度分析の実行 以上で述べた方法に従い,図 1の"An a l y t i cRoadMap"をもとに,主解析・感度分析を検討した. 6 . 1 試験計画・解析手法 うつ病の第 I I I相試験を想定し,以下の通りの解析を設定した.データは 6 . 2解析対象のデータで示す.. <estimandに対する計画段階での検討> 本試験はうつ病(精神疾患)の第四相試験を想定した.応答変数としては HAM‑Dスコアを用い,時点 4 ( 8週目)の平均の差を評価することを考えた.さらに, 3 . 3主解析に対する e s t i m a n dと e s t i m a n dに対する感 同 297・

308.

度分析に従い,巴 f f i c a c yの評価を目標とし,主要な e s t i m a n dを e s t i m a n d3とした.また,中止症例の影響を 評価する感度分析として, estimand6を用いた e f f e c t i v e n e s sの評価も実施することとした. <主解析> MMRMとした.詳細は以下の通りである. ・共変量:(連続値)ベースライン値, (カテゴリ値)投与群,時点,投与群と時点の交互作用 ・変量効果:被験者の影響を誤差と合わせてモデル化するため,明示的には特定しない ・相関構造:Unstructured (被験者ごと) 収束しなかった場合①初期値を F i s h e r ' sS c o r i n g法で得られた値とする ②相関構造を T o e p l i t z, H e t e r o g e n e o u sCS,AR ( l ) , CS,VCの順に指定する. .推定方法:REML ・自由度調整方法:KenwardRodger .帰無仮説:時点 4で群間差が 0 ・有意水準:両側 5% <感度分析 1:モデル適合の検討> 主解析に対する外れ値や影響の大きい症例の検討のため,残差診断と影響診断を行った. ・残差診断:Student化残差に対して①全体的な傾向を観察した,②絶対値が 2以上の場合に外れ値とみ なし,除外した解析を実施した. . 0 3以上の症例を影響の強い症例とみなし,除外した解析を実施した. ・影響診断:Cookの D 統計量が 0 <感度分析 2:欠測メカニズムに対する感度分析> 欠涼J Iメカニズムに対する感度を検討するため,以下の各モデルに対する解析を実施した.解析方法の詳細 は大江ら (2014),高橋ら (2014),駒寄ら (2014)参照. ・選択モデ、ル:MNAR を仮定し,感度ノ f ラメータをー 1~1 に対して 0.2 区切りで設定 ・パターン混合モデル・ NFMV (NCMV) を仮定し,感度ノ f ラメータを -3~3 に対して l 区切りで設定 .共有ノミラメータモデル:変量切片を考慮したモデル <感度分析 3:estimandに対する感度分析> E f f e c t i v e n e s sに対する検討として, p l a c e b oM u l t i p l eI m p u t a t i o n( PMI)を用いた解析を実施することとした. 補完後のデータは MMRMで解析を行った. 以上の解析をまとめたものを以下の表 2に示す. 表 2 主解析・感度分析の一覧 仮説 Estimand 欠測メカニズム 解析手法 主解析 E f f i c a c y 3 MAR 孔f 恥1RM 感度分析 1 E f f i c a c y 恥1AR 孔f 孔1RM モデル適合の検討 MNAR S孔f 感度ノ号ラメーター 1~1 MNAR PM恥f CMV) NFMV(N 感度分析 2 E f f i c a c y その他 感度パラメーター3~3 感度分析 3 E f f e c t i v e n e s s 6 MNAR SPM 孔⑪~AR pMI ‑ 2 9 8・ I

309.

6 . 2 解析対象のデータ 図 2,表 3に示すシミュレーションデータを用いた.以下,応答変数の値の要約を示すが,解析にはベー スラインからの変化量を用いた.なお,脱落確率は阿群でほぼ等しく,時点 4で 20%程度であった. 30 +・実薬群 ‑.̲プラセボ群 20 10 。 ペースライン 時点 1 時点 2 時点 3 時点 4 図 2 群ごとの HAM‑Dスコアの推移(平均土 SD) 表 3 時点ごとの症例数・ HAM‑Dスコアの平均・ SD ベースライン 例数 実薬群 1 0 0 プラセボ群 1 0 0 平均 (SD) 2 0 . 0 ( 4 . 1 ) 2 0 . 1 ( 4 . 2 ) 時点 2 時点 l 平均 例数 (SD) 1 8 . 1 9 3 ( 4 . 2 ) 1 7 . 5 9 0 ( 4 . 2 ) 平均 例数 (SD) 1 4 . 9 8 9 ( 5. 4 ) 1 5. 4 8 7 ( 4 . 6 ) 時点 3 例数 84 8 5 時点 4 平均 (SD) 11 .0 ( 6 . 3 ) 1 3 . 3 ( 6 . 3 ) 例数 8 3 8 0 平均 (SD) 8 . 5 ( 6 . 8 ) .0 11 ( 6 . 1 ) 6 . 3 解析結果 解析結果は,以下の通りである. <主解析> 主解析である MMRMの結果を表 4に示した. 表 4 主解析の結果 時点 4における各群の 点推定値 ( S E ) 解析手法 実薬群 MMRM 1 1 . 2 2( 0 . 6 9 ) ー 群間差 群間差の SE P1 1 直 ‑ 2 . 2 6 0 . 9 9 0 . 0 2 4 プラセボ群 明 8 . 9 7( 0 . 7 0 ) 有意水準両側 5%で有意であり,群間差は司2 . 2 6 と十分に大きかったため,主解析としては有効性を示す結果 となった.以下,感度分析でこの結果の頑健牲を検討する. <感度分析 1:モデノレ適合の検討> S t u d e n t化残差の残差プロット, Cookの D統計量のプロットを図 3, 4に示した.図 3より,やや負の値が ‑299‑

310.

多く見えるものの,全体的に 0に対しでほぼ対称に分布しており,特に偏りはみられなかった.また, Cook の D 統計量が 0 . 0 3を超える症例は l症例, S t u d e n t化残差の絶対値が 2を超えるデータは 3 1ポイント存在し た. これらの症例・ポイントを除いて,主解析と同じモデルで、 MMRMによる解析を実施した.主解析と比 較した結果を表 5に示した.群間差や群間差の SEはやや異なるものの,有効性を大きく減少させる傾向はみ られなかった Coo k ' s0 forF i xe ‑dEffects StudentizedRe割 dualsbyP開 dictedf o rv a l .40 ︒ ・0 明 , 4 吻今写機続物跡餅郵務機物静著者容を務格, ・ . , 0t・ dI d :trt) 図 3残差プロット (Sωdent化残差) 図 4Cookの D 統計量 表 5 外れ値・影響の強い症例の検討 除外判定基準 主解析 感度分析 l S t u d e n t化残差 (外れ値除外) 絶対値 2以上 感度分析 l C o o k ' sD (外れた症例除外) 0 . 0 3以上 症例数 データ数 群間差 群間差の SE 1 8 3 6 9 1 2 . 2 6 0 . 9 9 1 8 3 660 ‑ 2 . 3 7 0 . 8 7 1 8 2 687 ‑ 2 . 2 4 1 .00 司 <感度分析 2 :欠測メカニズムに対する感度分析> 次に,欠測メカニズムに対する感度分析の結果をみる.まず,感度パラメータを含めた SMによる解析結 果を図 5 ,6,表 6に示した.図 5 ,6の横軸は感度パラメータである. Ti│寸│i T十i l T│ 寸ii T │寸 Tll!VII‑ ム l Tl寸 l Tiイ ー T↑ iii ‑ 1 0 T ムli ‑9 Tjif‑‑4 8 T‑fl 一7 ‑ 2 1 1 ‑3 ‑ 1 2 ‑ 1 .0‑ 0 . 8‑ 0 . 6‑ 0. 4‑ 0 . 20 . 00 . 20 . 40 . 60 . 81 。 目 図5 . 感度ノ fラメータごとの両群の点推定値土 SE(SM) ‑300‑ ‑ 1 . 00 . 8‑ 0 . 6‑ 0. 4‑ 0 . 20 . 00 . 20 . 4 0 . 60 . 81 . 0 叩 図6 . 感度パラメータごとの群間差士 SE(SM)

311.

感度パラメータの値が小さくなるほど,群間差の値が小さくなる傾向がみられた.群間差の最小値は‑1.92 であった. 表6 .感度パラメータごとの解析結果(SM) 時点 4における各群の 解析手法 点推定値( S E ) 感度パラメータ 実薬群 群間差 群間差の SE プラセボ群 同 1 .0 ー 1 1 . 8 3 ( 0 . 7 2 ) ‑ 9 . 9 1 ( 0 . 7 2 ) 司 1 .9 2 1 .0 1 ‑ 0 . 8 ‑ 11 .7 8 ( 0 . 7 1 ) ‑ 9 . 8 4 ( 0 . 7 1 ) ー 1 .94 1 .0 1 ‑ 0 . 6 9 . 7 4 ( 0 . 7 1 ) ー 11 .7 1 ( 0 . 7 0 ) ‑ ‑ 1 .96 1 .00 4 司 0. ‑ 1 1 . 6 0 ( 0 . 7 0 ) ‑ 9 . 5 8 ( 0 . 7 0 ) ‑ 2 . 0 2 0 . 9 9 ‑ 0 . 2 4 4 ( 0 . 6 9 ) ‑ 9 . 3 1( 0 . 7 0 ) ー 1 1. ‑ 2 . 1 2 0 . 9 8 0 . 0 ー 1 1 . 2 2 ( 0 . 6 9 ) ‑ 8 . 9 6 ( 0 . 7 0 ) ‑ 2 . 2 6 0 . 9 8 0 . 2 ‑ 1 0 . 9 8 ( 0 . 7 1 ) ‑ 8 . 6 0 ( 0 . 7 2 ) ‑ 2 . 3 8 1 .00 4 0. ‑ 1 0 . 7 6 ( 0 . 7 3 ) ‑ 8 . 2 9 ( 0 . 7 4 ) ‑ 2. 48 1 .0 3 0 . 6 ー 1 0 . 6 3 ( 0 . 7 5 ) 8 . 0 9 ( 0 . 7 5 ) ‑ 2 . 5 4 1 .0 5 0 . 8 ‑ 1 0 . 5 5 ( 0 . 7 6 ) ‑ 8 . 0 0 ( 0 . 7 6 ) ‑ 2 . 5 5 1 .07 1 .0 ー 1 0 . 5 0 ( 0 . 7 6 ) ‑ 7 . 9 4 ( 0 . 7 6 ) ‑ 2 . 5 6 1 .08 SM 帽 次に,感度ノ fラメータを用いた PMMの結果を図 7,8,表 7に示した. TllJil‑‑ Tli寸i i Tli寸li Ti‑‑γili ‑‑Ti l寸 TIllL!lli 0603nu l寸 T│斗│ l ー7 ‑ 1 .0 ‑ 1 .5 ‑ 2 . 0 ‑ 2 . 5 ‑ 1 1 ‑ 3 . 0 ‑12 ‑ 3 ‑ 2 ‑ 1 0 2 ‑ 3 3 ‑ 2 ‑ 1 0 2 3 図7 .感度ノ 4ラメータごとの両群の点推定値土SE(PMM)図 8 .感度ノ fラメータごとの群間差: : ! : S E ( P M M ) 群間差の点推定値・ SEは感度ノ号ラメータにほぼ影響を受けなかった.これは NRC( 2 0 1 0 )の PMMを用いた 感度分析の結果と同様の傾向である. 最後に, SPMの結果を表 8に示した.本シミュレーションに用いたマクロでは,実薬群・プラセボ群の点 推定値・ SEは出力されなかった.群間差は・2 . 6 5となり,主解析の MMRMよりやや大きくなった. <感度分析 3:e s t i m a n dに対する感度分析> E f f e c t i v e n e s s( e s t i m a n d6 )を評価する解析として pMIを実行した結果を表 9に示した.群間差は‑ 2 . 0 6となり, 主解析の結果よりやや小さい値となった.プラセボ群のデータを元に中止後のデータを補完したため,主解 析より保守的な値となった. ‑301‑

312.

表7 .感度ノ fラメータごとの解析結果 (PMM) 時点 4における各群の 感度ノ fラメータ 解析手法 点推定値 ( S E ) 実薬群 PMM :NFV(NCMV) 群間差 群間差の SE プラセボ群 ‑ 3 . 0 11 .1 4 ( 0 . 8 5 ) ‑ 9 . 0 7 ( 0 . 8 3 ) ー 2 . 0 7 1 .22 ‑ 2 . 0 ー 1 0 . 9 8 ( 0 . 8 5 ) ‑ 8 . 9 1 ( 0 . 8 3 ) ‑ 2 . 0 7 1 .22 ー 1 .0 ー 1 0 . 8 2 ( 0 . 8 5 ) ‑ 8 . 7 5 ( 0 . 8 3 ) ‑ 2 . 0 7 1 .2 2 0 . 0 1 0 . 6 6 ( 0 . 8 5 ) ‑ 8 . 5 9 ( 0 . 8 3 ) ‑ 2 . 0 7 1 .22 1 .0 ー 1 0 . 5 0 ( 0 . 8 4 ) 8. 43 ( 0 . 8 4 ) ‑ 2 . 0 7 1 .22 2 . 0 ‑ 1 0 . 3 4 ( 0 . 8 4) ‑ 8 . 2 7 ( 0 . 8 4 ) ‑ 2 . 0 7 1 .22 3 . 0 ー 1 0 . 1 8 ( 0 . 8 4 ) ‑ 8 . 1 1 ( 0 . 8 4 ) ‑ 2 . 0 7 1 .22 明 表8 .SPMの解析結果 時点 4における各群の 点推定値 ( S E ) 解析手法 実薬群 群間差 群間差の SE ‑ 2 . 6 5 0 . 7 6 群間差 群間差の SE 2 . 0 6 0 . 9 9 プラセボ群 SP 恥f 表 9.pMIの解析結果 時点 4における各群の 点推定値( S E ) 解析手法 pMI 実薬群 プラセボ群 .0 3( 0 . 7 0 ) ‑ 11 ‑ 8 . 9 7( 0 . 7 1 ) 幽 6 . 4 感度分析の結果のまとめ 以上,主解析を MMRMとし, ( 1 )モデル適合, ( 2 ) 感度パラメータ, ( 3 ) e s t i m a n dに対する感度分析を実行し た.検討した感度分析の範囲内では,主解析のモデル適合に問題点はみられなかった.次に,各解析の群間 0に示した. 差の点推定値(の最大・最ノト)をまとめたものを表 1 表 1 0 . 主解析・感度分析の群間差一覧 解析手法 群間差 その他 最小 最大 主解析 MMRM 感度分析 1 MMRM モデ、ル適合の検討 ‑ 2 . 2 4 ー 2 . 3 7 SM 感度ノ f ラメータ -1~1 ‑ 1 .9 2 ‑ 2 . 5 6 ‑ 2 . 0 7 ‑ 2 . 0 7 感度分析 2 感度分析 3 PM恥f ‑ 2 . 2 6 NFMV(NCMV) 感度パラメーター3~3 SPM ‑ 2 . 6 5 1 p恥1 ‑ 2 . 0 6 ‑302・

313.

群間差は主解析と比較してやや小さくなるものもみられたが,点推定値はー 1.92~2.65 であり,主解析の結 果と大きく講離するものではない考えられたため,本薬剤の有効性は安定していると考えられた. 6 . 5 実際に適用する際の注意 以上のような感度分析を実際に利用する際,以下の点などに注意が必要である. ① estimandを適切に選択する. ②仮定を意識して適切な感度分析を計画・実行する. ③感度パラメータの適切な範囲を検討する.群ごとに異なるパラメータを用いることも検討する. ④公開されているマクロを使用する場合,適切にプログラムのバリデーションをとる. ⑤感度分析の結果が主解析の結果と比較的大きく異なる場合,解釈を慎重に行う. 特に,③(特に SM) ⑤などは今後の課題と考えられている 7 .主解析の選択 7 . 1 MARを仮定した場合の主解析 次に,欠測メカニズムとして MARを仮定した場合,計画段階でどの解析手法を主解析とするか,の選択 のためにシミュレーションによる検討を行った.図 lの主解析の候補である MMRM,wGEE,MIに LOCF (解析手法は共分散分析)を加えた 4種類を比較した.各手法の詳細は大江ら ( 2 0 1 4 ),高橋ら ( 2 0 1 4 ), NRC( 2 0 1 0 ), M a l l i n c k r o d t( 2 0 1 3 ),MolenberghsandKenward( 2 0 0 7 ),O ' K e l l yandR a t i t c h( 2 0 1 4 )等を参照せよ. MMRMの詳細等,以下で特に触れない部分は, 6.1試験計画・解析手法と同様とする.その他の設定は以 下の通りである. [wGEE] 脱落モテ苧ル:1 0 g i s t i cモデル(共変量は主解析と同じ) [MI ] 補完モデル・投与群ごとの単調回帰モデル(共変量:ベースライン,各時点の変化量). 5回 補完回数 : 解析方法:共分散分析(共変量:投与群,ベースラインのみ) [LOCF] 解析方法:共分散分析(共変量:投与群,ベースラインのみ) 7 . 2 シミュレーションの設定 [完全データ】 以下のような状況を想定し,完全データを作成した. ・投与群 :2群 g (g=1:実薬群, g=2:プラセボ群) ・被験者数: 100例/群 ・時点数:ベースライン +4時点(時点 4が主要評価時点) 1,1 2,図 9 ・測定値(完全データ)の各時点の平均・標準偏差・相関構造・表 1 表 11.完全データの各時点の測定値の平均 (SD) 測定値の平均値 ベースライン 実薬群 2 0 . 0( 4 . 0 ) プラセボ群 2 0 . 0( 4 . 0 ) ‑ 3 0 3 ‑

314.

表 1 2 . 完全データのベースラインと各時点、の測定値の相関 ベースライン 時点 l 時 点 、2 時点 3 時点 4 0 . 3 0 . 3 0 . 2 0 . 1 0 . 6 0 . 5 5 0 . 5 0 . 6 0 . 5 5 ベースライン 時点 l 時点 2 時点 3 0 . 6 時点 4 ー・圏実薬群 2 0 . 0 *ーブラセポ群 1 8 . 0 1 6 . 0 1 4 . 0 1 2 . 0 1 0 . 0 8 . 0 ~}ポ曜〉事〉唱F ~/',... ~匹やや~ / 川 r 図9 . 各時点の測定値の平均構造(完全データ) I 欠測のあるデータ] 上記の通り作成した完全データを元に, MAR,MNARの 2種類の欠測メカニズムを考え,欠測のあるデ ータを発生させた.なお,時点毎の欠測確率の目標値は以下の値とし,欠測は単調な欠測を仮定した 表1 3 .時点毎の欠測確率の目標値 上記目標値をもとに作成した欠測確率の関数は下記の通りである. ( Yo:ベースライン値, Y i :時点 iの 測定値,i=1 , 2, 3, 4) .なお,両群で同じ関数を用いた. 'MARにおける時点 i の欠浪J I 確率 :Pi=l‑ i 1+e x p ( ‑ 5 . 7 0+O . 1 4 Y iー1) ・MNARにおける時点 i の欠測確率 :pz=l‑ 1 l + e x p ( ‑ 5 . 7 0 + 0 . 0 5 Y i ̲ l+O.10YJ [検出力・ αエラー・ MSE等の算出] 上記の 2通りの欠測メカニズム (MARと MNAR) のもとでの欠測のあるデータをそれぞれ 1 0, 000組ずつ 作成し,ベースラインからの変化量に対して MMRM,MI,wGEE,LOCFで解析を行い,検出力, aエラー, MSE (時点 4 における群間差の真値は ‑ 3 . 0 ) 等の算出を行った.なお,有意水準は両側 5%とした.また, α エラー算出の際は,平均構造を両群とも上記プラセボ群の数値に設定した. 帽 304・

315.

7 . 3 シミュレーションの結果と解釈 シミュレーションの結果を表 1 4,1 5に示した.まず, αエラーは MAR,MNAR共に MMRM,MI,LOCF では 5%以下に保たれたが, wGEEは 5%を大きく上回った.検出力は MMRMが最も高く,次いで MI,LOCF, wGEEの順で、あった.時点 4の群間差に対する MSEは MMRMが最も小さく,次いで、 M, I LOCF,wGEEの MI, wGEEはほぼ設定値の ‑ 3 . 0に等しく, LOCF 順で、あった.最後に時点 4の群間差の推定値の平均は MMRM, はやや過小評価される傾向がみられた. 以上を踏まえ,本シミュレーションの結果からは MMRMが主解析として望ましいと考えられた.なお, MIもやや劣るものの,ほぼ同様の傾向を示した.また, wGEEは特に αエラーが有意水準の 5%を大きく超 えているため,今回のシミュレーションと類似したデータに対する主解析として使用する場合,より詳細な 検討が必要であろう.なお,原因としては,重みが極めて大きいデータが全体に大きな影響を与えたことな , αエラーには問題ないものの,検出力が MMRM,MIに比べて劣り,また群間差 どが考えられた. LOCFは の推定値を過小評価する可能性が考えられるため, MMRM等が使用可能ならば,特に使用する必要性は感じ られなかった.なお,本解析は 2シナリオのみのシミュレーションであるため,結果を一般化し過ぎないこ とに注意が必要である 4 . 検出力・ αエラー・ MSE・点推定値の平均 (MAR) 表1 時点 4における 時点 4における 群間差に対する 群間差の推定値 恥1 SE の平均 4 . 7 9 0 . 8 2 5 0 ‑ 2 . 9 9 8 8 8 9 . 1 9 4 . 8 0 0 . 8 3 9 7 ‑ 2 . 9 9 8 4 wGEE 6 9 . 3 1 11 . 12 2 . 3 0 1 6 ー LOCF 42 8 3. 4 . 7 8 0 . 9 2 9 3 ‑ 2 . 8 1 6 2 時点 4における 時点 4における 検出力(%) αエラー(%) MMRM 90. 40 MI 2 . 9 9 7 5 表1 5 . 検出力・ αエラー.MSE・点推定値の平均 (MNAR) 時点 4における 時点 4における 群間差に対する 群間差の推定値 MSE の平均 4 . 8 4 0 . 8 0 5 5 ‑ 2 . 9 6 8 8 8 9 . 1 6 4 . 7 0 0 . 8 2 5 0 wGEE 6 9 . 2 8 1 0. 40 2 . 1 8 4 0 ‑ 2 . 9 6 7 8 LOCF 8 6 . 3 3 4 . 7 6 0 . 8 7 3 1 ‑ 2 . 8 5 6 2 時点 4における 時点 4における 検出力(%) αエラー(%) 恥1MRM 9 0 . 5 3 恥1 1 司 2.9654 7 .4実際に適用する場合の注意 本シミュレーションでは, MMRM,wGEE,MIの 3種類の MARを仮定した解析と LOCFに対して, 1通 りのシナリオに対する検討を行った.シミュレーションの結果はデータの分布や欠測メカニズムに大きく影 響を受けることが想定されるため,実際に上記と同様のシミュレーションをもとに主解析の選択を行う場合, 以下の点などを考慮しつつ,様々なシナリオの検討を行うことが推奨される. ‑305‑

316.

[欠測メカニズ、ム] ① MARを仮定してよいか ?MARから大きく離れた場合,どの程度影響を受けるか? [応答変数のデータの分布] ①外れ値がある場合や,欠測しているデータの分布が観測データと比較的大きく異なる場合どうなるか? ②ベースラインと時点の交互作用等がある場合どうなるか? [欠測の発生確率] ①欠測が増えるのは,応答変数の値が大きい場合か,小さい場合か? ②補助変数が存在する場合どうなるか? 8 . まとめ 本稿では, NRC( 2 0 1 0 )の内容を発展させた Mal 1 i n c k r o d t( 2 0 1 3 )に従い, "An a 1 y t i cRoadMap"に沿った主解析・ 感度分析の検討を行った.また,主解析としての MMRM,wGEE,MI,LOCFの性能を 2通りのシナリオ(欠 測メカニズムが MARと MNAR) のシミュレーションで比較した. 広く言われている通り,欠測の発生メカニズムや解析に与える影響は疾患や薬剤,治験の実施地域等に強 く依存する.欠測の生じうる臨床試験の計画・解析の際は,本稿で示したように,シミュレーションによる 検討を十分に行って最適な主解析の選択を行い,適切な感度分析を実施した上で,主解析・感度分析の結果 を合わせて解釈を行うことが重要である. また,感度分析の研究は現在も極めて盛んに行われている.本稿 の内容はあくまで現段階のものであることにも注意されたい. 参考文献 し 駒寄弘,高橋文博,横溝孝明. ( 2 0 1 4 ) . 欠測メカニズムに対する感度分析.SASユーザー総会論文集. 2 . Ma l 1 in c k r o d t, C .H .( 2 0 1 3 ) .P r e v e n t i n gandT r e a t i n gM i s s i n gDatai nL o n g i t u d i n a lC l i n i c a lT r i a l s .Cambridge P r e s s . 3 . M a l l i n c k r o d t,C .H .,C h u a n g ‑ S t e i n,C .,M o 1 e n b e r g h s, G .,O ' K e l l y ,M., R a t i t c h, B ., J a n s s e n s, M.,andBunouf ,P . ηl e r a p e u t i cI n n o v a t i o n& r e g u l a t o η ( 2 0 1 4 ) .R e c e n td e v e 1 0 p m e n ti nt h ep r e v e n t i o na n dt r e a t m e n to f m i s s i n gd a t a, S c i e n c e, 48,6 8・8 0 . ,S c h n e l l, D ., Peng, Y ., Mancuso, J .P .( 2 0 0 8 ) .Recommendationsf o rt h eP r i m a r y 4 . M a l l i n c k r o d t, C .H ., Lane, P .W目 A n a 1 y s i sofc o n t i n u o u sE n d p o i n t si nL o n g i t u d i n a lC l i n i c a lT r i a l, DrugI n f o r m a t i o nJ o u r n a l, 42,3 0 3 ‑ 3 1 9 にk r o d t, C .H .,L in,Q ., L ipkovich, , . 1a n dM o l e n b e r g h s, G .( 2 0 1 2 ) .A s t r u c t u r e da p p r o a c ht oc h o o s i n g 5 . M a l l i r e s t i m a n d sa n de s t i m a t o r si nl o n g i t u d i n a 1c l i n i c a lt r i a l s, P h a r m a c e u t i c a lS t a t i s t i c s,1 1, 4 5 6 ‑ 4 61 . i s s i n gDatai nC l i n i c a lS t u d i e s .W i 1 e y . 6 . Mo1enberghs,G .,a n dKenward ,M.G .( 2 0 0 7 ) .M .( 2 0 1 0 ) .T h eP r e v e n t i o nandT r e a t m e n tofM i s s i n gDatai nC l i n i c a lT r i a l s .The 7 . N a t i o n a lR e s e a r c hC o u n c il N a t i o n a lAcademiesP r e s s . 8 . 大江基貴,土居正明,縄回成毅. ( 2 0 1 4 ) . 解析手法の解説 1 .SASユーザー総会論文集. l i n i c a lT r i a l sw i t hM i s s i n gData‑AG u i d e f o rp r a c t i t 仰 町' S ‑ .W i l e y . 9 . O ' K e l l y, M.,a n dR a t i t c h ,B .( 2 0 1 4 ) .C 1 0 . 高橋文博,藤原正和,大浦智紀,横山雄一. ( 2 0 1 4 ) . 解析手法の解説 2 .SASユーザー総会論文集. i n e a rMixedModelsforL o n g i t u d i n a lD a t a .S p r i n g e r . 1 1 . Verbeke,G .,a n dM o l e n b e r g h s,G .( 2 0 0 0 ) .L ‑306‑

317.

!医療政府自治体大学によるー別会誼 ‑ o a m . J ‑ , SAS ODSGRAPHICSを用いた臨床試験 データの可視化への挑戦 豊泉樹一郎,財前政美北西由武,都地昭夫 塩野義製薬株式会社解析センター Challenget oV i s u a l i z et h eC l i n i c a lT r i a lData w i t hODSGraphics 1 K i i c h i r oToyoizumiηMasamiZaizen1)Y o s h i t a k eK i t a n i s hj 1 )AkioTs 吋i ) 1)SHIONOGI&CO.,LTD. |臨政府開大…ヱコ~峨証…ー齢 ~I]9 要旨: 臨床試験の結果は要約統計量や仮説検定によって傭 撤することができる.しかし数値のみの結果を提示する よりも,適切な可視化を行うことでより理解を深められ ることが多々ある臨床試験における個々の症例プロ ファイルがその一例である.そこで今回 ODS GRAPHICSを用い,臨床試験データを可視化するため のS ASプログラムを開発した.その作成事例について 報告する キーワード・ O DSG R A P H I C S ‑ 3 0 7・

318.

臨 政 府 ・ 自 治 体 点 よ る 一 戸 両 手 託 子 一 ~II]9 l 臨床試験のデータ 鍾 樋 鵜安全性のヂ一家タ 機h 陛 … 開閉 EE 解析担当者が統計解析を行い,集計結果をまとめる │医癒政府開熔!こよ紅コシス間会話…四触 9 W l J 結果の出力例(主要評価項目の解析) 主事縞時点 投与群 2遡 プラセボ ~署長群 4湖 6遡 1 0遡 プラセボ 実業群 プラセボ 実費量群 プラセポ 案事監群 変化食 灘重臣平鈎僅 (練準誤差i ‑ 3 . 2 5(12 乃 ‑ 5. 38( 1 . 35 ) ‑ 6 . 1 1( 1 . 33 ) ‑ 8. 9 2( 1 4 1 ) 551( 1 3 9 ) ー1 0 . 8 6(1 4 6 ) ‑ 7 6 4(14 t り ー1 4 . 9 6 (1 .5 3 ) ‑ 3 0 8 ‑ プブセポとの比絞 首崎整平均歯車の豊監 ~信頼区間] p歯 車 勾 213[ ‑ 57 8 .15 02523 281[ ‑ 66 51 0 2 ] 0 . 1 4 9 9 534[ ‑ 9. 3 2 .‑ 1 3 句 。∞飽 732[‑1151 .‑ 3 1 3 J 。 仮 l O 7 匂

319.

!臨政府自治信長時当性端弘一 W l J 9 結果の出力例(有害事象の解析) : t=>t , r , 実業群 N~192 量 t l 吉 原J j c分獄 (SOC) 基本直面(P1) 全体 向筋書信審 : ! ! " ( . 古車秘 一般・全身障害および役専務伎の状態 口渇 倦怠感 N~193 n( 心 。 } 件数 n~も} 件数 p重 自 [ a l 1 2 3( 6 4. 1 ) 43( 124) 7( 3乃 4( 21 ) 210 5 5 7 4 1 2 3( 6 3乃 43( 223 ) 1 4( 73 ) 主(26) 230 64 1 4 5 I収X地 i回X泊 01770 IαX 悶 9( 4 η 4( 2 1 ) 4( 2 1 ) 1 1 5 4 7( 3の う(26) 4( 2. 1 ) 1 9 6 4 06111 熔 lαX 10 似 ] ( ) [ a l F l 虫 宮 古 田 細 胞t │ 医 療 、 政 問 自 信i 延命説鎮起点:ー W l J 9 数値のみの結果 ‑長所 一必要な情報はすべて盛り込まれている .短所 一一つ一つの結果を見ていくのには時聞がかかる 可視化することで,直観的に結果を理解できる ODSGraohicsで作成 金 ー ‑ 3 0 9 ‑

320.

│医額政府間大学向コ以テムの‑恥…会 ~9 臨床試験の結果で主に見たいもの .有効性 一主要評価項目の点推定値,区間推定値の経時的な推移 ‑どの時点で有意な差があるか 安全性 . ープラセボと比較して,どのくらい有害事象のリスクが大きいか(リ スク比のプロット) 一(適用拡大の薬ならば)他の適用症とのリスクの比較 ‑着目している有害事象聞の関連性 医療政府関大学問問ステムの実証…ー総会 . proc sgplot dataこtempOl noautolegend; series x=visit y=chg/ name="l" g r o u p = T R T ; scatter x=syx y=syy /markerchar=pmarkercharattrs=(size=12); scatter x=visit y=chg /markerattrsニ ( s y m b oI ニc ir c l e f iI l e d ) yerrorlower=LOW yerrorupper=UPP g r o u p = T R T ; yaxis l a b e lニ"Changefrom B a s e li n e " ; xaxis l a b e lニ" W e e k " ; ' 1 ' ' ; keyI egend ' r e f li n e O/axis=y Iineattrs=(pattern 二2 ); r u n ; I:n~f~~ ~ 今までは,ヂ切に白カされる線 ?の種類や色 r ; J : 1 アGraphT e 和p l a t e ‑で事前に定義しておかな l 子 才tば 緩喰らながった癖 と ー . ド , .本 6 1 0 Week トープラセ珊 ー輔副 ‑ 3 1 0・ 1

321.
[beta]
!底積一体点!こ平均ゐ é'~~~s~_~_.a

2
0
1
4

GraphTemplate
• GraphTemplate

‑出力されるグラフの色,線の種類等が定義されている
ーその一つ一つを定義しているのがGraphTemplate
Lan只uage(GTL}と呼ばれる SASのコード

e

園 田

ヒト:C
?raphTemr
;
>l
a
t
e

[医積政府自治体大学問均ムゐ錨t:H.~絡会

~II]]9

proc sgplot data=temp01 noautolegend;
Istyleattrs datacontrastcolors=(red g
r
e
e
n
)d
a
t
a
linepatterns=(dot s
o
li
d
);
ぽ
=
'
'
1
'
'g
roup=TRT
:
series x=visit y=chg/ nam
scatter x=syx y=syy /markerchar=p;
scatter x=visit y=chg /markerattrs=(symbol=circlefiIl
e
d
)
yerrorlower=LOW yerrorupper=UPP group=TRT;
xaxis l
a
b
e
l ="Week";
yaxis l
a
b
e
l ="Change from B
a
s
e
li
n
e
"
;
keylegend "
1
"
;
r
e
f
li
n
e O/axis二 y Iineattrs=(pattern=2);
run,

勺

05

よ 三︽じ長二苫﹃ヨニ 4υ
三
一
一
一 J4

oe
一aB2

一
勝
一

盃竺

h:

一や土

でプ一

k
:一

利

z
n

ポ
一
HW一

E

‑
3
1
1
‑

322.

│医療政府関大学問ロシステムの恥 適用症聞での有害事象発現のリスク比の比較 A n ロ υ ︒由主口古宮戸 血忠勝嵐官 疾暁槙 刊し 0. 12 5 32 0 . 5 0. 12 5 0 . 5 2 8 R 、 ,l a 旬、(' R i s k 32 01 2 5 , 8 0 . 5 32 ‑o.9 │ 医 療 政 府 間 鳩 山 コ 以 羽 詰 SAS.:J.‑"f 適用症間での有害事象発現のリスク比の比較 肌蜘駅 ル 担E ‑QZ智 Lト 疾疾疾 0 . 1 2 5 0 . 5 2 8 32 0 . 1 2 5 0 . 5 2 8 R e l a t i v ( '町, k 32 0 . 1 2 5 0 . 5 2 8 3 2 p r o cs g p a n 泡 Id a t a = t e m p 0 5n o a u t o l e g e n d 刀L U M N L A T T I C E p a n e l b y A E D E C O D/ c o l u m n s = 3n o v a r n a m eS P A R S EL A Y O U T =C 二L O Wy o r i g i n = d i s e a s eg r o u p = d i s e a s e v e c t o rx = u p py = d i s e a s e/ x o r i g i n p a t t e r n = s o li d )n o a r r o 哨h e a d s ; I ineaUrsニ ( s c a t t e rx = e s t i m a t ey = d i s e a s e/ m a r k e r a t t r s = ( s y m b o l = s q u a r e f iI l e d ) ; C O L A X I SL O G S T Y L E =L O G E X P A N DL O G B A S E = 2T Y P E =L O G L a b e l = " R e l a t i v eR i s k " ; R O W A X I Sv a l u e s = ( l .2 . 3 )m i n = O . 5m a x = 3 . 5v a l u e s h i n tl a b e l = " T r a g e tD i s e a s e " ; r e f li n el / a x i s = xI i n e a t t r s = ( p a t t e r n = 2 ) ; r u n ; 312・ ー

323.

(医療政府明大学によるロシステムの知b"R~齢 ~I~9 有害事象聞の関連(ベン図) ods graphics on/width=10cm height=llcm; proc sgplot data=temp02 noautolegend; styleattrs datacolors=(red green blue y e ll o w ) ; bubble x = x y=y/ b r a d i u s m i n = l .7cm bradiusmax=1.8cmtransparency=O.75 group=A1n a m e = ' T ' ; scatter x=x2 y=y2/markerchar=A2; xaxis min=‑7max=7 display=none; ニ ー 7m ax=7 display=none; yaxis min keyI egend ' ' 1 ' ' ; r u n ; l.ALT 上昇・ A S T上 昇 ・ GTF上昇 凶 L 上昇! どの有害事象と,どの有害事象が重複して発生しているかがわかる 11 告 白 !闘蜘帥矧こよる ここまでの話 ・試験全体での有効性・安全性の結果の可視化 .実際には,個々の症例がどのようなプロファイ ルを辿ったか,一例一例見ていくこともありうる .可視化を行わなかった場合,個々の被験者の プロファイルの情報は一覧表から取得すること になる ‑ 3 1 3・

324.
[beta]
闘政府間大学問コシステムの実証 SAS.:l-"f-Ill~9
一覧表の例
望
量
句
司
轟

亨寺壬軍

雇者画

性別

面「

貰

事電亙二主世主
輔

ペースヲイ J
2週

6
1
1

寓裳1
1

役与'章

子亨石軍

n

'
7

k

M
..温
H迦
、ース弔イム〆

2遥

後
l
I
O
l .~郵
t
lt
'ID 隼・l ~":聞
f
'
I
I
I (鯵舎4
岡
田2

男
帽

2
0
'
"
2
0
'
.
.ド
,
.

・ ・
・ 20'"

4

似

。

重量

重重旦‑
剖日

21
40
33
1

4

4

21
4
‑
M
‑
2
8
却
,
.
.
.
,
ド
口
お,....,岨

4

・
.
,
2
0
1
.
f
‑
0
4
.
.1
S

4

岨ー個

0
42

!II!lI時湖~~

,
.
,

言雇f
f
i

i
篇
区
う
ま
ー

梼緯期間Ih) 園祭陪係

.
援
護
鼻量第
欄進なし
日
中等!I
同様.鱒
関進 f;L
括経!I
5
6
I
多量鱒

口内炎
{口内向
血中 2 レステロー唱レ淘加
{血中三レステローも嶋加ゆ
便秘

{便属}

闇違 f
.
l

回転検めまレ

出量!I
•
I
参量篤
間違;t,.

{闘伝性耽まも、}

宿直寵品処.,
治験模以外の処置

1

コメント

転鋼.

雇事面重富喜子
』喝、え

回6
値
段与 変更せず
L渇 え
回復
役与量変更せず

t

え
闘
i
I
I
III与量'~J!.ず

L、
も点

回復

相縛後鋼聞{町・構織的情磯町.,

各症例について 1個 1個見ていくのは大変
ーシ可視化が重

│鴎政府富山…ロシス弘の実証一触

~9

個別症例のプロットで、見たいもの

• 安全性
‑着目したい有害事象が治験薬投与後のどの時点
から発現しているのか&どのくらいの期間継続し
て発現しているのか

• 有効性
一各被験者での死亡や症状悪化といったイベント
がどの時点で発生しているか
一主要評価項目の経時的な推移に対する有害事
象や併用薬の及ぼす影響

314

ー

・

325.

│ γ一一一i I 医臨療政附府臨熔矧榔には悶こ拡よ即る紅租工口口=宕 川山勺 鎚恥実期証 蜘 一 ~9 特定の有害事象の各症例での発現時期 ‑各被験者で J どの時点で食欲減退が発生しているのかが分かるが綴 ・プロットの色を変えることで¥有毒茅象の重症度の違いを表すことも可能 , …ムミ子科喜一一儲 I ' E I ! " i B l R i. m ~9 特定の有害事象の各症例での発現時期 食欲減退の発現時期 I D 001 002 003 004 title"食欲減退の発現時期". proc sgplot data=temp03 noautolegend; s t y l巴attrs datacontrastcolors二 ( b l u egreen r e d l ; vector x=AEENDY y=seq/ xorigin=AESTDY yorigln=seq group=AESEVC Iineattrs=(pattern=soli d thickness=2) 円oarrowheads name="1" nomissinggroup; i r c l e f iIl e d color=black size=5pt) scatter x=AESTDY y=seq / mark巴rattrs=(symbolニc scatter x=AEENDY y=seq / markerattrs=(symbol=circlefiIl e d color=black size=5ptl scatter x=dummy y=seq /markerchar=subjid markercharattrs=(size=14) x 2 a x i s ; xaxis label="Days" offsetminニ0.10offsetmax=0.01 values=(O to 28 by 7 ) ; x2axis offsetmin=0.01 offsetmax=0.92m i n = O .5 max=1.5 values=(l) display= N O N E ; yaxi sv aI ues=( ‑ 1 1 to 0 b y1 ) I abeI ="被験者番号" display= N O N E ; ' 1 ' ' "2"/ti tI e="Severi t y " ; keyI egend ' run, ‑ 3 1 5 ‑

326.
[beta]
│医癒政府間鳩山肌弘の実証拠汗総会

~9

各症例でのイベント発現日一覧
死亡,イベントの聾現日
!
日

f
台蝶群

×

0
0
1 高井1
1
量

×

0
0
2 商用量
0
0
3 中期最
0
0
4 中用量
0
0
5I
t
'周 量

ぬく

×

0
0
6プラセボ
0
0
7プラセボ
0
0
8プラセボ
0
0
9プラセボ

減〈
~X

→モー×
×

0
1
0プラセボ

••

1
2
。

"
'

1
6
0

式
加
。

2
4
0

。
鴻

(
)
町
、

桝酬×虻×醐靴 l

-どの症ぷ~~t 符死亡や症状悪化が起こったか,治験薬がどのくらしであ期間投与さ
話機
d
翠
z
麟蜘れ

れセいたかが視覚的にわかる的磁均問

寵醗

医療政府関大学問工均

各症例でのイベント発現日一覧
死亡,イベント回聾現 H

I
D 治療群
0
0
1 商用盤

×
×

0
0
2 商用惜
0
0
:
1 中間量
0
0
4 中用量

ぬく

×

0
0
5 中用量

t
i
t
l
e 死亡 イベントの発現日".
proc s
g
p1
o
t data=temp04 n
o
a
u
t
o1
e
g
e
n
d
;
v
e
c
t
o
rx
=
E
X
E
N
D
Yy
=
s
e
q
lx
o
ri
gi
n
=
E
X
S
T
D
Yy
o
ri
gi
n
=
s
e
q 1i
n
e
a
t
t
r
s
=(
p
a
t
t
e
r
n
=
s
o1
i
dt
hi
ckness=2
c
o1
o
r
=
b
a1
c
k
) n
a
m
e
=
'
'
1
'
'1
e
g
e
n
d1
a
b
e1
="投与期間".
s
c
悶a
t
t
e
rx
喝
=D
E
臥A
T
刊Hy
ド=
s
e
閃qIm
a
r
k
e
r
a
t
t
r
s
=
(
ω
s
y
卯刊
m
b
加o
l
=
Xc
0
1町
。r
ヰ
=r
e
ω
ds
剖I
z
e
斗
=1
命
4p
り
t
)問
n
a
剖f
目
m
e
=
"
γ
2
s
c
a
t
t
e
r x=
則
RI
以
SKy
=
s
目e
q 1m
悶
l
陥
a
r
k
e
r
a
杭
tt
r
s
=
(
ω
s
y
町
m
b
凶o
l
=
Xc
∞
0
1
。
川r
戸=
b
削l
u
出e 引
si
z
e
=
1
4
p
t
)n
a
m
e
= 3
" l
e
g
e
n
d
l
a
b
e
l
= 症状
I

∞

悪化".

s
c
a
t
t
e
rx
=
x
1y
=
s
e
q
/
m
a
r
k
e
r
c
h
a
r
=
s
u
b
ji
dm
a
r
k
e
r
c
h
a
r
a
t
t
r
s
=(
si
z
e
=
1
4
)x
2
a
xi
s
;
s
c
a
t
t
e
rx
=
x
2 y=seq/markerchar=TRTPCm
a
r
k
e
r
c
h
a
r
a
t
t
r
s
=(
si
z
e
=
1
4
)x
2
a
xi
s
;
x
a
x
i
sl
a
b
e
l
=
"
D
a
y
s
"o
f
f
s
e
t
m
i
n=
O.25offsetmax=
O.
O
lv
a
l
u
e
s
=
(
Ot
o280b
y4
0
)
;
x
2
a
xi
so
f
f
s
e
t
m
in
=
O
.0
1o
f
f
s
e
t
m
a
x
=
O
.7
5mi
n
=
O
.5m
a
x
=
3
.5v
a1
u
e
s
=(
1
.2
)v
a1
u
e
s
hi
n
t di
s
p1
ay=N
O
N
E
;
ー
(1
1t
o0 b
y1
) 1
a
b
e1
="被験者番号" D
I
S
P
L
A
Y
=N
O
N
E
;
y
a
xi
sv
a1
ues=
k
e
y1
e
g
e
n
d'
'
1
'
'"
2
""
3
"
;
r
u
n
;

‑
3
1
6
‑

327.
[beta]
mI

│竺一点i
と手会長会話尚一一
個別症例の推移図
1
0

t
制
量

8

告
E
4
凶

~一一~/'--"~~
1
4

28

7
0

4
2

98

Days

領服の使用
n内炎

便硲

血中

1

'‑," 曽力"

(tr 宅

一
一
了
一

1
4

2
8

4
2

7
0

98

Dayぉ
No¥Rに
も1
,̲,d • 、
,
1
:
ld

R
e
]
i
lt巳d

・ "d rate
J
¥
.
.
1

ド

圃

S
e
v
e
r
e

‑各被験者での主要評価項目の推移やどの時点でレスキュー投与されたかがわかる
&
・有害事象の重症度や因果関係を線種や色でぎすことも可能
熔

│医療政府開示よるや争議長い儲

~9

個別症例の推移図

iu\}イ~/~-~
一

1
4

一一一「一一

2
8

4
2

98
Days

「一lIi雇福岡

p
r
o
cs
g
p
l
o
td
a
t
a
=
t
e
m
p
O
ln
o
a
u
t
o
l
e
g
e
n
d
t
m
p
l
o
u
t
=
"
C
:半U
s
e
r
s平s
9
9
9
9
9平D
e
s
k
t
o
p
半e
x1
.s
a
s
"
;
s
e
r
l
e
sx
二A
DYy
ニA
V
A
L
;
s
c
a
t
t
e
rx
=
A
D
Yy
ニA
V
A
L
/
m
a
r
k
e
r
a
t
t
r
s二 (
s
y
m
b
o
l
=
c
i
r
c
l
e
f
iIl
e
d
)
;
x
a
x
i
sv
a
l
u
e
s
=
(
l,1
4,2
8,4
2,7
0,9
8
)m
a
x
=
1
2
0v
a
l
u
e
s
h
i
n
tl
a
b
e
l
=
"
D
a
y
s
"
;
y
a
x
i
sv
a
l
u
e
s
=
(
Ot
o1
0b
y2
) l
a
b
e
l
=
"
s
P
I捧痛重症度".
r
e
f
li
n
eC
M
S
T
D
Y
/
a
x
i
s
=
xl
e
g
e
n
d
l
a
b
e
l
= 頓服の使用"
Ii
n
e
a
t
t
r
s
=
(
p
a
t
t
e
r
n
=
2c
o
l
o
r
=
r
e
d
)n
a
m
e
=
"
l
"
;
1
"
;
k
e
yI
e
g
e
n
d"
r
u
n,

‑317‑

328.

[竺府… 口内実 使輯 血中コレヌチロv ル槽加 笛転憎めまL 1 4 2 8 4 2 9 8 70 D也. y o して二二二~包旦ニ二ニニニ旦笠長h凶・Mil:i・刷田弘之島型」 p r o cs g p l o td a t a = t e m p 0 1n o a u t o l e g e n d tmplout="C 平Users~s99999事Oesktop¥ex2. s a s " ; v e c t o rx = A E E N O Y 1y = s e q J x o ri gi n = A E S T D Y 1y o ri gi n = s e qn o a r r o w h e a d sn a m e = " 2 " I e g e n dI a b eI = " R eI a t e d "I i n e a t t r s =( c oI o r = bI a c kp a t t e r n = s oI i d ); v e c t o rx = A E E N O Y 2y = s e q / x o ri gi n = A E S T D Y 2y o ri gi n = s e qn o a r r o w h e a d sn a m e = " 3 I e g e n dI a b eI = " N o tR eI a t e d "I i n e a t t r s =( c oI o r = bI a c kp a t t e r n 司l e di u m d a s h ) / m a r k e r c h a r = A E O E C 0 0 1m a r k e r c h a r a t t r s =( c ol o r = bI a c k )n a m e = "4 s c a t t e rx = A E M E Oy = s e q2 I e g e n dI a b eI = " Mi I d " ; s c a t t e rx = A E M E Oy = s e q 2 / m a r k e r c h a r = A E O E C 0 0 2m a r k e r c h a r a t t r s =( c o l o r = bI u e )n a m e = " 5 I e g e n dI a b eI = " M o d e r a t e " s c a t t e rx = A E M E Oy = s e q 2 / m a r k e r c h a r = A E O E C O O 3m a r k e r c h a r a t t r s =( c oI o r = r e d ) n a m e = " 6 I e g e n dI a b eI = " S e v e r e " ; x a xi sv aI u e s = , 1 (14, 2 8, 4 2, 7 0, 9 8 ) mi n = ー1 0m a x = 1 2 0l a b e l = " O a y s "v a l u e s h i n t ; y a xi sv aI u e s =( 0t o4b y1 ) di s pI a y = n o n e k e yI e g e n d" 2 " ,γ"4" " 5 "" 6 " /p o si ti o n = b o t t 棚, r u n ; 問、政府自治体…テムの実証 SAS:l-"-~~ 口内炎 2川 便醐 血中コレステロール槽加 聞舷惜めま、 ~ ~ m G ~ このグラフが,どういったGTしで構成されているのかを i 一 一 一 凶o d ‑ iアウトプットするプログラム p r o cs g pI o td a t a = t e m p 0 1n o a u t oI e g e n d ( t m nI O l l t = " C :I I 1 1 0 A r o l l o Q Q Q Q Ql I I l 回k t o n I lA ' ?o a o " v e c t o rx = A E E N O Y 1y = s e q / x o ri gi n = A E S T D Y 1y o ri gi n = s e qn o a r r o w h e a d sn a m e = " 2 " I e g e n dI a b eI = " R eI a t e d "I i n e a t t r s =( 0 0I o r = bI a c kp a t t e r n = s oI i d ); v e c t o rx = A E E N O Y 2y = s e q / x o ri g i n = A E S T D Y 2y o ri g i n = s e qn o a r r o w h e a d sn a m e = " 3 I e g e n dI a b eI = " N o tR eI a t e d "I i n e a t t r s =( c oI o r= bI a c kp a t t e r n 司n e di u m d a s h ) 町 = A E O E C 0 0 1m a r k e r c h a r a t t r s =( c oI o r = bI a c k )n a m e = "4 s c a t t e rx = A E M E Oy = s e q 2 / m a r k e r c h l e g e n d l a b e l = " M iI d " ; 哨E M E Oy = s e q 2 / m a r k e r c h a r = A E O E C 0 0 2m a r k e r c h a r a t t r s =( 0 0I o r = bI u e )n a m e = " 5 s c a t t e rx I e g e n dI a b e1 = " M o d e r a t e " s c a t t e rx = A E M E Oy = s e q 2 / m a r k e r c h a r = 妊O E 0 3m a r k e r c h a r a t t r s = ( c o l o r = r e d ) n a m e = " 6 I e g e n dI a b e1 = " S e v e r e " ; 1 4, 2 8, 4 2, 7 0, 9 8 )m i n = ‑ 1 0m a x = 1 2 0l a b e l = " O a y s "v a l u e s h i n t ; x a x i sv a l u e s = ( l, y a xi sv aI ues=ωto4b y1 )d i s p l a y 司lOn e k e yI e g e n d' ' 2 "" 3 "" 4 " 5 "" 6 " /附S I T I O N喝 o t t 聞, r u n ; ∞ ‑ 3 1 8・

329.

~9 !医療政府関、大学によるーテムゐ実証 s … 会 ex1.sasの中身を見てみると・.. p r o ct e m p l a t e ; ①有効性の推移図を作成している G TL d e f i n es t a t g r a p hs g p l o t ; : ei n : e r a o h/ ; b e 1 a y o u to v e rI a y/x a xi s o p t s =(L a b eI = " D a y s "t y p e =I i n e a r I i n e a r o p t s = (t i c k v a l u e li s t = (11 42 84 27 09 8)v i e w m a x = 1 2 0)) 悲痛重症度 y 2 a xi s o p t s =( 1a b eI Fi t P oI i c y = S pI i t )y a xi s o p t s =(L a b eI = " B PI l a b e l F i t P o li c y = S p li tt y p e = 1i n e a rI i n e a r o p t s = (t i c k v a l u e li s t = (02468 附 叫= 1 0 ))y 2 a x i s叩 t s =( I a b eI Fi t P oI i c y = S pI i t ); 1 0)v i e w m i n = Ov i e a l "n a m e = " S E R I E S " ; s e r i e s P l o tX = A D YY = a v a l/l e g e n d l a b e l =v s c a t t e r P l o tX = A D YY = a v a l/p r i m a r y = t r u e m a r k e r a t t r s = (S y m b o l = C I R 札E F I L L E D )l e g e n d L a b e l =v a l "n a m e = "印 刷T E R " ; R e f e r e n c e Li n eX = C M S T D Y/cI i p = t r u en a m e = ' T 'I e g e n d L a b e1 = "頓服の使用 I i n e a t t r s = (C o l o r = C X F F O O O OP a t t e r n = 2 ); d i s c r e t e L e g e n d" 1 "/1 0 c a t i o n = O u t s i d e ; e n d l a y o u t ; H 、 、 m 回育問問ケ e n d ; r u n ; 一 一 一 一 一 一 口 均 一 … 一 ~9 有効性の推移図と有害事象の推移図を合成した GTLの作成 p r o ct e m p l a t e : e r a o hs u r f a c e ; d e f i n es t a t d y n a m i c ‑ t i ; K I L t ‑ ; どのくらいの比率でy①と②を配合するのかを定義 b e g i n g r a p h e n t r y t i t l e 個別症例の推移図"/; l a y o u tl a t t i c e/ ∞l u m n m a j o r b a c k g r o u n d c o l o r = w h i t er o w s = 2r o w w e i g h t s = ( . 5. 5 )o r d e r = 0 p a d = 2 0 p xb o r d e rヰ 1 ①有効性の推移図を作成している G T L ( 前賞の赤枠の部分)を貼り付ける L →次貰の赤枠部分 g 鵬 軍 事 管 霊 .I l ' . . , . e n d l a y o u t ; e n d g r a p h ; e n d ; r u n ; 幽 3 1 9 ‑

330.

一政府自治体大学による印ス払の開ムム絡会 p r国 t創咽 l a t e; d e fi n es t a t g r a p hs u r f a c e ; d y n a m i c̲ t i c k l同 t ̲ ~rn9 どのくらいの比率で.cfJと②を配合するのかを定義 I c y = : S pI I I i n e a r叩 t s = (t i c k v a l u e li s t = (114284 27 09 8)v i e w m in = ‑1 0v i o w m a x = 1 2 0)) 抑 制 s o p t s = (d i叩 I a y = n o n et y p e : ; ;I i n e a r I i n o a r o p t s = (t i c k v a l u o li s t = (0 1234)v i o 柵 I n 喝 v i o w m e x : . 4))x2axisopts=(laboIFitPoli c y ‑ ‑ ‑ S pli t ) ; V e c t o r PI o tX = A E 印O Y 1Y = s e qX O r i g i n = A E S T D Y 1Y O r i g i n = s e q/L i n e a t t r s = (C o l o r= C X O O < 以1 0P a t t o r n =1 )A r r 側、e a d s = f a l s e L e g e n d L a b eI = H R el a t e d "N A M E = " 2 " ; V e c t o r PI o tX = A E E N O Y 2Y = s e qX O ri g i n = A E S T D Y 2Y O ri g i n = s e q/L inoattrs=(C o l o r= C X O ∞醐 Patternヰ) Arr叫 heads=faIse L e g o n d L a b o l= 川 。tRolatod"刷 版="3"; S c a t t o r P l o tX = A E M E OY = s o q 2/p r川帽 r y = t r u eM a r k e rC h a r a c t e r = A . E D E0 1M a r k e r C h a r a c t e r A t t r s = (白 l o r = C X O O 目別) L o g o n d L a b e l=M iI d "胤M E = " 4 , S c a t t o r P l o tX = A E M E OY = . o q 2/M a r k e r C h a r a c t o r = A E O E D 2M a r k o rC h a r a c t o r A t t r s = (Color=C~例以lF円 LegendLabe I =~恥derate" N 馴E = " 5 " ; S c a t t o r P l o tX = A E M E OY = s o q 2/M a r k e r C h a r a c t o r = A E D ED 3M a r k e r C h a r a c t e r A t t r s = (C ol o r = C X F F ' αl O O )L o g o n d L a b o l=S e v e r e " N A M E = " 6 "; O i s c r e t o L o g o n d" 2 "" 3 "" 4 "" 5 "" 6 "/L 田 a t i o n = O u t s i d ev a li g n = b o t t 師 ∞ ∞ ∞ I i 一一一一一一一郎日一絡会 . SGRENDER を用いて出力 。 d sr t ff il e = " C :U s e r ss 9 9 9 9 9D e s k t o pp a t i e n t ̲ p r o f il e .r tf "b o d y t i t l e ; 半 事 平 平 泊目的 r op a t i e n t ̲ p r o f il e ( s u b j i d ) ; t i t l e" S U b j e c tI D :& s u b j i d ." ; p r o cs g r e n d e rd a t a = t e m p O lt e 澗p l a t e = s u r f a c e ; where s u b j i d = " & s u b j i d ." ; r u n 伽l e n dp a ti e n t ̲ p r o fiI e ; data n u l l s e tt e m p 0 2 ; c aIIe x e c u t e( ' 略p a ti e n t ̲ p r o fi I e( '1 1s t ri p( s u b ji d )1 1 '): '): r u n ; o d sr t fc l o s e : 作成したTemplate をもとに.SGRENDER .C a l lExecuteで 出力することで個々人の被験者ごkの,推移図が作成される ‑320・

331.

│鴎政府;自主伝議選鰐欝轡務ム ~Im] 拡張 ‑これらの個別症例のフ口ファイルや,背景情 報などを結合したファイルの作成 ・ハイパーリンクや見出しをつけて作成するこ とで,簡単に各被験者がどのような推移を辿 ったのか情報を見ることが可能になる |医康政府時点~長経弾事長一 Example D.moD.t. 回 0 0 1 003 004 006 007 投与野 完了Oi J Y ' j l ! : 薬 若 干 P l a c e b o Y P l a c e b o N Y 実薬書干 Y ' j l ! : 薬 事 業 年齢 6 2 5 3 48 49 48 性別 Male Male Male Female Male 併用療法併用薬 Y Y Y Y Y Y Y Y 個別研例の推移閃 ~一一~ヘ~ コ 工二二E耳 E一 ‑ 3 2 1 司 ~9

332.

│医療政府間的!こよるーマふ五十一o* 2 0 1 4 個別症例のファイルを作成するメリッ卜 探索解析を行う場合,有効性・安全性について個々の症例のプロ ファイルの検討から始めることが少なくない ・実際の個々の症例のデータを見ながら,探索解析のアイディアを 思いつくこともある .しかし数値データのみから,アイディアを思いつくのは困難 可視化が重要! 医 療 、 政 府 ・ 自 治 体 ぷ :よる口部テ i ~fj,iSllR'ÊI~äf*~*!j!r ト iLrl ~IW ←ー 嘆 誕 け ト 付 金 Conclusion ・臨床試験のデータにおける可視化の重要性 一臨床試験の結果について,数値で集計することは必 要かつ重要 ーしかし数値結果だけでは直観的な考察を得ることは 困難 • SGProcedureとODSGraphicsを用いることで,個々の症 例のプロファイルなど様々な視点からの可視化が可能 になる • ODSGraphicsによる可視化 l こより,新たな知見,アイディ アを得ることが期侍される 3 2 2 ‑ ー

333.

一 一 ‑ 自 … Eno '0 1S I l o ' e ‑ 3 2 3 ‑

334.

投与前値を含むクロスオーバー法での経時データの解析 高橋行雄 B i o S t a t研究所(株) A n a l y s i so fL o n g i t u d i n a lDataonCrossoverD e s i g n sw i t hB a s e l i n e Y u k i oT a k a h a s h i B i o S t a tResearchC O ., L t d . 要旨: 投与前値を含む経時データの群問比較において,投与前値を共変量とする線形混合モデ ルによる解析,あるいは,投与前値を各群で共通とした解析が,平均への回帰現象を受けにくく, 投与前値からの差による群間比較より統計的に優れていることが知られている.クロスオーバー 法による臨床薬理試験では,投与前値を含む経時データがしばしば得られる.同一症例内の各実 験時期の投与前値の変動が少ないとみなせるのであれば,投与後のデータのみ,あるいは,前後 差での解析を行うことの妥当性がある.しかしながら,同一症例内で投与前値に無視できない変 動があり,また投与後値との間でなんらかの相関関係があった場合には,投与前値を共変量とし た解析を行う必要がある.各種の統計モデルを適用した際に,薬剤群聞の差の信頼区聞がどのよ o rMixedModel2 e d .( L i t t l e( 2 0 0 6 ) )5 . 1節で例示されているクロス うに変化するのかを, SASf オーバー法による l秒あたりの呼吸量の経時データを用いて比較する.さらに,それぞれの統 計モデルによる誤差構造についての比較も行う. キーワード: QT/QTc試験,経時データ, MIXEDプロ、ンジャ,共分散分析,クロスオーバー法 1 はじめに ICH‑S7b iヒト用医薬品の心室再分極遅延 (QT 間隔延長)の潜在的可能性に関する非臨床的評 0 0 9年 1 0月 2 3 日にステップ 5となり,大動物を使ったクロスオーバー法によるテレメ 価」が, 2 トリー QT/QTc試験が多くの研究施設で行われるようになってきた.この試験から複数の投与前値 を含む超多時点の経時データが得られる.このようなデータに関して,どのような経時データの解 析を行うかについては適当な文献・成書がない. ICH‑S7bには,統計解析についての具体的な記載がないので, ICH‑EI4 i 非抗不整脈薬における QT/QTc 間隔の延長と催不整脈作用の潜在的可能性に関する臨床的評価 ( 2 0 0 9 ) J を参考にする. ICH‑E14の 2 . 2節 QT/QTc評価試験に iQT/QTc評価試験の目的は、被験薬に心室再分極に対する 一定の大きさ以上の薬理作用があるか否かを決定することであり、その値は QT/QTc間隔の延長と して検出される。規制当局が関心をもっ基準値レベルについては後述するが、 QTc間隔への作用の 平均値としておよそ 5msであり、 95%信頼区間の上限を 10msとするものである。」と信頼区間方 式による判定基準が示されている. 3 2 4 ‑ ー

335.

2ユ 4節の QT/QTc評価試験の解釈には, f 同様の考え方に基づき、 QT/QTc評価試験が陰性とは、 その薬剤の QTc間隔への時聞を一致させた平均効果の最大値に対する 95%片側信頼区間の上限が 10msを下回る場合を指す。この定義は、被験薬の QT/QTc間隔への作用の平均がおよそ 5msを超 えないことを合理的に保証するために選択されている。時間を一致させた差の最大値がこの基準値 を超える場合、試験結果は陽性とされる。」と判定基準を定めている. ベースライン値については, 3 . 2節 QT/QTc間隔データの解析に fQT/QTc間隔のベースライン に比しての延長は注意すべき徴候であるが、それらは平均値への回帰や極端な値を選択したためな ど薬物療法に無関係な要因による変化である可能性があるので、 QT/QTc間隔のベースラインとの 差の解釈は複雑である。 J と注意している.さらに, fQT/QTc 間隔データは、中心傾向 ( c e n t r a l t e n d e n c y ) の解析(例えば、平均値、中央値)及びカテゴリカル解析の両方の形で示すべきである。 どちらの解析も、臨床上のリスクを評価する際の適切な情報となり得る。 j と中心傾向の解析の必 要性が強調されている. 中心傾向とは,質問紙を用いた評価では「どちらともいえない」といったようなほぽ中心に回答 が集まる現象として知られている. なお, 3ユl節で「被験薬が QT/QTc間隔へ与える作用の解析 は、最も一般的には、時間を一致させた被験薬群とプラセボ群の平均値の差(ベースライン値によ る調整後)の、収集の全期間を通じた最大値を用いて行われる。」と述べられ,いくつかの例示も あるが,漠然としていてどのような解析なのかが不明瞭である. f 平均値への回帰」については, 丁寧な説明が別にされているので,一般的に用いられている投与前値を共変量とした解析でもない ようである. ICH‑E14の Q&A問 6に「ベースライン値の必要性について説明して下さい。また、ベースライ ン値が必要な場合、 QT/QTc評価試験がクロスオーバー試験と並行群問比較試験のデザインで実施 されるそれぞれの場合について、ベースライン値の測定方法を説明して下さい。」とあり,回答で は,被験薬の投与に先立って同時刻に測定されたベースライン,投与前のベースラインの 2つがあ り,スロスオーバー法では投与前のベースライを用いることが適切と述べている. これらの文脈から, f ベースライン値による調整」とは,クロスオーバー法で、は,投与前値から の差であることが推測され,投与前値を共変量とした調整ではないようである. そこで, L i t t e l lら( 2 0 0 6 )が SASf o rMixedMod 巴1 2 e d . 5 . 1節で例示しているクロスオーバー法によ る 1秒あたりの呼吸量の経時データを用いて,各種の統計モデ、ルを適用した際の,主要評価時点 における薬剤群聞の差の信頼区間について比較検討し,テレメトリー QT/QTc試験の経時データの 解析法の参考とすることにした. 2 . データの構造と判定基準 2 .1 データの概要 L i t t e l l らの呼吸機能の経時データを表 lに示す.これは,呼吸機能の改善を目的にした薬剤 T について,標準薬 S とプラセボ Pを対象にした 24症例のクロスオーバー試験の結果である.各群 s ts について, 1秒あたりの呼吸量 FEVl ( F o r c e dE x p i r a t o r yVolumei n1 e c o n d ) が単回投与前から 8 時間後まで 1時間ごとに測定されている.なお,文献では 24症例に対して 3種の薬剤をランダム に割り付けたと述べられているだけで,実験順序・時期などのデータは含まれていない. 3 2 5 ‑ ー

336.

。 表 1 FEVlの経時変化 d r u g p a t i e n t T ( a ) 2 0 1 T ( a ) 202 2. 46 3 . 5 0 2 . 6 8 3 . 9 5 2 2 . 7 6 3 . 6 5 3 2 . 5 0 2 . 9 3 4 2 . 3 0 2 . 5 3 5 2 . 1 4 3 . 0 4 6 2. 4 0 3 . 3 7 7 2 . 3 3 3 . 1 4 8 2 . 2 0 2 . 6 2 T ( a ) S ( c ) S ( c ) 232 2 0 1 202 49 2. 2 . 3 0 2 . 9 1 3 . 7 3 3. 41 3 . 9 2 3 . 5 1 3. 48 4 . 0 2 3 . 1 6 41 3. 4 . 0 4 3 . 2 6 3. 49 3 . 6 4 3 . 0 7 3 . 3 3 3 . 2 9 2 . 7 7 3 . 2 0 3 . 1 0 2 . 9 2 3 . 0 7 2 . 7 0 3 . 0 0 3 . 1 5 2 . 6 9 S ( c ) P ) P( P ) P( 232 2 0 1 202 2 . 7 9 2 . 1 4 3 . 3 7 4 . 1 0 2 . 3 6 3 . 0 3 3 . 8 5 2 . 3 6 3 . 0 2 4 . 2 7 2 . 2 8 3 . 1 9 4 . 0 1 2 . 3 5 2 . 9 8 3 . 7 8 2 . 3 1 3 . 0 1 3 . 1 4 2 . 6 2 2 . 7 5 3 . 9 4 2 . 1 2 2 . 7 0 3 . 6 9 2. 42 2 . 8 4 P ) P( 232 2 . 8 8 3 . 0 4 3 . 0 0 3 . 2 4 3 . 3 7 2 . 6 9 2 . 8 9 2 . 8 9 2 . 7 6 h I ω: l l s u o o o 口. s a s .∞m1 o u b l i s h i ng/bb u l 5 9 8 8 2 / 5 9 8 8 2 . z i p からダウンロードし整形. 表 lに示した 3例 に つ い て の 図 l に示す線グラフで経時変化の特徴を概観する.症例により 投与前値が異なり,同じ症例の中でも各薬剤の投与前値に症例間ほどではないが差があり,プラセ ボ投与以外は最初の 1時間目から反応があり, 8時間目まで継続していることが観察される. 6 6 4 4 6 5 ~:j~誌 H ト D J ~ 3 点 忌 匂 Is 2 2 。 i 。z 。。 1 ‑ 1 , … 4 6 8 t I m e 0 2 4 6 日 t i m e o 2 4 6 8 t i m e 図 l 症例ごとの FEVIの経時変化 y )の推移および投与前からの差 ( d )に つ い て 図 2 に示す. s 薬およ 全症例の経時変化の平均値 ( び T薬の投与後 1時間目で反応がピークとなり,その後 8時間目まで緩やかに減少している. p群 では大きな変動は見られない. 図 2 症例別 FEVIの群ごとの経時変化 ‑326‑

337.

2.2 信頼区間方式による薬効の判定基準 この試験は薬効評価のための試験であり,有効性判定基準がないため, QT/QTc評価試験に準じ た信頼区間方式による判定基準を次のように別途定める. 主要な評価時期に対して,試験薬 Tの片側 95%信頼区間の下限が,プラセボ Pの同時期の点推定 に対して 15%増の反応であれば,薬効がある用量とみなす.また,陽性対照である標準薬 Sに対し ても同様の基準を適用しこれを満たした場合はこの試験が適切に行われたたと判断する.なお, 試験薬 Tを複数用量設定すれば,標準薬 Sの投与量に対する等価用量の推定が可能となる. 並行群間試験の場合には,投与前値からの評価時点までの差 dを主要変数とする場合には,投与 前値を共変量として解析モデ、ルに含めること.これは,主要評価時点の反応を y とし投与前値を共 変量とした場合の薬剤聞に関する解析結果と一致することが知られているためである. なお,クロスオーバー法による実験の場合には,各症例のそれぞれの薬剤群の投与前値を共変量 としなくとも薬剤群問差の推定が適切に行える可能性もあるので,投与前値を共変量として含める 場合には,含めない場合の結果を示し,総合的な判断をすることが必要である. また,測定時点を含めた解析を追加する場合には,主要評価時点での薬剤群間差に関する各種の 推定を行い,総合的な薬効の判定に加えても差し支えない. 3 . 主要変数についての解析 3 . 1 主要変数についての解析 クロスオーバー法で、は,症例を変量効果,薬剤を固定効果とした解析が適切とも思われるが,生 物学的同等 (BE)試験では,症例を固定効果とした解析が定式化されている.そこで,両者での解析 結果を比較し結果の判定にどのような影響をあたえるのかを検討した. 反応のピークとなる 1時間目のデータを対象として,症例,および薬剤を固定効果とした 2元配 置繰り返しなしの分散分析表を表 2示す. r 平均平方の構造」は, GLMプロシジャの RANDOM ステートメントで症例を指定することによって得られる.この構造から症例についての分散成分を 計算した結果を付け加えてある. 症例を変量効果とした MIXEDプロ、ンジャの REML法(制限付き最尤法)による解析では,変量 効果に関する分散成分の出力と固定効果とした薬剤の自由度および F 値のみが出力されるが伝統 的 な 表 2 の様式の分散分析表の出力はない. 表 2 l時間目における 2元配置とした分散分析表と分散成分 要因 p a t Jen t d r u g 誤差 全体 自由度 平方和平均平方 . l8 0 9 7 . 1 6 1 3 l 2 3 2 i 2 46 7 1 9 . 9 9 4 8 4 . 1 7 3 4 41 . 33 4 . 9 9 7 4 ' F値 E J 直 平均平方の構造 2 1 3 . 0 2 ' く .0001σ e2 + 3σpatienl 2 ̲. 分散成分 0 . 3 6 3 4 2 5 5 . 0 8 く .0001σ e‑ + 2 4 σdrug 2 0 . 0 9 0 7 σe 0 . 0 9 0 7 症例を固定効果とするか,変量効果とするかで,表 3 に示すように各薬剤の信頼区間に異なる 結果を与える.プラセボ群の平均値は 2 . 8 1 5 0の 15%増は 3 . 2 3 7 3であり,であり,症例を固定効果 . 5 8 1 8,T薬は 3 . 3 8 5 5と大きく離れている.他方,症例 とした場合の S薬の信頼区間の 90%下限は 3 . 2 5 5 3と下方に広がり, T薬の場合には を変量効果とみなした場合に T薬の信頼区間の 90%下限は 3 ‑ 3 2 7‑

338.
[beta]
プラセボ群の平均値の 15%
増である 3
.
2
4
8
8をわずかに上回る結果である.

Eおよび信頼区間
表 3 1時間目における 2種類の S
薬剤
P
S
T
薬剤
S
T
S

{症例を固定効果
平均
S
E L90%
2
.
8
1
5
0 0
.
0
6
1
5 2
.
7
1
1
8
3
.
6
8
5
0 0
.
0
6
1
5 3
.
5
8
1
8
3.
48
8
8
;
SE L90%
差
0
.
8
7
0
0,0
.
0
8
7
0 0
.
7
2
4
0
0
.
6
7
3
8 0
.
0
8
7
0芸
誌0.5278
0
.
1
9
6
3 0
.
0
8
7
0 0
.
0
5
0
3
~個凪ι-ふ晶品温,晶且占晶."

j

薬剤
P
P
T

症例を変量効果
S
E L90%
.
5
8
1
6
0
.l
37
6 2
37
6.
3
.
4
5
1
6
0
.l
蜘
ー
晶 ・..圃也 圃
』
晶
凶
且
.
.
画
4

4

P群の 15%増
3
.
2
3
7
3
l.....C 晶品w品-,晶~昌司乱世担』

SE L90% l
P群の 15%
!
J
直
.
7
2
4
0<
.
0
0
0
1
42
2
3
0
.
0
8
7
0 0
0.
0
.
0
8
7
0揺 0
.
5
2
7
8く0
0
0
1浜
話0.
42
2
3議
0
.
0
8
7
0 0
.
0
5
0
3 0
.
0
2
8
8

症例を固定効果した場合,変量効果とした場合の薬剤群の信頼区間の 90%下限が異なるのは,以
下に示すように症例に関する分散成分を加味するかしなし、かによって説明される.
ま
,
症例を変量効果とした場合の分散成分は,平均平方の構造から症例の分散 dLJ

d
;
a
t =(V
pa
酬

附

‑

V
,
,
)/3=(1.1809‑0.0907)/3=0.3634

と推定できる.症例を固定効果とした場合に,各薬剤の固定 S
E
gは
, 24症例の平均値に対するも
d,'
円

のなので,
固定 SE
d
r
u
g=広万"4=~0.09石万五= 0.0615
である.これに対し,

症例を変量とした場合には,

砕u
g=~(尺 + a~atient) /24=~(0.0907 +0.3634)/24=0.1376
変量 SE

誤差分散(誤差の平均平方と同じ)に症例に関する分散成分を加えた結果となる.症例を固定効果

Eは,同ーの症例を対象として実験を繰り返した場合の各薬剤の母平均値に関する
とした場合の S
Eは,別の症例を対象にした場合となっていて,一般
ものであり,症例を変量効果とした場合の S
Eから信頼区間を計算することが望ましい.
化可能性の観点からは,症例を変量効果とした場合の S
E
d
r
u
,
!
f は,症例を固定効果とした場合でも,変量効果とした場合でも,
薬剤聞の差 S

ゾ2x0.0907/24=0.0870
群間差 SE
d
r
u
g=~2Ve /24=
と同じである.これは,異なる症例に対する実験であっても,各々の症例の反応の大きさに違いが
あったとしても,同じ症例内での薬剤聞の比較なので,症例に関する分散成分が入り込まなし、から
42
2
3であり, T薬の差の信頼区間の 90%下限は 0
.
5
2
7
8で
である.プラセボ群の平均値の 15%は 0.

あるので,ゆとりをもって T薬の薬効が証明されたことになる.
増増による評価と,プラセボと T薬の差がプラセボの平均値の 15%
増を
プラセボの平均値の 15%
用いた判定と 2通りが考えられる.どちらが適切なのだろうか.

3
.2 投与前値からの差での解析
投与前値からの差(変化量)による解析は,元データに比べて変化の大きさが明確で,相対的な
薬効の比較がしやすいとの利点もあり,また投与前値の症例聞の変動を除去できるために元データ

‑
3
2
8
‑

339.

での解析よりも望ましいのではないかと思われている.クロスオーバー法の場合は,固定効果,あ るいは変量効果として症例をモデ、ルに組み込んでいるので , SEがどのように変化するのか検討す る. 図 3 に示すように投与前と投与後の 1時間目の FEVlの聞の相関は,プラセボ群で相関係数 0 . 8 2, S薬 0 . 7 4,T薬 0 . 6 1,といずれも 0 . 5以上であるので,投与前からの差での解析が,元データでの 解析よりも望ましいとも思われる.これは,並行群間試験の場合であり,クロスオーバー試験で、も 成り立っかを検討する. rv r =0 . 8 2 / 恥 レり〆 。 2 。 3 4 5 。 2 4 6 4 2 。 。 2 。3 4 5 図 3 薬剤群ごとの投与前値と 1時間目の相関関係 表 4 にクロスオーバー法ではなく並行群間試験とみなした結果を示す.元データでの T 薬の平均 4888,SEは 0. l376であるのに対し,投与前からの差のデータでは, T薬の差の平均は 0 . 8 2 0 4, は 3. SEは 0 . 0 9 7 3と元データに比べて SEが小さくなっている.プラセボと T薬との差の SEは,元デー タで 0. l9 4 5であり,信頼区間の 90%下限は 0 . 3 4 9 4と P群の 15%よりも小さいので,薬効があるか は判定保留となる.差の差のデータの SEは 0 . 1 3 7 6で,信頼区間の 90% 。下限は 0. 41 1 9と P群の 15% よりも小さいので,薬効があるかは判定保留となる. 並行群問試験とみなした解析は,症例聞の変動が信頼区間の 90%下限の計算に含まれるために, 厳しい判定となってしまうが,投与前からの差をとることによって SEが小さくなり,信頼区間の 90%下限が狭まることが確認された. 表 4 並行群間試験とみなした解析結果 薬剤 p s T 薬剤:薬剤 s P T P S T 元データでの群問比較 平均 SE L90% 2 . 8 1 5 0 0 . 1 3 7 6 2 . 5 8 5 7 3 . 6 8 5 0 0 . 1 3 7 6 3. 45 5 7 34888 0.13761~!治活錨4 差 SE L90% 0 . 8 7 0 0 0 . 1 9 4 5 0 . 5 4 5 7 0 . 6 7 3 8 0 . 1 9 4 5三: . 03494 0 . 1 9 6 3 0 . 1 9 4 5 ‑ 0 . 1 2 8 1 , 差のデータでの群間比較 差の平均 SE P群の 15%増 0 . 1 7 9 2 0 . 0 9 7 3 l .0 4 1 3 0 . 0 9 7 3 3 . 2 3 7 3 0 . 8 2 0 4 0 . 0 9 7 3 長虻五五背骨 差の差 SE L90% P群の 15% 0 . 8 6 2 1 0 . 1 3 7 6 0 . 6 3 2 7 0. 42 2 3 0 . 6 4 1 3 0 . 1 3 7 6日 : 10 ; 4 1 0 1 4 2 2 3 0 . 2 2 0 8 0 . 1 3 7 6 ‑ 0 . 0 0 8 6 d 果空 軒 そ 開 聖 賜 毒 鉱 与 蛇 2 雄 在 ? 究 互 表 4 差の SEO.ω O 97 乃3よりかなり小さい. しかしながら,症例を変量効果とした場合の SEは 0 . 0 9 7 3 と同程度であるが,プラセボと T薬の平均値の差の SEは固定効果でも変量効果でも同じ 0 . 0 8 8 3で ‑ 3 2 9 ‑

340.

あり並行群間試験の場合の 0 . 1 3 7 6にくらべて明らかに小さくなっている. 表 5 投与前値からの差についての信頼区間の 90%下限値 薬剤 P S T 、薬剤!薬剤 P S P T S T j :症例を固定効果 SE L90% 差の平均 i 0 . 1 7 9 2 0 . 0 6 2 4 0 . 0 7 4 4 1 .0413 0 . 0 6 2 4 0 . 9 3 6 5 0 . 8 2 0 4 0 . 0 6 2 4 0 . 7 1 5 6 差の差 SE L90% 0 . 8 6 2 1 0 . 0 8 8 3 0 . 7 1 3 9 0 . 6 4 1 3 0 . 0 8 8 3 : 議0 . 49 3 0 0 . 2 2 0 8 0 . 0 8 8 3 0 . 0 7 2 6 症例を変量効果 SE L90% 0 . 0 9 7 3 0 . 0 9 7 3 0 . 0 9 7 3 0 . 0 1 5 4 0 . 8 7 7 5 0 . 6 5 6 7 SE L90% E . f 直 0 0 0 1 . 7 1 3 9 く. 0 . 0 8 8 3 0 0 . 0 8 8 3i;:~:0 .4930. < . 0 0 0 1 0 . 0 8 8 3 0 . 0 7 2 6 0 . 0 1 6 J P群の 15% 42 2 3 0. : 0 . 4 2 2 Y : 下 司 、 、 e・ 投与前からの差での解析において,クロスオーバー法の良さは実感できたのであるが,表 3 に 示した元データでの症例を変量効果とした場合の解析結果と比較してみよう.元データでの T薬の SEは 0.1376であるが,差のデータにした場合とした場合 0.0973と小さくなっている.これは,差 をとったことにより,症例聞の変動が軽減されたことによる. 症例を固定効果としても変量効果としてもプラセボと T薬の差の差の S Eは 0.0883と同じで,信 頼区間の 90%下限も 0. 49 30と同じであるが,表 3の元データで場合の 0 . 5 2 7 8よりも信頼区間の 90%下限が小さくなり,投与前値からの差による解析のメリットが見いだせない. 3 . 3 元データでの解析か投与前値からの差のデータでの解析か これらの結果を踏まえて,元データ,投与前値からの差のデータ,どちらの解析結果を用いたら よいのであろうか.あるいは併記するのがよいのだろうか.投与前データの総平均に比べ群平均が 高めならば増加量が抑えられ,群平均が小さめならば増加量は多めとなり,元データと差のデータ で、の解析結果が異なってしまう.これは,測定値がある範囲に限定されているような場合に,ある 症例の投与前値が高目に出たとすれれば,その次の測定ではそれ以上になる確率は低くなり,その 症例の真の平均に近づくことになる. 「平均への回帰」現象は, ICH‑EI4でも, 3 . 2節 の 中 心 傾 向 ( c e n t r a lt e n d e n c y ) で説明されてい るが,投与前値を共変量とする共分散分析については言及されていない.投与前値の群平均が完全 に一致していれば r 平均への回帰 j 現象の影響は受けないが,わずかでも異なると r 平均への回 帰」現象の影響から逃れない.この結果として,元データでの結果と投与前からの差での結果が微 妙にことなり,どちらか一方を使うと結果に対し,都合の良い方を使ったのではなし、かと疑われ, 併記すれば,どちらの結果で判定することが望ましいのかと,詰問されることになりかねない. 3.4 投与前値を共変量とした解析 並行群間比較試験の場合には,投与前値を共変量とすることで,元データでも差のデータでも結 果が一致することが知られているが,クロスオーバー法の場合でも一致するのであろうか. 図 3 に示したように投与前と 1時間目の各薬剤での相関係数は, 0 . 6以上の相関となっている. ‑ 3 3 0 ‑

341.

クロスオーバー法の場合には,投与前値を共変量とする場合には,各群の相関より,各症例内の相 闘が関与するようにも思われる,各症例内には 3薬剤分のデータしかないが, 1時間目のデータに ついてそれぞ、れの平均値と SDで基準化したデータについて図 4 に散布図を描き, 50%の確率楕 円を上書きした結果を図 4 に示す. 2 . 0 1 .0 ‑ 2 . 0 ‑ A‑ A' O O ZHMV 寄附 ‑ 1 .0 、 1 .5 2 . 5 Oh 3 . 5 図 4 症例ごとの投与前値と 1時間目の相関関係 投与前と基準化した 1時間目の確率楕円から,症例内での 3ポイントの相関は,正の場合もある が,負となる場合もあり,また無相関の場合もあるが,全体的には正の相関構造が示唆される.こ れらの相関構造を念頭にしつつ,投与前値を共変量とした解析を行い,結果の解釈の参考とする. 症例を変量効果とし, 1時間目の元データ,および投与前からの差のデータについての結果を表 6に示す.プラセボ群の調整平均 (LSMEAN)は , 2 . 8 2 5 2で,その 15%増は 3 . 2 4 9 0であり,表 3の l376であるのに対し,投与前値を共変量とすることによ 症例を変量効果とみなした場合の SEが 0. り , 0 . 0 9 8 8 と大幅に減少し, S薬の信頼区間の 90%下限は 3 . 5 2 2 5とかなり上回り, T薬は 3 . 3 0 7 6 とゆとりを持って上回るようになった. 投与前からの差について,もちろん調整平均は異なるが ,SEは完全に一致し, クロスオーバー 法で、あっても,元データと差のデータでも同じ結果が得られることが確認された.ただし,残念な ことに薬剤聞の差の SEは , 0 . 0 8 7 0から 0 . 0 8 5 0へとわずかな減少にとどまっている.この原因は, 表 6 投与前値を共変量, 症例を変量効果とした場合の信頼区間の 90%下限値 前値を共変量:元データ :前値を共変量:差のデータ 調整平均 SE L90%. 差(調整)[ SE. 0 . 1 7 5 9 0 . 0 9 8 8 : 2 . 8 2 5 2 :0 . 0 9 8 8 ' 2 . 6 5 8 5 … ら ー … … 叫 ぬ 3 . 6 8 9 2 :0 . 0 9 8 7 . 3. 52 2 5 1 .0399 0 . 0 9 8 7 3.474350.09881 讃甑轍!; 0.8250 0.0988' 差 SE L90%' 差の差 SE L90% 0 . 8 6 4 0 0 . 0 8 4 9 0 . 7 2 1 3 0 . 8 6 4 0 0 . 0 8 4 9 0 . 7 2 1 3 . 5 0 6 3 0.64910.0850持0 . 0 8 5 0$i9.5Q~3 0 . 6 4 9 1~ 0 0 . 2 1 4 9 0 . 0 8 5 0 0 . 0 7 2 1 0 . 2 1 4 9 0 . 0 8 5 0 ' 0 . 0 7 2 1 叩 矧了 p T E P S T一 耕 一s T S i P群の 15% 増 与 与 ω ど 3 . 2 4 9 0 ι隼 < . 0 0 0 1 < . 0 0 0 1 0 . 0 1 5 1 璽灘誠艇i 耕 一 主 主 ( 1 )15% 対 : ; ; ; ; 議 長 クロスオーバー法なので「症例Jがモデルに含まれており,薬剤群聞の差とした場合に各症例内で ‑ 3 3 1 ‑

342.

の投与前値の共変量としての調整の役割の寄与がほとんどなくなってしまったと解される. 4 . すべての測定時点を用いた解析 4 . 1 分割実験とみなした解析法の応用 並行群間試験の場合には,すべての測定時点を用いて解析を行うことで症例内の変動を抑えるた め 1時間目についての薬剤群での比較を行なう際に推定精度が向上することが期待される.クロス オーバー法の場合についても,同様に推定精度の向上があるのだろうか. 症例,薬剤,時点の 3因子をランダム化の順序を考えた分割実験として考える.各症例は互いに 独立していて,その中で 3薬剤がランダムに割り付けられ,その中で 1 ,2, . . . , 8時間目のデータ がランダムに測定されたとみなす.表 7 に 3因子交互作用まで平方和を分解した結果を示す.症 例は変量効果,薬剤は固定効果,薬剤Ijx症例は変量効果で 1次誤差,時間は固定効果であり,時間 ×症例,時間×薬剤×症例は,症例が変量効果なので変量効果となりも,同じ 2次要因内なので合 わせて 2次誤差とする. 表 7 分割実験とみなした場合の平方和 自由度 要因 ブロック, p a t i e n t l 次要因 i d r u g d r u g x p a t i e n t 2次要因 tnne t J e n t tnnexpa timexdrug xp exdrug a t i e n t ; t卸l j 全体 23 2 46 7 1 6 1 14 322 575 平方和平均平方役割 223.97 9.7378 変量効果 25.78 12.8913 固定効果 23. 44 0.5096 変量:1次誤差 1 7 . 1 7 2. 4529 固定効果 1 2 . 2 1 0.0759 変量 :2次誤差 6 . 2 8 0. 4 486 固定効果 1 8 . 2 8 0.0568 変量 :2次誤差 327.14 表 7 を 組 替 え て 表 8 に分散分析表としてまとめ直し,平均平方の構造から,分散成分計算し た結果を示す.ここに示した分散分析表は 1,2, . . . , 8時間の測定が完全にランダム化されたと みなした解析であり,そのために 2次誤差の自由度が 483とインフレーションを起こし,時間×薬 剤の F 検定が有意になりやすいとの批判があり,そのために自由度の補正が定式化されているが, ここでは言及しない. 表 8 分割実験とみなした場合の分散分析表 要因 ブロック p a t i e n t 自由度:平方和平均平方 I F :1 次 F:2次 平 均 平 方 の 構 造 2 32 2 3 . 9 7 9 . 7 3 7 8 1 9 . 1 1 σe2+24σ凹 Ht2 +80dru J ?x p a t i e n t2 l次 要 因 企u g d r u gXp a t i e n t, 2次要因tJ me 0 . 3 8 4 5 2 . 8 9 1 3 2 5 . 3 0 2 2 5 . 7 8 1 +8C drugx p a t in t2 σe2+192σdrug2+24σtimexdrug2 i 4 6 2 3. 4 4 0 . 5 0 9 6 P U H e n t 2 1 1 9 . 1 1 σf+8σ砕 明X 7 1 7 . 1 7 2. 45 2 9 38.86σ ノ + 7 2 σ time2+24σ r m c x d t g 2 t ' t i m e x d r u g 1 41 6 . 2 8 0. 4 4 8 6 誤差 49 4 8 3 3 0. 5 7 53 2 7 . 1 4 0 . 0 6 3 1 全体 分散成分 開 7.11σ ノ + 2 4 σ t t m e ' d r u g 2 lσez 0 . 0 5 5 8 0 . 0 6 3 1 批判にさらされている分散分析表をあえて持ち出したのは,平均平方の構造から分散成分の推定 ‑332‑

343.

ができるからである.投与後の全時点を用いることにより 1時間目のデータのみで推定した分散 成分よりも, 1時間目の薬剤聞の平均値に関して安定した推定値を用いることが可能となる.分散 成分の推定においては,自由度のインフレーションは,平均平方の構造に示したように除去されこ とが確認される. 分割実験型の分散分析を行う統計ソフト (GLMプロシジャ, JMPAMSタイプの適用)の致命的 な欠陥は,分散分析表における自由度のインフレーションよりも,各種の水準聞の比較にある.時 間×薬剤の 1時間目の推定値に対して薬剤群の推定平均の推定を行った時に起きる.表 9 に示す ように, GLMプロシジャの RANDOMステートメントで症例,薬剤IJX症例を変量と指定しでも, 平均平方の構造,分散分析表の F検定は適切に対応するが,薬剤群の推定平均および差の推定平均 も,すべて 2次誤差から次のように S Eが推定されているために,常に過大評価を招く. 1時間目の薬剤群の平均 S E: 長 日 ‑ ; ; , =JO.布市Z=0Ml3 = [ 2 耳石= 2x0.0631/24= 0.0725 S E 1 h,drug = l時間目の薬剤群間差の平均 S E: SE 1 山 ( d i f f ) ‑ . , / 症例,症例×薬剤を変量効果とした MIXEDプロシジャ(則Pの 阻ML指定)の場合には, 1時間目の薬剤群の均 SE: SE a;)/2 4=J(0. 3845+0.0558+0.0631)/24=0.1448 1 h. d r 噌 =~(â~α同十 â~atient'drug + 1時間目の薬剤群間差の平均 SE: S 毘E1h, d r 暗 u g 咽 ( μ 州 d d . のように,変量効果の分散成分が含まれていて,それぞれの SEは大きく推定されている. MIXED プロ、ンジャの場合には,推定された分散成分を合成した SE を算出し y 適切な推定値となる. 表 9 分割実験とみなした場合の 1時間目の水準聞の信頼区間 薬剤 P S T 薬剤薬剤 P S T P T S 1 時間目 平均 2 . 8 1 5 0 3 . 6 8 5 0 48 88 3. 差 0 . 8 7 0 0 0 . 6 7 3 8 0 . 1 9 6 3 固定 (GLM) S E L90% 0 . 0 5 1 3 2 . 7 3 0 5 0 . 0 5 1 3 3 . 6 0 0 5 0 . 0 5 1 3 ' 3: 4 042 SE L90% 0 . 0 7 2 5 0 . 7 5 0 5 0 . 0 7 2 5 05542 0 . 0 7 2 5 0 . 0 7 6 7 変量 (MIXED) S E• L90% P群の 15%増 0 . 1 4 4 8 2 . 5 7 0 3 0 . 1 4 4 8 4403 3 . 2 3 7 3 3. 0 . 1 4 4 8~ι3~2441 γ 3 1 2 3 7 3、 SE L90% P群の 15% 42 23 0 . 0 9 9 6 0 . 7 0 5 2 0. 42 23 0 . 0 9 9 6 . '0 . 5 0 9 0 0. 0 . 0 9 9 6 0 . 0 3 1 5 マ d 4 .2 時点聞の相関構造 MIXED プロ、ン、ジャを用いた経時データの解析では,各種の時点聞の相関構造を設定できるよう になっていて, L it t e l l らは,元データでの相関構造に対し,どのような相関構造が適合するか詳し く示し,図 5 に示すように投与後の各自時点聞の相関は,時点が離れるにつれて大きくなるが, 自己回帰型 (ARlタイプ)ほどではないと考察している.また, AICを用いた相関構造の選択では, 相関構造を特定しない UNタイプが優れているが, BICの観点からで貧弱な選択だと述べ,生物学 ‑ 3 3 3 ‑

344.

的な観点からの検討が必要性を示唆している. 時点聞の相関構造の選択は,多くの実験研究の裏付けが必要であり,また一定間隔で得られた経 時データでなければ適用が困難でらあり,また解析しようとしている実験データそのものから特定で きるものではない.ここでは, ( O h, l h,2h,4h,8 h ) などのように測定間隔が異なる場合でも適 用できる時点間の相関構造を平均的な相関とした c sタイプを用いることにする. 4 .3 投与前値を共変量とした解析 投与前値を共変量として変量効果モデ、ルに組み込むことにより, 1時間目の分散成分が小さくな ることが期待される.表 1 0 に示すように,が , 0 . 3 8 4 5から 0 . 1 6 6 9 と大幅に減少したが, . . .p a t i e n tは dふ g x p a t l 附および d ;の減少はほとんどなかった. 表 1 1 に,投与前値を共変量とした場合の 1時間目における各薬剤の推定値,および薬剤群聞の 差の推定値と 90%の信頼区間を示す.結果は,表 6で示した 1時間目の時点を用いた共分散分析 とほぼ同程度の結果であり,労多くして功少なしであった. 表 1 0 前値を共変量とした場合の分散成分 nρLW 果一則 効一目刈 量一町暗差 変一戸伽残 ム 前値を含まず 前値を共変量 分散成分 分散成分 変化 0 . 3 8 4 5 0 . 1 6 6 9 大幅減少 0 . 0 5 5 8 . 0 . 0 5 5 7 ほとんど変わらず 0 . 0 6 3 1 変わらず 0 . 0 6 3 1 表 1 1 前値を共変量とした場合の 1時間目の推定値と信頼区間 ‑ 3 3 4 ‑

345.

薬剤 P S T 薬剤 S T S 前値を含まず(表 9 再掲) 前値を共変量 平均 SE L90% 調整平均 SE L90% P群の 15%増 2 . 8 1 5 0 0 . 1 4 4 8 2 . 5 7 0 3 2 . 8 2 4 1 0 . 1 0 9 1 2 . 6 4 1 0 . 1 4 4 8 3. 3 . 6 8 5 0 0 4403 3 . 6 8 8 8 0 . 1 0 9 1 3 . 5 0 5 6 3 . 2 3 7 3 ;F蝉盤整H i i i : 4888 0.1448:;~呉越舷 3. 4758 0 3. . 1 0 9 1ザ錨脳 H 4 差 差 のS E L90% E L90% P群の 15% 差 差の S 0 . 8 7 0 0 0 . 0 9 9 6 0 . 7 0 5 2 0 . 8 6 4 6 0 . 0 9 9 5 0 . 6 9 9 9 0 . 6 5 1 7 0 0 . 6 7 3 8 0 . 0 9 9 6i 選 0.509Q . . 0 9 9 6r~ò":486伝説 0.4223 出 0 . 1 9 6 3 0 . 0 9 9 6 0 . 0 3 1 5 0 . 2 1 2 9 0 . 0 9 9 6 0 . 0 4 8 1 0. 4223 酎を 薬剤 P P T 寓 一田会直 事 幽 5 . 考察 TQ/TQc試験の,大動物を用いたテレメトリー試験ではクロスオーバー法での実験が定着してい t e l lらの l秒あた るので,元データが公開され,また各種の解析結果についても提示されているLit りの呼吸量 FEV1のデータを用いて,信頼区間方式による判定を行うために,どのような統計解析 が適切であるか検討した. ICH‑EI4で提示されている信頼区間方式では,時間を一致させた被験薬群とプラセボ群の平均の 比較でる.並行群間比較の場合には,症例に関する変動が信頼区間に入り込み,信頼区聞が広がる 原因となる さらにプラセボ群と被験薬群の平均の差の信頼区間は SE群間差 =~2âん印刷 /n とな り,被験薬群の例数を 2倍増やしても信頼区間の幅の d分の lにしかならない 並行群間試験の場合は,表 4 に示すように誤差分散に症例聞の変動が含まれ S Eが増大し,プラ Eにも入り込んで,信頼区間の 90%下限値を押し広げる原因となる. セボと T薬の平均値の差の S クロスオーバー法の場合は,表 3 に示したように症例聞の変動を誤差変動から分離することによ り誤差分散を大幅に減少することができる. 並行群間試験とクロスオーバー法による同時点の平均値の差の信頼区間の算出方法に明らかな 違いがあり,圧倒的に並行群間比較が不利である.これは,平均値の差の信頼区間を前提にしてい るためであり,公平な判定を行うために判定基準の明確化が必要と思われる.次のような判定基準 とすることにより,試験法による差異がなくなる. 判定 1.並行群間試験でもクロスオーバー試験でも時間を一致させた被験薬群の片側 95%の信頼区間が,プラセボ群の平均値の 10ms増しの限界値を下回る場合に陰性とする (新たに処方される集団に対する評価) J Tの信頼区間の下限は 3 . 2 5 5 3,プラセボ Pの 15% 表 3に示した症例を変量効果とした場合に薬剤I 増増しは 3 . 2 3 7 3と , 0 . 0 1 8 1上回っており薬効が認められる.ここで計算されている信頼区間は,表 4 に示した並行群間試験とみなして解析した結果と同様であり,試験法による判定に差異が生じに くい.しかし,この判定基準だけでは,苦労してクロスオーバー法で行った苦労が報われない.表 3 に示したクロスオーバー法での両群聞の差の信頼区間の下限は, 0 . 5 2 7 8,プラセボ Pの 15%増し 4223と , 0. 1055とゆとりをもって上回っており,明確な薬効が認められる.しかしながら,こ は 0. の判定は同一症例の中で比較となり,新たに試験薬が処方される集団に対する平均的な増加を評価 しているわけではない. したがって, 2つの判定を併記し,考察することを薦めたい. 判定 2 . クロスオーバー法の場合,時間を一致させた被験薬とプラセボ群の差の片側 95% ‑335‑

346.

の信頼区聞が, 10msを下回る場合に陰性とする(個々の症例に対する評価) 投与前値を共変量とすることで,クロスオーバー法の場合でも,ある時間の元データでの結果と 投与前値からの差のデータでも,表 6 に示したように投与群の SE, および群聞の SEが完全に一 致することが確認され,これにより,元データか差のデータかでの結果の不一致からくる悩ましい 問題の解決となる. ICH占 14では,中心傾向の解析のため投与前値からの差のデータについて時間 を一致させたプラセボと被験薬の平均値の差に対して多面的に検討するように求めているが,投与 前のベースライン値を共変量とした解析を標準的に使うべきである. クロスオーバー法で,時期ごとの投与前値を共変量として用いない場合に対する相対効率を Yan ( 2 0 1 1)が次のように報告している.時期数が 2の場合に相対効率は高いが,時期数が 3で,薬剤 数が 3の場合には時点聞の相聞が高ければ相対効率は上がるが,高々数パーセントでしかないこと 4930,共変量 が示されている.今回の群間差の SEが元データの場合 0.5278,差のデータの場合 0. とした場合 0.5063であり, Yanが示した結果と整合している. クロスオーバー試験では症例を固定効果とするか変量効果とするかによって薬剤群の平均値に 対する SEが大きく異なり,固定効果とした場合には, 同じ被験者に再度実験をした場合の評価と なり,一般化可能性を考えない判定になるので,推奨することができない.また症例を変量効果と 指定しでも REML法での計算を行うことが必須である. 測定時点を固定効果としてモデルに取り込む,いわゆる反復測定共分散分析の適用は,クロスオ i t t e l lらの実験データの解析では,分析精度の向上が確認できなかった.並行群問試 ーバ一法での L 験の場合には,複数時点のデータを取り扱うことによって分散の安定化が図れて分析精度の向上が 期待できるのであるが,クロスオーバー法の場合には,同じ症例に対する同時刻で繰り返し測定が 解析モデルの中で扱われており,経時データとしての解析において,分析性度の向上を見いだせな かった. 今後,さらに検討を要するが,時点を含めることにより複雑な解析を行うよりも,時点ごとある いは,数時点の平均値による解析を時点ごとに繰り返し,信頼区間による総合的な判定を行うこと を推奨する. 文献 YanZ .( 1 9 9 7 ),Thei m p a c to fb a s e l i n ec o v a r i a t e sont h ee f f i c i e n c yo fs t a t i s t i c a la n a l y s e so fc r o s s o v e r d e s i g n s .S t a t s t i c s i nM e d i c i n e .3 2 :9 5 6 ‑ 9 6 3 . i l l i k e n,G .A . , S t r o u p,W.W.,a n dW o l f i n g e r,R . D .( 2 0 0 6 )SASS y s t e m戸rMixedModels2 e d . SAS L i仕1,R.C M 円 I n s t i t u t e . 渡橋靖 ( 2 0 0 9 ),QT延長をし、かに判定すべきか:ICHE14 に準拠した臨床試験デザインと統計解析法,日薬 理誌 ( F o l i aPharmaco. lJ p n . )1 3 3,1 4 ‑ 8 . 高橋行雄 ( 1 9 9 6 ),各種の分割実験および経時測定データの解析, SASユーザ会論文集, 2 6 3 ‑ 8 6 . 高橋行雄 ( 2 0 0 9 ),薬理学研究における経時データ解析の考え方 血圧降下試験事例による解説一,日薬理 誌 ( F o l i aPharmacol .J p n . )1 3 3,3 2 5 ‑ 31 . 高橋行雄 ( 2 0 1 0 ),経時データに対する投与前値を考慮、した解析モデルの比較検討, SASユーザ会論文集, 4 5 ‑ 5 4 ‑336‑

347.

p ( p ) p a t 1e n t 2 0 1 2 0 2 2 0 3 2 0 4 2 0 5 2 0 6 2 0 7 2 0 8 2 0 9 2 1 0 2 1 1 2 1 2 2 1 4 2 1 5 2 1 6 2 1 7 2 1 8 2 1 9 2 2 0 2 2 1 2 2 2 2 2 3 2 2 4 2 3 2 平均 SD Oh . 14 2 3 . 37 1 .8 8 3 . 10 2 . 9 1 2 . 2 9 2 . 2 0 2 . 7 0 . 2 . 2 5 . 48 2 . 12 2 . 37 2 2 . 7 3 3 . 15 2 . 52 1 . 4 8 . 52 2 2 . 9 0 2 . 8 3 3 . 5 0 2 . 8 6 . 4 2 2 3 . 6 6 2 . 8 8 2 . 6 3 6 0 . 51 8 付録:データリスト s ( c ) 1h ~・0 円 2 . 36 0 . 2 2 3 . 0 3 ‑ 0. 34 1 .9 9 0 . 11 3 . 2 4 0 . 14 . 35 0 . 4 4 3 3 . 0 4 0 . 75 . 4 6 0 . 2 6 2 . 15 2 . 8 5 0 3 . 45 1 . 2 0 2 . 56 0 . 0 8 2 . 19, 0 . 0 7 2 . 14 ‑ 0 . 2 3 . 57 2 ‑ 0. 16 2 . 9 0 ‑ 0 . 2 5 3 . 0 2 0 . 50 1 . 35 ‑ 0 . 1 3 2 . 6 1 0 . 0 9 2 . 9 1 0 . 0 1 2 . 7 8 ‑ 0 . 0 5 . 31 3 . 8 1 0 3 . 0 6 0 . 2 0 2 . 8 7 0 . 45 . 32 0 3 . 9 8 3 . 0 4 0 . 16 2 . 8 1 5 0 . 17 9 0 . 57 7 0 . 33 7 Oh 2 . 30 2 . 9 1 2 . 0 8 3 . 0 2 3 . 2 6 2 . 2 9 1 . 9 6 2 . 7 0 . 50 2 2 . 35 . 34 2 2 . 2 0 2 . 7 8 . 4 3 3 3 . 0 7 1 . 2 1 2 . 6 0 2 . 6 1 2 . 48 3 . 7 3 . 5 24 2 . 8 3 3 . 47 2 . 7 9 2 . 6 4 4 . 54 6 0 3 3 7 ‑ ー T (の 1h 車10月 3 . 41 1 . 11 3 . 9 2 1 .0 1 2 . 52 0 . 4 4 4 . 43 1 . 4 1 4 . 55 1 . 2 9 4 . 2 5 1 .9 6 3 . 0 0 1 . 0 4 4 . 0 6 1 . 36 4 . 37 1 .8 7 2 . 8 3 0 . 48 4 . 0 6 1 .7 2 2 . 8 2 0 . 6 2 3 . 18 0 . 4 0 4 . 39 0 . 9 6 3 . 9 0 0 . 8 3 2 . 31 1 . 10 3 . 19 0 . 59 . 54 3 0 . 9 3 2 . 9 9 0 . 51 4 . 37 0 . 6 4 3 . 2 6 0 . 7 2 4 . 7 2 1 .8 9 4 . 27 0 . 8 0 . 10 1 . 31 4 1 . 0 4 1 3 . 6 8 5 0 . 7 0 7 0 . 47 7 ・ Oh 2 . 46 3 . 50 1 .9 6 3 . 4 4 2 . 8 0 2 . 36 1 .7 7 2 . 6 4 . 30 2 2 . 2 7 . 4 4 2 2 . 0 4 . 2 . 7 7 2 . 9 6 3 . 11 1 . 4 7 2 . 7 3 3 . 25 2 . 7 3 3 . 30 2 . 8 5 2 . 7 2 3 . 6 8 2 . 49 2 . 6 6 8 . 55 4 0 1h 虫10円 2 . 6 8 0 . 2 2 3 . 9 5 0 . 45 2 . 2 8 0 . 32 4 . 0 8 0 . 6 4 4 . 0 9 1 . 2 9 3 . 7 9 1 . 4 3 3 . 8 2 2 . 0 5 3 . 6 7 1 . 0 3 4 . 12 1 .8 2 2 . 7 7 0 . 50 3 . 7 7 1 . 33 2 . 0 0 ー0 . 0 4 3 . 36 0 . 5 9 4 . 31 1 . 35 3 . 8 8 0 . 7 7 1 .9 7 0 . 50 2 . 9 1 0 . 18 3 . 59 0 . 34 2 . 8 8 0 . 1 5 4 . 0 4 0 . 7 4 3 . 38 0 . 53 . 49 4 1 . 77 . 17 4 0 . 49 3 . 7 3 1 .2 4 3 . 48 9 0 . 8 2 0 0 . 7 2 8 0 . 58 4 ・

348.

医療・臨床研究分野における CDISC標準規格群への取り組み 大津洋 木内貴弘 順天堂大学大学院医学研究科 東京大学大学院医学系研究科公共健康医学専攻 先導的がん医療開発研究センター 医療コミュニケーション学・ UMINセンター E釘o r t st oCDISCs t a n d a r d si nt h em e d i c a la n dc l i n i c a lr e s e a r c hf i e l di nJ a p a n M . S c . H i r o s h iO h t s u, P r o f .T a k a h i r oK i u c h i L e a d i n gC e n t e rf o rt h ed e v e l o p m e n ta n dr e s e a r c hof D e p a r t m e n to fH e a l t hCommunication, C a n c e rm e d i c i n e, S c h o o lo f P u b l i cH e a l t h,TheU n i v e r s i t yofTokyo J u n t e n d oU n i v e r s i t y 要旨 医療・臨床研究分野での CDISC標準規格群がどのように紹介され、また、現状がどのような形になっ ているのか、大学病院医療情報ネットワーク研究センター (UMIN)、東京大学での取り組みを中心に取り上 げる。臨床研究における標準化されたデータ規格の取扱いは、もはや治験だけでなく広く活用されるべきで あり、それに向けて取り組みについても紹介する。 ADaM, Academicr e s e a r c h キーワード:UMIN,CDISC,ODM,SDTM, 医療・臨床研究分野での CDISC標準規格群 医療・臨床研究領域で CDISC標準規格群に触れ始めたのは、平成 1 6年度厚生労働科学研究費補助金厚生労 働科学特別研究事業「次世代医療機器研究・開発・商業科促進のための薬事承認のあり方に関する研究(主 J での報告書が先行しており、また、平成 1 7年度 任研究者:砂川│賢治 ) 日本医師会治験推進センタ一治験 T化の現状と課題(主任研究者:木内貴弘 ) J の研究の一部として、米国への訪問と詳細 推進事業 f 治験の I な報告書にまとめられている。平成 1 7年の報告については、 [古川│浩之、他, 2 0 0 6 ]を始め、 [木内貴弘、大 0 0 8 ] にて CDISC標準規格群を利用することによる統計解析業務への影響の考察など、いくつかのレ 津洋, 2 ポートとして発表されている。しかし、当時の状況では、大きなインパクトにはなりえなかった。 しかしながら、我々は、 CDISC標準規格群の影響力の大きさを見越し、継続的に海外との情報交流や、「新 たな治験活性化 5か年計画(平成 1 9年 4月実施)の中で、 fCDISC標準」という言葉を治験電子化のキーワ ードのひとつとして提案し、それを文言に含めることができた。この経緯については、 細に記載しているので、そちらを参照するとよい。 338‑ ー 0 1 3 ]に詳 [木内貴弘, 2

349.

UMINセンターを中心とする取組‑現状 近年、 CDISC標準規格群について検討・利用を開始した場合、対 PMDAとしての規格群、 CDISCSDTM/ ADaM に注目し、その規格についてのみ調査することが多い。あくまでも CDISCSDTM/ AD aMは、臨床試験を行っ た後の成果物のひとつのデータベースであり、統計解析を実施するものとしては充足するだろうが、データ マネージャー、プロジェクト担当者、システム担当者からすると、 CDISCSDTMI ADaMベースだけではあく までもデータ層のみの発想であり、通信層や定義層をカバーできていないという問題点がある。 その点、我々は、行政当局からの通知が行われる前からの活動を続けており、承認申請がある・なしに関わ らず、 CDSIC標準規格群を調査することが可能であった。従って、情報バイアスが入ることなく調査・検討 ができているといえよう。 情報の流通・情報の格納 の観点から、出来るだけ正確にシステム化を実施するため、通信規約である ODM とデータセンター (UMINセンター)を結ぶという手法を取ってきた。 UMINは、日本の研究領域では最大級の データセンター (UMININDICE)を提供しているが、他のシステムと UMININDICEを CDISCODM で通信す e v e 1d a t ac o m m u n i c a t i o np r o t o c o 1off o rCDISCODM" を るための基本的な規約である"UMININDICELower1 2013年 7月に公開しており、医療機関側からでも、他のかCRFからでも、システム対応が可能な状態にして いることが特徴的である。 また、 CDISC標準規格群を「治験J以外でも使える基盤として、平成 23年度に fCDISC標準を活用した死 体検案書の施設別及び全国集計データベースの構築Jの実施を行い、 CDISCODMでデータベースと通信を 行うクライアントソフトの構築をし、実運用に至っている。 医療・臨床研究分野でどう使うべきか? 医療・臨床研究分野では、いくつかの大きな変動があった。研究者主導治験が増加傾向であること、また、 昨年来、臨床研究における研究不正と思われる事案が複数発覚したことである。今後の臨床試験においては、 行政当局に申請のあるなしに関わらず、医療機関からのデータ提供が正しいことも当然であるが、その後の データの流れ(データの入手から解析結果の算出まで)を、これまで以上に明確にしておかなくてはならな い状況になりつつある。以前は、 EDCでの(し、わゆる)コンピュータ上でのロジカルチェックを厳密にして、 入力を制御する方向であったが、そうではなく、入力はできる限り早く行われ、変更がきちんと記録されて いること、どの情報がどういうプロセスを経て、結果として示されているのか、という点である。 その点、では、 CDISC標準規格群をフルに活用できれば、ある程度のプロセスを標準化し、最適化に向かわせ る可能性を秘めている。幸いにして、 CDISC標準規格群を使った医療機関等からのデータ収集の面では、現 状、日本が世界をリードしている。それは、前述した UMINもそうであるが、それ以外の研究機関や団体に おいても、いくつか CDISC標準規格群を使ったシステム開発を行ってきている経緯が、欧米の企業と FDA がモデルケースを立ち上げ、そこから実運用に持っていくことと逆のアプローチであるからである。 この日本流のアプローチは、実運用例を積み上げて、治験におけるデータ収集に高めていくという点では有 効な手であると考えられるが、その一方で、規格への誤解などで、同じ CDISC標準群と言いながら、亜流が 生まれる危倶も拭い去れない。統制が取れる欧米流も一理ある方向ではある。お互いに利活用していくこと O n e ‑ s t a n d a r d " な規格になるように、実務者として取り組むべきである。 で 、 " さて、今後、標準化した規格を多くの人に正しく理解して、使ってもらうためには、広く教育活動が必須で 339・ ー

350.

あると言えよう。 我々は、これまでの公的研究費を用いた研究の成果や経験をもとに、 CDISC標準規格群についての理解を含 める講習会を実施してきた。 UMIN主催のものとしては、 2 0 0 8年と 2 0 1 4年に実施したが、社会人を中心に多 I m p l e m e n t i n gCDISC U s i n g SAS:An くの参加者があり、関心の高さが伺われた。また、 SAS においても、 " E n d ‑ t o ‑ E n dG u i d e(SASP r e s s ) "を基とした CDSIC標準規格群における SDTM/ADaMの実装について、本の内 容と、近年の動向を踏まえて講義を複数回実施している。 関心のある人達への教育活動もさることながら、将来の臨床試験の姿を考えると、データ構造の標準化が一 般化することが想定される。現状は産官学の先端を目指すものとして CDISC標準規格群への理解は必要な知 識であるという認識より、本年より東京大学 医学系研究科公共医学専攻にて「医学研究と CDISC標準」を 単位認定科目として開講することになっている。 最後に若手の統計担当者・学生に対して、 CDISCADaMを理解し使ってもらうという点では、若干対応が遅 れている。この点については、東京理科大の佐野先生のグループの活動に期待したい。 参考文献 古川浩之、他. ( 2 0 0 6 ) . 臨床試験データの電子的伝達の標準化.月刊薬事, 1 2 5( 17 6 9 )一1 3 4( 1 7 7 8 ) . 木内貴弘. ( 2 0 1 3 ) . 日本のアカデミアにおける CDrsc標準への取り組み. Jpn Pharmacol Ther Vol.41 3 ‑ 1 8 . s u p p l, 1 木内貴弘、大津洋. ( 2 0 0 8 ) . CDrsc標準の現状と今後及び臨床研究データ管理・統計解析への影響. Proc 9 ‑ 4 9 . Soc ClinBiostat R e s .2 8, 3 ‑340・

351.

SASとE x c e lを用いた CDISCADaM 標準における作業効率化の試み 高浪洋平 武田薬品工業株式会社医薬開発本部日本開発センター クリニカルデータサイエンス部統計グループo Approacht oR e d u c t i o ni nWorkloadofCDISCADaMS t a n d a r dUsingSASandE x c e l Y o h e iTakanami , L t d . TakedaP h a r m a c e u t i c a lCompany 要旨 医薬品医療機器総合機構 (PMDA) より H28年度以降の医薬品承認申請時における臨床試験電子データ 提出義務化が発表され(詳細は t l t t o : / / w w w . o m d a . g o . i % o e r a t i o n s / s h o n i n l i n f o / i v a k u l i i s e d a i . h t m l参照),製薬 企業側は, CDISCに準拠したプロトコルの作成をはじめ,今後様々な業務において対応に追われること が予想される.特に,製薬企業の D M・統計解析・ SASプログラマーの担当者は,臨床試験データ標準 である S t u d yD a t aT a b u l a t i o nModel (SDTM),解析用データ標準である A n a l y s i sDataModel (ADaM) 形 式に従ったデータセット及び関連する文書 ( D e f i n e . x m lや解析関連の SASプログラム等)の作成が求め られ,今後の工数の増大は避けられない.本発表では, SASプログラムと E x c e lM e t a d a t a及 び E x c e lVBA の極めて基本的な機能のみを用いて, ADaMの D e f i n e . x m lの作成や解析及びバリデーションの実施にお ける作業効率化の試みを紹介する. キーワード:CDISC,ADaM,E x c e l,M e t a d a t a,VBA,D e f i n e . x m l,OpenCDlSC 1ADaMデータセットと M e t a d a t a 将来的に CDISC標準に準拠した臨床試験電子データを FDAや PMDA等の規制当局に提出する際に ADaMデ ータセットを作成する場合,データセットとともに, ADaMV2.1(こ定義されている各 M e t a d a t aを最終的に D e f i n e . x m lとして作成して提出することが想定される (FDA( 2 0 1 4 ),PMDA( 2 0 1 4 )).M e t a d a t aや D e f i n e . x m l の作成方法はいくつか提案されているが,本稿では, J a c kS h o s t a kら ( 2 0 1 2 )で紹介されている方法をもとに, E x c e l形式の M e t a d a t aを作成する.また,次章ではその E x c e lM e t a d a t aの情報をもとに SASプログラムによ るD e f i n e . x m lの作成方法を提案する. 1 . 1 ADaMデータセット 本稿では,表1.1に示す架空の臨床試験から得られたデータを想定し, ADaMデータセットとして, ADSL, ADAE及び BDS構造に従ったデータセットを用意する. ‑ 3 4 1 ‑

352.
[beta]
表1.1想定する臨床試験の概要

ADaMデータセットの概要を図1.11
こ示す.
デタセット

ι

ADSL:
被験者情報を格納したデー
タセット (
1症例 lレコー
ド)

内容(ー融機二叫す一二
出 UBJID

STUDYID

泊
<
X
I
STUDY‑
め
似
ぬ
<
X
I
STUDY‑
冷
似
PROD‑
泊
以ISTUDY泊
。
〈
PROD‑
ぬ
低ISTUDY‑ゆ<x
PROD‑
同
<
X
I
STUDY‑陪α
PROD‑X
XXl
STUDY‑
時
似
PRODーx
同
<
l
STUDY‑
持
制
以ISTUDY‑治
制
PROD時
一
泊
剖ISTUDY‑xx)(
PROD

PROD‑
PROD

∞
<
l
STUDY‑
ぬα

PROD‑)

有害事象の情報を格納した
データセット (
1事象 lレ
コード)

癒・未治癒判定を格納した
データセット (
1 時点・ l
パラメータで iレコード)
※パラメータは一つのみ

C
Y
S
l
l
t
l
S

問
>
k 回
"
"
,
,
町
,
‑
w
.
自
主
"
.
.
口 m.

Commonc
o
l
d
A
cuteab
由 m明
Commonc
o
l
d
宰
0
.
写t
n
c
p
o
l
y
p
H
e
d
d
d
c
帽
f
1
C
o
n
s
t
l
p
a
t
U
J
P
d
r
o
n
y
c
h
l
.
:
Epl~astflc d
陪 凹m
ft
r
y
ne
司l
e
r
o
s聞 n

AOY

"

2
9
2
9
1
5
1
5
1
5

Mal
l
c
f
y
‑
¥
l
l
l
er
s
ssyndr口~

"
"
'
,
同
"
y
噌 111$
"'副~'"

C
α"lSt
i
p
d
l胞内
宙 開Y
由 a
P
草昌s
t
n
c
d
l
s
c
o
m
f
o
r
t
E
P
I
'
円~''''田 l 号『目的門

A
O
Y
L
1
3
3
0
3
0
1
6
3
0
3
0

咽
。rrhoea
A
問
>
kclaareata
A
c
u
t
ed I 油 開 n
N
a
s
o
凶<<y' 1
1
1
$
G
a
s
l
n
cp
o
l
y
p
s

町

四
円 ,

ADEF:
BDS構造で,疾患 A の治

AEDEOOD

AETERM
I
I
I
S叫 .
D
r
d
r
r
十旧"
A C
l
e
l
a
r

Ic阿

SUBJID

時
以ISTUDYゆ<
X
I
9
0
0
1
0
0
1 9
0
0
1
0
0
1
時
抗ISTUDY‑治
以19001002 9001002
PROD沖
似ISTUDYぬ
似19001003 9001003
PROD‑
泊
。
<
l
STUDY‑
沿
<
X
I
9001001 9001001
PROD時
保ISTUDY勾
泊
。<
1
9
0
0
1
0
0
5 9
0
0
1
0
0
5
PROD沖
似ISTUDY‑治
以19001006 9001006
PROD 時
保
!
S
TUD
子
治
<
X
I
9001日07 9001007
PROD‑
ぬ
<
X
I
STUDY
一
泊
。
<
19001008 9001008
PROD
一
泊
<
X
I
STUDY‑
XXXl9001009 9001009
PROD‑
時
伐ISTUDY‑地
<
X
I9002001 9002001
PROD‑
ぬ
<
X
I
STUDY‑
時
<
X
I9002002 9002002

PROD‑

PROD‑

PRODー
)
(
)
収I
STUDY‑
玲<x

ADAE

同品川、

PARAM
a
s
eA
1陶 .
1
a
s
eA
1
10 " A
叶 3ト桂昌l
A
1ト4
開 l
10
A
1Hea
l 0
1D
l
s
e
l
l
s
eA
ー" H
曹昌 1
0
' 1Os
e
d
s
eA
1H
1D
l
s
e
d
s
eA
1Hed
l
i
r
曜 o
lOs
e
d
s
e向
IHed
ll
l
'
11
0
10時 e
d
s
eA
ln
c
:0
1O
i
s
e
畠" A
1Hed
IHed
l 0
1O
l
s
e
d
s
eA

旬
,
問
。
,
j
Q
暗
号
憎
山
崎
町 置
拘
,
冊
目
j
Q
,
芭
曲
芸
,
同
町 叩
.
"
哩
噂
町
口,
同
│
問
。
,

叶. f
恰a
h
r
唱 o
f0

町

901S11RIDLiGE70YEAARGSEU
9001

53 YEARS

9日日 1

5
6 YEARS

9001

62 YEARS

9001

7
8 YEARS

9001

6
1 YEARS

9001

3
8 YE内RS

9001
9日日 1

76 YEARS

3
8 YEARS

9002
9002

AEPTCD i
A
E
"
コ
D
S
可$
1
0
0
1
1
7
8
1f
i
f
e
c
l聞 草 加d
r
n
f阿 a
tlQn
s
1
0
0
1
2
7
3
5G
a
s
l
r
O
l
n
t
e
s
t
ll"Jdl
d
l
s
o
r
也"
1
0凹 1
7
6
1 $kl
na
r s
u
b
c
u
t u
s
t
l
s
s
u
e
おn
d
l
s
o
r
1
0日2
6
7
1
2
s
tl
f
1d
l
d
r
sr
d
e
r
s
1
0叫 刷 1
0I
nl
e
c
t
r
o
n
sa
n
dI
O
t
e
s
t
a
l
r
1
0日日日 5
4
7G
a
s
t
t
O
l
n
t
e
s
t
l
t
l
a
ld
r
s
1
0
0
2
8
8
1
0i
1l
e
c
t
l
o
n
sdI'世阿国凶附畠
1
01
)1
]
8
1
7 s
l
r
o
l
n
l
e
s
tll"la
ldls町d~ ,
1
凹 1
9
2
1
1N
e
r¥
lo
u
ss
y
s
t
e
md
l
sd
官官
!
日
目1
日7H GðslrOlntestlnðldlS口,~,
1
0
0
3
4
0
1
6 ~fecll口ns ondI
n
f
e
1
0
0
5
3
1
5
5G
a
s
l
r
o
l
n
l
e
s
t
l
n
a
l
d
l
s
o
r
d
e
r
s

咽
G
a
曲
目
刊
号

G
a

釦
牢
口
口
町
"
口
,
,
'"

6
7 YEARS
37 YEARS
AE8DSYCD
AEllT
1
0
0
2
1
8
8
1C
.
"
s
t
l
t
l
s
a
1
0
0
¥
7
S
4
7D
l
d
r
r
t
祖国
!
日
u
4
日7
8
5A
I
叫渇c
r
d
d
r
e
d
t
a

ロ
.
,

町

口
出
町
田
,
,
円
町

,口
割
引
町
"
'

町

1
2
0
6
2
7
7
3
R
m
E
e
S
d
P
i
a
H
s
t
t
l
n
a
y
│
d
h
i
s
o
v
r
a
d
e
e
l
r
C
s都世
PAR向同COI PARAMN
H
E向L
H
E向t
H
E肉L
H
E
A
L
H
E
A
L
H
E
A
l
HEAl
HEAl
HEAl
HEAL
HEAl
HEAl

内V
Al

AVAlC
2
d
1 a
l
e
d
1
2 凶討h
e
a
l
e
d
1H
他・除d
1Hea
l
e
d
u d
l
e
d
IH
e
d
l
e
d
1 a
回
IH
e
dl
e
d
1Hea
l
e
d
1H
e
a
l
e
d

出
岡
山
同
憎
.
I
o
d

,咽
吋
憎

口

1
0日1
河口 M
o
l
l
c‑
W
e
l
s
s
s
y
n
d
rm.
1
0
0
2
1
8
8
1 Commonc
o
l
d
1
0
0
1
7事4
7A
cu
l
eめ domen
1
0
0
2
1
8
8
1 Commonc
o
l
d
1
日
目1
7
9
4
7G
a
s
t
r
l
c
p1
>
'
0
'
1
0
0
2申2
0
5H
e
剖a e
100179~7 C
開 討i
p
d
t
l
o
n
1
0
0
2
1
8
8
1P
o
h岨
100'79~7 E
p
la
s
l
t
l
cd
回c
o
m
f
o
r
t
l
0
0
a
a
7
3
8 '
S,"唱 .
.
1 o
S
l
o
n

A¥
I
l
S
!
T
W毎回k1

AVJSπN

桃色""

Wee
k8
楠""
愉l
e
e
k
'

Wee
k8

仇
"
"
"
4
情依

Wも
"
"
Week2
Wee
l
<
.4
執e
'
e
l
<
.8

A
N
L
0
1
F
L

,Y

3Y
、4
Y
3Y
• y
2Y
y
• y
2Y
Y
• Y

,
,
,

図 1.lADaMデ ー タ セ ッ ト の 概 要

1
.
2 Excel形式の ADaMMetadataの作成
ADaMでは,以下の M
e
t
a
d
a
t
aが定義されており,最終的にこれらの情報を D
e
f
i
n
e
.
x
m
lに格納する必要がある.
種

Ana
l
y
s
i
sD
a
t
a
田 t
M
e
t
a
d
a
t
a

I解析用データセットの一覧と概要が記載されたメタデータ

An
削
等の情報が記載されたメタデ一夕

A
n
a
1
y
s
i
sP
a
r
a
m
e
t
e
rV
a
l
u
e
‑
L
e
v
e
lM
e
t
a
d
a
t
a I各解析パラメータの導出方法等の情報が記載されたメタデータ
A叫 s
i
山

T
七こ井苧ヂ一ヲ
表 1.2ADaMの M
e
t
a
d
a
t
aの概要

‑
3
4
2
‑

353.
[beta]
1.2に加えて, Define.xmlを作成する際にはコードリストの情報が必要なため,同様に作成して管理してお
くと効率的である.本稿では, JackShostak ら (2012) の方法をもとに, Excel形式の Metadataの一部として,
A D a Mデータセットで用いられているコードリストの一覧も Metadataに含めて作成した.各シートのイメー

ジを図1.2に示す.
AnalysisDatasetMetadataシート・データセットの一覧
K
o
yy劃句ゐi
時

A国 L

凶
2
B 国
鶴岡 九 e
を
n
<n
回
き
世
間
四
曲S
1
a
h
t
u
一~闘ZSU.D
S~hl竺E議向F匁"中2 金""'"民酔B望匁羽!坐田唖伺区坦准一塑機坦認旦竺聖識竺竺塑蜘堅一(一坦王省監一生
B
J
I
D

ADAE

Ad

E
開
,tA甜 pisD副島曹t

A
D
A
E
.
x
p
t

ADEF

生
園y盟 D o t 闘 を 加 T...,tD悶 健

A
D
E
F
x
p
t

D
豆
u
型.醐
ど

工醐l
bS

h山

咽古書

主""‑

童謡鳳

ADSL
ADSL

臨
魯

"'.じ釦省

沼!x

A
D
錨L 盟"""
AJ)磁L R
A
C
室
A
C
D
O
ADSL R

司 令 昨

ADIL

τ
R
τ

e

'
"
'
t
酎

.
R
o
o
・
1
'

組
z
・
.
.
t
回

園
田
甲
唱
団
出fP1皿E叫 ん 唖
D

'
"
'

出 明

別凶~Treumen(

(
.
J
.
G
W
)

A
G
:
思J

込

SEX

>F...,岨t.
,
R
A
C
E

:-M~le

=<
R
A
C
E

0
.
,
.λ
ル
唱
宣
F
w
'
A
、
司
.
0.B
ー
訟
唱
A
.
B
:
,
‑
1
)
.
,
司

RACE
お

~C

…
惜祖

恒国

B

1F

"
:
c

"

C

"

S~C

、
1

"

主匝

別
凶
凶
・
.
dTru .
t(N)
'
"
叫
すz
.
'
"
祖1Tn. .'0。

R
τ
c占A..'<
A
D
鋪L T

"
o
c

も

総 樋...

8

j(

'
"
'

こ
む

S.~0

l
n
a
p
r

s

IC

‑

.
匝
割
四 .n ・
‑
一'
Mrnτ"τD
長
国
』
園
田 D
DMt
:
宮
町
田D
mほSL1lJID
DMSfτED
'
"
曲
園
田
璽
明
頑
固
闘
‑ DM.AGE
長
由
創
価
臨
調
宮
M
.AG
E
.
.
.
.
由
園
町 D
DU
A
・
.
.
・
4
:
L
M
R
A
C
E
h・
"
"
"
'
" D
‑t
f
D
MR
.
λ,
C
E "AS!AN悶
A
絹吋
・
,
?4艇
鋼
崎
宮
p
"
,
"
回
開
聞 DMAR..¥
l
( n
l
"
OA
R
M
‑
'
宮
回
・F
l
i
l
u
r
e
"
)
1
do
;
.
.
t
A
R
.
.
¥
t
C
J
)
a
‑
"
D
r
司
.
¥
.
"
A
鋼
管
罰
岨 ,
!
:DMARMC
I
:
T
‑
"
D
r
唱B
"
DMACT
A
R
.
.
'
f
(
田
措
置
事 iiOM.ACτARM='"
S
世
・
岨 f.
w
u
r
e同}
:
.
.
e
n
,
A
相
2
・
'
0
.
,
.
'
伺 ....

受--・~

"
"
:
c
。

却
駐

忠岡

1

'
R:
‑
Cつ
A
D
哩
Lτ

AD
包

S
A
P
,
ADEF踊

B
D
S

c
o
,
必lbtJC
・,a・
.
.
.
. C剥
岨
組 N,
同
刷 . 0riP
τ‑
"ト

亀~,

,~,

匂揮官)

;
u
.1
創
)
J
¥
,L ,

s
n
Th
f正 血 血

v
回
.
.
地a
F
e
"
m
M
‑
e
'
τ
‑
)
1
'
",~--: 一
J
L
唱.
幽
例
.
一
.'
t
皿
出 事

A
G
E
じ

間制温 USUBJID
立 SEQ
U
S
U
B
,
D
I
1
1
皿001""叫
J
'
d
,
開
笹
田
'
"
PA
R
.
A
.
¥
!
C
D

悶 悶 吋 阿 哨 岡 阿 国 . 喧Z

CIu
.
.
(
。
町
咽
融
毘
句
錫
帽
'
A
D
D
U
S
L
掴4
・E主主 AD乱
闘S
A
D
A
玉舗盛
担担
日c
凶
岨y"",,,錨匙fedDRAVXX.
x

ADSLデータセットの変数一覧 (ADAE,ADEFも同様に作成)

出
塁
エ
A
D
鉱
ー
鋸
)
J
¥
,
L

興噌'

醐間

む

ADSLシート

A
D
底L

間

&苫倒的

AXM

醐

T
R
τ

勤可

A

DM. 3E..."{~"F"

~

DM.~"'l

誕

血 血

τU
l
I

‑
,
l
"
'
D
n
哩
A
,
1
=
唱
r
DB

τ
玄T

一一

阪可

'
C

$EX

:,fD~IS主.:xz"~r'

~

τ
R
1
ち
;

E

お曲0・~

""噂副.

Codelistシート:コードリストの一覧
C剖
I
e
Va
I
u
e

CodeT
田t

SEX

F

F古
田
I
e

t
田t

箆X

:M

~iaIe

旬
:
x
t

経 XN

1

Male

In
t
e
!
!
e
r

狂 恋4

円
~

Fe!国l
e

血 t
e
!
!
e
!

H罰 t

Nam
語

官
腸

AGEU

主ARS
E

ARM

D
r
w
!
:A

組 M

Dru~B

ARM

世
田nF.拍m
S

τRT

D
n
塀A

TRT

阪 u書B

TRTN

I

D
r
u
異A
D
r
u
eB
S
c
r
e
田F必 邸 宅
Dru
eA
Dru
gB
Dru
eA

τRTN

2

Dru~B

一

D由 T議
五
五

t
e
x
t

田t
t
t
回 t
t
田t

田t
t
国t
t
詑e
r

In
t
偲百

ValueListシート:解析パラメータの一覧
Da
tuet V
.
r
i
a
b
l
t

Name
'
I
.
.
A
D
E
F
.
A
¥
'
.
牟札

ADEF

Name
AVAL

l
>
l
鴻
V
a
r
i
a
1・
b
e
l

牌 出 血r
金獲議
F首 .
.
.
e
侵
t
H奪 nriabl~ Com

A
m
町
田 V曲m PAR.主主ICD

r
;

Pua
・揖酎嘗

Y副首1>1.

趨偏露

Tn
栂

F
o
n
a
a
t
8
1
1
.
0

m
t
句問

I
I
E
A
L

・

到 噌1T

L.
可也

An
alysisResultsMetadataシート:解析結果メタデータ

F
4
話
量
ミ

民吻t.
y~a血E

r
i
t
岨
勾
ぶ
内
一t
月
初
'
!
'
・糸

.認~

・

明'

唱
..

戸官加盟雌s

叫
凶 .TRTI円Fl="[沿曙 A 2=τ均百~B" ;
'
.
J
生一DEF
油
田 F.i姐fL.y副自主主"'"量 1.
凶
"
"
加官圃 T
R
T
P
N̲
T
R
τ
P
F
.
;
岨
戸'OCf
o
r
m
a
t
r
u
e
̲
T
R
T 1
‑刷
由
理 A"1="D
r
哩 B";
=;
伊
悦
.
.
.
却̲
̲
.
‑
¥
D
心ι
.
I
D
E
F
;
whm!P
P
R
O
'
百工宜‑y"", p
皿
A
.
¥
,
C
.
i
ーI
,
o
b
lA
¥
1
S
I
T
・
TR
1
'
F
.
o
'.
A
Y
A
L
Ci
1
平
田
f
町
田tTRTPS̲TR.TPF.;
,
間
M

T
a
b
i
e
l

D国
皿 A出血組事 b悟
町
S
t
u
d
y
V
W
I(F均

E
歪A
L

A
¥
'
且
,

D
E
F
p
"
叩 阻 嗣m
S
A
PA

H.
.
.
.
唱
,
,
0
,
田
昌
<
A E韮AL

A
可
¥
,
'
.
o
U
.

p
を,P開
制 m山

H岨明。ro岱値~A

F
A
SFl
‑
'
r鑑話
臥
五
町
田 1M姐
P
A
A
¥
1
5
π'N=4

=;

S
A
P

戸現量司副P"̲ADa..

宵

¥
'
l

T
・
b
l
e
1

旭
町 ....by
D醐 提 Al
S凶今、,~tsit 伊田》

A
D
E
F

J
>
l
'
R
O
'
古 1
守
・'''ar泌
P
.
‑
'
¥
R
.
A
.
.
¥
.
C
可
ー 1.
.
.

S
A
P

A可~1S打N ・ 4

担

ri:虫歯膏骨低唱

図1.2ExcelMetadataの概要(ファイル名:Run SAS.xlsm)
次章では,これらの ExcelMetadataを用いて,

A D a Mデータセットに関連する作業の効率化を提案する.

‑
3
4
3
‑

354.

2E x c e lVBAと SASプログラムの連携による作業効率化の試み 本章では,第 1章で作成した ADaMデータセットと E x c e lファイル形式の Metadataの情報から, VBAと SAS を用いて Define氾 n l及び解析帳票の作成,さらに OpenCDISCV a l i d a t o r (以下 OpenCDISCl によるバリデー 1,こ示す ExcelVBA実行用のシートを ExcelMetadataのファイルに順 ションを実施する方法を提案する.表 2. 次追加し,それらのシートから VBAを用いて SASを実行する. VBAによる SASの実行方法及び SASによ D e f i n e . x m l( 図2 . 6 ) D e f i n e . x m lファイルを作成するための情報と SAS実行ボタンを配置する. SUMMARY ( 図2 . 1 0 ) 被験者背景等の要約表を作成するための情報と SAS実行ボタンを配置する. AE ( 図 2. 10 ) 有害事象の集計表を作成するための情報と SAS実行ボタンを配置する. 図 2. 13 ) V a l i d a t i o n( OpenCDISCを実行するための情報と SAS実行ボタンを配置する. . 1SASを実行するためのシート名 表2 E x c e lMetad 旧切に含まれる各シートと, VBA及び SASの実行時のイメージを以下に示す.表 2 . 1の各シート から VBAを用いて SASを実行する. E x c e lMetadata An a l y s i sParameterV a l u e . L e v e lMetadata SASProgram 図2 . 1E x c e lMetadataのシートと処理フロー 2 . 1 フォルダ構成 r c :¥ temp ¥SUGI 2014J フォルダの下に関連するファイルを全て格納して管理する. ADaMデータ 本稿では, . 2に示す. セット, Metadata,作成されるファイル等のフォルダ構成を図 2 上 刊以行 i 後 J よポぷ… フオノレタ'名付 ぇ 概要 唱M 日 目 F 引句 ム" 河 タセットを格納する. D a t a ADaMデ ムDe f i n ex m l D e f i n exml D e f i n e . x m lファイルを作成するプログラムと結果を格納する. 長 ωg Log プログラム実行時のログを格納する. 乱1 e t a d a t a 第 1章で作成した E x c e l形式の M e t a d a t aファイルを格納する O u t p u t 解析帳票や OpenCDISCの実行結果を格納する. 長 D a t a 長 Me 回d a 回 事 O u t p u t • P r o g r a m s P r o g r a m s 図2 . 2 解析帳票や OpenCDISCを実行するプログラムを格納する. r c¥temp ¥SUGI 2014J フォルダ内の構成 344‑ ー 口でし

355.

2 . 2ExcelVBAによる SASプログラムの実行 E x c e lでは, VBAとフォームのボタンを組み合わせることで, SASを実行することができる.本稿では,森 岡 ( 2 0 1 3 ) が紹介した方法を用いて,以下のコードを「実行」ボタンに実装した.図 2 . 3では,シートに配 e f i n e氾 n lを作成する 置した「実行 j ボタンクリック時に SASが起動され, %incステートメントで, D fMrD e f i n e . s a s J という SASプログラムが実行される. 実行ボタンのフォーム VBAのコード S u bS A S ̲ R U N 3 0 D i ms a s o b jA sO b j e c t S e ts a s o b j =C r e a t e O b j e c tC "S A S .a p pI i c a ti o n " a l s e s a s o b j .V i s i b l e=F s a s o b j . S u b m i t( " 唱i n c' C平T e m p 平S U G I2 0 1 4 平D e f i n ex m l半M r̲ D e fi n e .s a s '; " ) " EN D S A S ;" ) s a s o bj .S u b mi tC E n dS u b 実行 図2 . 3E x c e lから SASを実行する VBAマクロ 2 . 3 SASによる Excelデータの読み込み SASの l i b n a m eステートメントの e x c e lエンジンでは, E x c e l形式のファイルをライブラリ,各シートをデー x c e lファイルの情報を入出力で、きるため,非常に有用な機 タセットとして処理を行うことができ,容易に E 2 0 1 3 ) ,高浪ら ( 2 0 1 2 ) ) .プログラム上では, l i b n a m eステートメントに E x c e lファイル 能である(森岡 ( のフルパスと e x c e lエンジンを指定し,シートを読み込む際は ' fシート名 $ ' n J と記述して,各シートをデー C o d e l i s t J シートを読み込むプログラム タセットのように扱うことができる.図 2.4では,図1.2に示した f と読み込まれたデータセット fCODELISTJ を示す. * ‑ ‑ ‑Metadataf il e I i b n a m e M E T Ae x c eI" C半t e m p 半S U G I2 0 1 4 平M e t a d a t a半R u nS A S . x l s m * * *Excelから CodeIi s tシートをデータセットとして読み込む, d a t a C O D E L IS T s e t̲ M E T A .' C o d e li s t $ ' n; r u n データセット rCODELlSTJ (一部抜粋) CodeValue Name SEX SEX SEXN SEXN 《白 EU F M 2 CodeText Female t e叶 Male Male t e x t I n t e g e r Female DataType I n t e g e r t e x t YEARS DrugA DrugB DrugA ScreenF a i l u r e DrugA ScreenF a i l u r e DrugA t e x t t e x t TRT Drug日 TRTN TRTN 2 DrugB DrugA Drug自 t e x t l 円t e g e t I n t e g e t ARM ARM ARM TRT Drug8 t e x t t e耳t 図 2. 4l i b n a m ee x c e lエンジンによる E x c e lファイルの読み込み この方法により, E x c e lの各シートに格納されている情報を容易に SASのデータセットやマクロ変数として 利用することが可能となる ‑345‑

356.

2. 4 SASプログラムによる Define氾 nlの作成 J a c kS h o s t a kら ( 2 0 1 2 )は , E x c e lM e t a d a t aを SASで読み込んで D e f i n e . x m lを作成する方法を提案した.また, 高浪 ( 2 0 1 3 )は , HTMLA p p l i c a t i o nと SASを用いた GUIベースでの D e f i n e . x m l作成方法を提案したが,本 x c e lM e t a d a t aを使用し, VBAから SASプログラムを実行して D e f i n e . x m lを作成する方法を提案する. 稿では E i D e f i n e . x mlJシートによる D e f i n e . x m l作成フローを図 2 . 5に示す. E x c e lf i l e i D e f i n e . x mlJシート SASで i D e f i n e . x m l Jシ ートを読み込む パラメータ入力後 「実行」ボタンクリック SASで ADaMの D e f i n e . x m lを作成 . 5D e f i n e . x m l作成フロー 図2 続いて i D e f i n e . x mlJシートのレイアウトを以下に示す. I t em列 l こは各ノ fラメータの概要, V a l u e列には選 択されたフォルダ、やテキスト入力及びリスト入力によって値を入力する. MVNAME列は, SAS実行時に格 納されるマクロ変数の名前となる. V a l u e列に出力フォルダと必要な情報を入力し i 実行」ボタンをクリッ . 3で示した VBAが実行され,続いて D e f i n e . x m l作成 SASプログラム iMrD e f i n e . s a s Jが E x c e l クすると,図 2 M e t a d a t aの情報をもとに ADaMの D e f i n e . x m lを作成する.HTMLファイル及び A n a l y s i sR e s u l t sM e t a d a t aの作 Y e s ) を指定する. 成の有無も指定可能となっているが,ここではどちらも作成 ( 象 l 滋闇龍 繋 P a t ho f! v ! a 血f o l d e r ( " t e m p "f o l d e ri nt h i sf o l <l町也叫4間 的 h 、 今 賞 i 定 、 。 一 町 l 撃凶圃ぶ九、 込 i ' ̲ 2 0 1 4 'Def i n e ̲ ","凶加 CcTemp'SUGJ ♂、 ♂ 払 ? 、 宮 d 参照 ぉαyyy S 位活y , ' P r o t 目 。I~畑悶 〈 崎 え STVDY C r 柑任回 o fDe勉e . h t m l( ! v ISXSL田 es 加u l d開 封 坦 t h e" f i I e . "f o l d e r . ) Y e s m乱立 Cr 闘争回 o fA 凶 y 拙 R 田凶 t s M e t a d a l a . A . R . ' ¥ I Y e s ~IT I 図2 . 6D e f i n e氾 n lシート e f i n e . s a s J の一部を以下に示す.パラメータを E x c e lシートから読み込ん 実行される SASプログラム iMrD だ後,順次必要なタグセットを出力していくプログラムが繰り返される. ********本* H e a d e ro ft h eD e f i n eA D a M . x m l *存率**キキ*** f i1 e n a m e H"品 C P A T H半t e m p ¥ ( ̲ h e a d e r .t x t " d a t a H E A D E R f il e H D T=p u t ( d a t e t i m e ( ), E 8 6 0 1 D T . ) p u t' く つx m lv e r s i o n = " 1 . 0 "e n c o d i n g = " U T F ‑ 8 "ワ)' p u t' く? x m l ‑ s t y l e s h日e tt y p巴= " t e x t / x s l "h r e f 二" d e f i n e 2 ‑ 0一oM O 臼x s l "つ)' p u t' く φ 0 D 聞Mx 畑m l 川 n s ド= " h t t 句p : ν / 川剛 . c 吋d i sc0 町r g ν / n s ν / 0 吋d m / ν 1 ν / v け 1 .3 γ " 叫t' x m l n s : d e f =勺l t t p : / / 剛 W .c di s c .o r g / n s / d e f/ v 2 .0 ' " p u p u t' x m1 n s: x1 i n k = " h t t p :/川WW.w 3 .o r g / 1 9 9 9 / xI i n k ' " 出i f& ̲ A R M二 1首t h e np u t' x m l n s : a d a m r e f = . . h t t p : / / w w w . c d i s c . o r g / n s / A D a M R e s / D R A FT . . p u t' O D M V e r s i o n二 " 1 .3 .2 " p u t' Fi 1 e O1 D 二 ' " " &S T U D Y ‑ D e fi n e ‑ X M L2 .O .0 ", ' " p u t' F il e T y p e = " S円a p s h口t " p u t' C r e a t i o n D a t e T i m e = DT+(‑1)'" p u t ' O r i g i n a t o r = " C D I S CA D a MM e t a d a t aT e a m " ) ' put' < S t u d yO I D = ' " " & ̲ S T U D Y "' ' ' ) ' l o b a I V a r i a b l e s ) ' p u t ' くG p u t' くS t u d y N a m e ) '" & ̲S T U D Y ", く/ S t u d y N a m e ) ' p u t' くS t u d y D e s c r i p t i o n ) '" & ̲ S T U D YD a t aD e f i n i t i o n "' < / S t u d y D e s c r i p t i o n ) ' p u t' くP r o t o c o I N a m e ) '" & ̲ S T U D Y "' < / P r o t o c o I N a m e ) ' ∞ 目 町 ‑346‑

357.

︐ ︐ 'w ﹄ E ︐︐ ふE ︐ W.i'1t 2u' H 問 い ︾ b n H ﹄nJ'‑ ‑ F n v 目 一 e 巴 nHν.'' . a nHnnH po‑‑‑ nun干 ︐ nuρ t lnu 唱 +L ︐︐ nhu‑‑laa ﹄ . ︐ 官 E n川 + E ・ 目 M mm 回' 目 9 u ' ' ︒ ap?ihHυ'M ︑︑/ nueHnuw Amnu'nu‑‑‑nu ・‑一 v v 'anunuum‑‑ HHuqaw ふ Haaγ'anJιnHU 一 同 Hu'oan‑‑al TEEMVEMnυoueo pahulm ﹁ HHν'CU9uau oa丁 目 HruNuv wqυ=eJU d 一n H v r r 'oιunuouqaao ‑w‑llnHanuJnu uv+Lilnn nu'nμzr'aa MmMle+L+ι w=rnunbnb =aupu ﹄ ・ 1 ' vv‑ n Hu︑ nuH ・ 8一 n nH 一 D HO p b 内 d n u m S 4 a pS すF T 'VBE‑‑Gouau auou ︐ . nuιnu ︑ ﹀ 〆 n HVMN nHu.nu︐ aunH ' l o ι k u ‑ ‑ ‑ 角︒内 gUpo ‑‑lvt v t U aHV Hu'aa lt‑+E 〆︑/¥ LUnu nvau ‑‑+L nhuab //HM川 川 ''''''' H U UHUHUHUHUHu nvnド nvnvnド nvnv 十 ︑ +L+L+L+L+L+L r u n. 図2 . 7D e f i n e氾 n lのヘッダ一部分作成プログラム(抜粋) e f i n e . x m lのパージョン 2 . 0のスキーマに従って作成し 実行結果の一部を以下に示す.本稿では,基本的に D ているが, A n a l y s i sR e s u l t sM e t a d a t aのスキーマを拡張しておらず, x p tファイル以外の外部ファイルへのリン ク機能は付与されていない. 'く つx m l ‑ s t y l e s h e e tt y p e = " t e x t / x s l "h r e f = " d e f i n e 2 ‑ 0 ‑ 0 ̲ M O D . x s l "ワ 〉 くO D Mx m l n s = . . h t t p : / / w w w . c d i s c . o r g / n s / o d m / v l . 3 . x m l n s : d e f =吋 ,t t p : / / w 剛 . c d i s c . o r g / n s / d e f / v 2 . 0 " x m l n s : x li n k = ' ' h t t p : / / w w w . w 3 . o r g / 1 9 9 9 / x l i n k ' ' x m l n s : a d a m r e f = ' ' h t t p : / / w 剛 c d i s c . o r g / n s / A D a M R e s / D R A FT " O D M V e r s i o n = " 1 . 3 . 2 " F il e O l D 二" X X X / Y Y Y ‑ D e f i n e ‑ X M L ̲ 2 . 0 . 0 " Fi I e T y p e = " S n a p s h o t " C r e a t i o n D a t e T i m e = " 2 0 1 40 6 ‑ 2 3T 11・4 0 :1 6 " O r i g i n a t o r = " C D l S CA D a MM e t a d a t aT e a m " ) < S t u d yO I D = " X X X / Y Y Y " ) くG l o b a l V a r i a b l e s ) くS t u d y N a m e ) X X X / Y Y Y < / S t u d y N a m e ) くS t u d y D e s c r i p t i o n ) X X X / Y Y YD a t aD e f i n i t i o n < / S t u d y D e s c r i p t i o n ) くP r o t o c o I N a m e ) X X X / Y Y Y く/ P r o t o c o I N a m e ) < / G l o b a I V a r i a b l e s ) くM e t a D a t a V e r s i o nO I D = " M D V . X X X / Y Y Y . A D a M I G .1 .O .A D a M .2 .1 " N a m e = " X X X / Y Y Y .D a t aD e f i n i t i o n s " D e s c r i p t i o n" X X X / Y Y Y .D a t aD e f i n i t i o n s " d e f : D e f i n e V e r s i o n = " 2 . 0 . 0 " d e f : S t a n d a r d N a m e = " A D a M ‑ I G " d e f : S t a n d a r d V e r s i o n 二 " 1 .0 " ) ← 二 図2 . 8 作成された ADaM用の D e f i n e . x m l (抜粋) 2 . 5 SASプログラムによる解析帳票の作成 E x c e IM e t a d a t aと VBAを使用することで, E x c e lシートを入力画面として必要なパラメータを入力して解析帳 票を作成することができる ここでは, E x c e lシートに ADaMデータセットと変数を入力し,被験者背景と 有害事象の要約表を作成するための ISUMMAYJ シートと I AEJ シートを用意する トの帳票作成までの処理フローを以下に示す E x c e lM e t a d a t a iSUMMARYJ シート ISUMMARYJ シー IAEJ シートも同様のフローとなる. パラメータ入力後「実 行 二 Jボタンをクリックし て VBAを実行 SASの l i b n a m ee x c e lエ ンジンで iSUMMARYJ シートを読み込む SASで解析帳票を作成 図2 . 9被験者背景要約表作成フロー ISUMMARYJ シート及び I AEJ シートには, I tem列に各項目の名前が表示されており, D a t a s e t列で D a t a s e t M e t a d a t aに記載されているデータセットを選択し, V a r i a b l e列で変数を選択する.同一ファイル内に図1.2に e t a d a t aに関するシートが含まれているため, V a r i a b l e列で変数を選択する際に, E x c e lの VLOOKUP 示す各 M ‑347‑

358.
[beta]
関数等を用いて当該変数のラベルやコードリストなどの情報を自動的に表示し,入力作業を簡略化する機能
を実装している

また,レコードフラグ変数の値や,解析帳票のタイトル等,テキスト入力が必要な項目に

ついては, Value列に値を入力する(文字変数の場合は引用符で囲む) .入力完了後

I
実行」ボタンをクリ

ックする.

SUMMARYシート(被験者背景の要約表作成ツール)

シート上部で投与群やレコード選択フラグ及び解析変数(入力必須)を指定する.年齢などの連続量に対
しては,右下部で算出する要約統計量を選択する.
T
"
温'"惚n
'

s
.
.p,

S
o
>
c
t
r
o
nC
n開 温 1
毎也ct抱 強 C
r
i
t
e
r
i
a
2
s.嗣醐 C
r
i
t
e
r
首 3

,
"
必kl

明

M
ゐ
,
1
:
t2

、
官
l
I
'
1
a
b
k
3

a
b
l
e
4
V官 h
5
'
・
也
,
.
,

,
.
凶

A
D
S
L AOE
J
i
l
l
S
L SEX
えDSし
EX

'
"
町

V官官

s
τ
i
l
l
e
l
T
i
t
恰2
T
i
t
l
e
3

1
.
0

悩冊

'
"
3
.
0

‑
(
'
。

S
医

S
I

1
.
0

T
R
D:

,
<
>

TRT
S
E
L
E
C
T
!
5
EllCT.
S
E
l
玉C
T
3
V
A
R
I
V
A
R
2
V̲W
V
A
R
4

T

闘

S
E
X
R
し
A
C
E
X

・

¥'A]tj

:\1-1E.-\..~SIDDE\'1ffi'.,"

Ti
b
l
el
.
l

M
l
ヨ
)
J
̲
>
.
.
.
.
")
.
!
.
i
.
}
{

範"'.俗曲齢Charxt
e
m
[
i
e
s

S
T
A
T
τ
τ
T
L
E
l
T
I
T
I
.
E
2
τ
πLEl

主 主J
T
R
じE

f
"N

TR
t
;
主

(
;
;M
e
d
r
l 1
I
E
.
.
!
"
'
'
'
S
r
o
D
E
f
"s
o

TRC
主
TRU
芝
F
A
L
S
E
'
R
.
C
E
τ
f
.
!
札 5
E

L
'
E
TR

言
込

、

PMin
rQI

~

f
"M
困剛

主
f
E
D
1
A
.
"

rQ'
PM
a
x

"
A
X

AEシート(有害事象の要約表作成ツール) :

投与群, MedDRAコーディング変数及び AE発現フラグ(入力必須),レコード選択フラグ等を指定する.
l
t
e
m
T,
田
山
出l
tGtO
U
P
ε
Sl
e
c
:
:
t
i
o
nC
r
i
t自 国 1
S
e
1
e
c
:
:
t
i
o
n
C
n
t
e
r
i
a
2
』匝"国 C
r
i
t
e
r
i
a
3
1
s
t生王れ担
lstSOC罰 E
htPTF
l
.
a
.
e
:
Q
t
b
e
, R̲dF
l
.
o
盆l
OtherR
鉱 別d
F
l
a
.
e
:2
SOCCODE
SOC主品1E
PTCODE
c
A'
1E
PT:
T
i
t
l
e
l
T
i
t
1
e2
T
i
t
l
e
3

u

V,
芭
笛ble
凶
'
1
<
同a
lT
周回制約)
ADSL T
R
T
0
1
A
.
'
" .
S
a
f
f
't
vP中
由
"
叩
F
l
.
o
,
ADSL SAfR

Da温甜

を 委
き

l
;
,
白
:
=
r
e
<
由
。f.‑
¥
n
v~主E Fl越
ADAE .
'
1
0αF
工
f
工
htC
比"""佐おeo
JSOCF
W
!
:
‑
'
i
l
l
A
E AOCCS
st
0即
即
夜
間 ofPrefm叫 TmnFlu
ADAE AOCCPFL 1
閣
.
.
a
a
s
.C似Ie

ミDAE 証 BDSYCDB吋 vS
y
s
t
e
四",0

D明治'Yfor圃

宜 TN
1
NY

1
1
1
1
1
1

Y
Y
Y

生DAE

80
5
2
'
曲

生E
主
主E

目

間
恒
0
<
四
,
C
l
a
碍
y
s
t
AEBODSYS BodvS
A玉PTCD fu
f<闇司 T",湿 C
o
d
e
ADAE AEDECOD D>凶OtlMV‑Deriv剖 T"""

田
c
o
d
e
l
i
s
t Vu

1
1
0

1
.
0

。

1
2
剖

MVN
A
.
¥
I
E

Y"

T宜T
SELECTl
S
El
EC
1
で
SELECT3
AE
兄 λG
SOCfLAG

"
)
"
'

PTfL~G

"
Y
聞

"
Y
"
町

RfL
AGl
R
f
工AG1
SOCCODE
S=.
,
,
"
'
1
E
PTCODE
PT
百A!
o
.
1
E
TITI
王l
1
T
a
b
l
e2.
Advぽ鍵 E
可"
e
n
t
s TI
立正2
T
I
T
I
五3

~lT I

図2
.
1
0解析帳票作成シート

ISUMMAYJ シート及び IAEJ シートの実行結果を図 2.
11及び図 2
.
1
2に示す.要約統計量や発現頻度等の

計算結果とともに,指定した変数のラベル,コードリスト等が出力されていることが確認できる.

‑
3
4
8
‑

359.

主ab1e 1.1 Demographic and Baseline Characteristic3 Statistic3 ICategories Variab1e 陶e Drug A Mean SD Min Median Max Female Male 且5工 且E 戸田 陣ace ( N ) Drug B 145 58.5 13.5 22 59.0 H 。 00 44( 30.3) 101( 69.7) 145(100.0 Total 133 56.7 12.9 28 53.0 B4 42(31.吾) 91( 吾8.4) 133noo.o 278 57.6 13.2 5 9 2 . E 2 。 】 86( 30.9) 1 ) 192( 6ヨ. 278(100.0 図2 . 1 1 被験者背景の要約表 Tab1e 2.1 且dverse Events System Organ Cla3s IPreferredTerm ALL DrugA 18 (12.0) Ga9trointestinal disorders Con3tipation Diarrhoea 活a llory 冒eiヨ3 syndrome Vomiting 且bdαminalpain 孟民主t e abdαmen Epigastricdiscomfort Faeces hard Ga3tric polYP3 Gastric ulcer haemorrhage Large intestine polyp Toothache 9( 6 . 0 ) 3( 2 . 0 ) ( 0 . 0 ) o( 0 . 0 ) 2( 1 . 3 ) 1( 0 . 7 ) 1( 0 . 7 ) 1( 0 . 7 ) む ( 0 . 0 ) 1( 0 . 7 ) 1( 0 . 7 ) ( 0 . 0 ) ( 0 . 0 ) 。 。 。 Druq B 19 (13.7) 8( 5 . 8 ) エ (0.7) 2 (1.4 ) ) 2 (1.4 o( 0 . 0 ) o( 0 . 0 ) o( 0 . 0 ) o( 0 . 0 ) 1( 0 . 7 ) む. 0 ) o( o( 0 .ヨ} 1( 0 . 7 ) 1( 0 . 7 ) 図2 . 1 2有害事象の要約表 2 . 6 SASプログラムによる OpenCDISCの実行 JackShostak ら ( 2 0 1 2 )は , SASプログラムから OpenCDISCを実行して SDTM及 び ADaMデータセットに IValidationJ シートにパ ついてバリデーションを行う方法を提案している.本稿では,その方法をもとに ラメータを入力し, V B A と SASプログラムから OpenCDISCv1 .5を実行する方法を提案する IValidationJ シートに入力する項目を以下に示す. 項目 内容 Sourcedatapath データセット " (xptファイル)の格納フォルダのフルパス OpenCDISCpath OpenCDISCのメインフオノレダのフノレノ fス jarf i l ename jarファイルのフルパス dataf i l e s バリデーションを行うデータ (*.xptで全てのデータセットを指定し,単一のファイ ル や LB*叩 tのように指定することも可能) Configf i l e . x Define M L Configファイルのフルパス バリデーション時の Define.XML の使用の有無 (yまたはブランクで, y の場合は Define氾 nlを Dataフォルダ汁こ格納) 表2 . 2 IValidationJ シートの入力項目 ‑ 3 4 9 ‑

360.

続いて, 旬岨 i V a l i d a t i o n J シートのレイアウトを以下に示す. 誇 ミ 饗V 曲為替、奪第 愛 器 内喜劇嚇ぬ 編 選 番 金 包 C : ¥ T . 由宇 ' S U G I ̲ 1 0 1 4 ¥D幽 soun:e品切阿h , MVN 瓦:ME 司 臨 ~ 舎照 盟 申: S U G I ̲ 2 0 1 4 ¥ O p e n ( 泡 ' l S C . l.5¥opeDcdi晶、世出町 : ¥ T . o p e ぽ DlSC凶h C 参照 a r血 盟 問 C : ¥ T . 田 平i S U G J ̲ 2 0 1 4 : U!四回' I S C 1 5 咋 間 同 町 由 加 ぽh bv 曲却町‑di‑U . J a r 参照 lJAR 品回 f i l e s . . x p t C四亘書偽 C : T 1 四>p ' S U G I ̲ 1 0 1 4 ¥Open(刃誌C U 司盟副1iIC.唱』掴阿国m亀 田 m f i t ! . . . 垣島1 0 =1 参照 iCO!'.'F1G De血路XML Y F l l . E S 民E DEF 主 江J 図2 . 1 3 i V a l i d a t i o n J シート(Op enCDISC実行ツール) u t p u tフォルダに OpenCDISC実行結果のレポート 「実行」ボタンクリック後, VBAから SASが実行され, O が作成される. OpenCDISCV a l i d a t o rRepo 代 C:¥Temp ¥ S U札 抑 制 但 n C 印S C ¥ I .5 ¥ o 凹n c d i s c 咽 雌 附 開 旬 、 倒 晦 醐 肝1 . 0 x r 川 総鴫 p t O l 叙 拘d 2 0 14 ‑ 0 ι2 訂1 9 :G e: 3 3 1 . 5 図2 . 1 4Op enCDISC実行結果 x c e lM e t a d a t a及び VBAを組み合わせることで, D e f i n e . x m l,解析帳票の作成及びバリ 以上のように, SAS,E デーション等の ADaMに関連する作業を効率的に実施することが可能となる. 3 まとめ 本稿では, ADaMの Define.xml作成時に必要な情報を組み込んだ Excel形式の Metadataを作成し, さらに ExcelVBAと SASを組み合わせて Define.xmlや解析帳票の作成ならびに OpenCDISCを用い たバリデーション作業を効率的に実施する方法を提案した. PMDAから電子データ提出についての通知が発出されたこともあり,本邦においても新薬承認申請時の 電子データ提出義務化への動きは加速し,製薬企業の負担は増大することが予想される.また,製薬企 業が CROに CDISC標準に関する業務を委託する場合が多いと想定されるが,規制当局に臨床試験の 電子データを提出することは製薬企業にとって非常に大きな責任を伴う業務であり,成果物の仕様の標 準化や規制当局との協議ならびに成果物を受け取った際の自社内での受け入れ確認、等を重厚に行う状 ‑ 3 5 0・

361.

況も想定される.そのため, ADaMのみならず, CDISCに関連する臨床試験データや文書作成作業の 効率化は製薬企業にとって重要な課題となる.その中で,本稿で紹介したような,実務担当者が日常的 に用いる SASや Excel等の身近なツールの利便性を最大限に活用することは非常に有用であると考え る. 連絡先 本稿で用いた E x c e lM e t a d a t aや SASプログラム等に関する質問は下記に連絡されたい. vouhe . it a k a n a m i( a J ,t a k e d a . c o m 参考文献 • FDAS t u d yD a t aS t a n d a r d sR e s o u r c e s .htm h t t o : / / w w w . f d a . g o v / f o r i n d u s t r v / d a t a s t a n d a r d s / s t u d v d a t a s t a n d a r d s / d e f a u lt • FDA( 2 0 1 4 ) .STUDYDATATECHNICALCONFORMANCEGUIDE(DRAFT) 佐v l Da t a S t a n d a r d s / S t u d v D a t a S t a n d a r d s /U CM384744.odf h t t o : / / w w w . f d a . g o v / d o w n l o a d s / F o r l n d u s ・ PMDA次世代審査・相談体制について(申請時電子データ提出) h t t o : / / w w w . o m d a . g o . i % o e r a t i o n s / s h o n i n / i n f o / i v a k u/ i i s e d a i . h t m l • PMDA ( 2 0 1 4 ) 薬食審査発第 0620第 6号通知「承認申請時の電子データ提出に関する基本的考え方につ いて J h t t o・ / / w w w . o m d a . g o . i 0 / o o e r a t i o n s / s h o n i n l i n f o / i v a k u/i i s e d a i l f i l e / 1 4 0 6 2 0 ‑ t s u c h i . o d f ・ CDISCh t t p: l / w w w . c d i s c . o r g / • J a c kS h o s t a k( 2 0 1 2 ) .I m p l e m e n t i n gCDISCU s i n gSAS:AnE n d ‑ t o ‑ E n dG u i d e .S a sI n s t C h r i sH o l l a n d, ・高浪洋平 ( 2 0 1 3 ) .S i m p l eT o o lf o rC r e a t i n gADaMD e f i n e . x m lf o rS t a t i s t i c i a n si nP h a r m a c e u t i c a lCompanies U s i n gSASa n dHT 恥1 L A p p l i c a t i o nw i t hE x c e lM e t a d a t aF i l e .CDISC2013J a p a nI n t e r c h a n g e ・森岡裕 ( 2 0 1 3 )i ライブラリ参照と名前定義を利用して EXCELファイルへの柔軟な入出力を実現する方 法と応用例の提案一解析結果のレポーティングからセルオートマトンまて← JSASユーザー総会 2013 ・ ・高浪洋平,舟尾暢男 ( 2 0 1 2 ) í統計解析ソフト WSAS~J 工学社 OpenCDISCV a l i d a t o rh t t o : / / w w w . o p e n c d i s c . o r g / ‑351‑

362.

大学における統計家育成のための CDISC教育の実践 佐野雅隆 東京理科大学工学部 I m p l e m e n t a t i o no fCDISCE d u c a t i o nf o rB i o s t a t i s t i c i a nT r a i n i n gC o u r s ei nU n i v e r s i t y SANOMasataka TokyoU n i v e r s i t yo fS c i e n c e S c h o o lofE n g i n e e r i n g, 要旨 大学における統計家教育に際して, CDISC( C l i n i c a lD a t aI n t e r c h a n g eS t a n d a r d sC o n s o r t i u m ) 標準,特に ADaM(Ana l y s i sDataModel)を理解する上で基本となる考え方は何か,標準化の目的・意義と関連して述 べる. キーワード:ADaM,教育, O f f i c i a lr 巳a i n i n gc o u r s e はじめに CDISC(C l i n i c a lD a t aI n t e r c h a n g eS t a n d a r d sC o n s o r t i u m ) 標準の医薬品開発における重要性が増している.その 中でも, S t u d yD a t aT a b u l a t i o nModel (SDTM) とAn a l y s i sD a t aModel (ADaM) は , PMDAに提出することか ら,その重要性が高まっていると考えられる. 産業界では, CDISCに関する教育研修の機会を設け,社員の能力開発に努めている.東京理科大学では医 薬統計家の育成に取り組んでいるが, CDISCに関しては取り組み途中である. CDISC標準に関して医薬統計 家が具備すべき知識の全体像はまだ明らかではない. 研究室内での有志メンバーによる CDISC教育(勉強会)を開始したので,とくに,医薬統計家に向けた ADaM の導入教育の実践について報告する. 産業界における教育内容の調査 産業界では, CDISCに関する教育研修の機会を設け,社員の能力開発に努めている.大学において教育を 実施するに当たり,これらの事例を参考にするため,調査を実施した.浅見ら [ 1]は,統計解析担当者に対す る CDISCの社内教育として,下記の教育プランを提案している. 1 . 関連する SDTM/AD aMドメイン横断の教育 2 . SASを用いたハンズオン (ア)サンプル ADaMデータセットのレビュー (イ)ADaMに準拠した標準化 SAS解析プログラムの実行 3 . eCTD,申請ノ号ッケージを用いた説明 ‑ 3 5 2 ‑

363.

(ア)SASXPTがどのように eCTDに添付されているか (イ)FDAが実際にどのようにデータセットをレビューしているか? さらに, SAS社による CDISC概論, SAS による 1 . CDISCの概要 2 データモデルについて CDISCSDTM/ ADaM の実装では, 3 . ADaMメタデータと ADaMD e f i n e . x m l 4 . ADaM の実装 5 . ADaMデータのバリデーション また,ある企業では,下記の取り組みをホームページ上で紹介している. .CDISC標準モデルと IGの環境 ・各種検討会・実装化の準備 ・教育資料の作成・社内への展開 ・今後のトレーニング・教育研修対策 教育項目の選定と実施 浅見らの提案する教育項目は,グローパル申請の際に,併合解析を実施することを念頭に置いている.さ らに,社内で ADaMのガイダンス教育を一通り実施した後の課題認識に基づいて立案されたものである.大 学における統計家育成においては, ADaMのガイダンスを一通り実施することがまず必要であると考えた. 一方で、,ガイダンスの全体を詳細に理解することに比べて,概要を理解した上で標準化の目的や標準化を用 いた上での臨床試験の質の担保・向上に向けた利活用への理解が重要であると考え,教育内容を選定するこ とにした. ADaMにおける中心的なデータ構造としては, ADSL( S u b j e c tl e v e la n a l y s i sd a t a s e t ), BDS(Basicd a t as t r u c t u r e ), ADTTE(BDSf o rt i m e ‑ t o ‑ e v e n ta n a l y s i s ),ADAE(ADaMd a t as t r u c t u r ef o ra d v e r s ee v e n ta n a l y s i s )が挙げられる.上 記の目的から,まずは, ADSL,BDSに焦点を当てることにした. 教育を実施するにあたり,まずは, CDISCの公式トレーニングに参加した.その後, CDISCの文書として n a l y s i sD a t aModel(ADaM)v 2 . 1,A n a l y s i sD a t aModel(ADaM)I m p l e m e n t a t i o nGuidev1 .0, 参考にしたものは, A A n a l y s i sD a t aModel(ADaM)Examplesi nCommonlyUsedS t a t i s t i c a lAn a l y s i sMethodsの 3種類について,その内 容の中から抜粋した. n a l y s i sD a t aModel(ADaM)I m p l e m e n t a t i o nGuidev l . Oからは,下記の内容を抽出した. たとえば, A 2F u n d a m e n t a l so ft h eADaMS t a n d a r d 2 . 1F u n d a m e n t a lP r i n c i p l e s 2 . 2T r a c e a b i l i t y 2 . 3TheADaMD a t aS t r u c t u r e s 2 . 3 . 1TheADaMS u b j e c t ‑ L e v e lAn a l y s i sD a t a s e tADSL 2 . 3 . 2TheADaMB a s i cD a t aS t r u c t u r e(BDS) 3 . 1ADSLV a r i a b l e s ‑353‑

364.

3 . 2ADaMB a s i cD a t aS t r u c t u r e(BDS)V a r i a b l e s 3. 2. 2T r e a t m e n tV a r i a b l e sf o rBDSD a t a s e t s ユ l y s i sP a r a m e t e rV a r i a b l e sf o rBDSD a t a s e t s 3 4Ana 標準化の目的や標準化を用いた上での臨床試験の質の担保・向上に向けた利活用においては, ・ ・ ・ ・ 標準化と改善の基礎・ PDCA,SDCAサイクル 質の定義 技術標準としての CDISCの位置づけ 管理指標 について,触れることにした. Examplesi nCommonlyUsedS t a t i s t i c a lAna l y s i sMethodsには,下記の手法が取り上げられており,統計か教 育においては実例をイメージしやすいと思われたので,上記の基本的な知識の習得後に,データセットの作 成,および解析の試行にとりかかることとした. AnaLysisofCovariance (ANCOVA) ‑ 阿c Nemar AnaLysis of Variance (ANOVA) • Regression,Cox • Chi‑squared • Regression,Linear • Chi・squared,Corrected • Regression,Logistic • Cochran・阿 anteL‑HaenszeL • Sign Test • ManteL HaenszeL • F isherI s Exact ・ KruskaL‑WaLLis • ・ • ・ t・Test,1・sided t‑Test,2・sided ・ • 阿 ann‑Whitney) WiLcoxon ( Log Rank SDTM‑ADaMp i l o tS t u d yのデータを基にして, SASを用いたハンズオンであるサンプル ADaMデータセッ トのレビュー, ADaM に準拠した標準化 SAS解析プログラムの実行を試行することが理想的であったが, SDTM‑ADaMの P i l o tデータを入手することは困難で、あったため,データの作成も踏まえて検討することにし た. 以上の検討を基にして,参加者を募集した.研究室全体に向けて勉強会の案内を通知した,とこ単位を取 得できるコースではないにも関わらず,修士の学生 7名の参加者が集まった.一方で,社会人学生の方や, 研究室を卒業して産業界で活躍している方の中にも,興味を持った方もいたものの,教育実施の時間帯の調 整が難しく,まずは学内のみで実施することにした. 参加者には,各種ドキュメントを配布したが,英語で書かれたドキュメントであるため,必ずしも理解が スムーズに進むとはいえなかった.現在,導入教育が終了した段階であり,今後 exampleを基に,データセ ットの作成,および解析の試行に移行する予定である.大学・産業界からの外部講師の招鴨を含めて計画し たい 今後の課題 ‑ 3 5 4 ‑

365.

教育項目の妥当性について,産業界からの意見を反映することが必要であると考えている.現状の教育に ついて,計画を実行することとその評価が必要である.さらに, I C HE 9の Trial Statisticianの役割の明 確化と CDISC標準に関する教育項目との対応付けが挙げられる.東京大学における教育内容の把握も必要で ある. 参考文献 [ l J 浅見由美子ら, " S A Sを用いた医薬品開発の統計解析担当者に対する CDISCの社内教育", SASユーザー総 0日論文集, 4 2 3 ‑ 4 3 8 . 会2 l y s i sD a t aModel(ADaM)v 2 . 1, CDlSC, 2009 [ 2 J Ana [ 3 JA n a l y s i sD a t aModel(ADaM)I m p l e m e n t a t i o nGuidevl .O, CDISC, 2009 [ 4 JA n a l y s i sD a t aModel(ADaM)Examplesi nCommonlyUsedS t a t i s t i c a lA n a l y s i sMethods, CDISC, 2009 k .I m p l e m e n t i n gCDISCU s i n gSAS,2012 [ 5 JC h r i sH o l l a n dandJ a c kS h o s t a [ 6 J 東京大学 SPHシラパス, hm ・ / / w w w . m . u ‑ t o k v o . a c . j o / e d u c a t i o n/ 4s o h2 0 1 4 . o d f ‑355‑

366.

産官学での CDISC 標準利用に向けた取り組み:実務担当者のために 承認申請のための CDISC実装とメタデータ作成 氏名 浅見由美子(第一三共)、奥田恭行(第一三共)、 TonyChang (AmgenI n c . ) E f f o r t st o w a r dt h eu t i l i z a t i o no fCDISCs t a n d a r d si ni n d u s t r y , govemment, anda c a d e m i a I m p l e m e n t a t i o no fCDISCS t a n d a r d sa n dt h eM e t a d a t af o rR e g u l a t o r yS u b m i s s i o n Name YumikoAsami1), Y a s u y u k iOkuda1), TonyChang, AmgenI n c .2) 1 )D a i i c h iSankyoCo L t d ., 2 )AmgenI n c . 円 要旨 C l i n i c a lD a t aI n t e r c h a n g eS t a n d a r d sC o n s o r t i u m (CDISC) とは、医薬品に関する臨床・非臨床データの標準を 推進する非営利団体である。 2016年(予定)より、 PMDA承認申請の際に CDISCのデータ標準である SDTM (申請臨床試験データモデル:S t u d yD a t aT a b u l a t i o nModeI ) /ADaM (統計解析データモデ、ル:Ana l y s i sD a t a ModeI)に基づく電子データセットの提出が義務化されることが公表されている。 CDISC標準に基づくデー タセット(以下、 CDISCデータセット)の作成には、 CDISCガイダンスに基づいたメタデータ(データセッ トの仕様)が必要となる。メタデータには CDISCガイダンスをそのまま適用すれば作成できる部分もあるが、 承認、申請のスポンサー(以下、スポンサー)が作成しなければならない部分も多く含まれる。承認申請用の 併合解析や、 SDTM/ADaM作成用の SASプログラムを効率よく構築するためには、臨床試験単位ではなく、 プロダクトもしくはスポンサー内で共通で使用できるメタデータを作成することが重要となってくる。本稿 では、グローパル承認、申誇における CDISC実装の経験をもとに、プロダクト内で適切に効率よくメタデータ を構築する方法を提案する。あわせて、メタデータ作成における課題についてもまとめる。 キーワード:CDISC、SDTM、ADaM、メタデー夕、 SAS、承認申請 背景 1 . 1 CDISC C l i n i c a lD a t aI n t e r c h a n g eS t a n d a r d sC o n s o r t i u m (以下、 CDISC) とは、医薬品に関する臨床・非臨床データの 標準を推進する非営利団体である。 1) CDISCが作成した標準(以下、 CDISC標準)には、以下のようなモデ ルが含まれる。 ・ ・ • S t u d yD a t aT a b u l a t i o nModel(SDTM):医薬品の規制当局の申請臨床試験データ形式 A n a l y s i sD a t aModel(ADaM):医薬品の規制当局の承認申請統計解析データ形式 その他、 CDASH、SEND、PR等 ‑ 3 5 6・

367.

代表的な例として、 E l e c t r i cD a t aC a p t u r e(EDC) 等で収集された臨床試験データから SDTMを経て、 SAS 等を用いて ADaMデータセットが作成される。そして ADaMデータセットを基に、 SAS等を用いて統計解 析結果が生成される。図 1に 、 SASと SDTM/ADaMを用いた統計解析プロセス例(模式図)を示す。 , XPT(SAST~ansport 1l e ) XPTrSAST r a n刷局罰幅} 図 1:SASと SDTM/ADaMを用いた統計解析プロセス例(模式図) 1 .2 国際共同開発 「国際共同治験に関する基本的考え方 J2)の発行により、日本が参画する国際共同試験の数が急激に増加し、 複数のスポンサー(製薬企業またはアカデミア)や複数の地域(日本、アメリカ、ヨーロッパ等)が開発計 画に関与し、閉じ時期に世界の各規制当局に対する承認申請を実施する場合もある。その結果、日本の製薬 企業、アカデミアおよび CRO等の組織においても、 FDA承認申請のために、日本で実施した臨床試験の CDISC データセットを作成したり、アメリカで実施された臨床試験の CDISCデータセットを用いて、日本における 承認申請のための解析を実施したりする場面も増加してきた。 1 .3 医薬品承認申請における電子データ提出に関する各規制当局の対応 以下に各規制当局における医薬品承認申請における電子データ提出に関する対応を簡単に述べる。 FDAは 1980年代から SASデータセット(その後、 SASTr a n s p o r tv5f o r m a t ) を移送形式とした電子デ ータ提出をスポンサーに要求し、さらに 2004年からは、データセットの構造、変数の属性等の標準として CDISC標準を推奨してきた。そして、 2014年に r D r a f tGuidancef o rIndustryProvidingRegulatory Submissionsi nE l e c t r o n i cFormatStandardizedStudyDataJ ならびに r D r a f tStudyDataT e c h n i c a l ConformanceGuideJ を発行した。それにより、 FDAの医薬品承認申請における CDISC標準に基づく電子 データ提出の強化が予想される。 3) 一方、 PMDA (医薬品医療機器総合機構)は臨床試験の電子データ提出を従来スポンサ}に要求していな aM標準に基づく電子データ提出を 2 0 1 6年(予定)より義務化することを かったが、最近 CDISCSDTMIAD 公表した。これにより、日本の製薬企業、アカデミアおよび CRO等の組織においても、 PMDAの承認申請 のために CDISCデータセットを作成し、提出することが必要となる。 4) 2 CDISCデータセットのメタデータ作成における問題点 2 . 1 CDISCデータセット作成におけるメタデータ m e t a d a t a ) とは、一般的には「データに関するデータまたは情報」を意味する。 CDISC標準 メタデータ ( Ml ADaM の実装においては、データセット、変数等に関する定義、仕様書にあたり、 SAS等を使用して SDT データセットを作成(変換)する際のベースとなる。メタデータは、 SDTMI m p l e m e n t a t i o nG u i d e(以下、 SDTM I G )、ADaMI m p l e m e n t a t i o nG u i d e(以下、 AD aMI G )等の CDISC標準に関するガイド類 1)に従う必要がある。 承認申請時には r D e f i n ef i l eJ に含めて、規制当局へ提出される。なお、本稿においては、メタデータは SDT Ml ADaMデータ作成(変換)の元になる仕様書を意味し、 D e f i n ef i l eの意味を含めないこととする。 3 5 7 ‑ ー

368.

図 2に S ASを用いて作成した場合の SDTMAEドメインの一部(見本)を示す。メタデータの検討の際に は、データセット(ドメイン)レベル、および、変数レベル で検討する必要 が ある。 ( : ゐ じ ロ 総 忌 ‑ ̲ 可 寸1 園 料 u l ril‑‑F 1‑1醤 1‑1 骨 図 2:SASを用いて作成した場合の SDTMAE ドメインの一部(見本) 2 . 2 メタデータ作成における問題点 日本製薬工業協会(以下、製薬協)が 2013年に実施したアンケート 5)によると、製薬協加盟企業の約半数 が SDTM実装の経験があるが、そのうち、その約 3 / 4は SDTM標準に適合しているとは言えない(し、わゆる iSDTMLikeJ) であるとのことであった。それらの企業では、 SDTMデータセット作成の基となるメタデー タが SDTM10に適合していない可能性がある。 EDC等で収集された臨床試験データ(以下、 CRFデータ)を基に SDTMデータセットを作成するためには、 SAS等を用いたデータ加工(複数データセットのマージや転置等の構造変換、変数の属性変更、単数もしく は複数の変数の値を代入した四則演算や関数等を用いた変換など)が必要となる場合がある。 CRFデータの 構造によっては、データ加工の仕様が複雑になることもあるため、 SDTMメタデータ作成のためには SAS等 によるデータ加工のプログラミングの知識も必要となる。 SDTM実装の経験が少ない組織では、 SDTMメタ データ作成における SASプログラミング知識の必要性が認識されていない場合もあり、 SDTM作成を担うフ ァンクションに SASプログラミングの知識のある人材が不足している可能性もある。 また、 SDTM10や ADaM10には画一的ではなく、複数のオプションを取りうる事項が含まれている。そ のことが、メタデータ作成を困難にしている可能性がある。 3 医薬品の承認申請における統計解析とデータ標準化 図 3に SASと ADaMを用いた承認申請用解析のプロセス例(模式図)を示す。使用する臨床試験数で出力 する解析帳票を分類すると以下ようになる。 1 ) 単一の臨床試験のデータを用いる解析帳票(主に総括報告書用) 2 ) 複数の臨床試験のデータを用いる解析帳票(主に承認申請資料座) 複数の臨床試験データを用いる解析帳票には、例として併合解析や複数試験の「横並び」の解析(臨床試 験、投与群を横に並べたような解析)がある。 臨床試験問で解析データの仕様が統一されていない場合、 1 )において解析プログラムを再利用することが 難しくなり、臨床試験毎に解析帳票作成プログラムを作り直すことが必要となる。また 2 )において解析を実 施する前に、承認申請資料に含まれる複数の臨床試験の解析データの仕様をそろえるための変換が必要とな る。その変換作業は煩雑になることも多く、承認申請タイムラインに影響を与える場合もある。 そこで解析データ仕様の標準化が重要となってくる。 CDISC標準は規制要件としてだけでなく、上記のよ うな問題を回避するためにもメリットがあると考えられる。更に、レビューアー(社内の関係者、規制当局 3 5 8 ‑ ー

369.

審査官等)がデータをレピ、ューしやすくなるというメリットもあると考えられる。 時閣 ; ゅ 園 時 ゆ き 自 ...プロジェクト.位 ( Y .A抽酬.A.currぬ.CDISC~相暗剛咽晶側、お也、ー餌 .lft) 図 3:SASと AD aMを用いた承認申請用解析のプコセス例(模式図) 4 メタデータの作成手順と管理項目 4 . 1 メタデータの記述ノ ξターン SDTMと ADaMでは、より自由度の低い SDTMメタデータの IGへの適合性がより重要であると考えられ るため、 SDTMメタデータを中心に検討を進める。実際の SDTM実装の経験を元に、表 lに SDTMメタデー タにおける記述のパターンの分類を示す。本稿においては 4つの分類とした。 CRFデータの構造に依存し 1 ) に該当する割合が高くなり、メタデータの作成、及び、その後のプログラミング作業の負担が大きくなる。 )、3 )に該当するメタデータ作成、および、その SDTMIGへの また、 SDTMの経験が少ない組織の場合は、 2 適合性の確認に時間が掛かる可能性がある。 表 1:SDTMメタデータの記述パターンと代表的なデータ加工例 メタデータの記述パターン 代表的なデータ加工例 (データ構造変換、属性の変更、派生等) O)CRFデータの Copy 1 )SDTMIGで決定されている属性と D a t a s e tName、S t r u c t u r e、Keyv a r i a b l eの変更 CRFデータのギャップの穴埋め V a r i a b l eName, l a b e l, Typeの変更 Co 附 o l 1edTenninologyの変更、等 2 )一般的に CRFデータとして収集さ T r i a lD e s i g nT e n n i n o l o g yの作成 れておらず、他のマテリアルの記述に B a s e l i n eF l a gの作成 依存するもの P o p u l a t i o nF l a gの作成, E x t e n s i b l eT e n n i n o l o g yの追加 S p o n s o rS p e c i f i e dT e n n i n o l o g yの追加、等. 3 ) その他、一般的にスポンサーが決定 CustomDomainName,S t r u c t u r eの設定 ( C l a s sの選択) する属性 V a r i a b l eL e n g t hの調整 S u p p l e m e n t a lQ u a l i f i ぽの作成、等 *注:2 )と 3 )は重複もありうる。 ‑ 3 5 9・

370.

4 . 2 医薬品承認申請を考慮したメタデータ作成手順 表 1のメタデータの記述パターンを基に、医薬品の承認申請時の工数軽減も考慮した、メタデータ作成の 負担軽減策を表 2にまとめる。 表 2:SDTMメタデータの記述パターンと負担軽減策 メタデータの記述パターン 負担軽減策 O)CRFデータの Copy 1 )SDTMIGで決定されている属性と .CDASHの活用、プロジェクトまたは組織内の CRFデータ CRFデータのギャップの穴埋め 標準化、英語化(日本ローカル試験の場合) 2 )一般的に CRFデータとして収集さ .SDTMを考慮したプロトコル標準化、、マシンリーダブル れていない項目 形式の採用、英語化(日本ローカル試験の場合) .SDTMを考慮した統計解析早期策定(ベースラインの定義、 解析集団の定義、等)等 ‑図 4及び表 3参照 3 )一般的にスポンサーが決定する属性 ‑図 4及び表 3参照 表 2における 2 ) 及び 3 )、及び、 ADaMメタデータは、スポンサーで決定できる属性を含むため、承認申請 プロジェクト内の臨床試験間でばらついてしまう場合がある。そのことが承認申請用の解析実施時の工数増 大につながる可能性がある。また、臨床試験ごとにメタデータを作成する場合、本来同じ派生ルールの場合 でも、記述方法が異なってしまう可能性もある。 そこで、図 4のイメージにあるような、承認申請プロジェクト内の臨床試験のメタデータを横断的に管理 できるようなシートを用いることとした。一般的に、承認申請プロジェクトに含まれる臨床試験は実施時期 が異なるため、新規の臨床試験時はカラムを追加する形式とした。また、そのシートを用いたメタデータの 管理項目と作成手順を表 3に示す。 防 署 ・ 8e ZZZZ 噛晶 z z z z ccG ZZZZ ZZIZ d剖 C h o r C同( C h l r N回 n S z z S z z S z z z z z z z z z z z z z z z z z z z z ZZZZ z z z z z z z z z z z z 陶 Q ・ I fx 間=x:闘をen ̲"l(' X 。 。 咽 NA 同OQ X 咽 N A C o r NA x NA 図 4:承認申請パッケージ内のメタデータ管理シート(イメージ) ‑ 3 6 0 ‑

371.

表 3:承認申請パッケージ内のメタデータ管理項目と作成手順 順序 2 レrミノレ 管理項目 データセット(ドメイン) D a t a s e tName,S t r u c t u r e, KeyV a r i a b l e ( s ) レrミノレ *必要な場合はカスタムドメインの設計 変数レベル V a r i a b l eName, L a b e l, Type, D i s p l a yf o r m a t, D e r i v a t i o nR u l e *特に CRFデータの構造が臨床試験問で異なる場合は変数 派生ルール( D e r i v a t i o nR u l e )の確認が重要 3 ターミノロジ一、辞書 C o n t r o l l e dT e r m i n o l o g y( E x t e n s i b l eo rn o t ) S p o n s o rS p e c i f i e d( T r i a ld e s i g n, e t c . ) *臨床試験問で別の意味のデータに、同じ T e r m i n o l o g yを当 てはめないように注意 5 実際の承認申請における適用 図 4のシートと表 3に示す方法を用いて、実際のグローパル承認申請プロジェクトにおけるメタデータを ・ ・ ・ ・ 作成、管理した。その結果をまとめると以下のとおりである。 既に存在する変数はそのまま使用することができた。また、既に存在する変数を誤って別の名前また は属性で新規に作成することが防げた。 臨床試験問で同じ意味の場合、 T e r m i n l o g yを共通して使用することができた。一方、別の意味の場合、 誤って臨床試験問で同じ T e r m i n o l o g yにならないように、排他的に作成できた。 変数派生ルールの記述を再利用することができた。また、それに基づく SASコードを再利用すること ができた 0 異なる会社、地域間でメタデータを見える化、共有化することができた。 6 まとめ SDT 恥 1 I ADaMメタデータを IGに適合する形で、効率よく作成するためには CDASHおよびプロトコル標準 を用いて、 E n d ‑ t o ‑ E n dの標準化をすることが望ましい。しかし、組織全体でそのようなプロセスに移行する にはある程度の時聞が掛かる。また、医薬品の承認申請準備の効率化も考慮すると CDASHの適用のみでは 解決できない問題点もある。そこで、本稿では実際の SDTMメタデータ作成の経験を基に、 SDTMメタデー タの記述パターンを分類することにより、 CDASHの適用で負担を軽減できる部分と、その他の方策も必要な 部分を明確にした。 CDASH以外のその他の方策のーっとして、医薬品承認申請を考慮したメタデータ作成手 順と管理項目を設定した。そして、実際のグローパル承認申請でその方法を用いた結果をまとめた。 PMDA承認申請における 2016年(予定)からの CDISCデータセット提出の実現のためには、 E n d ‑ t o ‑ E n d で標準化されたプロセスへの移行準備と、それが定着するまでの過渡期の対応を同時に進めていく必要があ ると考える。 ‑361‑

372.

<参考> 1 ) CDISCW e b s i t eh t t n : l l w w w . c d i s c . o r i ! 1 2 ) 薬食審査発第 0928010号.国際共同治験に関する基本的考え方;2007 3 ) FDAS t u d yD a t aS t a n d a r d sR e s o u r c e s h t t n : l l w w w . f d a .l ! ov l Fo r l n d u s t r v / D a t a S t a n d a r d s / S t u d v D a t a S t a n d a r d s / d e f a u l t . h t m 4 ) 医薬品医療機器総合機構 次世代審査・相談体制について(申請時電子データ提出) h t t n : l l w w w . o m d a .l !o . i o / o o e r a t i o n s / s h o n i n l i n f o / i v a k u l i i s e d a i . h t m l n t e r c h a n g eJ a p a n ;2 0 1 3 5 ) 製薬工業協会発表資料、 CDISCI ‑362‑

373.

PMDAにおける次世代審査・相談体制と CDISCの利用について 安藤友紀 独立行政法人医薬品医療機器総合機構 次世代審査等推進室 AdvancedNewDrugReviewandU t i l i z a t i o nofCDISCi nPMDA do YukiAn AdvancedRevieww i t hE l e c 甘o n i cDataP r o m o t i o nGr oup, P h a r m a c e u t i c a l sandMedicalD e v i c e sAgency 要旨 近年の医薬品開発においては、開発の意思決定におけるデータに基づく定量的な情報の積極的な利用 4日内閣官房長官、厚生労働大臣・関係 が進められている。本邦では、健康医療戦略(平成 25年 6月 1 大臣申合せ)において、医薬品医療機器総合機構 (PMDA) における承認申請データを一層活用した承 認審査や相談の質の向上が求められている。現在、 PMDAでは臨床試験データの電子的提出を受けるこ とを視野に、医薬品承認申請時に添付される臨床試験データ利用のための具体的検討を行っており、そ の基本的な方針について通知「承認申請時の電子データ提出に関する基本的考え方について J (平成 26 年 6月 20日薬食審査発 0620第 6号)が発出されたところである。医薬品の承認審査への臨床試験デー タの利用、及び将来的な蓄積データの横断的な検討には、データ標準の利用が不可欠であり、 PMDAで は、データ標準として CDISC による標準を採用する予定である。国際的に広く使用されている標準の 採用により、 PMDA及び申請者の両者において、国際連携を視野に入れたより適切かっ最先端の解析や 評価が可能となると考えられる。本発表では、 PMDAにおける次世代・審査相談体制の概要、準備状況 と、実施中のパイロットを含む CDISCの利用に関する取り組みについて紹介する。 キーワード:承認申請、臨床試験デー夕、データ標準 次世代審査・相談体制 近年の医薬品開発においては、開発の意思決定におけるデータに基づく定量的な情報の積極的な利用が進 められている。開発中に得られる多くの情報を数理モデルにより統合し効果等の予測に用いる Modelinga n d S i m u l a t i o nの利用はその代表的なものである。一方、医薬品を開発し承認申請を行う者のみならず、審査当局 においても臨床試験データ及び各種手法の理解、及び積極的な活用を進めることは重要であり、健康医療戦 4日内閣官房長官、厚生労働大臣・関係大臣申合せ)においては、医薬品医療機器総合 略(平成 25年 6月 1 機構 (PMDA) における承認申請データを一層活用した承認審査や相談の質の向上が求められている。 PMDA では、平成 2 5年 9月 1日の「次世代審査・相談体制準備室」の設置、平成 26年 4月 1日の「次世代審査等 推進室J への改組を経て、現在、承認申請時に提出される臨床試験データを一層活用した承認審査や相談の 実施について具体的な検討が進められているところであり、その基本的な方針に関する通知「承認申請時の ‑ 3 6 3・

374.

電子データ提出に関する基本的考え方について J (平成 26年 6月 20日薬食審査発 0620第 6号)が発出され たところである。 承認申請時に提出される臨床試験データは、まずは各品目の審査の効率化、高度化のために利用される。 PMDAのこれまでの審査においては、 PMDA自身が臨床試験の被験者レベルの電子データを持っていなかっ たことから、有効性及び安全性の検討において申請資料として提出されていない解析の結果を確認する必要 が生じた場合、全ての解析を申請者に依頼し実施してもらう必要があった。しかしながら、被験者レベルの 電子データが入手可能となることにより、一定の解析については PMDA内で実施する等、申請者の負担が軽 滅される側面があると考えられる。また、ソフトウエアの利用による試験結果の視覚化や、試験結果から個 別被験者のデータへのアクセスが容易になる等、臨床試験結果のより詳細な検討が可能となることも期待さ れる。一方、承認申請時に提出される複数品目の臨床試験データが蓄積されることにより、例えば特定の疾 患の治療薬に関する品目横断的な検討に有用な情報が得られる可能性もある。このような検討に基づくガイ ドラインの発出等、蓄積されたデータが将来的な医薬品開発の効率化につながることも期待される。 PMDAにおける CDISCの利用について 承認申請時に PMDAに対して臨床試験の電子データが提出される場合に、各臨床試験のデータが一定の標 準に従って構成されているか否かは非常に重要となる。審査員は審査や解析に先立ち、個々の臨床試験のデ ータの内容を理解する必要があるが、データが特定の標準に従っている場合には理解が容易になると同時に、 標準の使用を想定して作られたソフトウエアによりデータの視覚化等を容易に行うことができる。また、将 来的な蓄積データの横断的な検討には、各臨床試験のデータが特定のデータ標準に準拠していることが不可 欠となる。国際的なデータ標準への準拠は、医薬品の審査のみならず開発段階の国際的な連携等においても 重要であると考えられる。 PMDAでは臨床試験データのデータ標準として CDISC ( C l i n i c a lD a t aI n t e r c h a n g eS t a n d a r d sC o n s o r t i u m )に よる標準を採用することとし、 SDTM(SωdyD a t aT a b u l a t i o nModel)に従う臨床試験デー夕、 ADaM(An a l y s i s D a t aModel)に従う解析用デー夕、及びそれらの定義ファイル ( D e f i n e . x m l)の提出を求める予定である。 PMDA における CDISCに準拠した臨床試験データの入手は初めてのことであり、各審査員の CDISCへの理解を促 進する必要がある。また、申請者に関しでも、データ標準として CDISCが採用され、それに従ってデータが まとめられている例はまだそれほど多くないようである。 PMDAにおいては平成 25年後半より、実際に製薬 企業から CDISC標準に準拠してまとめられた臨床試験データを提出してもらい、 PMDA内で一定の解析が可 能であることを確認するパイロットを実施しており、パイロットの実施を踏まえて各社の CDISC準拠データ 聞に多少の違いがあることを認識している。このような違いが出てくる原因としては、様々な臨床試験に適 用可能な標準そのものの特徴もあるが、標準への理解度や経験の違いも考えられる。今後、本邦において CDISCの利用を推進していくにあたっては、標準自体の理解や情報の共有を進めることが重要であると考え る 。 今後の展開 PMDAでは現在、「基本的考え方」に続き、実務的な詳細に関する通知に含めるべき項目について整理し ており、今後も関係者との意見交換、パイロットの実施等を踏まえて検討を進めていく予定である。特に CDISC標準に準拠した臨床試験データに関しては、これまでに準拠したデータを作成したことのある経験者 の意見も踏まえて、利用にあたっての注意や、 SDTM、ADaMそれぞれのモデルに関する作成時の留意点等 ‑ 3 6 4・

375.

のより詳細な内容を提供することが重要であると考えており、実際に製薬企業及び CROの実務担当者の協力 も得て、技術的な準拠ガイドに記載すべき内容も検討中である。本邦において承認申請時の臨床試験電子デ ータ提出が予定されていること、 C DISCによる各種標準については今後のパージョンアップも想定されるこ DISCの利用に関してはガイド等の発出に加えて、利用者内の頻繁な情報共有も重要であると考え とから、 C られる。今後も、臨床試験におけるデータの収集、整理や解析データセットを用いた結果の解析、承認申請 DISC標準データに関わる実務担当者や、承認審査にデータを用いる PMDA の準備等、申請までの各段階で C も含め、各自の経験を踏まえたタイムリーな情報共有により、本邦における C DISCの普及が速やかに進めら れることが期待される。 参考文献 厚生労働省医薬食品局審査管理課長、「承認申請時の電子データ提出に関する基本的考え方について」、平成 26年 6月 20日薬食審査発 0620第 6号 ‑ 3 6 5・

376.

社内標準策定での CDISCの利用 坂上拓 株式会社中外臨床研究センターバイトメトリクス部 データサイエンスグループ lT S t a n d a r d i z a t i o no fs t a t i s t i c a la n a l y s i sp r o c e s sb a s e donCDrSCs t a n d a r d TakuS a k a u e B i o m e t r i c sDept .D a t aS c i e n c eGroup1 T, C h u g a iC l i n i c a lR e s e a r c hC e n t e r . LTD 司 1.要旨 標準を導入することの最大のメリットは,業務の効率化,アウトプットの品質の向上,また関係者間 で同じ言葉も用いることによるコミュニケーションの向上などが考えられる. 承認申請時の CDISC標準に準拠した臨床電子データの提出義務化を控え,我々が CDISC標準を導入 する際,承認申請対応という目的と共に,如何に標準を導入することで得られる恩恵を享受するかが, 導入の大きなポイントとなる. 本発表では,当社で CDISC標準の ADaMを導入と共に検討された業務プロセスを元に,我々の統計 解析業務に ADaMを導入することで想定される効果(効率面,品質面,コミュニケーション)と,その 標準の維持・管理について紹介する. キーワード:CDISC標準, ADaM,統計解析業務プロセス 2 . はじめに CDISC標準の一つである ADaM(Ana l y s i sR e s u l tM o d e l )は,臨床研究データの統計解析と,それに続く 統計的な検討を行うためのデータモデルで、ある.この ADaMは , CDISC標準の臨床研究データの申請用 データモデルである SDTM(SωdyD a t aT a b u l a t i o nM o d e l )のようにハードな標準の枠組みが規定されてお らず,自由度が高いデータモデ、ルで、あることが知られており,作成されるデータセットの数,そのデー タ構造,作成される変数は,解析要件(仕様,解析帳票のレイアウト)によって多様に変化する. 3 . 解析要件と ADaM/データ処理の関係 臨床検査値のシフトテーブルを例に,解析要件によって ADaMや,解析プログラムがどのように変わ るかを説明する. 臨床検査のような,被験者に対し複数の測定項目・測定時点を有するデータを解析する際, BDS( B a s i c D a t aS t r u c t u r e )と呼ばれる構造を持つ ADaMを用いる. 表1.臨床検査値のシフトテーブル ( 1) ‑ 3 6 6 ‑

377.

B a s e l i n e Parameters V i s i t NEUTROPHILS WEEK2 GroupA N=xx GroupB N=xx Low Normal ~ xxx( x x x . x ) xxx( x x x . x ) xxx( x x x . x ) Normal XXX( x x x . x ) XXX( x x xぷ) XXX( x x x . x ) H i g h x x x . x ) XXX( x x x . x ) XXX( x x x . x ) XXX( Low Normal H i g h x x x . x ) xxx( x x x . x ) xxx( x x xx ) xxx( x x x . x ) XXX( x x x . x ) XXX( x x x . x ) XXX( XXX( x x x . x ) XXX( x x x . x ) XXX( x x x . x ) Low x x x . x ) XXX( x x x . x ) XXX( x x x . x ) XXX( Normal XXX( x x x . x ) XXX( x x x . x ) XXX( x x xx ) H i g h x x x . x ) XXX( x x x . x ) XXX( x x x . x ) XXX( x x x . x ) XXX( x x x . x ) XXX( x x x刈 XXX( XXX( x x x . x ) XXX( x x x . x ) XXX( x x x . x ) XXX( x x x . x ) XXX( x x x刈 XXX( x x x . x ) S h i f t Low WEEK3 目 目 表 lのシフトテーブソレを実現するには,以下のような変数を有する ADLBを作成する. ADLB USU副 1 0 PRAMCO PARAM ABLFL AVISIT TEST‑Ol GroupA TRTA NEUT NEUTROPHILS Y WEEKl NORMAL TEST‑Ol GroupA TEST‑Ol GroupA TEST‑02 GroupA NEUT NEUT NEUTROPHILS NEUTROPHILS WEEK2 WEEK3 NORMAL NORMAL NEUT NEUTROPHILS WEEKl NORMAL TEST‑02 GroupA NEUTROPHILS WEEK2 NORMAL NORMAL LOW TEST‑02 GroupA NEUT NEUT NEUTROPHILS WEEK3 NORMAL NORMAL TEST‑02 GroupA NEUT NEUTROPHILS WEEK4 NORMAL HIGH Y BNRINO LBNRINO NORMAL LOW NORMAL この ADLBの変数を解析帳票に annotate した結果と,解析帳票を作成するために必要な,データ処理 の概要を以下に示す. ADLBannotate結果 処理概要 B a s e l i n e PA.RAM ̲̲圃薗ー̲. BNRIND ̲園開園田ー・ ト 、 配 、 ・ τ 一 一 一 一 一 一 一 一 一 一ーで?で一‑;‑ Param r s V i s i t S h i f t Low Normal H哩: h ̲ ~ . . ‑ ー ー 一 ・ 冒 一一ーー司 NEUTROPH比 五i WEEK2 ii Low ixxx( x x x . x ) XXX( x x x . x ) XXX( x x x . x ) ! ::Normal:XXX(削 x ) 削 (xω) XXX(xω} AVISIT H i g h Il O ( Xt Y V . . ¥ XXX( x x x . x ) XXX( x x x . x ) F ! ! LBNRIND WEEK3 ~ :Low ^ ^ ^I x x x . x l XXX( x x x . x ) XXX( x x x . x ) x x x . x ) XXX( x x x . x ) XXX( x x xぷ) Normal~ XXX( H i g h XXX( x x x . x ) XXX( x x x . x ) XXX( x x x . x ) WEEK4 IILow XXX( x x x . x ) x x x(xxx.x) x x x(xxx.x) Normalix x x(xxx.x) XXX(xxx.x) XXX(xxx.x) l . . ̲ ー ー ̲ i;_I!~__i x x x(xxx.x) XXX(x 肌 次に解析要件を変更し,以下のような臨床検査値のシフトテーブルを作成する場合を検討してみる. ‑ 3 6 7‑

378.

表2 . 臨床検査値のシフトテーブル( 2 ) B GroupA Group N=xx N=xx Low/NormaltoHigh XXX(xxx.x) XXX(xxx.x) High/NormaltoLow XXX(xxx.x) ) XXX(xxxぷ Parameter5 Shift NEUTROPHILS 表 2のシフトテーフ守ルは,ベースラインの測定値から,ポストベースラインに発生した最悪値への変 動(同一被験者が High/Lowの両方向に変動した場合は,それぞれにカウント)を,特に関心のある変 動に着目して集計したものになる.本帳票を作成するために,以下のような変数を有する A D L B を作成 する. ADLB U5UBJIO TRTA PARAM ABLFL AVI51T AVAL BA5E v WEEK1 4 . 2 4 . 2 。 NORMAL TE5T‑01 GroupA NEUTROPHILS CHG BNRIND LBNRINO 臥M L NOR OTYPE F T l S村I High/Nomalt olow TEST‑01 GroupA NEUTROPHILS WEEK2 1 .7 4 . 2 ー2 . 5 NORMAL LOW TEST‑Ol GroupA NEUTROPHILS WEEK3 2 . 3 4 . 2 ‑ 1 .9 NORMAL NORMAL 1 .7 4 . 2 ー2 . 5 NORMAL LOW MINIMUM 2 . 3 4 . 2 一 1 .9 NORMAL MAXIMUM 7 . 5 。 NORMAL 7 . 5 NORMAL NORMAL INE POST‑BASEl TEST‑01 GroupA NEUTROPHILS MIMINUM POST‑BASEL lNE TEST‑01 GroupA NEUTROPHILS MAXIMUM Y TEST‑02 GroupA NEUTROPHI凶 WEEK1 TEST‑02 GroupA NEUTROPHILS WEEK2 8 . 2 7 . 5 0 . 7 NORMAL HIGH TEST‑02 GroupA NEUTROPHILS WEEK3 9 . 1 7 . 5 1 .6 NORMAL HIGH TEST‑02 GroupA NEUTROPHILS WEEK4 1 . 7 7 . 5 ‑ 5 . 8 NORMAL LOW 1 . 7 7 . 5 ‑ 5 . 8 NORMAL LOW MINIMUM High/Normaltolow 9 . 1 7 . 5 1 .6 NORMAL HIGH MAXIMUM LowjNormaltoHigh POST‑BASEL lNE TEST‑02 GroupA NEUTROPHILS MIMINUM POST‑BASEL lNE TEST‑02 GroupA NEUTROPHI凶 MA 山 MUM この A D L Bの変数を解析帳票に annotate した結果と,解析i 帳票を作成するために必要な,データ処理 の概要を以下に示す. 結果 処理概要 A D L Bannotate ‑PARAM ふ Pa ters NEUTROPHILS LYMPHOCYTES GroupA Shi SHIF T1 N=xx ー 1L ー o・ W /N ormaltoH ・ i ー ghー . i XXX(xxx.x) :High/NormaltoLow : ) XXX(xxxぷ 一 也監 一 Ll Low/L 伽円 22m2a2 lM i E h i !..t~!;?~_! byPARAM XXX(xxx.x) XXX(xxxぷ ) Reporting 表 2は,世間一般に「縦持ちデータ J と呼ばれる B D S構造から作成し易いレイアウトで,データ処理 の処理概要で減少した lステップ以上に,解析帳票を実現するためのデータ処理が単純化できることは, 表 lのレイアウトの解析帳票を一度でも作成したことがあるプログラマなら容易に想像できる. また,表 2のレイアウトは,尿検査や医師所見といった定1 ' 空値項目の頻度集計と同様のルーティンで 処理することができ,解析プログラムの再利用も可能にする. ‑ 3 6 8 ‑

379.

提示した ADLBやデータの処理概要はあくまで一例に過ぎないが, ADaMのデータ構造や変数の特性 に応じて解析要件を工夫することにより,データ処理が単純化され,効率的に解析業務を遂行できるよ うになる. 4 . 標準の活用 本章では,弊社で ADaM導入時に検討された業務プロセス(図 1 ) を紹介すると共に,そのプロセス で得られる効果について紹介する. この業務プロセスは,第 3章のシフトテーブ、ルの例で説明した, r 解析要件によって作成されるデータ セットの数,そのデータ構造,作成される変数が変わる J という考えの元,解析要件を CDISCに適した 形で固定した上で,構築した業務プロセスになる. まだ着手が始まったばかりで,これから示す業務プロセスは,構想段階の域を出ないことをご留意い ただきたい. ご崎一 一 一 川 一 一 dF 間出世当ー町一一量一 昨一 一 位 一 一 一 一 一 一 一 一 回 一 一 一 一 一 一 し は し 一 zt一直一 唱 し 図 1.ADaMを導入した統計解析業務プロセス 4 . 1 アウトフ。ットカタログ アウトプットカタログは,どの試験でも概ね作成される解析帳票のレイアウト集で,レイアウト名と そのレイアウトが対になるように管理されていることが望ましい.生物統計家は,このアウトプットカ タログから,必要な解析帳票を選択し,統計解析計画書を作成する(レイアウト集にないものは別途計 画するに 369‑ ー

380.

これにより,モックアップを作成する手聞が省け,製品横断的に同じレイアウトの解析帳票を作成す ることができるようになる。また,アウトプットカタログを,臨床開発担当者やメデイカルライター, プログラマと共有することで,出力イメージや,解析帳票に表示されている数値の意味を共有しやすく なると共に,レイアウト名を使った会話が成り立つようになる. 4 . 2 標準管理 DB 標準管理 DBは,アウトプットカタログのある解析帳票を実現するために必要な, ADaMのデータセ ットとそのメタデータ(変数属1 ' 生や導出ルーノレ,格納値のターミノロジ一等),解析帳票のプログラム仕 様を管理したものになる.当然,解析する疾患領域や,プロトコルによって解析要件は異なるため,全 てを標準として管理するは不可能で,管理するものは必要最小限に留めておく(解析要件のバリエーシ ヨンを把握できている場合は,バリエーション分管理した方が,より統制が効く).この標準管理 DBは , 標準管理者と標準を検討するチームを用意し,定期的に標準を見直すようなプロセスを構築して運用す る. また,この標準管理 DB と共に,解析要件に応じて標準から変更したもの,新たに追加したものを管 理しておくと,定期的に標準を見直す際に参考情報となる. 4 . 3 プログラム仕様書と d e f i n e ‑ x m l プログラム仕様書は,統計解析計画書で計画されたレイアウト名を元に,標準管理 DBから自動的に 生成する.これにより,社内で作成されるデータセットの仕様は統一されると共に,プログラム仕様を 効率的に作成できることが期待される. 標準管理 DBから自動的に生成されたままの状態では,統計解析計画書の要件を満たさないため,統 計解析計画書を元にプログラム仕様書を更新することになる.ここで更新された情報を,標準と比較し, その差分(標準からの変更点・新規に追加した仕様)を把握しておくことで,プログラム仕様書のレビ ューするポイントが絞られ,効率的な文書レピューと,仕様書の品質向上が期待される. e f i n e . x m lを作成するためのデータソースとなる. 更新されたプログラム仕様書は, d 4.4プログラミングと品質保証 解析帳票は,アウトプットカタログと標準 DBを元に作成する解析帳票作成プログラムライブラリに あるものを用いて作成する.品質の保証されたプログラムを用いて解析帳票を作成するため,プログラ ム開発とその品質保証に係る時間を大幅に短縮できる.また,解析要件に応じて変更・追加した箇所を, 特に注意すべき箇所として品質保証することで,効率的に品質保証できることが期待される。 5 . まとめ このように,標準を導入し,その恩恵を享受するには,まず導入する標準を元にプロセスを再構築し, 標準を維持・管理していくための仕組みが必要だと考える. 当社では, 4 章で紹介した統計解析業務プロセスの導入に着手したばかりだが,一部の工程は実装可 能な段階まで来ているものもある。今後も,本業務プロセスの実装方法と成果,発生した問題点を共有 していきたい. ‑ 3 7 0 ‑

381.

参考文献 M i c h a e lJ .Kl e p p e randB a r t o nC o b e r t( 2 0 1 1 ), DrugS a f e t yD a t a:How1 0An a l y z e,Summarize,andI n t e r p r e tt o D e t e r m i n eR i s k . 開 3 7 1 ‑

382.

i J ‑ : ‑ f Y J l 医 積 政 府 自 治 体 大 学 問 問 也メ 知コ一 雌 9 W l J SASを用いた EMICMアルゴリズムによる MST推定の性能評価 中川雄貴,若林将史.浜田知久馬 東京理科大学工学研究科 Performancee v a l u a t i o no f t h eMSTe s t i m a t i o nmethodu s i n g t h e EMICMa l g o r i t h mw i t hSASSoftware Y u k iNakagawa,MasashiWakabayashi,ChikumaHamada TokyoU n i v e r s i t yo fScience GraduateSchoolo fE n g i n e e r i n g, は む 均 気 持 ( 持I ι l医蝿蜘自体増I 触 要旨: SASG l o b a lForum2010において,区間打切りデータにおける 生存関数の推定を SASで実行するプログラムが発表された [8] 本発表ではその論文で用いられている EMICMアルゴリズムに よる生存関数推定法の性能を検討する キーワード:EMICMアルゴリズム, MST,区間打切り, 生存関数 ‑ 3 7 2 ‑ 2 0 1 4

383.

1 医療政府関均一一緒語~--;~S:1_"-øa 2 0 1 9 生存時間解析 》生存時間解析 獄験終了時の患者の生存や追跡不能等の打切りを扱う 》生存関数 :t ) ある時点 tまでイベントが起きない確率 S(t)=Pr(T; 》本研覧では生存関数に指数分布を仮定 h ( t )= A S ( t )= e x p ( 一λt ) 臨政府自治向日必み硲トムー ~9 区間打切りデータ 》ある区間内でイベントが起きたことしかわからないデータ 》がんの臨床試験における区間打切りデータ 》増悪は隣接した診断時点聞で発生→正確な発生時点が確認できない 》増悪確認時点を増悪発生時点として解析→生存時間の過大評価 》区間打切りの例 $ 診断時点 " 2④ ," │ b i a s │ " i ⑬ 災:増悪発生 1 6 ‑ 3 7 3 ‑ 20 24 同 )

384.
[beta]
テ
ム
の
実
証

2

SAS.::J.‑"'‑儲

加9

MST:MedianS
u
r
v
i
v
a
lTime
》生存割合が 50%となる時点・がんの治療効果の指標
治療後の生存期間中央値 (MedianS
u
r
v
i
v
a
lTime)
→増悪の 50%時点
生存蜜骨

10

品
ロ

lu

場
た

仮

定

布

を

釘⁝附

kF

M指

09

05

S
(
t
)= exp(ーλt
)
0.
5= exp(ーλMST)

l
o
g
(
0
.
5
)

MST=ーーす一

04

j
圏 、J
。十」

。 ( ' )診断時点

。φφ68
φ
;
J
:
1
J
1
φ
1
8
φ
2
2③

│医療政府自郎学問

MSE:MeanSquareE
r
r
o
r
》推定慌のばらつきの指標
二乗損失の期待値目平均二乗誤差 (MeanSquareE
r
r
o
r
)
》定義式

>
> X:推定髄

MSE= E
[
{
X
‑μ}2]

,
真
値
>
> 8 :推定値の期待値E
[
X
]
》 μ

=E[{(X‑θ)+(θ 一μ))
2
]
=V[X]+(8‑μ)2

>>MSEを小さくする推定法→精度の高い推定法

‑
3
7
4
‑

385.

医療、政府自…一手伝説ムー 9 W l J 力プラン・マイヤ一法 》生存鴎数の推定法 生存時間分布に特定の分布の仮定はしない,打切り考慮 》カプラン・マイヤー推定量 ) > t i :イベント発生時点 》πi:リスク集合の大きさ ) > di:イベント発生数 ( 1‑~) x ( 1 ‑子 )x・・ ( 1‑~) =n ( t , ( 1‑~) S ( t )= < t ) ‑ |閥、蜘自治一一本当訴訟~irf"~SAS~_"-.* 2 0 1 9 区間打切りの場合の生存関数推定法 》カプラン・マイヤ一法 》右側近似 イベント確認時点をイベント発生時点として 生存関数の推定を行う手法 》中点近似 イベント確認時点と直前の診断時点の中点を イベント発生時点として生存関数の推定を行う手法 yEMICM(Expectation‑MaximizationI t e r a t i v eConvexM i n o r a n t ) アルゴリズム [4][5][6] 生存時間分布に特定の分布を仮定することなく, 区間打切りの影響を考慮して生存関数の推定を行う手法 最尤推定で特定の基準を満たすまで推定値の更新を行う ‑ 3 7 5 ‑

386.
[beta]
│臨政府自治問吋1
1
がゐ(‑ 2
0
1
9
生存関数推定法に基づく MSTb
i
a
sの例

:
"
;了‑L‑1‑i¥¥
:
!
'
¥

。 φ0'

"
',;" <
8
;;
"

・~

右側近似

~ n

, .0診 断l点

。

令。 4
h〈beedb!3J6 ・ ~n 令。4>く!>

̲<
.
)
:

G

中点近似

6

i
f
s
断跨

九

i⑫ぉ③

t ~ ~,,' ~~~ -~. '
,
'

EMICM

》推定法が異なれば, MSTb
i
a
sの大きさも異なる

同一…よ匂汐碕j
ミ
.
総
* 2
0
1
9
研究目的
》生存関数推定法の性能をシミュレーションによって評価
》複数の MSTの真値を設定し複数の診断スケジュールにおいて
総合的に性能がよい適切な生存関数推定法の検討
》性能評価指標
正確度:MSTb
i
a
s
正確度+精度:MSE

コ臨床試験における適切な MSTの推定法の検討

1
03
7
6
387.

ぷぷ次 医額、政府・自治体、大学によるロジス弘め実謹 ρ b 1 . t 1 ! a ; z = 倣 ヲ 目1 r J I シミュレーション条件 》想定する条件 》想定する臨床試験.追跡期間 2 4ヶ月の臨床試験 》生存時間分布:指数分布 》患者数 9 9人 》診断回数 : 6回 T >MSTの真値:8,1 0,1 2,1 4,1 6ヶ月 》シミュレーション回数:10000回 》診断スケジュール T >j (等間隔) :4,8,1 2,1 6,20,24ヶ月 t >j (前半は密後半は疎) :2, 4,6,8,1 0,24ヶ月 t >j j j(前半は疎後半は密) : 2,1 6,1 8,20,22,24ヶ月 t >j v(開始時と終了時に密):2, 4,6,20,22,24ヶ月 1 1 ト医僚政府自治体大学による工コシ鳳の期[.:s'lト付金 w l l 9 等間隔な診断スケジュール l i l i i 真値 8 診断時点 4 8 10 12 14 16 12 l 16 MSTb i a s(月) l 20 MSE(月2 ) EMICM 右側近似 中点近似 2 . 0 3 2 0 . 1 4 3 8 . 1 8 6 4 . 0 5 7 1 0 2 . 1 0 3 0 . 1 5 2 7 . 1 0 4 2 . 6 9 1 1 2 2 . 0 8 2 0 . 1 4 6 9 . 0 4 3 4 . 7 1 3 14 2 . 1 2 5 0 . 1 4 4 9 . 8 9 4 5 . 3 9 7 1 6 2 . 1 1 6 0 . 1 3 9 11 . 13 9 6 . 7 2 5 真値(月) 右側近似 8 中点近似 l 24 1 2 ‑ 3 7 7 ‑

388.

│ 医額政府自治体大学による工コシステムム‑会 ~[1 前半は密で後半は疎な診断スケジュール l i i i i 真値 診断時点 8 10 12 14 16 l l l l l 2 4 6 l 8 10 24 MSTbias(月) 1 1 真値(月) 右側近似 中点近似 8 1 . 6 9 6 0 . 3 7 7 1 5 . 5 5 2 5 . 4 9 9 1 0 6 . 9 4 4 2 . 9 0 7 9 9 . 5 0 4 2 5 . 8 7 2 1 2 1 0 . 4 3 6 4 . 1 0 3 1 2 8 . 4 9 2 2 3 . 2 4 8 1 4 9 . 7 9 9 1 6 7 . 9 8 1 1 3 ト医療政府間大学による~弘の実証 s…会 W l J [ 1 前半は疎で後半は密な診断スケジュール I 111 1 真値 診断時点 8 10 12 14 16 I 1 1 1 1 1 2 16 18 20 22 24 1 I l 真値(月) 8 I8 . 0 0 0 1 4 I6.000 I4.040 I2.424 1 6 I 1.549 1 o 1 2 14 ‑ 3 7 8・

389.

臨政府間大学はるロ均 開始時と終了時に密な診断スケジュール 1 i i i 真値 診断時点 8 10 12 14 16 2 4 l 20 22 24 MSTbias(月) IV 真値(月) 右側近似 8 11 .5 74 1 0 9 . 9 9 3 1 2 8 . 0 0 0 1 4 6 . 0 1 1 1 6 4 . 1 2 4 l i 6 MSE(月2 ) 中点近似 EMICM 右側近似 中点近似 EMICM 4 . 7 5 6 記儲9二 撒 2 4 . 5 1 3 ~;21SJ 1 3 9 . 7 4 4 I t 治 1 5 │ 〓 川 辺 叩 医額、政府・自治体、大学によるZコジスホムの実龍 sÁ釦~会 …ー│ "..4l1 r~1. 等間隔な診断スケジュールにおける 中点近似の性能評価に対する再検討 》等間隔な診断スケジュールにおいて中点近似が MSTb i a s最 小 →真値の設定がたまたま中点近似の性能を上げた可能性 以下の設定でシミュレーションを実行,性能の再検討 》想定する条件 》想定する臨床試験:追跡期間 24 ヶ月の臨床試験 》患者数:99人 ~MST の真値: 9,1 1,13,15,17ヶ月 》シミュレーション回数:10000回 》診断スケジュール 凶(等間隔):4,8,12,16, 20,24ヶ月 16 ‑ 3 7 9 ‑

390.

i医 痕 政 府 自 治 問 に よ る 工 コ シ ス テ ム の 担 … 一 齢 ~9 等間隔な診断スケジュール l 1 1 1 1 真値 9 i 診断時点 4 1 8 1 1 13 15 17 1 1 i 12 16 20 MSTbias(月) 真値(月) 右側近似 9 中点近似 l 24 MSE(月2 ) EMICM 右側近似 中点近似 2 . 2 4 4 8 . 1 0 8 3 . 1 3 2 1 1 2 . 0 4 7 7 . 9 1 6 3 . 7 2 5 1 3 2 . 1 2 0 9 . 5 6 1 5 . 0 7 8 1 5 2 . 1 3 8 1 0 . 6 1 1 6 . 0 5 7 17 2 . 1 2 6 .626 11 7 . 2 4 2 17 l 医療政府駒大学問切払のふ… ~9 まとめ 》シミュレーションによって生存関数推定法の性能を評価 》診断時点が等間隔な場合は中点近似が MSTb i a s最 小 → EMICMアルゴリズムによる推定も大きな差はない 》すべての診断スケジュールにおいて EMICMアルゴリズムによる推定は安定して性能がよい アルゴリズムによる推定を用いるのが好ましい = キ EMICM 1 8 ‑ 3 8 0 ‑

391.

E i W r j = j ' 塑盟聾韓轟轟冨 2 0 1 4 参考文献 [ 1 ]A n d r z e jP .,MarekK . .B i o i n f o r m a t i c s .S p r i n g e r .2007. [2]DempsterA . P .,L a i r dN.M.,RubinD. 8 . .Maximuml i k e l i h o o dfrom i n c o m p l e t ed a t av i aTheEMa l g o r i t h m .JournaloftheRoyalS t a t i s t i c a l So c i e t y,S e r i e sB,39,1 ・3 8 .1977 [ 3 ]E f r o nB . .Thetwosampleproblemw i t hcensoredd a t a .I nP r o c . 5 t hBerkeleySymp.onM a t h .S t a t i s . tProb..Berkeley:Universityo f C a l i f o r n i aPress,8 3 1 ‑ 8 5 3 . 1967 [ 4 ]GroeneboomP .,W e l l n e rJ目 A . .I n f o r m a t i o nboundsand nonparametricmaximuml i k e l i h o o de s t i m a t i o n .DMVSeminar ,Band 19,B i r l くh auser,NewY o r k .1992 [ 5 ]JianguoS . .TheS t a t i s t i c a lA n a l y s i so fI n t e r v a l ‑ c e n s o r e dF a i l u r e TimeD a t a .S p r i n g e r .2006. 1 9 Et=i!@rj=i聖霊盟盟盟璽宮室tllj~1 参考文献 [ 6 ] T u r n b u l lB .w . .Nonparametricestimationofsurvivorshipfunction w i t hdoublycensoredd a t a .J o u r n a loftheAmericanS t a t i s t i c a l 6 9 ‑ 1 7 3 . 1974 A s s o c i a t i o n,69,1 [ 7 ]WellnerJ .A .,ZhanY .Ah y b r i dA l g o r i t h mf o rComputationo ft h e NonparametricMaximumL ikelihoodEstimatorfromCensoredData, J o u r n a lo ft h eAmericanS t a t i s t i c a lA s s o c i a t i o n,92,9 45‑959. 1 9 9 7 . [ 8 ]YingS .,GordonJ .,SeH .K A n a l y z i n gI n t e r v aトCensored S u r v i v a lDataw i t hSASS o f t w a r e .SASG/obalForum2010, paper257.2010. [ 9 ]大橋靖雄,浜田知久馬生存時間解析東京大学出版会 2010 目 20 ‑ 3 8 1 ‑

392.

ア : i ヱ ン ダ 1 .データ公開・共有の背景 2 .データ公開・共有の概要 3 .SASの役割 4.CTDT ソリユーションの概要 5 .M u l t iS p o n s o rE n v i r o n m e n t ( M S E ) 6.CTDTにおけるホットトピック │M ‑ 3 8 2 ‑

393.

1 .データ公開・共有の背景 l1li…ー(j F データ公開・共有の背景 s a九 │ 背景 ・製薬企業が、 NDA(新薬承認申請)を行う際に、 データなどのエビデンスを、 FDA、EMAや PMDA などの 規制当局に提出 義 よ 、 ‑ それらのデータは基本的には、 提出する製薬企業、及び、 受領する規制当局以外の 第三者は入手不可 ‑ 医薬品業界は、 この従来より独占権を持って扱ってきた データの管理について、考え方を変えつつある状況 l l!lllSlI'l伽‑ ‑ 3 8 3 ‑ ( j 田 ‑ ,

394.
[beta]
EMA
のドラフトガイドライン(1/
2
)

データ公開・共有の背景

EMA(欧州医薬品庁)が、 2
0
1
4年6月2
4日にリリースした、データ公開・共有に関するドラフト
ポリシーにて患者レベルデータの公開などがうたわれており、医薬品業界関係者の関心が
高まりました。

。

EU.
邸宅 ANM
EDIC!NlSN
:
i
臨 むY
ち
句 " NC!

4

.~ f'

P
u
b
l
i
c
a
t
i
o
nandaccesst
od
i
n
i
c
a
l
‑
t
r
i
a
ldata

s

.
.
.
.
=
o
!
>
.
.
I
If c < 叫 ‑

s

一昨

J (I

~II"'"

I

u
12

附
"
・ductl・
師
・
ぬdpurpoo

1.1

一
…
一
一
一
'
'
'
'

|ドい引加川川川
1什r引和川川川
町川川!叱川叫叫仁け叫叫川山
iりl片y刊
咋削
刊山
伽川川山山
Cω
巾mωM
川
ωf
川山
111
叩
M
引仏
l比は~

データ公開・共有の背景

EMA
のドラフトガイドライン (212)

多数の、意見の異なるパブリックオピニオンの受領などを通じて、 EMA
の意思決定は遅延し
てきましたが、データ公開・共有のポリシーに関して6月に方向性について合意し、最終化中
の詳細手順を含め、 7月中旬に完成する見込みです。

…
量蜘

Nov22, 喜一一ーセ
議一
2012

I

臨床ヂ‑';1公開・共
量 Oct1

I2014

I'Public

Dec17,
2014

墨 ι-=-~ム"-__ I C
o
n
s
u
l
t
a
t
i
o
n
孟護軍量議題量器翠;;1 Closed
W o刺kshop 1

'CTDT

‑
3
8
4
‑

Jun 1
2,

2014

有のボ 1
)シ に つ
いて合意

395.
[beta]
データ公開・共有の背景

e
f
p
i
aとPhRMA
共同のコミットメント

20137月、欧州製薬業団体連合会 (
e
f
p
i
a
)と米国研究製薬工業協会 (PhRMA)が、データ
公開・共有に関して、共同でコミットメントを行ないました。

B泊 叫

e
f
p
t
a

5つのコミットメント

,

1 患者レベルデータの研究者との
共有の推進
2 臨床試験情報(最低でもCSRの概要)への
市民のアクセスの推進
U [tr.:開閉j加~耳目朗代3 臨床試験に参加した患者への
結果の共有
仰 向 品l
叫
…
…
一
m
耐
一
叩
ω
吋
一
…耐
出
刷
帥
附
t
旬
d
…
帥
e
…同
h
。
州……
a
向
叫
山
叩叫叩
川叫
…
…
帥
p
…
附…
川…
i
h
陣
川
曲
附
師
似
酬
一
柚
山……
4 臨床試験情報を共有する
n
n
g
o
f
ぬ
d
2κ
tg副
8
I
t
柏
n
叫
a
l
d
a
t
a
lnaman
e
r
t
仙
hはt
t
恒
e
刷
n
川t
叩
w
;
,
納
h
t
h
e制 i
ぬ。刷呼 P
n
n
α
叩p
臨
手続きの保証
.
S
a
f
e
g
u
a
吋i
n
gt
h
ep
r
i
v
a
c
yo
fp
a
t
i
e
n
t
s
5
. 臨床試験の結果の公開に関する
‑
R
.
申・ c
t
i
n
g
t
h
e
i
n
抽g
r
i
t
yo
fn
a
t
i
o
n
a
l阿 g
u
l
a
柏町'1'恒 ms
コミットメントの再確認
|-両両両面山両示戸川向元副両……山側~部恥二j

m
;
t
;
m
r
s
T
:
J
l
i
J
j阿部mt
i
]
!
‑
llIj1I1lli!1'.1回~巾-,

・

l

剛
阿
剛
附
師
臼

川

剖打

司叫"絹 $印悶陪

叩
、
闇

2
.データ公開・共有の概要

│
川

‑
3
8
5
‑

396.

データ公開・共有の概要 Who, what, whyandHOW?(112) ‑独立した委員会 ( I n d e p e n d e n !P a n e l )が定義する、「正当な』研究目的 .一般的な探索のためではなく、研究に関する提案書の提出が必須 ・ライフサイエンス企業 l 立、結果にアクセス 両 両 データ公開・共有の概要 ! 白 川 山 Who,what,whyandHOW?(212) ‑結果の再現、検証を可能とすること ・新たな知見を生むための、貴重なリソース ・治験参加者への義務、彼らのデ‑$1の再利用 ・公衆衛生の改善、患者の安全性の改善、医薬品開発の促進 ・世間からの信頼の醸成 ・潜在的な規制に対する積極的な対応 ‑ 3 8 6 ‑ 羽

397.

3 .SASの役割 臼 ‑ S SASの役割 取り組み経緯 SASは 、 2013年前半に先行企業様のデータ公開、共有環境を構築した後、先行企業様の お力をお借りしながら、本テーマに関するミーティングなどをコーディネー卜して参りました。 2013年前半 先行企業様の環境構築{臨床デ一世レポジトリ、 SDD*をベースに開発) 2013年 10月17日 第 1回 CTDT フォーラム開催 (SAS 米国本社) 2013年 12月 第 1回 CTD 丁目本セミナー開催(東京、大阪二回開催) 2014年2月 1 1日 第2回 CTDT フォーラム開催 (SAS米国本社) 2014年第一四半期 r S A S @ C l i n i c a l T r i a lOataTransparencYJを製品化 2014年 4月29臼 フォーラム開催 (SAS英国オフィス) 第 3回 CTOT 2014 年第二四半期 M u l t iSponsorEnvironmen t (MSE:後述)を提供開始 2014年 8月下旬 第 2回日本 CTOT セミナー開催(予定) 卜 山 I I 1 n ~恥. I 叩 即 日r 咽[tlm… ‑ 3 8 7・

398.

SASの役割 ご参考資料 ミーティング等の様子は、以下のリンクからご参照頂くことが可能です。(一部、登録が必要) 先進企業の皆様が、 CTDTの取り組みの意図やオペレーションについて共有されております。 .第 1回CTOTフォーラムのビデオ、マテリアル • h t t p : / / 盟盟盟宣車昼堕担金nus/,白押ers/13a41C皿屋呈.1-Tria~Datを工堕DJill呈堕!!ÇY:白血m乏286皇鍾l段gister.html .第2 回CTDTフォーラムのビデオ、マテリアル h世' o : I /w.Nw . s a s∞m/en u邑白宵e r s l 1 4 a 1 / C l i n i c a l ‑ T r i a l s ‑ D a t 国‑ Transoa 間n cv‑Farum‑Post‑Event‑ 912341 陪 a i s t e r . h t m l 22 ・第3回CTOTフォーラム • h t t o : / , 川ww.sas∞m / a o D s l w e b n e t l e v e n t sho附 video.html?Dlavlist=a差益皇50769笠白昼捌宣,!-=--~v ct2014 ※ビデオ h 1 1 0仇 帆 州 sas∞m / o f f i c e s l e u r o o e / u k l d o w n l o a d s / c l i阿 国I t r i a l d a t a ‑ e x e c ‑ s u m m a r v . o d f※イベントサマリー . エグゼクティブに対するビデオインタビュー . h\!Q.:伽型民鰻丞盟ml銀p~!':!.堕bne.阪宣車眼鏡安世主国里ohtml?ola叶 ist=346874但鐙∞1皇国野三位3位制皇盟 担1 丑 . . . . . . . . . I |山山~ 6臼r; 4.CTDT ソリユーションの概要 s .. ご I ‑ 3 8 8 ‑

399.

i独立審査委員会(lRP)で /の提案レビュー /iデータ公開・共有 二 三 」 司 掴 ム官 Lr イ 出問サ 提開け の閉止 f 案叩げ 提同 究山 f研l叩 CTDT ソリューションの概要基本的なワークフロー 提案の 」与 (肝白 ‑M‑2J 田 昌 酌 叫 ん Ll t I J : 認 議長 S │ 叫 伽 附 叩 CTDTソリューションの概要 ソリューシヨンのカバー範囲 : : sAS@CTDT のオプシヨン、もしくは ideaPoint 社システムのカバー範囲 1,研究提案の提出 日 SAS@CTDTの カバー範囲 リ / 独 立 制 委 員 会( I R P ) " ( ' I~ー i の提案レビュー 止 ぜ こ 型 公 開 ・ 共 有 パブリッヲサイド 持 マ 一 国 一 / 帽 ;日書写‑一 ;惜し;醤 s lllliIlI'l叫叩同p川 ~ 1 加問lilI印刷 ‑ 3 8 9 ‑

400.

研究提案の 提出 CTDT ソリューションの概要基本的な要件 か‑凶諸島 お な ・ m吋 ' 都L醤 ‑ パブリックサイトでの情報掲載 ‑ 公開可能な情報(プロトコル情報、患者レベルデータ等)の説明 公開可能な試験のリスト .研究提案プロセスの説明 ‑ データ利用同意書 ( DataUsageAgreement)の説明 ‑匿名化の方法の説明 ・当該時点までの研究提案数、その承認数等の指標、等 5)お . . │石川んぷ 研究提案の 提出 CTDT ソリューションの概要基本的な要件 研究提案のハンドリングの為の機能 ‑研究提案の入力、受領 独立審査委員会 ( IRP)への通知 │ 白 川 ‑ 3 9 0・

401.

独立審査委員 会(lRP)での CTDTソリューションの概要基本的な要件 提案レビュー 独 立 審 査 委 員 会 (IRP)での提案レビュー 新たにレビューが必要な研究提案の通知 .研究提案へのアクセス ‑ スポンサーから追加情報が必要な場合等の、スホ。ンサーへのアップデート ‑結果のスポンサーへの通知 土f 土 c ! 8 " t " " ~SaS~!ii. 独立審査委員向 . , . " , 会(lRP)での 1 1 CTDT ソリューションの概要 基本的な要件 ' " ー/ 提案レビュー ‑ 独 立 審 査 委 員 会 (IRP)での提案レビュー 【承認の場合】 必要なデータのスポンサーへの通知 ・スポンサー新規データの場合、匿名化 システムーリサーチヤ一向けの研究領域とアカウントの用意 システムー新規データの場合、データのロード システム:研究者とデータの関連付け 研究者に、承認された旨と初期ログイン情報の通知 【却下の場合】 ・研究者に、却下とその理由の通知 │ 白 川 ωnfldent,al ~泊S 恥 391・ ー I

402.

CTOT ソリューションの概要 基本的な要件 データ公開・共有・情報 プロジェクト領域※クラウド上の領域 . 形式を問わず、ファイルを保管 ( s a sプログラム、 sasデータセット、 p d f ファイル、 wordファイル・・・) ・ データや情報へのアクセスと閲覧 ・ 新たな情報のインポート※スポンサーが自動もしくは手動でコントロ ル可能 情報のエクスポート※スポンサーが自動もしくは手動でコントロール可能 分析ツールへのアクセス サード I~ーティツール(修IJ: R)へのアクセス │ 1 0 m 山 ~sas 恥 f f d e n f f a l I CTOT ソリューションの概要 基本的な要件 データ公開・共有国分析 【 SAS】 ※クラウド上の領域 • SASプログラムの開発、実行環境(ログやリスト、アウトプットの閲覧含む) .版管理 ・他の研究者とのデータ共有 【N o n ‑ S A S】 ※クラウドよの領域 • SAS環 境 ( S A S ‑ I M Uを通じたRへのアクセス • Rへの直接アクセス s 節税払山 l lStnctlγC川~ ‑ 3 9 2・

403.

データ公開・ " . ̲ 1 1 1ー,期限ケ':J:~.~_ .̲/ 共有 CTOT ソリューションの概要 基本的な要件 ‑ サポートと管理 ホスティングとアドミニストレーション ・ トレーニング(研究者向けのトレーニングビデオを用意) . セルフヘルプ パックアップ、システムのモニタリング . サービスレベルアグリーメン卜 (SLA) ソリュ ションや環境のアップデート ・テクニカルサポート※弊社米国本社にて集中対応 . 分析サポート※スポンサーが担当 印刷Iil白川~ ~泊S 議品 目 │ CTOTソリューションの概要 セキュアな臨床分析プラットフォーム CTDTは 、 CFR21Part1 1準拠やグローバル開発の効率化目的で実績のある 臨床データレポジトリ CCOR)、SAS@DrugDevelopmentをベースに開発されております。 F ‑ ・ E・ ‑ ‑ ・ 面 白 直 面 . 園 一 一 幽 晶 画E 圃 . パーミッシヨン・ベースのファイル・レポジ卜 1 )ぷぷ?内ャャ… ファイルの版管理 仇欄欄川畑";.~,.y..... 伊川 i 自動の監査証跡取得機能 : 一1 i 与 データ・ブラウザ L .i:.:~X::: ・ SASプログラム開発、実行機能 地ふぷ鳴らゆ…吋 ・プログラム開発環境の統合; ; (従来の SASプログラマーが 馴染みゃすい環境) ・実行環境 ・ 結果のトレース機能 (manifest ) 必要に応じて、外部の分析環境 との統合 ‑ 3 9 3 ‑ ' " , 一一目四四一

404.
[beta]
5
.M
u
l
t
iSponsorEnvironment(MSE)

s~I

M
u
l
t
iS
p
o
n
s
o
r
E
n
v
i
r
o
n
m
e
n
t
(
M
S
E
)

アプローチの比較

M
u
l
t
i
‑
S
p
o
n
s
o
rEnvironment

S
i
n
g
l
eI
n
s
t
a
n
c
e
(従来のアプローチ)
論、 i 剛 山 " 叩 町 市

む

話
番

;
で
島

一軸町長義

t

町 制

J
争

やす
‑L‑‑46
1
q怨34'‑ ,"",<.̲ー‑.司

.
.
柑幽卸幹郁俺割削

!史的
.
.

コ~一一--f6--

‑
3
9
4
405.

M u l t iSponsor Environment(MSE) MSEのイメージ 各研究者チームは、それぞれの研究プロジェクトの為に、一軒の『家』を使用 .いくつのスポンサーのデータにアクセスするかは研究者の自由(但し、承認されれば) .研究者チームが複数のプロジェクトを承認された場合は、複数の「家 jを使用 │ l 1 i m ! l l I ' l 伽 削 ntial $ . s a s恥 M u l t iSponsor Environment(MSE) MSEのメリットとデメリット 丘竪 Cons ・スポンサー毎に、設定やブランディングで きる範囲の制約 ・研究者は、一つのプロジェクトにおいて、 複数のスポンサーのデータにアクセスす ることも可能 ‑スポンサーはホステイング費用を分担する ことが可能 ‑臨床データの公開、共有について、業界 のデファクト・スタンダードを確立可能 ‑物理的には、情報を他のスポンサーの データと一緒に保管 ‑他のスポンサーと問ーのソフト、ツール、 プロセスを適用することが必要 ‑他のスポンサーとの法的な合意が必要 ‑環境構築 ( g o ‑ l i v e )までの期間短縮が可 能(数か月から数週間に) ~ w I yConfiden!ml ‑ 3 9 5 ‑ s a si*~" I

406.

‑ 3 9 6 珊

407.
[beta]
島 村 文 也 ・ 浜 田 知 久 馬 ・ 佐 野 雅 隆

東京理科大学大学院工学研究科経曽工学専攻

》 生 存 時 間 解 析 に お け る 多 群 比 較1
3
1

R
‑︐

αヱラ開怠水準以引調えるために 臥 め に 検 問 行 う
多量比鮫誌が概数存在
i

睡眠一

綿
一

・生存闇敏の多群比較における多震比躯去の性能待値 I
志+分でない

ゆ

F

w

足
山
町
一

勧

ri‑‑
し

寸1
1

M晦⁝

よ

L

白m
m
ι

a
u
‑

膚
一

f‑

EJ﹁

鍵
⁝

輪
一

ん w
が
一

生存$

,.
.

‑検定白書置性問
ー積書を複数回行うと,.エラーが増大する

・医車研究では,イベント発生までの時間(生存時間)を評価
ノンパラメトリッタ検定を用いて,各務の生存間数を比較

1

》 閲SE同の群の生存崎聞を考慮

J
o
i
n
t
‑
r
a
n
k
i
n
g法

・生存時間に対する順位付けの方法の決定

‑
J
o
i
n
島 帽D
I
U且.1
量

咽

・すべての酵の生存情聞に対して順位付けを行う

・
・

spm 静 岡DkI崎港
・比較する 2つの群の生存時間に対してのみ順位付けを行う

.︐.

鱒Mq

・

‑
e
"

(イベントョがん発生}

i

》生存時間解析において,より性能由高い鱒比闘行うため由適切な方法を鮒

1

1 ・JoInt‑rankiゆ と 均 四tc‑ranking~ q)性 能 評 価
j
l‑
α エラーを有意水準付近以下に抑えつつ,犠出力の高い多量比較法由検討 l

皮膚がん舞金までの嶋岡(週》

‑‑ーーーーーーーーーーーーーーーーーーーーーーー・ーーーーーーーーー幽幽幽幽‑‑‑ー幽ー・ーー

‑生存時間分布指数分布

》 本 研 究 で 横 射 す る 多 重 比 較 法1
1
1

・各群由症例数 5
0例 (3群 比 較 )
.検定方法。ロゲランク検定

• Bonferroni法

0通り)
‑横討した方法(計 1

‑
h

α=~

r̲~
,

崎

、

{
.
:
;
山
崎
逮
}x~門法ト
S a
l
e
‑
r
a
1
r
叩艦

地;""法

・シミユレ

シヨン回数

•S
i
由k法

0叩 町 田 温

に

α'=1‑(1‑α)
瓦

l

_n.oll~~...

1
0,
000園

S
c
h
e
f
f
e,
*
T時'"議

J

・ 有 意 水 車 両 側 5%

• Holm法

・評価指標 αエラー,総対検出力,量大差値出力,

‑p値を小さい顕に並ベてか色股宣した有意水準 aを調整

P
1S P
2S・ 三 P
h ‑+ a'I=~. a'2=6.

'
、量検出力
量1

.山
=?

• Sche
除法
一自由度を r‑1としたが分布を仮定することで鯛聾

n
o
n
‑
a
d
j
u
s
t
e
d
:p= pr
(
x
f>X
l
j
)

x
h
)

p=p
r
(
x
;
̲
l>

S
c
h
e佐
• Tukey法

‑
x
'分布の代わりに.rstudentil::された範囲の q分布』を

陸 定 lに闘して, T
ukey法が事少有意水準を上回る
S
e
p
a
r
a
t
e
‑
r
a
n
k
i
n
g法と Holm法を用いた場合が量も高い
ー巴エラーを有怠水噂以下に仰えられないログランク織定の怪貨が原因附

用いて調整

》多量比駿法における積出力問
・多重比較では複数個の対立仮説があるため,検出力由定量も様々
それぞれの定畿に応じて各手去の量劣の程度も盆化

す~~Iの月比較I~j手Ç~'êifþi事}隊第興した場合

河電
~

中鎗・量四晴雄m盤

r
守 骨 骨 盤 剖 植 山 南

<
D:.l欝と篇 2騨の差
適
量i
五E
あ偏差

O.9r~

0
.
.¥
"
¥
.
̲

:
:
1
i
j
J

<ll,~,~健対検出力

品品 ψ

…'aIr......,~_J

m検出川[

3
"
I
1
>
.~

第
"
'
I
:
!
I
I

:
:
1
;
じ〉、
¥

.
.
.
.
.
.
.

,
'

。
。
。
。

、

¥
、
、

句

まとめ

: 最 小 量 検 出 川 浩 存 時 間 に 対 す る 順 位 付I
す白方法 l
摘して

ζ ~

~ -"'~".

限 定 4に関しては,Tuke
y法が最も検出力が良いが他の
手法以前差はない

・αエラーは各手法で名護水準以下に保たれている
‑‑九』

....~.._-...:ご士一一~一一一←

‑
.
.
.
.
.
.
.‑
̲
.
・"・
‑
‑
‑••..
時間{年 3
9

・全体的年検出力は S
ena阻 旬 間n
k
i
n
g法 の 方 が 高 い
岨 引 の 猷 筆 ・ ・4唖 品 加 増 し て よ み l
曲 t
‑
r
a
n
l
d
n
g法合円高い

30~ ̲
̲
̲
.
.
.
.
.
.
.
.
.
.
.
.
.
̲
.
.
.̲
》書量比厳法に闘して

股 定 4に関しては, J
o
i
n
t
‑
r
a
n
k
i
n
g法 が 全 体 的 に 1‑2%
程上回ったカ(, Holm法においては差はない

n
L

参考文献

[
1
):4t園舗,曾図道弘線齢的多重比虚荷量の ・
ザイエン守イスト種 訴 栂 1

[
2
1
*園 鯛 陸 国 0‑
多量比緩における編t
:
.C
i
:
・幽カ@鑓ヨ置と骨手速の..比・慶
t
.
9
3
‑
I
U
.
I
9
9
1
応用続術学 I

(
3
1
"
・・・,渓園姐久罰金事事情問解続盆A
Sによる隼輸脈"

「 ・ ー 推 費 す る 手 法 ー ー 一 軍東大軸嵐会".,
:
坤
E
・檎出力
;Separa
t.←削 klng滋 i"1242ZP:22 ZLa・
~
Holm法 ,
H
o
l
m > Tukc
y > B岨 伽 咽 .S
幽 >8 < ' " 臨 し 一 一 一 ‑ E E ‑ ‑ J a
刷 出 1
9
.
f
m
̲
6
8
2

.
S
c
h
e
f
f
e法は慢守的(他の手法も問題なし)

‑397・

」

.
.
.
.
T
̲

408.

│医原政府間鳩山コシステムの恥 抗がん剤の第 2相試験における被験者数 変動を考慮した最適デザイン 豊泉滋之/ファイザー株式会社/臨床統計部 浜田知久馬/東京理科大学 l 医療政府間大学による四ステムの実証…哨 ~9 要旨: 抗がんAl J のスクリーニングを目的とした臨床鼠験は,効果を有するか否かを見纏めることが最 大の目的であり,効果が見込まれない薬剤l 候補を早期に判断できるよう,多段階{多 < 1 ま2 段階) に分けて効果を判定する鉱験デザインが用いられる古典的な2段階デザインとして,平均症例 数を愚小化または最大症例数を最小化する鼠験デザイン (Simon法)が多用されている Simon 法では計画症例数と実際に解析対象となる症例数(実症例数}が一致する場合にその最適性が 保障されるが.被験者の途中脱落や計画よりも多くの症例を畳録することにより,計画症例数と 実症例数が異なる場合に最適性が失われる問題が存在するまた,計画症例数と実症例数が 異なる場合に,効果の有無の判定基準(境界例数)を実症例数に基づき再設定する手法が提案 されているが,計画症例敏からの変動幅に制限がなく,恋意性が入り易いといった問題がある 本発表では実症例数の変動を考慮し,計画症例数と実症例数が異なる場合においても最適性 が保障される鼠験デザインを提案し,その獄験デザインを求める SASマクロについて発表する. ‑ 3 9 8・

411.

旬、政府省点点主主号機野¥… ~9 SAS/IMLによる医療経済評価 (モデル分析) 奥山ことぱ MSD株式会社 グローパル研究開発本部臨床研究統計部 H e a l t hTechnologyAssessment (ModelA n a l y s i s )byUsingSAS/IML KotobaOkuyama e c i s i o nSciences(BARDS) B i o s t a t i s t i c s&ResearchD . K . JapanDevelopment,MSDK │医制府自治ーとん均時i ん 絡 会 要旨: 医療費の高騰から、医療経済学評価を用い、限られ た財源を医療資源へ最適配分することも注目されて いる。そのモデル分析(決定樹、マルコフモデル等) の基礎的概念と、計算過程で IMLを利用する方法を 紹介する。 キーワード医療経済学、 HTA、決定樹、マルコフモ デル、費用対効果、 ICER ‑ 4 0 1 唾 ~9

412.

│医療政府自治体鳩山 発表内容 1 . はじめに 2 .判断分析モデル 決定樹、 QALY、費用 3 .マルコフモデル 状態推移図、割引、結果解釈 (ICER)、 不確実性の考慮、 4 . マルコフモデル(シミュレーション) 5 .海外での医療経済評価 6町おわりに │ 医療、政府自治体、大学によるエコシステムの諒~…僻 ~I]9 はじめに ‑我が園の医療費は増加の一途 ・ 平 成2 4年度の国民医療費は 3 8.4兆円(毎年、約 1兆円増のベース) . 限られた財源の医療資源への最適配分又は効率的配分の重要性 業界の動き ‑ 中医協の専門部会では、費用対効果評価を薬価や診療報酬に反映することに ついて検討を重ねている。 ・昨年、厚生労働省研究班(福田班)から「医療経済評価研究における分析手法 に関するガイドライン』が明らかにされた。 →遠くない将来、既収載の薬価の見直し等を皮切りに、費用対効果評価が薬価収 載時に求められる可能性がある。 ・ 医療経済学評価でのモデル分析手法 決定樹、マルコフモデル、シミュレーション(マルコフモデル)等 ‑ 本発表では、手法の基礎的概念と、計算にSAS/IML を利用する方法を紹介する。 ‑ 4 0 2 ‑

413.

W I l 9 i !医療、政府・時点 今 缶詰子議ぷムー融 判断分析モデル C D e c i s i o nA n a l y s i sModel) ・判断樹/決断樹/決定樹 C D e c i s i o nTree) 一 確率点 剤 、 。 (ChanceNode) p 禁 一 シナ 寸 リオ1 費用 効 用 (QALY) 50, 000円 10QALYs 000円 70, 5QALYs 70, 000円 10QALYs A 悪 化 シ ヨ オ2 p = 0 . 4 (新薬〉 , シナリオ3 7 由E2 ロ ム 同 8 3 く 悪化 p = 0 . 2 ノ 000円 70, 終点 (DecisionNode) ( T e r m i n a lNode) … 会 W I l 9 ~Ji,iBlRi.ÊI~ftf*..*!J(~山内主 鳳 政問台体、規尚一点みI 計 質調整生存年;Q ALY(s)[QualityAdjusted L i f eY e a r ( s ) ] ・生存期間 l こQOL を乗じた指標 QALY(0‑1);1健康、 O 死亡 質調整生存年が等しい場合 .健康 (QOL=1) で 1年生存 ‑半分の QOL(0 . 5 )で2年生存 QOL QALY 曲線下面積 0 健康 病状の悪化 ‑403‑ 〉 時間 死亡

414.

│医馴 各薬剤の平均費用 費用 期待費用 シナリオ 1 A剤 。 (新薬)ノ 口 、 uO B 剤 (既存薬 7 p禁 < コ 50, 000円 x O . 6 = 30, 000 < ナ コ リ オ2 悪化 シ p=O. 4 70, 000円 xO. 4 = 28, 000 p 完 =0 治 8 、 汁¥ 寸F 3 70, 000円 x O . 8 = 56, 000 p悪 =0 化 . 2 シナ ¥ パ リJオ4 000円 x O . 2 = 14, 000 70, A剤 の 平 均 費 用 = 30, 000 + 28, 000 = 58, 000円 B剤 の 平 均 費 用 = 56, 000 + 14, 000 = 70, 000円 一 一 時 点i日戸伊ゐムー ~9 各薬剤の平均 QALY 期 待 QALY QALY 、 Eフ τ士~;'ご4ロ8 p=0.6 A剤 。 (新薬)ノ ロ B剤 (既存薬 シナリオ 1 < J 悪 化 シヨオ2 p=O. 4 5QALYs xO. 4 = 2QALYs シナ リ オ3 巴フ~ ,ごi 口 A p=0.8 10QALYs x O . 8, = 8QAL Ys d )0 = 6QALYs 10QALYs x O . 6, 3; H 3 士 シ く ナリ オ4 5QALYs xO2 , = 1QALYs 目 1 の平均 QALY = 6 + 2 = 8QALYs A斉] B斉] 1の平均 QALY =8 + 1 =9QALYs ‑404‑

415.

│一一両手鞍場停I : . . *2 0 1 4 各薬剤の費用対効果 及び増分費用対効果比 (ICER;I n c r e m e n t a l C o s t ‑ E f f e c t i v e n e s sR a t i o ) R開欄開 ・・.1話 rm烹~ A斉J I 58, 000 8 7, 250 70, 000 9 7, 778 (新薬) B : 剤 (既存薬) 12, 000 1 12, 000 │ωLY あたり話司 プログ、ラム ( d e c i s i o nt r e e . s a s )で出力(テキスト出力)する内容。 │医額一 マルコフモデル 状態推移図 ( S t a t eT r a n s i t i o nDiagram) 要因相関図 ( i n f l u e n c ediagram) 亀負 C T r a n s i t i o n P r o b a b i l i t y ) マルコフ性Tを仮定 T現在の状態のみに依存して、将来の状態が確率的に決定 ‑ 4 0 5 ‑

416.

i 医痕政府間大学問問弘の実証~"I!!OCIil:I総会 W J 9 状態推移図のフロー ⑦ 2年目 1年目 スタート │臨政府自治体大学問一弘の実証 SASト 付 金 推移確率行列 ・推移確率を行列形式にまとめたもの 0 .群の数だけ推移確率行列も存在する。 推移後 病態 1 病態2 死亡 推 病態 1 移 病態2 前 死亡 。 。。 0 . 6 ‑ 4 0 6・ 0 . 3 0 . 7 0 . 1 0 . 3 ~I]9

417.

医療、政府自浩一日品切ゐ~.SAS.2-~-.* 21 9 コホート分布の計算 1年目‑ 2年目: 。o 時 「 (病態 1 ,病態 2 ,死亡) 0 . 7 0 . 3 1 = ( 6 03 0 1 0 ) 1 ( 6 03 01 0 ) 10 0 . 7 0 . 31 =( 3 63 9 2 5 ) 001 n年目: … ( ol) ( 10 000 ) 10 0 . 70 . 3 001 I 平均自治体¥ゐ.足踏ι … ー 蝕 . 費用・効果/効用ベクトル 5 一叩一 O 費用 (万円/年) 病態 1 病態2 死亡 新たな死亡のみ費用 が発生する場合があ る 。 ‑ 4 0 7 ‑ 効果/効用 (QALYs) 0 . 9 0 . 5 0

418.

片手政府間熔中おス弘の実証…一総会 ~I][1 費用の計算 …{ì]~500 開始年: … ー イi ' ]~57 1年目: 2年目: 〉合計費用 … ( o l j ( 5 ) ( 1 0 0 0 0 ) 0 0 0 0 7 0 1 3 1 0 0 n年目: U Z 場一持' t f R i !H 9 でかヲセ1 ア刀工宗万三で‑‑警官罰金子 問、政府・師、大学問 会 割引計算 ・インフレの考慮、時間選好等の考え方 ・将来の費用及び効用の両方を、現在の価値に換算する。 t年目の費用及び効用を (1+割引率 t )で割る。 .ガイダンスでは日本の経済実情を反映 (2%)。 .割引率を変化させた感度分析が必要 (0‑4%)。 費用 現在の価値 (割ヲ│率 2%) 開始年 100万円 100万円 1年目 2年目 100万円 100万円 1 0 0 / 1 . 0 2 = 9 8万円 100 パ. 0 22=96万円 合計 300万円 294万円 ‑ 4 0 8 ‑

419.
[beta]
!臨政問自主ふ(制撤警報弘子

~9

数式表現
•

X;:l年目のコホー卜分布のベクトル

・

T
:推移確率行列

•

c
:費用/効果ベクトル

・ C;:1年目の費用

• d
:害J
I引率
・各年の費用=各年のコホート分布ベクトル×費用ベクトル
Co=xJC

,X
;

(
1+d
)
C = C=x~Tc /

x
;=X~T2 c/(1 +d)2

c2 =

c
n

二

C

<
c=x~Tnc/(l +dr

吉良時灘郡山三g

.
E
I
J

I
i
:
J
i
,i
U
.
f

数式表現(つづき)
・費用の合計
工 cI= 工 x~T;c /
(
1+d
)
'
i~O

i~O

二 x~ ~I +̲l̲T+ 1 ̲T2+ ・
+ 1

。
‑
l(
1+d
)‑ (
1+d
)
2‑
ー ←

r~c

(
1+dy‑ J

,

QALYの計算も全く同様→ IMLで実行可能
(i主 )S~T!(l+めとし、以下のようにも変形できるが、逆行列が一意に求まらないことが生じう

るため、上記の計算式を使用する(そうすることで、経時的変化がトレース可能となる)。
γ (
l‑ A r1 二

エC,X:;I
{+s+ +".+ }
C
=

S2

S"

i
=
O
二

X
:
;(1‑S川)(1‑Sr1C

1+A+A2+ ーーより

I+A十 A2+ ー+A"
ニ(/‑Ar1‑(A",
1+ A +2 +".)
斤

=(
/‑A)‑l‑A"+l(1十 A+A'+ ー
)
ニ

(/‑A)‑I‑A'
叶(/‑A)‑I

ニ(/̲A''
'
l
)
(
/‑A)‑I

‑
4
0
9
‑

420.

│一向j 台 一 例:状態推移図 60% 70% 3%2% 55%60% 7% 3% 15% 15% 黒字は既存薬群 赤字は新薬群 85%85% w l l 9 コ シ ス テ ム の 期 純 一 蝕 ! 医 療 政 府 自 治 体 、 大 学 問Z 例:推移確率行列 推移後 上段 A剤(新薬) 下段 B剤(既存薬) 軽度 推 移 中等度 前 重度 死亡 軽度 中等度 重度 0 . 7 0 0 . 6 0 0 . 2 5 0 . 3 0 0 . 0 3 0 . 0 7 目。05 0 . 0 5 0 . 0 0 . 0 。。 。。 死亡 目。02 0 . 0 3 0 . 3 0 0 . 3 5 0 . 0 5 0 . 0 5 0 . 0 0 . 8 5 0 . 8 5 0 . 1 5 0 . 1 5 0 . 0 0 . 0 0 . 0 0 . 0 1 . 0 1 . 0 0 . 6 0 0 . 5 5 。 。 ‑ 4 1 0 ‑

421.

I 忠 政 府 自 治 弘 ; 込I 三荷揚路弘一 W l J 9 費用・効果/効用ベクトル 分析の期間(時間地平): 2 0年 割引率 2%/年 開始時のコホート分布 ( 1 0 0, 0, 0, O ) 費用(万円/年) 上段 A剤(新薬) 下段 B剤(既存薬) QALYs 軽度 1 0 0 70 0 . 8 中等度 1 3 0 1 0 0 0 . 5 重度 1 8 0 1 5 0 0 . 1 死亡 0※ 0※ 。 。 ※新たな死に対する費用も考慮する場合がある。 │医額一 計算結果 ( M a r k o v . s a s ) C o s t ‑ E f f e c t i v e n e s sAssessment MarkovModel T o t a lCost T o t a lQALY T o t a lCost T o t a lQALY C o s t ‑ B e n e f i t C o s t ‑ B e n e f i t f o rDrugA f o rDrugA f o rDrugB f o rDrugB f o rDrugA f o rDrugB 132871.57 423.773 99144.11 336.677 D i仔 " er encei nCost D i f f e r e n c ei nQALY (DrugA‑B ) (DrugA‑B ) 46 33727. 87.0957 313.544 294.478 ICER 387.246 1QALYあたり 388万円の費用増加だが、 B剤(既存薬)からA剤(新薬)に変更するこ とは、基準となる闇値の 500万円 /QALY※より小さいので、費用対効果が良いことに なる。 が目安とされている。 ※日本では 500‑600万円 /QALY ‑ 4 1 1 ‑

422.

同政府自治体大学による羽詰みん付金 Ifl!l]~ 計算結果 (Markov.sas)一つづき T"", C副 rceofQAl Y DR喝=印",. 山一 j │医療政府関、博関口伊ら抱一一蝕 WlJ~ 結果の解釈 増分費用(万円) 医療技術 5 . . 医療技術 4 ガイドラインの 解説 [ 4 ]より抜粋 して改変 医療技術4が費 用対効果がある なら、医療技術5 も費用対効果が ある。 医療技術2に 対し優位 増分効果 (QALY) 図4 . 1 劣位(医療技術 2)と拡張劣位(医療技術 4) ‑412‑

423.

EEEE 謹韓関翠謹塑里1m]団 不確実性の考慮、(一元感度分析) トルネードチャート(竜巻図) 影響力の大きいパラメータから 順番にプロット 薬剤の中止 10%‑50% 状態 1から状態2への 推移確率 状態 3から状態4への 推移確率 瞳掴 割引率 e t c 瞳 費用の増分/QALYの増分(実薬群 プラセボ群) 1 1 1 争議ムー 加 [ 9 臨附!白部元手 不確実性の考慮、(二元感度分析) (縦模) +Gど N泊者ハザ吉山凶器 JCMW雄 輔 枠 組 薬剤l の中止率(%) ‑ 4 1 3 ‑

424.

実行が可能で、パラメータ設定が明快。 マルコフ性(メモリーレス)により、各患者が直前にどのステーツにいたのかが判別 不能。 一複数のステーツが並行する場合(ステーツの履歴が重要) ーステーツ滞在時間より、推移確率が変わる場合 1ワ次元)のみの評価で、 ICER値は範囲で示され、 感度分析はパラメータの低次元 ( 尤度のような定量的に評価した値は算出できない。 モンテカルロシミュレーション(コホ トではなく、患者単位でシミュレート) マルコフ性を超えた柔軟性を実現できる。 増分費用、増分効果、 ICERを1つの値ではなく、分布として得るため、闇値を超える 確率などを定量的に評価可能(=繰り返しが必要)。 確率的感度分析 ( P S A ;P r o b a b i l i s t i cs e n s i t i v i t ya n a l y s i s )※ l こ対応可能 ※全パラメータに不確実性を導入する方法 • N I … ι … 医 一 自 … │ 2I ム μ I ム ふ I 一5 一 ζよ 悶 叫 む 一 … ? 干 ? 均 ぞ 玖 子 以 ネ 砕 戸 詩 吟 持 均 詰 主 均 ム… A 一 ふ … ふ … よ ミ 干 ふ 一 入 ふ ‑ 一 → ム ザふ …… モンテカルロシミュレーション 疾患の進展を 1 例ずつ確率的にシミュレート 前例で、実薬群で、現在の状態が「軽度 J の場合 一様乱数 U ( O, 1)を発生し、次年の状態を決定し、死亡ま たは分析の期間に達するまで繰り返す。 軽度に留まる確率 中等度に進展確率 重度に進展確率 死亡に進展確率 70%/年 ( 0: 5U(0, 1 ) < 0 . 7 0 ) 25%/年 ( 0 . 7 0: 5U(0, 1) < 0 . 9 5 ) 3%/年 ( 0 . 9 5壬U(0, 1) < 0 . 9 8 ) 2%/年 ( 0 . 9 8壬U(0, 1) 引 ) 当該患者の疾患進展における費用及び効用を算出 (各年度で割引も考慮)。 ・ 所与の例数分の合計により、 ICER等を算出する。 これを多数回繰り返し(例:10.000回)、平均値を推 定値として用いる ( 1 0, 000個の ICERの平均値) ‑ 4 1 4 ‑

425.

l ‑ 医療政府間大学による防ス弘の翻…ー蝕 . 計算結果 (Markov ̲ p a t i e n t ̲ l e v e . l s a s ) Cost‑E 仔 ' ec t i v e n e s sAssessment MarkovModel( P a t i e n tL e v e l ) T o t a lCost f o rDrugA T o t a lQAL Y f o rDrugA T o t a lCost f o rDrugB T o t a lQAL Y C o s t ‑ B e n e f i t C o s t ‑ B e n e f i t f o rDrugB f o rDrugA f o rDrugB 132841592.24 424034.70 99071545.78 336791.04 D i f f e r e n c ei nCost D i f f e r e n c ei nQAL Y (DrugA‑B ) ) ( D r u gA・B 33770046. 45 87243.67 313.280 294.163 ICER 387.077 上記は 100, 000 例を 1回だけシミュレートした結果で、コホート分布を利用した ICER(387.246)とほ l ま同じ。 100例を 10, 000回シミュレーション(平均 ICER=417.830):バラツキ大 1000例を 1000回シミュレーション(平均 ICER=390.960) より複雑なモデルは、繰り返し回数の増加が必要になる(上記の単純な例でも、 1000 例を 10, 000回シミュレーションは実行 l こ90 分弱)。 │医問自主体大…m ス弘の抱一総会 ~9 計算結果 (Markov̲patient̲level.sas)つづ、き 許容可能性曲線 ( a c c e p t a b i l i t yc u r v e ) 100 / 一 蜘 ⁝ [主豆EZ差ト gωo‑vM且出 A一 g 電告主 Uち h 豆 剖田市師団咽担四柑 QALYが減少し、 且つ費用も増大 する(劣位)のシ ナリオは除いて 作成する。 。 。 1 0 0 6凹 2 加 ‑415‑ 7 ( 抽 @叩

426.

匡 制 府 ・ 自 治 吋 同 一 一 一 ミ ー モンテカルロシミュレーション一つづき 症例の背景因子の違い、現在の状態、時間依存的 に推移確率を変更することも対応可能 ‑ 背景の分布、時間依存的な推移確率等の追加情報が必 要となるが、十分なエピデンスが存在しないかも。 一 複雑なモデルでは計算時間が増大し、十分な感度分析 の弊害となる可能性がある。 コホート分布用いたモデルとの比較 ‑ 結果が同様であれば、コホート分布で十分かもしれない。 ‑ 比較した研究が少ないため、どちらが優れているか結論 にまでは至っていなし、 [ 1 1] 1 持議鰐駐髄鮎 I I i臨故向陥白佐向;右自j 必 訴 払 為 当 ぷ i h i t ! : j 1 1 1 ? ? ? ? : ? ? ? ? ? ? f ? ? ? ! ! ? ? ! ! ? ! ! ! ! ! ! ; ; I ムム 」 ム よ 海外の医療経済学評価 F I 震 1 .A l g o n t h n げ 町 m岨 . 1 ~Jmulallon UKPDSOutcomesModel[ 1 2 ) l2004)より抜粋 ( C l a r k ee ta. Ellhb y ‑ 一 一 開山ヘ J ‑ 4 1 6 ‑ l 巾ふん

427.

│医癒政府開大学!こよるロシス弘ぬ齢 w l l 9 おわりに ・医療経済評価を通じて、限られた医療財源の効率的配分 に寄与することも期待され、今後、医療経済評価が求め られる可能性がある。 ・本発表では分析手法の基礎的概念と、 SAS/IML等を利 用して計算する方法を紹介した。 ・コホート分布かシミュレーションかは、取り組む問題の 性質や複雑性などに依存する。 ・モンテカルロシミュレーションは柔軟性はあるが、実行 時間が長い、追加情報の必要性の問題などがある。 l 医療政府自治体大…工コシス均実証 s … 哨 ~9 参考文献 [ 1 ]平成24 年厚生労働科学研究費補助金福田班,医療経済評価研究における分析手法に関するガイドライン, V e r . 1 . 0,2013 問自省健,福田敬,五十嵐中,池田俊也, CHEERS 声明ー医療経済評価における報告様式のガイダンスー, 保健医療科学, Vo . l62,NO.6,641・ 666,2013 問白岩健,く総説 医療経済評価研究における分析手法に関するガイドライン」の解説,保健医療科学, Vo . l 62,NO.6,590‑98,2013 [ 4 ] 福田敬,白岩健,池田俊也他,く解説>医療経済評価研究における分析手法に関するガイドライン,保健医 . l62,NO.6,625‑40,2013 療科学, VO [ 5 ]白岩健,福田敬,五十嵐中,池田俊也訳,く解説 >CHEERS 声明ー医療経済評価における報告様式のガ . l 62,NO.6,641‑66,2013 イダンスー,保健医療科学, Vo ま う , 2003 [ 6 ]坂巻弘之やさしく学ぶ薬剤経済学 じI [ 7 ]池上直己西村周三編著,医療技術・医薬品,劾草書房, 2005 [ 8 ] 鎌江伊三夫,医薬経済学的手法による医療技術評価を考える <6>ーデ‑$1の不確実性をどう取り扱うかー, 医薬品医療機器レギュラトリーサイエンス, 4 4 ( 1 ),4753,2013 [ 9 ] 飯野四郎,安田清美,小林慎,藤野志朗,小川京子, C型慢性肝炎に対する IFN療法の費用効用分析ー活 動性役与と非活動性投与の比較日本医事新報, 3870,10‑15,1998 [ 1 0 ]池田俊也,山田ゆかり,池上直己抗痴呆薬ドネベジルの経済評価,医療と社会, Vo . l10,NO.3,20 > r l 目 ∞ [11]BriggsA,ClaxtonK,SculpherM,D e c i s i o nmodelingf o rh e a l t heconomice v a l u a t i o n,O x f o r d :Oxford 2006 U n i v e r s i t yPress, ta , . lAmodelt oe s t i m a t et h e [ 1 2 ] C l a r k ePM,GrayAM,BriggsA,FarmerAJ,FennP,StevensRJ,e l i f e t i m eh e a l t houtcomeso fp a t i e n t sw i t ht y p e2d旧 b e t e s :t h eU n i t e dKingdomP r o s p e c t i v eDiabetes i a b e t o l o g i a,47,1747 ・ 59,2004 Study(UKPDS)OutcomesModel',D [ 1 3 ]小久保欣哉,山田謙次,医療技術評価 (HTA:H e a l t hTechnologyAssessment)の政策動向と製薬企業に ‑ 4 1 7 司

428.

1 1 尚三総会 医療、政府・問、即応 ~I]9 減らせ突然死 院外心肺停止のビッグデータから見えてくるもの 田久浩志、田中秀治 国土舘大学体育学部スポーツ医科学科 ToI mproveR e s u s c i t a t i o n A f t e rO u t ‑ o f ‑ h o s p i t a lSuddenCardiacA r r e s t TAKYUH i r o s h i,TANAKAHideharu l 医療政府間大学による一弘の実証…‑蝕 W J 9 要旨: JMPを用いて92万件の病院前の心肺停止のデータを解析し、心臓 突然死の基礎的背景を検討する。 .0 キーワード:心肺停止、病院前、 JMPl1 ‑ 4 1 8 ‑

429.

1 医 療 、 政 府 自 治 休 止 高 勝 議 議¥ j p a 2 8 1 9 【はじめに】 ‑我が国では 2 0 0 5 ‑ 2 0 1 2年にかけての 9 2万件に及ぶ、院 外心肺停止のデータベース(ウツタイン様式レジスト リ)が整備されている。 ‑従来の院外心肺停止患者の解析は、病院到着までの心 拍再開 ( R O S C ) 、一か月後の生存、社会復帰の有無を ロジスティック回帰などで検討していた。 ‑ しかし、救命士が患者に接触した時の心電図波形が、 A E Dが作動する V F / V T、つまり助かり易い心電図波形か か否かは定かでない。 M Pで接触時の V F / V Tの存在率を求め、心臓 ‑本報告では J 突然死の基礎的背景を求める。 旬、政府I祢起点税務議再'~:~2-"-.. 2 0 1 9 ウツタイン様式レジストリとは ・総務省消防庁が主体となって集計している、病院の外で 発生した心肺停止に関するデータベース。 • 2 0 0 5年 ‑2012年で9 2万件近くが登録されている。 ‑シンガポール、台湾、韓国、日本に同様のものがあるが日 本のものは高齢者が多い。 ‑ 4 1 9・

430.

ææ~iBl1ffl.~j合同点母親静子-.mJ9 ウツタイン様式レジストリの内容 口頭指示あり 波形種別 生年月日 8 . J I 齢 急救命士乗車 飾の乗車 師 の 2次 救 命 処 置 目撃 目撃時刻 t イスタンダ一種別 同イスタンダ ‑CPR有 無 心臓マッサージ は工呼吸 怖民等による除細動 隊定/推定/不明 除細動 二相性/単相性 初回除細動実施時刻 除細動施行回数 実施者:救急救命士 実施者.救急隊員 実施者:消防隊員 実施者ーその他 気道確保 特定行為器具使用 特定行為器具種別 静脈路確保 覚知 現着 接触 CPR開 始 病院収容 心原性/非心原性 心原性の種別 非心原性の種別 心拍再開 初回心拍再開時刻 1ヶ月予後回答 1ヶ月生存 脳機能カテゴリー 全身機能カテゴリー 薬剤投与 薬剤投与時刻 薬剤施行回数 |閥、政闘争伝説場報端模様~* 2 0 1 9 用語定義 ・バイスタンダー救急現場に居合わせた人 ・ CPR • BCPR AED VF • VT • PEA 心肺蘇生法 バイスタンダーによる心肺蘇生法 自動対外式除細動器 心室細動 心室頻拍 ( V F V T :社会復帰率高 AED作動) 無脈性電気的活動 心静止 ( P E A / A s y s :社会復帰率低 AED作動不可) .脳機能カテゴリ 1 ‑ 4 :生存、 5 :死亡 • Asys ト2 :社会復帰 3 ‑ 4 :高度障害、寝たきりなど ‑ 4 2 0 ‑

431.

!時、問自伝託尋戦勝範.一 mJ 対象 ・ウツタイン様式データ ( 2 0 0 5 ‑ 1 2年9 2 5 2 8 8人) 中 、 1 5 ‑ 8 9歳、目撃あり、心原性疾患を対象と した。 E D使用は除外 ‑非心原性疾患、市民による A • 1 1 9番通報である覚知から患者接触時間はその 9怖を占める 2 6分までとした。 時間分布の 9 0 0 3 8 8人となった。 ‑解析対象は 1 跡沼.. 今 持 梅 ! ム ミ ー │医癒政府自 i ~9 解析対象の内訳 令2 0 0 5・2 0 1 2のデータを対象 ( n = 9 2 5 2 8 8 ) . 。包含基準 J 性別が明確、年齢 1 8 ‑ 8 9 J 目撃あり、パイスタンダ一種別が明確 実施の有無に欠損値無 〆心原性心停止、心電国波形と BCPR 。除外基準 J 薬剤投与回数不明確 2 8 5 1 7人 J 一月後脳機能カテゴリ不明確 1 1 3人 J 気道確保の器具不明確 3 2人 │131301人を包含! 〆覚知接触、覚知病着、覚知薬剤が 9 9 p e r c e n t i l e以上の時間的異常値 1 6 9 7人 〆救急隊到着前の心拍再開 2 3 2人 │ 〆覚知接触薬剤病院着の1 I 慎番が異常 7 3人 I 3 0963人を除外 J 初回の心拍再開後に薬剤投与 2 9 9人 I1 00338人を対象 ‑ 4 2 1 ‑

432.

t t t z 1 均期 │医療、政府・自治体大学による ‑ o . SAS. : t ‑ " f 2 0 1 9 薬剤投与と気道確保の器具の関係 叢剤投与フラグと OBVM‑S 倒的臨調均分析 一 一 ・!・ モザイク国 BVM‑SGA 気道を確保する器具 の種類 M ッグバルブマスク 1 :声門上気道デバイス │ 1 1 l l : 1 2 :挿管チューブ 薬剤投与 0 投与せず 1 エビネフリン投与 分割褒 OBVM‑SGA u r "度数 o 111 事 I N0 議引 2 I42768 34062 4 1 3 0 : 80960 j_~~~~~l 叫η~' 6726 : ̲1 338 __~1.!51 1 ω,67, ̲ 2 5 9 6̲ l9378 ∞ 本報告では、基本的手技である BVM使 用のみの 4 8883人を対象とする ! │ 一 一 一 ーさ竺三fiiE ‑o.9 I J SAS. : t ‑ " f 方法 ‑救急隊接触時の心電図波形は、 A E Dが作動する V T / V FおよびA E Dが作動しない P E A / A s y sとした。 • 目的変数:覚知一接触時間(秒) ‑独立変数:年齢、性別、 B C P Rの有無、 B C P R実施者 の種類等を用いた。 5 ‑ 4 9,5 0 ‑ 6 9,7 0 ‑ 7 9,8 0 ‑ 8 9の 4段階に分類 ‑年齢は 1 ‑生存期間分析、 C o xの比例ハザードモデルで V F / V T をエンドポイント、 P E A / A S Y Sを打ち切りとし、覚 知一接触時間と各種変数の関係を求める。 ‑ 4 2 2 ‑

433.
[beta]
とよむお杭右主主

問、政府・自治体均I

2
0
1
9

SAS.
:
1
‑
"
‑
l
!a

研 究‑
1
・比例ハザード性の検討のために、各変数の力
プランマイヤー曲線を求めた。

‑補足
ーグラフ上 Y軸の「故障率」の標記は、累積V
F
/
V
T
存在率、つまり一種の助かり易さを意味する。
ー覚知一接触時間 =119番入電から現地で救急隊が患
者に接触するまでの時間(秒)を意味する。

1 5 ‑

9

[
r
n

鴎政府自治体大学問ロシス蜘競…蝕

性別

年代

Kap拍 n‑Meier
法による高てはめ

Ka
plan‑Mel
町量による高てはめ

敵陣車プロット

曲陣車プロット

白

10

10

08

~

*
'

06

E04

r
‑
'
̲j

02

00

o

‑
,
‑
200

400

̲̲̲̲.‑‑

骨

豊

.
.
.
r
‑
6
田

800

十 一 151

06
04

02

1000

1
2
0
0

00
0

1
4
0
0 1
6
0
0

岬欄~
2凹

400

打ち切りきま数 0;1脈打ち切り
(
p
n
s
ο
rCodel
グループ変数年代 n
e
w2

2
:女

800

1
0
0
0

1
2
0
0

1
4
0
0 1600

0"
知銭触

打ち切り変重宝 O波 酎Tち切り
ζt
>nu
rCodpl

1:
男

600

イベシ卜までの時間 0覚 知 纏 鰻

クルプ変敏性別

,

制 ‑

I ‑ 80 I

0貧 知 獲 触
イベントまでの時間 O覚 知 簿 触

I ‑ 50 I
l
70 I

1
5
‑
4
9

上から 1
5
‑
4
9,5
0
‑
6
9,7
0
‑
7
9,8
0
‑
8
9歳

‑
4
2
3
‑

434.
[beta]
Kapl
副 ーM
eier
法によるあてはめ

披障寧プ口、y ト

一一回

10守
一
一
一

ーー一一一一

2
:家族以外

08

¥¥J

0
:昼

i;Jr

06

骨

1
.
0マ
ー
ー

g
聖
誕

04

0
.
2

0
.
0

o

2
0
0

400

6
0
0 8
0
0 1
0凹
0貧 知 鐘 触

1
2田

o

1
4
0
0 1
6
曲

2
田

400

6
田

8
0
0

1
0
0
0 1
2
0
0

イベントまでの時間 0
1
軒日後触
打ち切り変数 O波形打ち切り

C
e
n
s
o
rCode1
クルブ変数家族わ官力、

2
:家族外

0
:昼 6時一 1
8時
1:
夜 1
8時一6時

(友人、同僚、通行人、その他等)

1:家族

9

片語、向自治体、鳩山口ザ将司 ム ‑o*
3

46

「

白

BCPRあ
り

t
I
J

S.:J.‑"f

薬剤投与の有無

め

‑
﹂

て
あ
る

よ

町四件

F1

骨
置
組

B
C
P
Rの有無

抱ロ

陥ゴ o

u
n

却故

M 耐

08

08

薬ーあり

"'¥白

鍋!//:以│

06
j

04'

0.
2

…一…一←
o
2
0
0 400 6
0
0

00

ー一一一

.
o
γ

8
0
0

1
0
0
0 1
2
0
0 1
4
0
0 1
6
0
0

畦知鍍触

イベントまで(})時間 0貨 知 鑓 触
打ち切り変数.
0
;
皮形打ち切り

CensorCode1
グループ変数l:l.BCPRあり/むし

1
4
0
0 1
6
0
0

。覚知接触

イペノトまでの時間 O覚 知 鑓 触
打ち切り変数 O凌形打ぢ切り
仁e
c
巧
,0
1CodE
'1
グループ変叡昼夜

イペノトまでの時間 O鍵 知 援 触
打ち切り変敏 O波形打ち切り
C
P,吋引 Cndr
1
グJ
t,.‑プ変数薬斉リ総与フラグ

1薬剤投与あり

1・B
C
P
Rあり
O
:
B
C
P
Rなし

0
:薬剤投与無

‑
4
2
4
‑

435.

l 医 療 政 府 関i 溺鞍轄権ゐ戸 ~9 心拍再開 社会復帰 白 場 dF め て あ E ﹄ M 汁 ・ る よ h r 且 O B1 ・一同日 肺プ r ツ 却鼠 M 臨 国 08 08 憐 06I 君 言 0'" 02 02 イヘノトまでの時間 O質実日鑓触 ク ル ブ 笈 数 C亡P C高 分 銅 1:心拍再開あり ト2 :社会復帰 0 :心拍再開なし 3 ‑ 4 :社会復帰不可 5 :死亡 |医療一日報議務鞍~-.. 2 0 1 9 研究 ‑ 2 ・Coxの比例ハザードモデルで、 VF/VTの存 在率に影響を与える要因を検討した。 • B C P Rの有無は覚知 接触時間で変化し、 薬剤投与は県で投与タイミングが異なる が、その影響を見るため独立変数に含め た ‑ 4 2 5 ‑

436.

~9 一応政府自治体大学問工コシステムゐ期一齢 V F / V Tの存在の有無のリスク比と 9 5 % C I • 軍 • ‑ ・ • 宣 1 冨轟 • 軍 軍 宣 まi‑ 々、 宣 宣 U.~ 宣 f く 幽「 0.25 E 性別 年齢 JBCPR 通報者 0.125 男 ーよ側 95% ・リスク比 ‑下側 95% 女 1 5柑 5 0 . 6 97 0 . 7 98 0 . 8 9 0,65 1 0,62 0 . 6 0 1 BCPR BC 開 窓族問僚 無 有 等 0 . 8 3 0 . 4 8 0,25 1 . 14 0 . 7 9 0,45 0 . 2 4 1曲 1 . 1 0 0 . 7 5 0 . 4 3 0 . 2 2 1 . 0 6 時刻 友人 0 . 6 6 ‑ 1 21 2 ‑ 1 81 8 ‑ 2 4 1,38 0,71 1 1 . 1 0 0 . 9 6 薬剤 薬剤薬剤 無 有 1 . 0 2 1 . 3 3 0 . 6 7 1 . 0 0 1,05 0 . 9 2 1 . 0 0 0 . 9 8 1 . 2 8 0 . 6 3 1,01 0 . 8 7 │医療政府間大学による均ス均知:…哨 0 . 9 3 ~9 研究 ‑ 3 ・覚知接触時間を調整したあとでの、 V F / V T 存 在率に影響を及ぼす変数は明らかになった。 ‑そこで、ひと月後の社会復帰と社会復帰不可 で覚知接触時聞がどうなるかを見た。 ‑ 4 2 6・

437.
[beta]
W
J
9

│医痘政府自綿大学による口システムゐ実証[;s;lト付金

覚知 (119 入電)~患者接触

調: 一一;

 社会復帰、社
会復帰不可、
死亡の 3群で
覚知ー患者接
触の時間に

g
j
計十
一元国置の分散分続
分敵分街

.
1
I
i
I

自由庫

F

&r'‑nヨn1nwd

z‑445

444

Unu
unU 

360

﹄寸

360

hR 4q'ι
H﹂

300



 

2堕盤
社会復帰
社会復帰不可
死亡

有意差がある



 .)I

平方和零時平方

26
3
3
7
4
1
3
7
.
13
1
6
8
7
0
6
97
4
3
.
7
3
7
9
鼠量
1
0
0
3
3
54
2
7
4
7
8
8
3
8
64
2
6
0
5
.
1
5
7
全体{倍E済み} 1
曲3
3
74
3
3
8
1
6
2
5
2
3
OCPC
一再分類

p

rob>町

7
旦血 量室盤

4
8
0

1560

540

1560

600

1560

2
0
1
4

}一一色均とよる防ステムの実証…-ø~

社会復帰、 社会復帰不可、 死亡と覚知接触時間
600


r

nunununu
nunununu

E堂要録︐辰制執

.
.
.



争+イ,...

. ... .







n
u守 




.



3

a

.
a

••  

事事 

・‑





"
叫
.
司

4
司

100

。
社会復帰

社会復帰不
可

死亡

1
5
‑
4
95
0
‑
6
97
0
‑
7
98
0
‑
8
9

1
5‑
4
95
0
‑
6
97
0
‑
7
98
0
‑
8
9

1
5
‑
4
95
0
‑
6
97
0
‑
7
98
0
‑
8
9

480 480 480 540

540 540 540 540

600 600 600 600

‑中央値 420 420 360 420

420 420 420 420

480 480 480 480

・

4
6
2
.
1 440.
44
4
0
.
14
4
2
.
0

5
1
0
.
05
0
9
.
75
1
1
.
15
1
5
.
0

360 360 300 300

360 360 360 360

+75%
値

咽伊平均値 4
2
7
.
24
1
4
.
6 393.
54
2
8
.
3

25%
値

300 300 300 300

‑
4
2
7
幽

438.

臨即時均一手当争時五一一 W I l 9 まとめ ‑ 1 ・救急隊接触時の V F / V T存在率は年代と共に有意 に低下し、 B C P Rの実施、家族以外の発見、午 後の発症で有意に上昇した。 • V F / V Tの存在率が低い者にエビネフリンを投与 する傾向は見られなかった。 ‑社会復帰は復帰不可に比べて覚知 接触時間 が短い傾向にあった │鶴、蜘跡均I 守勢持説. まとめ ‑ 2 ・家族以外の発見、 BCPRの実施、午後の発症 は傷病者が発見されやすい環境である。 ‑今後は、心肺停止時に発見されやすい環境、 的確な BCPRの実施、覚知接触時間短縮のた めの工夫、などで院外心肺停止の社会復帰 が増える可能性がある。 ‑ 4 2 8 ‑

441.

東 京 都 23区 の 公 立 図 書 館 の 比 較 評 価 一 統 計 と DEAの 共 生 新村秀一 成媛大学経済学部 Comparisonofpublicl i b r a r i e sof23wardsofTokyo ‑CollaborationofDEAandS t a t i s t i c s‑ ShuichiShinmura SeikeiUniv. DepartmentofEconomics, 要旨 統計と数理計画法を研究テーマとする筆者にとって、日本は住みにくい環境にある。分析したい 対象がデータで表されておれば統計分析が、データがない場合は対象を数式で記述し数理計画法で 8歳 の と き に SAS を 、 3 2歳 の と き に シ カ ゴ 大 学 で 開 発 さ れ た 数 理 計 問題解決が図れる。そこで、 2 I N D Oを 日 本 に 紹 介 す る こ と に し た 。 情 報 処 理 企 業 に お い て 世 界 最 高 水 準 の 統 計 ソ フ 画法ソフトの L トと数理計画法ソフトを習得し、その成果を普及することが自分にとっても日本の社会にとっても 最 善 と 考 え た 。 し か し 、 私 自 身 の 中 で も こ の 2つ は 容 易 に 共 生 し な か っ た 。 縁 あ っ て 48 歳 の と き に 成 媛 大 学 に 移 っ た 。 大 学 卒 業 後 に 大 阪 成 人 病 セ ン タ ー で 、 心 電 図 の 自 動 解 析 シ ス テ ム の プ ロ ジ ェ ク ト に 参 加 し 、 当 時 脚 光 を 浴 び て い た 「 計 量 診 断 学 Jを 勉 強 し 、 異 常 心 電 図 所 見 と 正 常 所 見 の 診 断 論 理 を 判 別 分 析 で ア プ ロ ー チ し た 。 し か し 、 4年 間 の 研 究 成 果 は プ ロ ジ ェ クトリーダーの野村医師の開発した経験的な「枝分かれ論理」にまったく歯が立たなかった。「科 学的な判別理論がなぜワ」という挫折体験が社会人の出発になった。そこで、大学での研究テーマ MNM) 基 準 に よ る 線 形 判 別 関 数 」 を 整 数 計 画 法 で 行 を 1998年 か ら 「 学 習 標 本 で の 誤 分 類 数 最 小 化 ( うことにした。統計分野からの研究者には、「学習標本で誤分類数を最小化すれば検証標本で overestimateす る こ と も 分 か っ て い な い の か 」 と い わ れ 、 数 理 計 画 法 の 研 究 者 か ら 「 時 間 の か か る 数 理 計 画 法 の 定 式 化 は 問 題 で あ る 」 と い わ れ な が ら 、 基 本 的 な 研 究 は 2010 年 に 研 究 を 完 成 さ せ て 成果を出版した。多くのユーザーが成果に驚くと思いきや誰も驚かない。そこで「線形分離可能な デ ー タ の 判 別 」 に 焦 点 を 合 わ せ て 研 究 を 行 い 、 2013年 に 一 応 の 成 果 を 得 た が 日 本 で は あ ま り 理 解 さ れ な い 。 そ こ で 2014年 は 英 語 の フ ル ペ ー パ ー を 5本 程 度 出 す こ と を 目 標 に 定 め て 、 一 応 の 成 果 を 得た。 次 は 数 理 計 画 法 の 研 究 テ ー マ の 中 で 、 企 業 の 経 営 効 率 性 分 析 手 法 で あ る DEAを 統 計 と 共 生 す る こ とを考えている。数理計画法を用いて入力データと出力データを重回帰でアプローチするのでなく、 総 合 化 さ れ た 入 力 と 出 力 の 比 の 情 報 を 分 析 す る 手 法 と 考 え れ ば よ い で あ ろ う 。 DEAの 研 究 論 文 の 多 く は 、 統 計 手 法 で は 1) 回 帰 係 数 な ど の 重 み が デ ー タ 全 体 で 共 通 で あ る 、 2)複 数 の 出 力 ( 目 的 変 数 ) が 扱 え な い ( 正 準 相 関 分 析 で は 可 能 ) な ど が 、 DEA法 が 統 計 手 法 に 比 べ て 優 位 で あ る 、 と い う 主 張 が見られる。しかしこれらの主張は瑛末である。 本研究では、 DEA法 の 結 果 を 統 計 分 析 す る こ と で 、 数 年 前 か ら マ ス コ ミ で 取 り 上 げ ら れ た 公 立 図 書 館 の 革 命 的 変 革 を 紹 介 す る 。 本 研 究 は マ ス コ ミ が 取 り 上 げ る l 年 ほ ど 前 か ら 行 っ て お り 、 Big 1 ‑ 4 3 1 岨

442.

Dataに 隠 れ て 注 目 さ れ な か っ た の は 非 常 に 残 念 で あ る 。 1 . はじめに Data Envelopment Analysis(DEA)は , 評 価 に 可 視 化 と い う 新 し い 視 点 を 持 ち こ ん だ . 入 力 を x と し て 出 力 yが 評 価 を 表 す 場 合 , 回 帰 分 析 で y=a*x+c と い う 単 回 帰 式 で 評 価 項 目 yが x で 予 測 で き る . こ の 場 合 xは , 時 間 的 に y よ り 先 行 し て い て , 制 御 し や す い と い う 条 件 を 満 た す こ と で 実 用 上 意 味 を 持 っ て く る . 欠 点 と し て は n個 の 評 価 対 象 か ら 共 通 の 回 帰 係 数 a と 定 数 項 c を 求 め て い る 点 で あ る . こ の と き 出 力 y が 大 き い ほ ど 良 い と 仮 定 し た 場 合 , 誤 差 eが 大 き く て 正 に な る も の が 評 価 さ れ る べ き で あ る が , 現 実 は yの 値 が 大 き な も の 注 目 し が ち な 傾 向 が あ る . 例 え ば , 企 業 に お け る 事業部評価でも,売り上げや利益規模の大きな中核事業が注目され,たとえ採算性が良くても規模 の 小 さ い 事 業 部 は 評 価 さ れ な い こ と が 多 い . こ れ に 対 し て DEAは , 入 力 と 出 力 の 比 を 効 率 値 y/X と し て と ら え る こ と を 提 案 し た . そ の 上 で 個 々 の DMU, (評価対象)に最適な重みを与えて, DEA効 率 値 b, *yja, *xiを 他 の DMUj( j=l, … , n)の 効 率 値 1を l以 下 に す る と い う 制 約 の も と で 最 大 化 す る こ と を 提 案 し た . DEAの 基 本 的 な こ の 手 法 は , 米 国 テ キ サ ス 大 学 の Charnes と Cooper両 教 授 と Rhodes に よ っ て 開 発 さ れ た の で CCRモ デ ル と 呼 ば れ て い る [4J[9J , ; MAX= bi*yjai*X , b *y/a川町三五 1; j=1, 一 ,n ( 1 ) 入 力 と 出 力 が 複 数 あ る 場 合 , 入 出 力 と 重 み を ベ ク ト ル に 置 き 換 え て , DEA効 率 値 を も i*yj'a, *xiと 2 )で 一 般 化 さ れ る . こ れ に よ っ て 重 回 帰 分 析 で 扱 え な い 複 数 の 出 力 変 数 も 分 析 で き 定義すれば式 ( る. MAX= 'bi*yj'ai*xi; ( 2 ) しかし,このモデルは非線形計画法になるため,これまでは計算時聞がかかり大域的探索が必要に なる.そこで式 ( 3 )の よ う に 変 形 し て , 線 形 計 画 法 で 解 く こ と で 非 線 形 計 画 法 の 問 題 が 解 消 で き る . し か し 、 近 年 急 速 に 数 理 計 画 法 ソ フ ト の 能 力 が 向 上 し 現 時 点 で も 研 究 論 文 で 10年 一 日 の よ う に 行 われているこの定式化は意味がなくなってきている。 MAX= ' bi *yi; =l; a i *xi t ' bi *yj~玉、 i *Xj; j=l, … ,n ( 3 ) CCRモ デ ル を 用 い る 最 大 の 利 点 は , 評 価 の 可 視 化 と 公 平 性 が 実 現 で き る 点 で あ る . す な わ ち 評 価 対 象 自 身 に 最 適 な 重 み を 求 め て い る が , そ の 結 果 DEA効 率 値 が 1に な る 場 合 と , な ら な い 場 合 が る . 従来の企業における評価法は,上可や専門家の経験や知識に負うところが大きい.そして,その基 準が分かりにくく不明であることが多く,評価が良くない場合には評価対象にとって与えられた評 価 が 納 得 し に く か っ た . し か し DEAで は , 評 価 対 象 自 身 に 最 適 な 重 み を 求 め て な お か つ 非 効 率 で あ れ ば , そ の 重 み で 効 率 値 が lに な る 他 の 評 価 対 象 が い る こ と に な る . そ の 場 合 , そ の 評 価 対 象 を 参 照集合(手本)として改善点を考えることができる.これが重回帰分析のように共通の重みであった り,他の評価対象の重みであったり,評価基準があいまいであったりしない点が,評価の可視化や 公平性を考える上で重要になる. 一方では, CCRモ デ ル は 各 評 価 対 象 に 一 番 有 利 な 評 価 を 行 う た め , 入 出 力 の 変 数 が 増 え て く る と 1 DEAの 目 的 関 数 の 値 を DEA効 率 値 , ク ロ ス 効 率 値 ( 制 約 式 ) で 計 算 さ れ る も の を 効 率 値 と 区 別する. 2 ‑ 4 3 2・

443.

手本が増える問題がある.企業で普及を考える場合,たくさん出てくる手本の中で一つの評価対象 を手本にして問題点(改善点)を検討し,必要であれば別の手本で追加検討する方が普及しやすい. CCRモ デ ル の 欠 点 は , 手 本 の 中 で 優 先 順 位 が つ け ら れ な い 点 で あ る . そ こ で 式 ( 4 )の Inverted CCR モ デ ル の 利 用 が 考 え ら れ る . DEA効 率 値 に 代 わ っ て DEA非 効 率 値 ( t bi 打 jtai*x,)を考え,この重みを 用 い て 他 の 評 価 対 象 が 1以 上 に な る と い う 制 約 で 最 小 化 す る 重 み を 求 め る こ の モ デ ル の 有 用 性 は , DEA非 効 率 値 が lに な る 非 効 率 な 手 本 に 注 目 す る こ と で は な く , CCRモ デ ル で 手 本 に な っ た 評 価 対 象 の 中 で DEA非 効 率 値 が 最 大 の 評 価 対 象 を 最 初 の 改 善 目 標 に す る こ と を 提 案 す る 目 MIN= t b i * Y i; t =l; a i*xi a i * Xj; t b i * Y jと t j二 1 , … ,n 式 ( 4 ) 以 上 の 利 点 を 正 し く 紹 介 し , 企 業 へ DEAを 経 営 効 率 性 の 改 善 法 と し て 普 及 す る た め に 以 下 の 点 を 提案する. • DEAの 有 効 性 を 示 す 分 か り や す い 成 功 事 例 と し て , 東 京 都 の 公 立 図 書 館 の 1986年と 2011年 を 比 較し, 2 5年 間 に 目 覚 ま し い 図 書 館 業 務 の 改 善 が 行 わ れ た こ と を 示 す . ‑企業に DEAを 普 及 す る た め に は , 最 初 の 段 階 で は CCRと Inverted CCR と い う 基 本 モ デ ル に 限 定 する必要がある.最新の研究成果までを普及の初期段階で行うことは,多くの企業人の理解を得る ことが難しく普及を困難にする. 'DEAは 数 理 計 画 法 で 定 式 化 さ れ , 多 く の モ デ ル が 研 究 さ れ て い る . し か し , 普 及 の た め に 数 理 計 画 法 の 理 解 を 前 提 と せ ず , 与 え ら れ た 評 価 対 象 の デ ー タ F (Factor) と,最適化で得られた重み W と,そこから計算されたクロス効率値' Cと DEA効 率 値 SCOREと い っ た デ ー タ で 説 明 し た 方 が , 統 計 分析の知識がある多くの企業人の理解が得やすい ・普及のために, Exce1上 に 評 価 対 象 の デ ー タ Fを 与 え れ ば , モ デ ル の サ イ ズ に 影 響 を 受 け な い CCR と Inverted CCRモ デ ル が 簡 単 に 実 行 で き る 汎 用 モ デ ル 3を 開 発 し た [7]. ・ 評 価 対 象 デ ー タ Fの 各 変 数 の 最 大 値 を l以 上 1 0未 満 に な る よ う に 単 位 を 変 換 す る こ と で , 数 値 計算上の問題の回避と重みの解釈が容易になる. • 1入 力 2出 力 あ る い は 2入 力 l出 力 モ デ ル の 場 合 , 入 力 と 出 力 の 2個 の 比 を 作 り 散 布 図 を 描 く こ と で , 効 率 的 DEAフ ロ ン テ ィ ア と そ れ に 包 み 込 ま れ る 非 効 率 な 評 価 対 象 の 改 善 昌 擦 が わ か る . た だ し 入 出 力 変 数 の 和 が 4個 以 上 に な る と 散 布 図 を 描 く こ と は で き な い の で , ク ロ ス 効 率 値 か ら 求 め た DEAク ラ ス タ ー で 対 応 す る こ と を 提 案 し た [ 3 J[ 8 J 'DEAI 土,これまでの企業における評価で単に規模が小さいことで注目されなかった評価対象であっ ても, DEA効 率 値 が 1で あ れ ば 手 本 で あ る こ と を 示 し て く れ る . し か し , 変 数 が 多 く な っ て い く と 手 本 や DEAク ラ ス タ ー が 増 え て い く 傾 向 が あ る . 評 価 対 象 全 体 で ま ず 改 善 策 を 考 え る 場 合 は , CCR モデルで効率的であり, InvertedCCRモ デ ル で 最 大 の 非 効 率 値 ( 逆 SCORE) を も っ 評 価 対 象 を 共 通 の改善目標と考えた方がよい それがうまくいった後,次の改善策を考えるべきである ‑ 改 善 方 法 を 考 え る 場 合 , 評 価 対 象 の デ ー タ Fを用いて, Excelで 簡 単 に 計 算 で き る r 1入 力 固 定 改 善 法 J を 提 案 す る . こ れ に よ っ て 経 済 学 の 学 生 に 就 活 希 望 の 業 種 の 企 業 を 20社 ほ ど 集 め さ せ て 分 析 さ せ た と こ ろ 、 デ ー タ の 入 力 に 1時 間 、 分 析 に 2時 間 ほ ど で 、 社 会 経 験 の な い 学 生 で も 容 易 に 有 益な知識が得られることが分かった。し治、し、テーマの選定と、分析結果をレポートにするのが多 2 CCRモ デ ル で 求 ま る 重 み が 無 限 に あ る 場 合 で も , 効 率 値 が 1に な る も の は 影 響 を 受 け ず , 非 効 率 な 値 だ け が 影 響 を 受 け る . 本 研 究 で は 効 率 値 が 1に な る も の だ け に 注 目 し 議 論 を 行 う . 3 統計ソフトが普及したのは,各統計手法がデータの変更に影響を受けない点、である.数理計 画法の各種問題でデータの影響を受けないモデ、ルを汎用モデルと呼ぶことにする. 3 ‑ 4 3 3・

444.

くの学生のネックであることが分かった。 ‑専門用語としての r DMU(意思決定主体)J と 「 参 照 集 合 」 に 代 わ っ て , 柔 ら か い 印 象 を 与 え る 「 評 価対象」と「手本」に置き換えて普及した方がよいと考える. ・そして、これらの出力結果を統計分析することで、より多くの人に理解してもらえることを示す。 また l入 力 と I出 力 の 比 が も っ 情 報 は 元 の デ ー タ に な い 情 報 を 持 っ て い る よ う な 官 職 を 得 て い る 。 す な わ ち p入 力 q 出 力 の デ ー タ が あ れ ば 、 p*q個 の 比 を 作 り 、 そ れ を 統 計 分 析 す る こ と で 元 デ ー タ で得られない結果が得られるのではないかと考えている。 2 . 企 業 へ の DEA普 及 の 提 案 2 .1 成 功 事 例 の 紹 介 企業へ広く D EAを 普 及 す る に は , 成 功 事 例 の 紹 介 が 重 要 で あ る . そ の 点 で , 1 9 8 6年と 2 0 1 1年 の 9 8 6年 時 点 で は , 床 面 積 , 職 員 数 , 貸 出 数 を 用 い た 2 東京都の公立図書館の事例は最適である. 1 入 力 1出 力 モ デ ル で , 人 口 の 多 い 世 田 谷 区 と 杉 並 区 が 手 本 と な っ た . そ し て , 千 代 田 区 は , 住 民 へ の図書の貸し出し需要が少なく D EA効 率 値 は O .1 9と 最 低 で あ っ た . こ れ ま で の 研 究 で も , こ の よ うな小さな値を持つ評価対象がある分析対象は少ない.また世田谷と他の公立図書館を r 1入 力 固 定 改 善 法 」 で 比 較 す る と , (手本の杉並を含む)他の 2 2区 の 公 立 図 書 館 の 床 面 積 が 過 大 で あ る こ と が分かる.この場合,一番簡単な改善案は余分な床面積を貸会議室や他の文化事業などへの転用な どが考えられる.しかし, 2 0 1 1年 時 点 で は 公 立 図 書 館 の 多 く は , 予 算 以 上 に 図 書 館 業 務 の 拡 大 と 改 善に成功した.また 1 9 8 6年 で 最 も 非 効 率 で あ っ た 人 口 の 一 番 少 な い 千 代 田 区 が , 2 0 1 1年 で は 効 率 的になった.この点を,主成分分析のスコアプロット上で効率的フロンティアに対応する曲線を描 くことで, 1 9 6 6年 か ら 2 0 1 1年 に 効 率 的 フ ロ ン テ ィ ア が 拡 大 し た こ と を 図 で 示 す . 2.2汎 用 モ デ 、 ル を 用 い た DEAの 説 明 ( 1 )L INGOに よ る 汎 用 モ デ ル 用いる D EAの 手 法 は , 付 録 の LINGO[2J[ 6 J[ 7 Jで 作 成 し た CCRと Inverted CCRモ デ ル で あ る . 数 理計画法モデルの分析は,データのスケーリングが重要である.例えば数理計画法ソフトが 1 0 ‑8 以 下 を 0と 判 定 し て い る 場 合 , デ ー タ の 最 大 値 と 最 小 値 の 比 が 1 0 '以 上 で あ れ ば , 計 算 過 程 に お い EAで 分 析 す て 最 大 値 で 割 る と 0に 判 定 さ れ る も の が 出 て き て 数 値 計 算 上 の 問 題 が 生 じ る . そ こ で D るデータは,各変数を 1 0 "で害J Iり最大値を l以 上 1 0未 満 に 正 規 化 す る こ と を 提 案 す る . こ れ で 数 値 計算上のトラブルが回避でき,さらに単位が明らかで重みの比較が容易になる.付録で示すが, D EA I 去は式 ( 2 )で 表 さ れ る 分 数 計 画 法 を 式 ( 3 )の 線 形 計 画 法 に 変 換 し て い る た め , InvertedCCRモ デ ル で 入力の重みが局所解の 0 を求めると,非効率値を計算する場合に分母が 0 になり問題が生じる~ れを回避し L Pで 計 算 す る 方 法 を 示 す 4 ( 2 ) 2入 力 l出 力 モ デ ル で CCRモ デ ル の 説 明 図 lは , 1 9 8 6年 の 2 3公 立 図 書 館 で , 職 員 数 ( F列 ) と 床 面 積 ( G列 ) を 入 力 と し , 貸 出 数 ( H列) を 出 力 と す る 2入 力 l出 力 モ デ ル で あ る 1 9 8 6年 の 評 価 対 象 の S Nを 3 1から 5 3で , 2 0 1 1年 は 1か 3で 区 別 す る . 評 価 デ ー タ F を セ ル 範 囲 名 5 F( F 2 5 :H 4 7 )に 与 え る . た だ し 各 変 数 は 最 大 値 が l ら2 4 逆 CCRモ デ ル で ク ロ ス 効 率 値 の 計 算 を 含 め て 非 線 形 計 画 法 モ デ 、 ル と し て 大 域 的 探 索を行えば問題が生じないが計算時聞がかかる. 5 L I N G Oは E x c e lの セ ル 範 囲 名 Fを f@OLEO=F;Jで 入 力 fF=@OLEO;J で 出 力 で き 4 ‑ 4 3 4 ‑

445.

以 上 10未 満 に な る よ う に 変 換 し で あ る . こ の デ ー タ を 入 力 し CCRモ デ ル を 実 行 す れ ば , DEA効 率 値 が セ ル 範 囲 名 SCORE (J25:J47) に , 重 み が セ ル 範 囲 名 W (L25・N47) に , ク ロ ス 効 率 値 [8]が セ ル 範 囲名 C(S25・A047)に 出 力 さ れ る . デ ー タ を 基 準 化 し た こ と で 重 み の 解 釈 が し や す く な る . 床 面 積 の 大きい中央区,港区,新宿区,杉並区は床面積の重み ( W 2 )を 0に し , 世 田 谷 区 は 職 員 数 が 多 い の で W1) を 0 に す る こ と が DEA効 率 値 を 高 め る た め に 有 効 で あ る . 重 み の 詳 細 な 分 析 は , 今 後 の 重み ( 課 題 と す る . こ の 千 代 田 区 の 重 み を 評 価 デ ー タ F に適用し, S列 の セ ル 範 囲 S25:S47 に 効 率 値 を 出 力 す る す な わ ち セ ル S25 は 千 代 田 区 の 重 み (3.29,O.64,1 .79)で 計 算 し た 千 代 田 区 の 効 率 値 で O .19 ( = 3.29*0.26 +0.64 * 0.22+1 .79*0.11)と 非 効 率 に な る 千 代 田 区 が 1に な ら な い の は , 千 代 田 区 の 重 み で 計 算 し た 世 田 谷 区 ( セ ル S36)と杉並区(セル S39)の 効 率 値 が 1 に な る た め で あ る . す な わ ち , 千 代 田 区 は こ の 2 区 を 目 標 に し て 改 善 を 図 れ ば よ い . DEA以 前 で あ れ ば , 入 出 力 の 比 を 比 べ て 他の区より明らかに劣っている個々の比率が分かったとしても,それを区民人口の少なさなどに原 因を帰着させて終わりになることが多かった.それが世田谷区と杉並区が手本であることが分かれ ば,世田谷に比べて職員数と貸出数が少なく,床面積が大きいことが簡単に分かる.実際には千代 田区は, DEA を 利 用 し な い で 2011 年 に は 目 覚 ま し い 改 善 を 達 成 し た . し か し , 改 善 を 考 え る 際 に , DEAの 分 析 結 果 が 事 前 に 分 か れ ば , 試 行 錯 誤 の 無 駄 が 省 け る . 同 様 に 中 央 区 か ら 江 戸 川 区 の 重 み を 適用し, T列 か ら AOylJにクロス効率値を出力する.この対角要素の効率値が, J列 の DEA効率値(セ ル 範 囲 名 SCORE)で あ る . DEA効 率 値 か ら 世 田 谷 区 ( セ ル J36)と杉並区(セル J36)の 2 区 だ け が 手 本 に な り , ク ロ ス 効 率 値 で は こ の 2区 に 対 応 す る 36行 と 刊 行 の 効 率 値 だ け が 1 に な る . ク ロ ス 効 率 値 の S列 か ら AO列 の 23個 の 列 ベ ク ト ル で , こ の 2 区 の 効 率 値 が l に な る パ タ ー ン は C1 (千代田区 の 重 み で 計 算 し た 効 率 値 ベ ク ト ル ) と C12 ( 世 田 谷 区 の 重 み で 計 算 し た 効 率 値 ベ ク ト ル ) と C15 (杉 並 区 の 重 み で 計 算 し た 効 率 値 ベ ク ト ル ) の 3個 あ る . C2 は C15,C10 と C23 は C1 と 同 じ DEA ク ラ ス タ ー に な る . 23 区 の 公 立 図 書 館 を こ の 3個 の パ タ ー ン に 分 け て , 表 lの よ う な DEA ク ラ ス タ ー に 分 類できる. 離島 1S N Ai 区sぉ~仏職政L 員数j床a面叫楕貸州出数中日OムOJ;ム逆KE引 C 州いよ四 A斗附動恥お01恥お02 事 . u 2 3 1 千代田区 32中央区 33港区 34新宿区 必 一 2 一 9 一 吋 弘 35文京区 36台東区 2 3 7 2J 3 7 1喜 三田区 38江東区 49 0品川区 目黒区 国 3 指号 7t l 1 3 3 4 1 大田区 42世田益区 43渋谷区 44中野区 45杉並区 46豊島区 47北区 4 4 2 3 } j 4日荒川区 49板橋区 3 3 B 9 君 i 。練馬区 5 1足 葛 立区 52 飾区 53江戸川区 0 . 2 6 0 . 2 2 0 . 3 0 0. 46 0 . 6 9 11 .4 0 . 9 6 1 . 1 1 1 . 1 4 1. 0 1 . 3 9 0 . 5 1 0 . 5 4 0 . 6 1 0 0. 7 7 0 . 6 2 . 9 3 1 . 2 7 0 0 . 8 4 0 . 5 1 2. 42 1 . 9 7 2. 0 2 1. 0 9 . 7 5 0 . 7 4 0 0 . 9 2 0 . 7 1 1. u 3 1 . 1 5 0 . 6日 口 70 0 . 9 6 0 . 7 8 0 . 7日 口 55 1 . 1日 1日9 0 . 1 1 0 . 3 1 0 . 7 6 0 . 9 3 1. 44 0 . 5 4 0. 84 1 . 1 0 11 .6 1 . 5 6 3. 0 6 4 . 1 0 0 . 5 4 1. 3 5 2 . 3 0 口98 1. 3 5 0 . 8 5 1 . 7 1 0細 10 iC 飽 12 i … 01 線 5;i CA2 3 Qj 0 . 1 9 1:329 0 . 6 4 1 . 79 0 . 1 9 0 . 1 8 0 . 1 9 0 . 1 2 0 . 1B 0 . 1 9 0. 47 1 . 4 63 . 3 3 0 1. 49 0. 44 0. 47 0 . 4 4 0 . 1日 0. 47 0. 44 0. 49 1. 4 2 1. 45 0 0 . 6 5 0. 45 0. 49 0. 45 即日 0. 49 0. 45 0. 43 .1 . 7 9 1. 0 4 0 0. 47 0. 43 0. 43 0. 43 0 . 2 2 .0 . 4 3 0. 43 0 . 5 9 3. 0 50 . 7 5 0 . 1 5 0. 41 0 . 5 9 0. 57 0 . 5 9 0 . 3 8 0 . 5 7 0 . 5 9 口5 2 . 6 3 1 . 7 1 0 . 3 3 0 . 9 3 0. 5 0. 4 日 0 . 5 0 . 3 7 0.4日口 5 0 . 6 4 3 . 3 1. 4 0 . 2 7 0 . 7 6 0 . 6 4 0 . 6 2 0 . 6 4 0. 41 0 . 6 2 0 . 6 4 0 . 6 73 . 5 3 1 . 1 2 0 . 2 2 0 . 6 1 0 . 6 7 0 . 6 4 0 . 6 7 0. 47 0 . 6 4 0 . 6 7 0. 44 2 . 2 60 . 6 9 0 . 13 0 . 3 8 0. 44 0. 41 0. 44 0 . 3 3 0. 41 0. 44 . 2 1 0 . 5 8 0 . 9 1 0 . 8 3 0 . 9 1 0. 82 . 0. 83 0 . 9 1 0 . 9 1 ;4 . 5 9 1m 0 0 . 5 93 . 1 2 0 . 3 6 0. u 7 0 . 1 9 0 . 5 9 0 . 5 7 0 . 5 9 0. 41 0 . 5 7 0 . 5 9 o 0.92 0.24 1 0.91 1 0 . 9 1 5 . 0 1 0 . 3 3 1. 5 3 1 . 1 3 0 . 2 2 0 . 6 1 0 . 3 3 0 . 3 3 0 . 3 3 0 . 1 9 0 . 3 3 0 . 3 3 0 . 6 93 . 6 1 0 . 9 5 0 . 1日 0 . 5 2 0 . 6 9 0 . 6 5 0 . 6 9 0 . 5 1 0 . 6 5 0 . 6 9 14 . 2日 0 . 9 7 0 0. 43 1 1 1 0 . 5 3 1 0 . 6 52 . 9 7 1 . 2 2 0 . 2 4 0 . 6 7 0 . 6 5 0 . 6 4 0 . 6 5 0 . 3 7 0 . 6 4 0 . 6 5 ' 0 . 6 6 3. 47 0 . 9 0 . 1 7 0. 49 0 . 6 6 0 . 6 3 0 . 6 6 口46 0 . 6 3 0 . 6 6 0. 52 2 . 6日 1. 1 3 0 . 2 2 0 . 6 1 0 . 5 2 0. 49 0 . 5 2 口4 1 0. 49 0 . 5 2 0 . 6 73 . 3 6 0 . 7 2 0 . 1 4 0 . 3 9 0 . 6 7 0 . 6 5 0 . 6 7 0. 42 0 . 6 5 0 . 6 7 12.0..1, 07. 1 . 9 1 0. 74 3日1 ;0 7 1 . 0.14.039 . .. 0. 7 4 0 7 1 . 0 . 7 4 OA7..0? 1 . .. 0 . 7 4 1. 0 1 1. 0 6 1. u 7 0. 4 日 2 . 1 6 0. 82 0 . 1 6 0. 45 0. 48 0. 47 0. 48 0 . 2 7 0. 47 0. 4 日 0 . 7 4 0 . 6 5 1 . 2 2 口77 4. 0 21 . 15 '0 . 2 2 0白3 0. 7 7 0 . 7 4 0. 7 7 0 . 5 .0 . 7 4 0. 7 7 図 l 汎用モデルの入力と出力結果(クロス効率値は一部のみ表示) る.そして, LINGO内 部 で は Fで 配 列 計 算 に 利 用 で き る . 5 ‑ 4 3 5 ‑

446.

C15(AG列 ) は , 杉 並 の 重 み で 計 算 し た 23区 の 効 率 値 で あ り , 杉 並 区 だ け が 1に な る . こ の よ う な パ タ ー ン に な る の は 杉 並 区 を 含 む 4区(中央 (C2),港 (C3), 新 宿 (C4), 杉 並 (C15)) で あ り , 杉 並 区 を 目 標 に 改 善 す れ ば よ い . 杉 並 区 を 改 善 目 標 に す る こ と は , 杉 並 以 外 の 3区 は 自 分 に 最 適 な 重 み で な く , 杉 並 S列 ) は 千 代 田 区 の 重 み で 効 率 の 重 み ( 構 成 比 ) を 参 考 に し て 問 題 点 を 発 見 す る こ と を 意 味 す る . C1( 値 を 計 算 し , 世 田 谷 区 と 杉 並 区 が 1に な る . こ の パ タ ー ン を 持 つ の は , 世 田 谷 区 と 杉 並 区 を 含 ま な い 18区 で あ る . C12(AD列 ) は 世 田 谷 区 の 重 み で 計 算 し , 世 田 谷 ( C1 2 )だ け が lに な り 構 成 員 も 世 田 谷 だ け である. DEAク ラ ス タ ー の 利 点 は , 入 出 力 が 4変 数 以 上 で も 次 の 散 布 図 と 異 な り 対 応 で き る 点 で あ る . 表 1 3個 の DEAク ラ ス タ ー DEAク ラ ス タ ー │ 手 本 構 成 員 ( 接 頭 語 Cを省く) C15 杉並 Cl 世 田 谷 , 杉 並 11811,5‑11,13,14,16‑23 C12 世田谷 1 1I 12 図 2は , こ の 2入 力 l出 力 モ デ ル で , 貸 出 数 / 床 面 積 と 貸 出 数 / 職 員 数 の 比 を 求 め て 散 布 図 を 描 い た . 原 点 と 杉 並 と 杉 並 か ら Y軸 に 引 し 、 た 水 平 線 で 作 ら れ る 三 角 形 が ほ ぼ DEAク ラ ス タ ー C15 に 対 応 す る . 原 点 と 杉 並 と 世 田 谷 で 作 ら れ る 三 角 形 の 領 域 が DEAク ラ ス タ ー Cl に 対 応 す る . 原 点 と 世 田 谷 と 世 田 谷 か X,y )ニ ( 0,2.5) らX軸 に 下 ろ し た 垂 直 線 で 作 ら れ る 三 角 形 の 領 域 が DEAク ラ ス タ ー C12に 対 応 す る . こ の ( か ら 杉 並 へ の 線 分 と , 杉 並 か ら 世 田 谷 へ の 線 分 と , 世 田 谷 か ら X軸 へ の 垂 直 線 で 作 ら れ る 折 れ 線 を DEA 効 率 的 フ ロ ン テ ィ ア と 呼 ぶ . 全 て の 評 価 対 象 は こ の 凸 体 に 内 包 さ れ る .r 非効率な新宿の改善目標は, 原 点 と 新 宿 を 結 ぶ 直 線 と 世 田 谷 と 杉 並 を 結 ぶ 効 率 的 フ ロ ン テ ィ ア の 線 分 の 交 点 が 改 善 目 標 (DEA効 率 値 1) で あ る 」 と い う 説 明 が 行 わ れ て い る が 厳 密 に は 正 し く な い . 同 じ こ と が 千 代 田 区 で も い え る . 原 点 と 千 代 田 区 を 結 ぶ 直 線 と 世 田 谷 か ら X軸 に 下 ろ し た 垂 線 の 交 点 が 改 善 目 標 で は な い . 表 1に 示 す よ う C1 )は DEAク ラ ス タ ー Clに 属 し て い る . に , 新 宿 は 中 央 区 と 港 区 と 同 じ DEAク ラ ス タ ー C15に,千代田区 ( また実態のない理想点を改善目標に選ぶことは,理想点の最適な重み(構成比)を参考にして問題点を 考えることになるが,実際の手本との比較で問題を見つける方が現実的で説得力が出てくる. 2 I f ‑ ‑ 0 . 5 。 0 . 5 1 1 .5 2 2 . 5 3 3 . 5 4 貸出/床 図2 効 率 的 フ ロ ン テ ィ ア と 非 効 率 な 評 価 対 象 の 改 善 目 標 の 関 係 こ の 散 布 図 に よ る 説 明 は 入 力 と 出 力 の 1変 数 毎 の 組 み 合 わ せ で あ り , DEAの 効 率 値 は 重 み で 総 合 化 さ れた多入力と多出力の比で定義しているので,厳密な説明には利用できない.例えば,中央区,港区, W 2 )は図 lから 0で あ る こ と が 最 適 で あ り , こ の 3区 に と っ て X軸 の 値 の 違 い は 意 新宿区の床面積の重み ( 味がない.世田谷や杉並も個々に異なった重みを用いているので,この図による説明は誤解を生じる ので利用に際して注意がいる. 6 ‑ 4 3 6 ‑

447.

( 3 ) Inverted CCRモ デ ル の 利 点 汎 用 モ デ ル で CCRモデルの分析後, InvertedCCRモ デ ル が 実 行 さ れ る . 表 2の SCOREは CCRモ デ ル の DEA 効 率 値 で , そ れ 以 降 が Inverted CCRモ デ ル の 非 効 率 値 ( 逆 SCORE) と 重 み と ク ロ ス 効 率 値 の 一 部 で あ る.クロス効率値は, 23区 の 重 み 全 て で 千 代 田 区 が 非 効 率 値 lに な っ た . 非 効 率 値 が 最 大 な の は 世 田 .59で あ り , 手 本 の 杉 並 区 は 4.28で目黒区よりノj 、さい. 谷 区 の 5.01で あ り , 次 は 手 本 で な い 目 黒 区 の 4 2つ の 異 な っ た 基 準 で , 世 田 谷 が 1986年 時 点 の 2入 力 l出 力 モ デ ル で , 他 の 図 書 館 が 共 通 し て 改 善 目 標 に す べ き こ と が 分 か る . こ の 場 合 , 表 Iの 杉 並 区 を 手 本 と し た 4区 の 扱 い は 後 で 検 討 す る . 表 2 Inverted CCRモ デ ル SN 区 Wl SCORE 逆 SCOREI 31 千 代 田 区 O .19 W2 1I3.85 40 目黒区 l .19 41 大 田 区 0.41 42 世 田 谷 区 0.5 CI0 Cll C12 C15 o 9.49 o 2.94 4.59 4.59 4.59 4.59 6.57 o l.02 3.123.123.123.123.31 o l.22 5.015.015.015.018.03 o 0.87 l.86 5.51 5.51 5.51 5.51 4.28 45 杉 並 区 2.3 ICl W3 1入 力 画 定 改 善 法 CCRモ デ ル と Inverted CCRモ デ ル を 併 用 し て , 最 初 の 改 善 目 標 を 世 田 谷 に 決 め た . 次 に 他 の 公 立 図 書館の問題点を発見する方法のーっとして r l入 力 固 定 改 善 法 」 を 説 明 す る . 表 3の 3列 か ら 5列 は 代 表 的な 5区 の デ ー タ で あ る . 世 田 谷 を 目 標 と し て , 床 面 積 ( m ' )を 固 定 し て 考 え る . そ し て 世 田 谷 以 外 の 図書館の職員数(人)と貸出数(冊)を世田谷の構成比と同じになるよう比例計算する.例えば杉並区を 考えると次のようになる ( 世 田 谷 の ) 床 面 積 職 員 数 : 貸 出 数 三 10888:202:4096300 二 11469/10888*(10888 :202: 4096300) 二 11469: 213: 4314885=杉 並 の 改 善 目 標 表 の 6列 か ら 8列 は こ の 改 善 目 標 値 で あ る . こ の 値 を 達 成 で き れ ば 世 田 谷 の 重 み で 全 て の 区 の DEA効 率 1列 に な る . 負 で あ れ ば 現 在 の 値 は lに な る . そ し て 実 際 の 値 か ら 改 善 目 標 値 を 引 し 、 た も の が 9列 か ら 1 値が世田谷の構成比に比べて少ないので改善が必要になる.一方で正の場合は,世田谷基準を上回っ ているので現状維持するか,少し削減し負の入力を増やすかのトレード・オフを考えることになる. こ の 計 算 は Excelで 簡 単 に 計 算 で き る . 杉 並 区 は 図 書 館 の 収 容 力 に 対 し て 職 員 が 110人 少 な く , 貸 出 数 が 2,015,191冊 少 な い こ と が 分 か る . 杉 並 区 は 職 員 を 110人 増 や し て , 貸 出 数 を 2,015,191冊 と 現 状 の 2 倍に増やせるか検討することになる.このような非常識な値になるのは,杉並や大田区の床面積が必 要以上に広すぎるためである.そこで余分な床面積を貸会議室などに転用し,縮小均衡を図ることが 現 実 的 で 容 易 で あ る . 例 え ば 杉 並 の 床 面 積 を 6000と 半 分 に し て CCRモ デ ル を 解 く と 世 田 谷 の DEA効 率 値 が 0.98に な り , 杉 並 だ け が 手 本 に な る . す な わ ち 手 本 で あ る 杉 並 で あ っ て も , 世 田 谷 に 比 べ て 床 面 積 が過大であり改善すべき問題点が分かる 6 表 に 載 せ た 区 を 含 め 世 田 谷 を 除 く す べ て の 22区 の 床 面 積 以 外 の 入 出 力 値 が 負 に な る また入力に蔵 書 数 , 出 力 に 登 録 者 数 を 加 え た 3入 力 2出 力 モ デ ル で 計 算 し で も 同 じ 結 果 に な る . し か し , 後 で 分 析 す る 5入 力 2出 力 モ デ ル で は , 予 算 と 人 口 を 入 力 に 登 録 者 数 を 出 力 に 取 り 込 む と 手 本 な ど が 大 幅 に 異 な っ てくる. 表 3 床 面 積 を 固 定 し た 世 田 谷 区 の 構 成 比 に よ る 1入 力 固 定 改 善 法 6 本論文では,これ以降このような個別の変数の改善は議論しない. 7 ‑ 4 3 7‑

448.

SN 区 床面積職員数│貸出数 床面積職員数│貸出数 3 1 千代田 2249 2 6 105321 2249 4 2 4 0 目黒 5077 8 4 1562274 5077 9 4 1910077 4 1 大田 19716 242 3055193 19716 366 7417584 4 2 世田谷 10888 202 4096300 10888 202 4096300 4 5 杉並 11469 1 0 3 2299694 11469 2 1 3 4314885 846122 床面積職員数│ 貸出数 。 16 740801 。 10 ‑347803 。 124 ‑4362391 。 。 。 。 110 ‑2015191 r 1入 力 固 定 改 善 法 J の 問 題 点 は , 図 2で 説 明 し た 欠 点 と 同 じ く . 2 2区 の 改 善 目 標 値 が 生 産 可 能 集合(あるいは効率的フロンティア)をはみ出すこともある点である.しかし,改善目標を現実に実 現できるか否かを検討し,例え現状の生産可能集合をはみ出していても,結果として達成可能であ れば問題がないと考える.計画が達成できなければ,結果責任を問えば済むことである.一方,改 善目標が生産可能集合の中にあっても,各公立図書館の改善能力が低ければ改善目標はクリアでき ない.すなわち,生産可能集合をはみ出す可能性に注意して r 1入 力 固 定 改 善 法 」 を 利 用 す れ ば よい.あるいは固定した入力変数の改善目標に対する比が問題であることを示しているので,固定 した入力の改善を考えた方が現実的で簡単である. 一方,この改善法の手Ij点は次のとおりである. • 1入 力 に 限 定 し , 改 善 目 標 に 選 ん だ 世 田 谷 の 構 成 比 に 比 例 し た 改 善 目 標 値 と 現 実 の 値 と の 差 の 計 算は簡単にでき,内容の理解も容易である. ‑単純な比率の比較は企業でも良く行われていて,改善活動にとって多くの関係者が理解しやすい という点で重要である. r 1入 力 固 定 改 善 法 J は , 固 定 す る 変 数 の 違 い で 複 数 の 代 替 案 が 得 ら れ , そ れ ら を 比 較 す る こ と で不完全であるが総合化して判断できる.多入力と多出力で適切な改善法が分かつても,多くの企 業人が簡単に理解できなければ普及は難しい. ‑分析に用いていない蔵書数と登録者数を加えて るので r 1入 力 固 定 改 善 法 j で 検 討 し で も 同 じ 結 果 に な 3入 力 2 出 力 モ デ ル の DEAの 分 析 は 省 略 で き る . た だ し 分 析 を 行 う と 世 田 谷 と 杉 並 に 加 え て板橋区が手本に加わる. 3 . 1986年と 2011年 の 5入力 2出力モデ、ルによる検討 3 .1 単 年 度 ご と の 検 討 表 4 (左)は 1986年 の 2 3公 立 図 書 館 の 予 算 , 区 の 人 口 , 床 面 積 , 蔵 書 数 , 職 員 数 を 入 力 と し , 貸 出 数 と 登 録 者 数 を 出 力 と す る 5入力 2出力 7の CCRモデルと Inverted CCRモ デ ル に よ る 分 析 結 果 で ある. 7図 書 館 が 手 本 に な っ た . InvertedCCRモ デ ル か ら 千 代 田 区 に 加 え , 台 東 区 と 江 戸 )1区 が 非 効 率 な 手 本 に な っ た . ま た CCRモ デ ル で 手 本 の う ち . InvertedCCRモ デ ル で 文 京 区 の 効 率 値 が 2 .65 と 最大になる. SN 区 SN 区 3 1 千代田区 l 千代田区 33 港区 3 港区 7 5入 力 2出 力 を 検 討 す る の は .1986年 の デ ー タ と し て 文 献 [ 9 ]に 記 載 さ れ て い る も の を 採 用 し たためである. 8 ‑ 4 3 8 ‑

449.

35 文 京 区 4 新宿区 2.65 36 台 東 区 40 目黒区 O .79 41 大 田 区 0.67 1I 5 文京区 0.57 2.45 7 墨田区 1 .48 8 江東区 1 .5 0.51 42 世 田 谷 区 2.27 10 目黒区 2.02 45 杉 並 区 1 大田区 1 .64 1 1 .05 47 北 区 1 .10 12 世 田 谷 区 0.86 49 板 橋 区 1 .58 13 渋 谷 区 0.57 1I 18 荒 川 区 O .70 53 江 戸 川 区 O .79 1 .30 19 板 橋 区 1 .09 20 練 馬 区 1 .38 21 足 立 区 1 .20 23 江 戸 川 区 1 11 1 .1 8 表 4(右)は 2011年 の CCR と Inverted CCRモ デ ル に よ る 分 析 結 果 で あ る . 1986年 に 非 効 率 値 が l の 千 代 田 区 と 江 戸 川 区 さ ら に 公 立 図 書 館 改 革 の 先 鞭 を つ け た 足 立 区 を 含 む 10図 書 館 が .DEA効 率 値 lの 手 本 に な っ た . InvertedCCRモ デ ル か ら 7図 書 館 が 非 効 率 な 手 本 に な り , 目 黒 区 の 非 効 率 値 が 2.02 と 最 大 に な っ た . ま た 江 東 区 は 両 方 と も lである. CCRモ デ ル は 改 善 目 標 に な る 手 本 を 客 観 的 に示してくれるが,変数が多いか評価対象が多様化すれば多くの手本を見つけ,改善活動が細分化 さ れ て 改 善 目 標 が あ い ま い に な る . そ れ を 避 け る た め . InvertedCCRモ デ ル で 非 効 率 値 が 最 大 の も のを最初の改善目標と考える. 3.2 両 年 度 の 46図 書 館 の 検 討 表 5は 2011年と 1986年 の 46公 立 図 書 館 の 分 析 結 果 で あ る . 手 本 は , 表 4 (右)の 2011年 度 単 独 の 分 析 と 同 じ 10図 書 館 で DEA効 率 値 (SCORE)も 全 て 同 じ で あ る . す な わ ち 1986年 の デ ー タ に ま っ た く 影 響 さ れ な い こ と が 分 か る . 1986年 単 独 で 手 本 で あ っ た 表 4 (左)の 7図書館の効率値は, 表 5の 文 京 区 (SN=35)の 0.65か ら 世 田 谷 区 (SN=42)の 0.89の 間 に あ る . 以 上 か ら 1986年 単 独 の 効 率 的 フ ロ ン テ ィ ア は 表 5で は 非 効 率 に な り .2011年 の 効 率 的 フ ロ ン テ ィ ア に 図 書 館 業 務 が 拡 大 し た )の 非 効 率 値 が 5.35 と 一 番 大 こ と が 分 か る . ま た InvertedCCRモ デ ル か ら 2011年 の 目 黒 区 (SN=10 きし¥ 表 5 2011年度と 1986年 度 の 5入 力 2出 力 モ デ ル に よ る 比 較 SN 区 │予算人口床面積蔵書数職員数貸出数登録者数 I SCORE I 逆 SCORE 1 千代田区 O .1 6 O .5 1 0.37 0.30 0.99 0.81 O .7 0 2.03 3 港区 1 .4 8 2.28 1 .3 7 0.83 0.42 2.53 2.07 2.57 5 文京区 1 .1 1 2.00 1 .1 9 1 .0 4 0.31 3.64 1 .8 0 7 墨田区 0.43 O .63 0.67 0.57 1 .2 9 0.64 8 江東区 0.82 4.74 1 .7 6 1 .4 8 0.59 4 .59 0.97 1 .8 5 1 0 目黒区 O .40 2 .62 0.99 1 .1 5 O .9 3 4 .6 5 2.08 5 .35 2.5 4 .6 2 0.51 2.36 1 1 大田区 1 .5 0 6 .94 2 .1 3 1 .7 1 0.16 4.82 1 .9 2 1 2 世田谷区 O .7 1 8 .5 3 1 .8 3 1 .9 9 3 .0 6 6.68 3 .1 1 0.86 3 .50 0.69 2.71 2 .6 5 1 5 杉並区 1 .1 6 5.39 1 .9 5 2 .2 8 1 .1 5 5.05 2.10 1 9 板橋区 1 .0 7 5.36 1 .8 0 1 .3 1 0.24 3.45 2.21 3.01 2 0 練馬区 1 .5 3 7 .08 1 .9 8 1 .6 4 1 .2 7 6 .7 5 2.53 3.42 9 ‑439・

450.

2 1 足立区 0.47 6.66 1 .9 9 2 3 江戸川区 1 .796.80 2 .1 7 1 .2 4 1 .2 9 5 .3 4 2.45 3 1 千代田区 0.16 0.49 O .2 2 O .1 6 O .2 6 O .1 1 0.06 3 3 港区 0.31 1 .92 1 .1 4 0.36 0.69 O .7 6 0.57 1 .4 2 3 5 文京区 0.38 1 .9 4 1 .0 1 0.54 1 .1 4 1 .4 4 O .6 6 2.65 3 6 台東区 O .1 5 1 .7 6 O .3 9 0.28 0.51 0.54 O .1 6 0.47 4 0 目黒区 0.21 2.67 O .5 1 0.51 0.84 1 .5 6 0.65 O .7 5 4 1 大田区 O .7 5 6.60 1 .9 7 1 .2 6 2.42 3.06 0.98 O .5 9 1 .4 8 4 2 世田谷区 O .5 9 8.08 1 .0 9 1 .1 5 2.02 4.10 1 .9 1 0.89 2.27 4 5 杉並区 0.57 5.38 1 .1 5 O .7 7 1 .0 3 2.30 0.85 0.72 1 .6 4 4 7 北区 O .1 6 3.66 O .7 8 O .5 3 0.96 1 .3 5 O .3 7 O .7 3 1 .1 0 4 9 板橋区 0.90 5.04 1 .0 9 0.57 1 .1 8 1 .7 1 1 .0 3 0.82 1 .5 8 5 3 江戸川区 O .3 3 5 .1 7 0.65 0.47 0.74 1 .2 2 0.47 0.63 1 .7 7 1 .2 1 3 .3 0 2 .7 0 2 .3 2 3.34 O .1 7 2.45 注 :2011年 の 職 員 数 は , 調 査 票 の 常 勤 と 非 常 勤 の 合 計 を 用 い た . 臨 時 職 員 は 0記 入 の 区 が 多 い の で 含 ま な い . ま た 大 田 区 , 中 野 区 , 北 区 , 板 橋 区 は 非 常 勤 が 0に な っ て い る . 千 代 田 区 は す べ て 外 注 化 し て い る の で 0 と 表 記 さ れ て い た の で , HPに 公 開 さ れ て い る 人 数 を 用 い た . 3.3 2011年 と 1986年 の 増 減 比 率 と 入 出 力 比 の 検 討 表 6は , 2011年と 1986年 の 増 減 比 率 で あ る . 増 減 比 率 は , 年 2 .81出で 25年 間 毎 年 延 び た 場 合 に 2になるので, 2以 上 か 以 下 か に 注 目 す る . 入 力 で 2倍 以 上 の 区 は , 予 算 が 1 6区 , 人 口 は 0, 床 面 1 区 , 職 員 数 は 4区 で あ る . そ れ 以 上 に 出 力 の 貸 出 数 は 1 8区 , 登 録 者 数 は 1 5 積 は 2区 , 蔵 書 数 は 1 区と大きく図書館業務が拡大している. 予 算 は 16区と多いが, 2未 満 に 千 代 田 区 を 含 む 7図 書 館 が く る . 特 に 本 研 究 で 注 目 す る 千 代 田 区 , 目黒区,大田区,世田谷区と足立区が含まれていて,これらの区は予算に比べて図書館業務を改善 .71 し た こ と が 分 か る . 千 代 田 区 は 予 算 が 25年 間 で 叫 , 人 口 は 刊 し か 伸 び て い な い が , 貸 出 数 で 7 倍 , 登 録 者 数 で 12.57倍 と 著 し く 伸 び て い て , 1986年 に 最 も 非 効 率 な 状 態 か ら 2011年 に は 手 本 に な っ た . あ る い は 1986年 に は , 法 人 税 な ど で 区 の 財 政 に 余 裕 が あ り 放 漫 な 予 算 で あ っ た と も い え る . 人 口 は 6区 で 減 少 し て い る . 床 面 積 が 2倍 以 上 は , 江 東 区 と 江 戸 川 区 だ け で あ り 予 算 も 4 .17 と 5.4倍 と 増 え て い て , 図 書 館 サ ー ビ ス に 力 を 入 れ た こ と が 分 か る . 蔵 書 数 は , 1 1 区が 2倍 以 上 で あ る . 職 員 数 は 4区が 2倍以上で, 1 0区が 1未 満 と 減 少 し て い る . 図 書 館 業 務 が 著 し く 増 え て い る の で , 職 員 数 の 減 少 は 考 え ら れ ず 記 載 の 不 統 ー の た め と 考 え る . 特 に 大 田 区 の 職 員 数 は 242人 ( 図 1)が 16人(表 5の四角い枠)と 226人 の 減 少 は 大 き い . 足 立 区 の よ う に 中 央 図 書 館 だ け が 直 轄 で , 分 館 の 外 部 委 託 が 考 え ら れ る . 0.07 と い う 増 加 率 は 区 の 職 員 を 97幅 減 ら し た こ と を 表 す と 考 え ら れ る.1 8区 の 貸 出 数 と 1 5区 の 登 録 者 数 が 2倍 以 上 で , 図 書 館 の 業 務 量 は 大 き く 増 加 し た こ と を 表 す . 千 代 田 区 と 目 黒 区 に 代 表 さ れ る 公 立 図 書 館 は , こ の 25年 間 に 予 算 以 上 に 図 書 館 業 務 を 拡 大 し た と 評 価 で き ょ う . 一 方 , 大 田 区 や 世 田 谷 区 は 2倍以下であるが, 1986年 時 点 で す で に 規 模 が 大 き い の で健闘していると考えるべきである. こ の よ う に 個 々 の 比 率 で 分 析 で き る が , 統 一 性 を 欠 く 点 で あ る . DEA効 率 値 と 非 効 率 値 は そ れ を 統一的に判断する基準を与えたと評価できる. 表 6 2011年 の 1986年 に 対 す る 増 減 比 率 予算人口床面積蔵書数職員数│貸出数登録者数 千代田区 I 1 .04 1 .03 1 .66 1 .82 ~旦 I L斗 1 0 ‑440‑ 些」ヱ

451.

1 .45 1 .90 1 .23 4.66 4.55 4 .76 1 .1 9 1 .20 2.29 0.61 3 .33 3.61 3.28 0.97 1 .1 5 1 .7 1 2 .1 7 2.61 2 .1 6 .03 2.93 1 1 .1 8 1 .9 1 0.27 2.53 2.72 .03 2.67 1 1 .59 1 .99 1 .1 8 3.37 6.58 中央区 7 .5 5.02 1 港区 新宿区 文京区 台東区 墨田区 .1 0 2.47 1 1 .1 6 1 .3 1 o .93 1 .54 1 .82 江東区 .22 4 .17 1 2.83 3.76 0.79 4 .1 7 1 .68 品川区 2.97 1 .02 1 .20 1 .66 0.46 2.88 1 .49 目黒区 1 .9 1 0.98 1 .94 2.24 1 .1 1 2.98 3 .18 大田区 1 .99 1 .05 1 .08 1 .36 1 .58 1 .96 世田谷区 1 .1 9 1 .06 1 .68 1 .73 1 .52 1 .63 1 .63 渋谷区 3.34 0.87 1 .45 2.50 0.43 3.03 1 .9 1 中野区 2.08 0.94 1 .39 1 .80 0.24 1 .70 1 .49 杉並区 .00 2.04 1 1 .70 2.96 1 .1 5 2 .1 9 2.48 豊島区 3.320.96 1 .42 1 .85 1 .41 2.25 2.94 北区 6.51 0.91 1 .78 2.37 0.66 2.80 5.20 荒川区 3.37 1 .08 1 .34 1 .74 1 .5012.36 1 .80 板橋区 1 .1 9 1 .06 1 .65 2.31 0.2012.02 2.15 練馬区 .20 4.52 1 1 .82 2.45 1 .1813.55 3.63 足立区 .07 1 .06 1 1 .85 2.09 1 .1 11 1 .73 3.02 葛飾区 1 .1 3 1 .08 1 .52 2.14 2.3913.31 3.93 江戸川区 5.40 1 .32 3.33 2.66 2.1414.36 5.19 表 7は , 表 6の 増 減 比 率 を 用 い た 入 出 力 比 の 比 較 で あ る . 最 初 の 5列 は 貸 出 数 と 5入 力 の 比 で あ り , 次 の 5列 は 登 録 者 数 と 5入 力 の 比 で あ り , 最 後 の 列 は 貸 出 数 / 登 録 者 数 で リ ピ ー タ ー 率 に 対 応 し て い る . 貸 出 数 と の 比 で 2倍 以 上 は 2区 , 17区 , 9区 , 2区 , 15区 で あ り , 登 録 者 数 の 比 で 2 倍 以 上 は 4区 , 16区 , 9区 , 4区 , 1 7区 で あ り , ほ ぽ 同 じ で あ る . 予 算 と 蔵 書 に 対 す る 貸 出 数 と 登 録 者 数 が 2倍 以 上 に な っ た 区 は 2区 か 4区 で あ る . 人 口 と 職 員 数 に 対 す る 貸 出 数 と 登 録 者 数 が 2 倍以上になった区は 1 5区から 1 7区 と 多 い . 床 面 積 に 対 す る 貸 出 数 と 登 録 者 数 が 2倍 以 上 に な っ た 区 は 9区 と 中 間 で あ る . 以 上 か ら , 25年 間 で 人 口 と 職 員 数 に 対 し て 図 書 館 業 務 が 著 し く 改 善 し た これは開館時間の拡大で人口がそれほど増えない中にあって利用者層の拡大を図り,図書館 業務の拡大を一部外注化などで乗り切って出力を増加させたためと考える これに対して,予算 や 蔵 書 数 の 増 加 に 対 し , 貸 出 数 と 登 録 者 数 の 伸 び は 小 さ か っ た . 表 6と表 7か ら 公 立 図 書 館 ご と に当事者はさらに改善策を詳細に検討できるが,本稿の目的と外れるので省略する 5区が 1以下であり, 最後の列は,貸出数/登録者数の比で,千代田区を含む 1 な い よ う だ . 台 東 区 だ け が 2以上で, リピーターが少 リピーターが多いことが分かる.千代田区にとってこの指 標だけが悪い.次の経営効率化の改善目標として,台東区を調べてリピーター率を上げることが 考えられる. 表 7 2011年 の 1986年 に 対 す る 入 出 力 比 貸出/貸出/貸出/ 千代田 予算 人口 7.44 7.46 貸出/ 貸出/ 床面積蔵書 4.65 4 .24 職員 登録/ 登録/ 登録/ 登録/ 登録/ 貸出/ 予算 蔵書 職員 登録 6.92 6 .22 0.61 人口 3 .81 1 2 .1 3 1 2 .1 5 1 1 ‑ 4 4 1・ 床面積 7.59

452.

中 央 区 I0.93 2 .97 ~旦 港区 主主主 主~I 0.91 U立 与!l. U 旦 L旦 旦 I1 .02 10.70 2.81 2.78 1 .45 5.4710.76 3.04 3.01 1 .58 5.9310.92 新 宿 区 1 0.80 2.70 2.27 1 .52 1 .20 1 0.66 2.24 1 .88 1 .27 1 .00 1 1 .20 文 京 区 10.86 2.46 2.15 1 .32 台東区 1 1 .27 3.27 2.12 1 .70 9.32目 1 0.93 一 2.65 一 2.30 一 1 .42 1 0.01 1 0.93 目 2.86『 1 2.47 6 . 3 9 4 . 1 3 3 . 3 2 5 .58 1 0.51 一 一 一 一 一 , 1 .41 1 .33 1 .18 1 .65 1 0.74 1 .66 1 .57 1 .39 1 .94 1 0.85 江東区 1 1 .00 3.43 1 .47 1 .1 1 1 .38 0.59 0.45 品 川 区 I0.97 5.2610.40 ‑ 2.1 212.48 一 目 2.82 U旦 1 .74 6.20 1 0.50 1 .46 1 .24 0.90 3.20 1 1 .94 目黒区 1 .56 3.03 1 .53 1 .33 2.67 1 .67 3 .25 1 .64 1 .422.86 0.93 大田区 O .79 1 .50 1 .46 1 .1 6 年 L旦泣 0.98 1 .86 1 .81 1 .45 2 9 .63 0.80 世田谷 1 .37 1 .54 0.97 0.94 1 .37 1 .54 0.97 O .94 1 .0 練 馬 区 1 0.79 2.96 1 .95 1 .45 足立区 1 1 .63 1 .62 0.93 0.83 山山一山一山 山一山一山一山一 山一川山一川 1 .31 1 .64 。 山一山一川山一 3 .32 山一川川山一 u主 ;L̲Qエ u工 1.54 江戸川 1 O .81 3.4 1 .07 川一川 葛飾区 1 .08 344 区区区区区区 谷野並島区川橋 渋中杉豊北荒板 墨 田 区 10.63 1入 力 固 定 改 善 法 (1)目黒区を最初の改善目標とすることの妥当性 CCRモ デ ル で 手 本 に 選 ば れ た 10 区から, Inverted CCRモ デ ル で 非 効 率 値 が 最 大 に な る 目 黒 区 を 最 初 の 改 善 目 標 と す る こ と の 妥 当 性 を 以 下 で 検 討 す る . 目 黒 区 は 予 算 / 人 口 が 21位 で , 貸 出 総 数 は 6位 , 登 録 者 数 は 7位 で あ り , こ れ ま で の 評 価 法 で は 注 目 さ れ な い 区 で あ る . 予 算 / 人 口 が 少 な い 割 に 出 力 が あ る 程 度 良 く て 予 算 と 貸 出 数 の 重 み だ け が 正 で 手 本 に な っ た . 表 8は , DEA効 率 値 (SCORE) を第 1ソ ー ト キ ー , 非 効 率 値 を 第 2ソートキー(逆 SCORE)と し て 降 1 1 偵 で 並 べ 替 え た . DEA効 率 値 が l の 1 0区 を 手 本 と す る 区 の 数 は , 目 黒 区 は 港 区 と 江 戸 J 1 区を除く 2 2区 の 手 本 に な っ た . 港 区 の 重 み は 人 口 と 職 員 数 と 登 録 者 数 が 正 で あ り , 目 黒 区 の 効 率 値 が 0.83 で 千 代 田 区 , 港 区 , 文 京 区 の 効 率 値 を Iにする.表 6の 予 算 の 増 加 率 2位 の 江 戸 川 │ 区 の 重 み は 蔵 書 数 と 貸 出 数 と 登 録 者 数 が 正 の 重 み .93 で 予 算 の 多 い 港 区 と 江 戸 川 │ 区 の 効 率 値 を lに す る . 以 上 で,予算の少ない目黒区の効率値が O 1区 の 扱 い を 別 途 検 討 す る 必 か ら 少 な く と も 目 黒 区 は 21 区 の 手 本 に な る と 考 え ら れ , 港 区 と 江 戸 J 要がある. 一方, DEA効 率 値 と 非 効 率 値 が lとなる区は,改善率が大きい千代田区,予算/人口が l位の港区, 貸 出 数 が 7位 の 江 東 区 , 予 算 / 人 口 が 23位 と 最 も 少 な い 足 立 区 と い っ た 特 徴 を も っ 4 区 で あ る . 非 効 率 値 だ け が lに な る の は , 荒 川 区 , 新 宿 区 , 渋 谷 区 , 墨 田 区 の 4区 で あ る . 前 者 の 4区 は 何 か 特 徴 が 明 確 で , そ れ ら を 手 本 と す る 区 は 3区から 7区 と 少 な い . こ れ に 対 し , 後 者 に 含 ま れ る 渋 谷 区 は 20区 , 墨 田 区 は 19区 と 多 い . 表 8 DEA効 率 値 と 非 効 率 値 で 並 べ 替 え た 23区 12 ‑442‑

453.

順位 SN 区 SCORE 手 本 数 1I10 目 黒 区 2 5 文京区 21 2 .017 l 9 1 .498 2 1 .379 l 6 1 .180 3I20 練 馬 区 4 23 江 戸 川 区 逆 SCORE 手 本 数 5I19 板 橋 区 4 1.093 6I1 1 大田区 5 1 .054 7 l 千代田区 1 7 l 3 8 3 港区 1 6 1 7 9 8 江東区 l 2 I 5 l l 6 1 0 2 1 足立区 6 台東区 0.952 1 .580 4 中野区 1 2 1 0.876 1 .066 0.871 1 .090 O .858 1 .511 1 1 1 3 9 品川区 7 北区 1 4 1 15 1 2 世田谷区 0.855 1.305 1 6 22 葛 飾 区 0.817 1 .203 17 16 豊 島 区 O .798 1 .154 2 中央区 O .796 1 .193 18 19 1 8 荒川区 0.697 20 1 5 杉並区 0.685 1 .144 4 新宿区 0.669 1 1 1 22 13 渋 谷 区 0.574 1 20 23 O .508 l 19 2 1 7 墨田区 (2) 目 黒 区 を 手 本 に し た 4 r1入 力 固 定 改 善 法 J 表 9は 目 黒 区 を 改 善 目 標 と し て , 表 8の 手 本 で あ る 文 京 区 , 江 戸 川 区 , 大 田 区 , 千 代 田 区 , 港 区 の 5区 と 非 効 率 な 世 田 谷 区 と 墨 田 区 の 2 区 で して 5個 の r 1入 力 固 定 改 善 法 」 を 行 っ た . 5個 の 入 力 変 数 に 対 r 1入 力 固 定 改 善 法 」 の 代 替 案 が あ る . こ れ を 目 黒 区 と の 比 の 大 き な 入 力 変 数 の 順 に 固 定して並べ替えた.そして,比較のため出力の一つが最小の正になる代替案で比較する. 最 初 の 5行 は 文 京 区 の 入 力 変 数 を 予 算 , 床 面 積 , 蔵 書 数 , 人 口 , 職 員 数 の 順 に 固 定 し て r 1入 力 回定改善法」を行った.目黒区の各入力変数の値との比をとると,この順に小さくなる.文京区は 目黒区と比較して予算の比が一番大きいので,他の入出力変数の値は全て負になる.床面積の比は 予 算 よ り 小 さ く て 残 り の 3変 数 よ り 大 き い の で , 床 面 積 で 固 定 す る と 予 算 だ け 正 で 残 り は 負 に な る . 以上からこのような順に並べ替えた表の入出力の値は昇順に改善される.そして入力変数で作られ る 配 列 の 対 角 要 素 は 固 定 し た こ と を 表 す 0に な り , 対 角 セ ル の 上 は 負 に 下 は 正 の 値 に な る 構 造 を も っ.最初の代替案は予算を固定しているので改善目標値が一番大きくなり,表に示す出力は一番悪 くなる.最後の行は職員数の比が一番小さいので,改善目標値は一番小さくなり,表に示す出力は 一 番 良 く な る . 代 替 案 の 真 ん 中 で あ る 3番 目 で 他 の 区 と の 比 較 す る こ と が 考 え ら れ る が , 出 力 の う ちの一つが最初に正になった 4 行目の人口を固定した代替案で比較する.目黒区と比べて予算は ', 蔵 書 数 が 1 7万 冊 多 く , 職 員 数 が 40人 少 な い . 貸 出 数 は 1 1万冊, 8 .1億 円 , 床 面 積 が 0.44万 m 登 録 者 数 は 2.2万 人 多 い . 文 京 区 は 目 黒 区 に 対 し て 予 算 , 床 面 積 , 蔵 書 数 に 余 裕 が あ る の で , 予 算 を 工 夫 し て 職 員 数 を 40人 増 や せ ば , さ ら に 図 書 館 業 務 の 改 善 が 行 え る 可 能 性 が あ る . 13 ‑443・

454.

江戸川区は,入力変数を予算,人口,床面積,職員数,蔵書数の順に固定して 1 1入 力 固 定 改 善 法」を行った 入 力 を 順 次 固 定 し て い く と , 予 算 が 目 黒 区 に 比 べ て 最 大 13.6 億 円 多 い の に , 蔵 書 数 が 最 大 386万 冊 少 な い 問 題 が あ る . 25年 間 で 予 算 を 5.4倍 増 や し た が , 蔵 書 数 を 増 や す こ と に 気 づかなかったようだ.少ない蔵書数を固定すると,全ての入出力が正になる.予算を工夫し蔵書数 を増やすことができれば,目黒区に比べて床面積や職員数に余裕があり,さらに図書館業務を改善 できると考えられる. 大 田 区 は 職 員 数 を 固 定 す る と 他 の 入 力 は 全 て 正 に な り , 貸 出 数 は 402 万 冊 , 登 録 者 数 は 15.6 万 人 多 く 問 題 が な い よ う に 見 え る . DEAの 分 析 で は 調 査 デ ー タ の 職 員 数 を 用 い て い る が , 次 に 回 帰 分 析 で 職 員 数 を 予 測 し 再 検 討 す る . 職 員 数 を 他 の 6変 数 で 変 数 選 択 を 行 い , 予 算 と 人 口 の 回 帰 式 ( 職 員 数 =0.37‑0.28*予 算 + 0 .19*人 口 ) が 得 ら れ た . 予 測 値 は 130人 に な り , こ の 値 で 1 1入 力 固 定 改 善 法」を行うと参考行の結果になる 職 員 数 を 固 定 す る と , 貸 出 数 が 169 万 冊 , 登 録 者 数 が 10 万 人 少 な く な る . ま た DEA効 率 値 は 0.69, 非 効 率 値 は 2 .65 と な り 非 効 率 に な る . 世 田 谷 区 と と も に 図 書館業務の規模の大きな区の未来像を模索するか,目黒区を手本に改善するかが考えられる. 1入 力 固 定 改 善 法 」 を 行 千代田区は,入力変数を職員数,予算,床面積,蔵書数,人口の順に 1 っ た . 蔵 書 数 を 固 定 す る と , 職 員 数 , 予 算 , 床 面 積 , 登 録 者 数 が 多 く , 人 口 は 1 .7万 人 , 貸 出 数 が 39万 冊 少 な い . 表 7で も 指 摘 し た が 登 録 者 の リ ピ ー ト 率 を 上 げ る こ と が 問 題 点 と し て 考 え ら れ る . 港区は,入力変数を予算,床面積,人口,蔵書数,職員数の順に 1 1入 力 固 定 改 善 法 」 を 行 っ た . 人口を固定すると,予算と床面積と登録者数が 2 .6万 人 多 く , 蔵 書 数 が 16万 冊 , 職 員 数 が 39人 , .76倍 増 や し た が , 蔵 書 数 と 職 員 数 を 増 や す 配 分 が 悪 貸 出 数 が 151万 冊 少 な い . 25年 間 で 予 算 を 4 かったようだ. 1入 力 固 定 改 善 法 J 表 9 目黒区を改善目標とする 1 S N 区 予算 一 1 .53 5 文京区 S N 床面積蔵書数人口 。 O .63 5 文京区 0.75 0.3 5 文京区 0.81 0.44 5 文京区 0.98 0.86 区 予算 23 江 戸 川 区 ‑ 5 .26 2 .26 9.21 3.96 35 ‑ 1 .18 0.81 1 .97 O .72 0.38 O .53 0.57 0.09 0.4 O .11 0.22 2.09 1 .1 。 0.65 。 O. 4.89 1 .1 2 1 .73 6.72 2.95 75 一 1 .27 4 .88 2 .1 2 ‑0.35 1 .14 一0.45 28 O .19 0.91 1 .04 23 江 戸 川 区 1 .23 3 .1 5 O .79 23 江 戸 川 区 1 .36 3.95 1 .1 予算 人口 。 。 O. 。 床面積蔵書数職員数 。 2.82 1 .54 一12.5 5.83 1 .33 ‑ 2 .3 7.49 ‑ 3 .59 1 .85 5 .24 2.58 1 .22 2 .1 1 1 .18 4.02 1 .56 0.63 1 .27 1 1 大田区 0.9 3.04 1 1 大田区 1 .43 6.49 1 .96 1 .51 室主主且早 O .93 3 .27 O .75 O .1 職員数予算 貸出数登録者数 3.3 0.43 区 6 .83 ‑ 2 .56 1 1 大田区 。 O. 0.48 15.39 。 O. O .28 1 1 大田区 S N 3.86 貸出数登録者数 39 0.75 区 1 .1 2 2.85 23 江 戸 川 区 1 1 大田区 。 2.23 23 江 戸 川 区 S N 。 O .17 床面積職員数蔵書数 人口 。 貸出数登録者数 2 .1 3 。 O. 5 文京区 職員数 。 77 0.66 床面積蔵書数人口 14 司 444 噂 。 。 1 .69 貸出数登録者数

455.

l 千代田区 0.00 ‑0.26 0.68 0.92 2.29 4 .14 1 .52 l 千代田区 0.61 0.00 O .03 O .1 7 O .56 1 .09 O .15 l 千代田区 0.64 0.01 0.00 O .1 4 O .48 0.95 0.09 l 千代田区 O .75 0.06 O .12 0.00 O .1 7 O .39 O .16 0.09 O .18 0.08 O .00 0.09 O .30 l 千代田区 SN 区 0.81 予算 3 港区 SN 床面積人口 。 2.27 。 蔵書数職員数 7.4 1 .35 3 港区 0.93 3 港区 1 .1 3 0.51 3 港区 1 .19 0.65 0.38 3 港区 1 .3 0.92 1 .09 区 職員数人口 。 1 2 世田谷区 。 。 1 .42 。 1 2 世田谷区 0.04 1 2 世田谷区 1 .34 3.67 1 2 世田谷区 1 .43 3.92 O .1 1 2 世田谷区 1 .45 3.98 O .12 SN 区 予算 7 墨田区 0.00 7 墨田区 7 墨田区 3 .39 3.01 14.63 0.75 O .87 3.91 0.82 O .1 6 O .39 1 .5 1 0.26 0.85 0.55 0.42 1 .13 。 O .3 1 床面積予算 O .1 1 人口 1 .38 貸出数登録者数 0.25 。 蔵書数 5.61 貸出数登録者数 1 .79 8.65 3.75 0.6 1 .74 8.44 3.66 0.04 O .1 4 1 .95 O .75 0.02 1 .49 0.55 1 .39 O .5 0.62 。 0.01 。 床面積職員数蔵書数 貸出数登録者数 1 .61 O .33 0.44 0.43 O .57 3.73 0.05 0.00 0.31 0.32 0.43 3 .14 1 .35 O .18 0.83 0.00 0.02 0.07 1 .67 0.69 7 墨田区 O .19 O .89 0.02 0.00 0.04 1 .56 O .64 7 墨田区 0.20 0.98 0.06 0.03 0.00 1 .41 O .57 手 本 で あ る 5区 の 場 合 , 出 力 が 正 に な る も の が あ る が , 非 効 率 な 世 田 谷 区 や 墨 田 区 は 出 力 が 全 て 負 で あ る . 世 田 谷 区 を 蔵 書 数 で 固 定 し で も , 貸 出 数 は 139万 冊 , 登 録 者 数 は 5万 人 少 な い . こ の 場 合,余裕のある職員数,人口,床面積,予算,蔵書数の順に検討して無駄を省き,蔵書数,予算の 順に増やすことを検討し出力を改善することが考えられる.世田谷区は図書館運営を区の直営とし て区の職員を手厚く充当している.このため職員数が目黒区に対し最も非効率であり,他の入力を 固 定 す る と 4人 か ら 145人 多 い . 一 方 , 蔵 書 数 は 2万 冊 か ら 179万 冊 少 な い 1936年 に 世 田 谷 区 と 比 べ る と , 他 の 22 区 は 床 面 積 が 2倍 以 上 の 区 も あ り 非 効 率 的 で あ っ た . し か し , 職 員 数 を 固 定 す る と 目 黒 区 に 比 べ て 1 .42 万 m2, 人 口 を 固 定 す る と 1 .38 万 m2少 な く な っ て い る の で , 世 田 谷 区 は 25年 間 で 床 面 積 が 狭 く な り 問 題 を 抱 え て い な し 、 か 検 討 す べ き で あ る . 墾 田 区 は 蔵 書 数 を 固 定 す る と , 予 算 が 2億 円 , 人 口 が 9.8万 人 , 床 面 積 が 0.06万 m2, 職 員 数 が 3名 多 く , 貸 出 数 が 141 万 冊 , 登 録 者 数 が 5.7万 人 少 な い の で 目 黒 区 を 参 考 に 大 幅 な 改 善 策 を 検 討 すべきである. 4 . 統計分析と資料による検討 4 .1 主 成 分 分 析 図 3は , 5入 力 2出 力 に 用 い た 7変 数 で 主 成 分 分 析 し , 第 l主 成 分 と 第 2主 成 分 上 で ス コ ア プ ロ 15 ‑445・

456.

ッ ト を 描 い た [1][5]. そ し て 1986年と 2011年 の デ ー タ を 個 別 に 95略 正 規 確 率 楕 円 を 描 い た . 大 き な 正 規 確 率 楕 円 が 2011年 で あ る . そ れ に 含 ま れ る 左 上 の 小 さ な も の が 1986年 で あ る . 3象 限 に あ る 1986年の千代田区は, 2011年 に は 第 2象 限 の + 印 の 右 上 に 移 動 し て い る . 移 動 距 離 か ら , 千 代 田 区 の 図 書 館 業 務 の 規 模 が 小 さ い こ と が 分 か る . 1986年 に 手 本 で あ っ た 第 1象 限 の 世 田 谷 区 は , 右 上 の + に 移 動 し 業 務 を 大 き く 拡 大 し て 外 れ 値 に な っ て い る . ほ ぽ 重 な っ て い る 大 田 区 が 第 4象 娘 に 大 き く 移 動 し て い る が , 移 動 方 向 は ほ ぼ 90度 異 な っ て い る . 第 2象限にある目黒区は, 2011年 に は第 4象 限 に 大 き く 右 下 方 向 に 移 動 し て い る . 足 立 区 を は じ め 文 京 区 , 港 区 , 江 戸 川 区 も 右 下 方 向 に移動している. ‑ 1 . 2 . 2 4 主 成 骨2 図 3 7変 数 の 主 成 分 分 析 0変 数 ) で 主 成 分 分 析 図 4は , 5入力 2出 力 で 用 い た 変 数 で 1 0個 の 入 出 力 の 比 ( 表 7の 最 初 の 1 し た 結 果 で あ る . そ し て 1986年と 2011年 の デ ー タ を 個 別 に 9日 正 規 確 率 椅 円 を 描 い た . 左 下 の 小 さ な も の が 1986年 で , 右 の 大 き な 正 規 確 率 楕 円 が 2011年 で あ る . ま た 46図 書 館 の CCRモ デ ル で 選ばれた手本の 1 0図 書 館 を 線 分 で 結 ん だ . 凸 包 に な っ て い な い が 効 率 的 フ ロ ン テ ィ ア に 対 応 し て いる. 1986年 の 95略 正 規 確 率 楕 円 が 効 率 的 フ ロ ン テ ィ ア に 含 ま れ て い る . ま た 1986年 に 7区ある 手 本 の う ち の 杉 並 区 は 第 3象 限 に , 世 田 谷 区 は 千 代 田 区 と 足 立 区 を 結 ぶ 線 分 上 に あ り 1986年 か ら 2011年 に か け て 効 率 的 フ ロ ン テ ィ ア は 拡 大 し た こ と を 示 す . 千代田区は, 2象 限 か ら 2011年 に は 第 4象 限 の 効 率 的 フ ロ ン テ ィ ア ま で 大 き く 動 い た . 図 3 と異 な り 変 化 率 が 大 き か っ た こ と を 示 す .1986年 に 効 率 的 で あ っ た 世 田 谷 区 は 右 下 方 向 に 業 務 を 拡 大 し ているが, 1986年 の 図 書 館 業 務 の 規 模 が 大 き か っ た の で 変 化 率 は 小 さ い . こ れ に 対 し て , 規 模 の 大 きな大田区は右上に大きく変化しているのは職員数の未記入の問題が影響している. 民医 5 4 3 向同余圏直側 2 。 ‑ 1 ‑ 2 ‑ 3 4 4 ‑ 2 o 2 4 主慮分 12 16 ‑ 4 4 6・ 6 8

457.

図 4 主成分分析によるスコアプロットと 4 6図 書 館 の 効 率 的 フ ロ ン テ ィ ア 5 . まとめ 本研究では 1 986年と 2011年 の 東 京 都 2 3区 の 公 立 図 書 館 の 比 較 を .5入 力 2出 力 モ デ ル で 行 う こ とで,次のことが分かった. • 1986年と 2011年 の 46図 書 館 を 5入 力 2出 力 の CCRモ デ ル で 分 析 す る と , 手 本 は 2011年 単 独 の 手本と同じ 1 0図 書 館 で . InvertedCCRモ デ ル で は 1986年 単 独 の 場 合 と 同 じ く 3図 書 館 が 非 効 率 な 986年 か ら 2011年 に か け て 効 率 的 フ ロ ン テ ィ ア が 拡 大 し た こ と が 手本になった.このことから. 1 分かる 986年 で 最 も 非 効 率 で あ っ た 千 代 田 区 は . 2 5年 間 で 予 算 と 人 口 は 1 .04倍と1.03倍 し か 増 え て ・1 いない 床 面 積 , 蔵 書 数 , 職 員 数 は 1 .6 6倍. 1 .8 2倍. 2.02倍 増 え た が , そ れ 以 上 に 貸 出 数 と 登 録 .7 1倍と 1 2 .5 7倍 と 図 書 館 業 務 を 大 き く 改 善 し . 2011年 に は 手 本 に な っ た . 他 の 公 立 図 書 者数を 7 館も,図書館業務を大きく改善したものが多い.これは,図書館業務の外部委託化と図書館の複合 センター化などで達成できたと考えられる.しかし,近年多くの組織で外注化が行われているが, 以下の質的改善が同時に行われた結果といえる ・区の直轄事業であれば司書を正式に採用できないが,専門業者であれば可能になる ・公立図書館の 2 2時 ま で の 開 館 や 図 書 の 24時 間 返 却 ポ ス ト の 開 設 , 託 児 サ ー ビ ス な ど に よ り , 勤 労者や児童保護者の図書館利用層の積極的な拡大を行った. ・大学図書館や他自治体やグループへの積極的な貸し出しを行った. ・千代田区にみるように,神田の古書庖などの地域との連携が行われ,単なる図書の貸し出しから 従来の図書館の枠を超えた情報の提供という旧来の図書館業務には見られない試みもあり評価に 値する. ま た 本 研 究 事 例 は .DEAの 評 価 に お け る 可 視 化 と 公 平 性 を 示 す 成 功 事 例 と 考 え る .1 986年 に は DEA 効率値が o .19で あ っ た 千 代 田 区 が 2011年 に は 目 黒 区 と 同 じ く 手 本 に な っ た 点 で あ る これまでも 比率を用いた評価は単純でわかりやすいが個々で異なった結果になり,説得性に乏しかった.それ ' a i * X ; )を 提 案 し た 点 を 複 数 の 入 力 と 出 力 を 重 み で 総 合 化 し , 評 価 対 象 に 最 適 な DEA 効率値('bi 打 j で あ る . こ れ に よ っ て 規 模 の 小 さ な 千 代 田 区 や , 予 算 や 人 口 が 少 な く 出 力 も 6位 と 7位 と い う 目 黒 区が総合して効率的であることが分かった.さらに r 1入 力 固 定 改 善 法 」 で , 複 数 の 代 替 案 を 総 合 的に判断することで,評価対象の問題点が発見できた. これまでの評価法であれば,千代田区や目黒区を評価する基準がなく,図書館業務の規模の大き な大田区や世田谷区に隠れてクローズアップされなかったであろう.日本では企業の事業部評価に おいても,採算性は良いが規模の小さい事業部を評価することは一般的に行われていない それが DEA効 率 値 と い う 尺 度 で も っ て 初 め て 正 し く 評 価 で き る 道 が 開 カ ミ れ た 点 は 大 き い . 今 後 企 業 の 経 営 効率性の分析や,経営効率性になじまない大学経営にも利用できる可能性がある. 011年 の 調 査 を 担 当 さ れ た 東 京 都 立 中 央 図 書 館 の 担 当 者 の 方 に 説 明 会 謝辞:本研究内容に関して.2 を開催し,職員数などに関して意見交換する機会を得たことに感謝する. 1 7 ‑ 4 4 7 ‑

458.

参考文献 [ l JJ .P .Sall,L .C reighton&A .Lehman(2004).JMPを 用 い た 統 計 お よ び デ ー タ 分 析 入 門 ( 第 3版) SAS Institute Japan 附. [新村秀一監修] [ 2 JL .S chrage(2003). Optimizer Mode1ing with L I N G O . LINDO Systems I n c . [ 3 J S .Shinmura(2012).Re1ationship between t h e DEA c1uster and the 10wer 1imit of weights. Proceedings o f DEA Symposium 2012, pp.63‑68 [ 4 J K .Tone( 1 9 8 8 ) .Introduction t o Efficiency Ana1ysis o f a company‑DEA (1). Operations Research, 3 2 / 1 2 . 2 0 0 4 ) . JMP活 用 [ 5 J新 村 秀 一 ( 統計学とっておき勉強法.講談社. [ 6 J新村秀一 ( 2 0 0 7 ) . Exce1 と LINGOで 学 ぶ 数 理 計 画 法 . 丸 善 . [ 7 J 新村秀一 ( 2 0 1 1 ) .数 理 計 画 法 に よ る 問 題 解 決 法 . 日 科 技 連 出 版 社 . [ 8 J ̲(2011).DEAに よ る 回 帰 型 デ ー タ の ク ラ ス タ ー 分 析 . 成 隊 大 学 一 般 研 究 報 告 , 45/3, 1 ‑ 3 7 . 1 9 9 3 ). 経 営 効 率 性 の 測 定 と 改 善 ー 抱 絡 分 析 法 DEAに よ る . 日 科 技 連 出 版 社 . [ 9 J刀根薫 ( [ l O J ̲(1987).DEA事例集. Institute for Po1icy Science Research Report .1 ‑ 3 3 . 2 0日 年 東 京 都 公 立 図 書 館 調 査 J . 1 ‑ 1 3 8 . [ 1 1J 東 京 都 中 央 図 書 館 . r 1 8 ‑ 4 4 8 ‑

459.
[beta]
'7Û>~ ん2(.,/(;
守、
(
しν
Z ヂし

1

LS

し‑
S
'
"
"ì:~-.

‑GLM と PLM によるモデル推定後のフ。ロセスー
0魚 住 龍 史
京都大学大学院医学研究科医学統計生物情報学

Thecuπenti
n
n
o
v
a
t
i
o
nf
o
rLS‑Means:i
m
p
l
e
m
e
n
t
a
t
i
o
nbyu
s
i
n
gb
o
t
hGLMandPLMp
r
o
c
e
d
u
r
e
s

R
y
u
j
iUozumi

Depαr
t
m
e
n
t01B
i
o
m
e
d
i
c
a
lS
t
αt
i
s
t
i
c
sα
ndB
i
o
i
n
f
o
r
m
a
t
i
c
s
,K
yotoU
n
i
v
e
r
s
i
t
yGraduateS
c
h
o
o
l01M
e
d
i
c
i
n
e

要旨
SASでは,線形モデ、ルによる解析を行うためのプロシジャが多く実装されている.これらのプロシジ
ャでは,モデルの推定後にパラメータの線形式に対する推定が必要となることがある.例えば,
最小 2乗平均Iを算出し,比較することが挙げられ
LSMEANSステートメントによる各群の LS‑Meansr
る. LSMEANSステートメントや ESTIMATEステートメント等の機能は, SAS/STATV9.22から大幅に
拡張され,より多くのプロシジャで実行できるようになった.さらに,上述したモデル推定後のプロセ
スは,以前のパージョンで、はプロシジャの実行とともに記述する必要があったが, SAS/STATV9.22から,
モデル情報をアイテムストアとして保存するための STOREステートメント,及びアイテムストアを呼
び出すための PLMプロシジャが追加された.本稿では, GLMプロシジャを用いた, LSMEANSステー
トメントによる LS‑Meansの算出について,各ノ fラメータに対する係数を ESTIMATEステートメントで
明示的に概説する.次に,オプション機能として, OBSMARGINSオプション, BYLEVELオプション,
ATオプションを用いた LSMEANSステートメントによる LS‑Meansの算出について解説する.また,
GLMプロ、ンジャによるモデ、ル情報から, PLMプロ、ンジャを用いて, LSMESTIMATEステートメントに
よる推定を行う実行手順を示す.

キ ー ワ ー ド :LS‑Means, GLM, ESTIMATE, OBSMARGINS, BYLEVEL, AT,モデル情報, PLM,
LSMESTIMATE

1 はじめに
SASでは, GLMプロシジャや LOGISTICプロシジャなどのように,線形モデルによる解析を行うためのプ
ロシジャが多く実装されている.これらのプロシジャでは, MODELステートメントにおいて推定するモデ
ル式を記述し, SOLUTIONオプションによってパラメータ推定値を表示することができる.さらに,データ
解析では,モデル推定後のプロセスとして,パラメータの線形式に対する推定が必要となることがある.

‑
4
4
9
‑

,、 1~('Ylj

460.

例えば, LSMEANSステートメントによる各群の最小 2乗平均(le a s ts q u a r e sr n e a n s,以下, LS‑Means) を算出 し,比較することが挙げられる.LSMEANSステートメントは, OBSMARGINS(OM) オプション, BYLEVEL オプション, ATオプションといったオプション機能がサポートされており,大変簡便かっ有用で、ある. また, CONTRASTステートメントや ESTIMATEステートメントによる,任意の係数を用いた推定も考えら れる. LSMEANSステートメントの機能は,以前のバージョンにおいては GLMプロシジャなどの一部の プロシジャのみで利用できるものであった.しかし, SAS/STATV9.22から大幅に拡張され,表 lのように, LOGISTICプロシジャや PHREGプロシジャなどのより多くのプロシシャで実行できるようになった.また, 新たに LSMESTIMATEステートメントが追加されており, LS‑Meansの線形式に対する推定,検定を行うこ とができる. LSMESTIMATEステートメントは, LSMEANSステートメントと異なり,各 LS‑Meanの値は算 出されない.さらに,モデルパラメータの線形式を用いる ESTIMATEステートメントと異なり, LSMESTIMATEステートメン卜では LS‑Meansの線形式を用いるため,より解釈しやすいステートメントと いえる 2 0日)によって, PHREGプロシジャによる上記のステートメン 本ユーザー総会においては,浜田 ( トの解説が行われ,決まりきった対比較等の不必要な項目まで冗長に出力されてしまう LSMEANSステー トメントに比べて,特定の群問比較のみ出力できる LSMESTIMATEステートメントが推奨された [7] 表 1:各プロシジャにおけるステートメントの使用可否 [3] 1 . G 再 w 大交交交交交交交食会 O H ムH ムX c 即日 公安 。 公安公安 交交交交ム 。 。 │闘圃幽晶1LI・・岨溢晶畠山岨晶 000 。 00000 。 O ム MO 可 EGGR 11EOH HURLP 吃 ャDX D m m m G 印町町町 ヅ 再 AH1EHVVV J 1E ︑ 一 umXNUGRTMRRR ロ LIELOHRLUUU プ GMGGLPOpsss ••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••• 0:以前のパージョンから利用可能,カ:新たに追加あるいは更新サポートされていない その他にも, SAS/STATV9.22から拡張された機能として,モテ、ル情報をアイテムストアとして保存するた めの STOREステートメント,及びアイテムストアを呼び出すための PLMプロシジャが追加された.上述し た LS‑Meansを算出するモデル推定後のブ勺ロセスは,以前のパージョンではプロシジャの実行とともに記述す る必要があり,オブザベーション数が多い場合やモデル式が複雑で、ある場合,モテ、ル推定に再度多くの時間 を要することがあった.しかし, PLMプロシジャを用いると,推定されたモデル情報を呼ひ、出し,統計量の 算出, ODSGRAPHICSによるグラフ表示等を実施でき,再度の入力データセットの参照,線形モデルプロシ ジャの実行が不要であり,大変有用であるといえる. ‑ 4 5 0 ‑

461.

本稿では, GLMプ口、ンジャを用いた, LSMEANSステートメントによる LS‑Meansの算出について,各パ ラメータに対する係数を ESTIMATEステートメントで明示的に概説する次に,オプション機能として, O M オプション, BYLEVELオプション, ATオプションを用いた LSMEANSステートメントによる LS‑Meansの 算出について述べる.さらに, GLMプロシジャによるモデル情報を用いて, PLMプロシジャを実行する手 順を述べ, GLMプロシジャではサポートされていない LSMESTIMATEステートメントによる推定を行う手 買を示す. ) 1 2 GLMプロシジャによる LS・Meansの算出 2 . 1 G L Mプロシジャによる LS‑Meansの数理 GLMプロシジャによる LS‑Meansの算出までのプロセスを示すために,表 2の 2元配置アンバランスデー タを考える 表 2:2元配置アンバランスデータ例(データセット名:twoway) ¥ 6) 1 .3 3 46(n2 22 26 30 3 , , , 二 , 26 2 9 .3L3 3(n2 2= 4) , このとき,切片パラメータを μ,治療効果を表すノ fラメータを α, ( i= 1, 2 ),ブロック効果を表すパラメー タを β' j ( j 1 , 2 ),治療 iとブ、ロック j の交互作用効果を表すノ tラメータを ru' 治療しブ、ロック j における k 二 番目の観測ノ fラメータを, Yjk (k 1 , 2, . . "nu),誤差パラメータを eijk (互いに独立に平均 0,分散 σ2の正規分布 二 y l ︑ ︑ / a z に従うと仮定)とすると, 九 =μ+α+βj +r i j +e i j k と表せ,治療 i,ブロック jにおける母平均パラメータは E[ , Yj1 =μ+α+βj +ん と表せる.また,治療 i,ブロック jの周辺母平均ノ tラメータはそれぞれ , Y l+E[九] μ+α+ ¥ β¥+ β 2 ,r i l +γ E[I : . ]=E[ ‑ I I 一一一一+一一一三 =μ+α+β +r, ‑t̲ E [ Y j l= . J . . . . . ‑ t ̲‑JL. J E[1 ' ; , ]+E[Y 7i] りり 2 ロー+仏 ~ ( 2 ) r "+r 2i ~ '~Jμ+α+β +r =μ+~+β+' J l 2 'J 2 と表記できる. さらに,治療効果の差の推定を考えると,式 ( 2 ) より, Y¥¥ E[Y , ] ‑E[Y =α1α2+‑ 2l +r¥2‑r2¥‑r22 2 となり , rijが含まれることに留意しなければならない. ‑ 4 5 1 ‑ ( 3 )

462.

ここで,パラメータベクトル pを p= ( μ α1 α2 βl β2 Y l l Y l 2 Y 2 1 Y22Y' l ・ n u nり 弓MF3 0 . 5 0 . 5 0 . 5 0 0 . 5 0 0 。 。 0 0 . 5 0 . 5 0 . 5 ハリハリ ' i Aり E I Aり ハ り ハ リ TAAU'IAU'I 2 1 Aり ω000l 0 0 . 5 ω0100 。 。 。 ' I Aり olω ωoo‑‑ L= 11 loM ω1100 係数行列 Lを ( 4 ) として ,(周辺)母平均ノ tラメータベクトルは Lpを計算することによって求まる. LS‑Meansは,推定ノ《ラメ ータベクトル pから求まる Lpである. 2.2 LSMEANSステートメントによる実行 GLMプロシジャでは, LSMEANSステートメントを用いて, LS‑Meansを容易に算出することができる. 表 2のデータに対して,モデ、ル式 ( 1 ) を用いて, LS・Meansを求めるための SASプログラム例及び実行結果 を一部抜粋したものを図 lに示す. E 而II1IIムドトメント日いたプログム proc glmdata~twoway; class treatment block; model y~treatment Iblock; l s r n e a n s treatment I c l stderr e ; lsmeans block / c l stderr e ; ; lsmeans treatment block/ 1 stderr e 女 run;quit; │係数ベクト干の型{治療効果, . . . .,~htj"'1算出結果 T トe a t m e n t B l o c k vの最小 2 乗 平 均 標 準 誤 差 2 9 . 1 6 7 2 . 0 9 1 1 2一 1212 2 一 ‑ 2i'I ウ&吋 4 最小 2乗 平 均 T r e a 肺 , 削 tの 係 数 効果 T r e a t m e n t水 準 1 2 I n t e r c e p t 0 T r e a t m e n t1 T r e a t m e n t2 0 0 . 5 0 . 5 B l o c k1 B l o c k 2 0 . 5 0 . 5 0 T r e a t m e n t * B l o c k11 0 . 5 0 T r e a t m e n t * B l o c k12 0 . 5 0 . 5 T r e a t m e n t * B l o c k21 0 T r e a t m e n t * B l o c k22 0 0 . 5 30.542 l .909 26.167 1 . 707 33.542 2.259 .000 2l . 333 3l 2. 41 5 3. 41 5 2. 41 5 29.750 2.957 37.333 図 1・GLMプロシジャによる LS‑Meansの算出(1) LS‑Meansの計算は, CLASSステートメント及び MODELステートメントによるモデル推定後のプロセス となるため, GLMプロシジャ内の LSMEANSステートメントは上記 2つのステートメントの後に記述する. ‑452 幽

463.

図 lの例では,交互作用効果を含んだモデル式 ( 1)から得られる治療効果,ブロック効果,交互作用効果の LS‑Meansをそれぞれ求めている なお, LSMEANSステートメントの E オプションは,推定に用いる係数ベ クトルを出力させるための機能である.推定に用いる係数ベクトルの出力は,式 ( 2 ) に対応する場合のみ抜 2 ) すなわち,式 ( 4 ) の L における第 l行,第 2行が該当する. 粋して示している(i=1, なお,表 lに示すように, SAS/STATV9.22以降, LSMEANSステートメントは多くのプロシジャでサポー トされている 2 . 3 ESTIMATEステートメントによる実行 図 lのように, LSMEANSステートメントの E オプションを指定すれば,式 (4) の Lのような係数(行手 I J ) を出力させることは可能である.しかし SASプログラム上で明示的に確認はできない.そこで, ESTIMATE ステートメントを用いて,各ノえラメータに対する係数を指定した上で, LS‑Meansを求めるための SASプロ グラム例及び実行結果を一部抜粋したものを図 2に示す. l 日 │ 11011ステートメントを用いたプログラム 1 ... proc glm data=twowaYi class treatrnent block; model y~treatment est~mate Ib lock; "Treatment ユ "工 ntercept 1 treatment 1 0 block 0.5 0.5 treatmentkbユock 0.5 0.5 0 0 / e ; ; estimate "Treatment 2 " intercept 1 treatment 0 1 block 0.5 0.5 treatment block 0 0 0.5 0.5 / e 大 estユmate "Block 1" ユntercept 1 treatment 0.5 0.5 block 1 0 treatment*block 0.5 0 0.5 0 / e ; " intercept 1 treatment 0.5 0.5 block 0 1 treatment block 0 0.5 0 0.5 I e ; est工mate "Block 2 女 ; estimate "Treatment 1 Block 1 " inte工cept 1 treatment 1 0 block 1 0 treatment block 1 0 0 0 I e 女 est mate "Treatment 1 810ck 2 " intercept 1 t工eatment 1 0 block 0 1 treatment*block 0 1 0 0 / e ; ム " intercept 1 treatment 0 1 block 1 0 treaヒmen七女 block 0 0 1 0 I e ; estimate "Treatment 2 Bょock 1 " 工ntercept 1 treatrnent 0 1 block 0 1 treatment block 0 0 0 1 I e ; est mate "Tど eatment 2 Block 2 女 ム runiquiti ル~算出結果 │係数ベクトルの出力(糊効果) 推定 T r e 剖 開 叫 lの係数 1 T1 I n t e r c e p t T r e a t m e n t1 T r e a t m e n t2 B l o c k1 0 . 5 Block2 0 . 5 l o c k11 0 . 5 T r e a t m e n t準B T r e a t m e n t湘B l o c k12 0 . 5 キB l o c k21 T r e a t m e n t l o c k22 T r e a t m e n tネ B 推定T r e山 田n t2 の係数 行 l I n t e r c e p t T r e a t m e n t1 T r e a t m e n t2 0 . 5 ∞k1 B l B l o c k2 0 . 5 T r e a t m e n tキB l o c k11 T r e a n n e n t * B l o c k12 T r e a t m e n t * B l o c k21 0 . 5 T r e a t m e n t * B l o c k22 0 . 5 。 。 。 。 。 。 パラメータ Treatment1 推定値標準誤差 t値 P γ 〉判 29.167 2 . 0 9 1 1 3 . 9 5<.0001 Treatment2 30.542 B10ck1 26.167 1 .909 16.00<.0001 1 .707 15.33<.0001 1 4 . 8 5く 0001 Block2 33.542 2.259 Treatment1Bloιk1 21 .000 2. 415 8.70く . ∞01 Treatment1Block2 37.333 3.415 1 0 . 9 3<.0001 Treatment2Block1 . 333 31 2. 415 1 2 . 9 8<.0001 Treatment2Block2 29.750 2.957 10.06く 0001 図 2:GLMプロシジャによる LS‑Meansの算出 (2) ‑ 4 5 3 叩

464.

ESTIMATEステートメントにおいても Eオプションを指定でき,推定に用いる係数ベクトルを出力させる ことができる.図 lと同様に,推定に用いる係数ベクトルの出力は,式 ( 2 ) に対応する場合のみ抜粋して示 i=1 , 2 ) . 図 2における LS‑Meansの結果は, LSMEANSステートメントを用いて求めた図 lの結果 している ( と一致していることを確認できる. なお, LSMEANSステートメント同様、 ESTIMATEステートメントも多くのプロシジャでサポートされて いる.しかし, LOGISTICプロシジャ等では, CLASSステートメントの PA 孔屯M オプションを指定でき,プ ロシジャによってデフォルトが異なる.そのため, ESTIMATEステートメントにおける係数の指定に注意が 必要である.図 2のような Lふ Meansの推定を行う場合, GLM法によるデザイン行列の指定がわかりやすい [8J 3 GLMプロシジャによるオプション機能を用いた LS‑Meansの算出 同様の表 2のデータを用いて, LSMEANSステートメントのオプション機能を考える.本セクションでは, 5 ) を用いて考える. モデ、ル式(1)よりシンプルな交互作用効果を含まないモデル式 ( W ら =μ+αj+β'j +εp このとき,治療 i,ブロック j に対して, LSMEANSステートメントによって求まる LS‑Meansはそれぞれ , +丘 一 E [r ; ]=μ+αt+」s 7 h μ + α j + β ( 6 ) E [ Y j l=μ丹 生 叫 = 川 リJ と表記できる. さらに,治療効果の差の推定を考えると,式 ( 6 ) より, E[ , ; Y1 ‑E[Y2'1 ロ αIα2 ( 7 ) となり,式 ( 3 ) と異なり, α tのみで表せる. パラメータベクトル pを い αlα2 s,s , Y z p= 係数行列 Lを I 1 1 0 0 . 5 0 . 5I I 1 0 1 0 . 5 0 . 5I L=I I 10 . 5 0 . 5 1 0I I 10 . 5 0 . 5 0 ( 8 ) 1I とすると, LS‑Meansは,推定パラメータベクトノレ。から求まる LPである. 3 . 1 O Mオプションの利用 治療効果に対する LS‑Meansを考えると,表 2のデータのようにブロックが 2水準の場合, β' " s 2に対する 係 数 C"C2は ‑ 4 5 4・

465.

=112=0.5, c2 =112=0.5 C1 エ ( c =) 1 k k となり,各水準に対して等しい割合が係数として用いられていることがわかる. 一方, LSMEANSステートメントの OBSMARGINS(OM) オプションを用いると,入力データセットにお ける各水準のオプザベーション数に依存して,係数が設定される.表 2のデータでは,各プロックにおける データ数は n .1=L i n i l=12 n . 2 ヱ 7 = ini2 = であるため,係数 Cp C2は ハ=12119 0.6316 C1= n . 1 / n . .=Linil/LiL C2 = = n . n . .=Lini2/LiLjn y= 7119=0.3684 2/ となる. すなわち, O Mオプションを用いると,治療 i のし句・Meansは 1 2̲ 7 E[YJ=μ+αi+~=ßl +一 β2 一 1 9 1 9 '• 且 と表記でき,治療効果の差の LS・ Meansは ( 9 ) E[: r ; . ]‑E [ Y 2 . ]=α1ー α2 となり,式 ( 7 ) と同様に α,のみで表せる.係数行列を考えると,式 ( 8 ) の代わりに 1 1 1 0 0 . 6 3 1 60 . 3 6 8 4 1 1 1 0 1 0 . 6 3 1 6 0 . 3 6 8 4 1 L=I 1 47 3 7 0 . 5 2 6 3 1 0 1 1 1 0. 47 3 7 0 . 5 2 6 3 1 1 0. を用いて, 0 1 1 L Pを計算している. LSMEANSステートメントの O Mオプションを利用して,モデル式 ( 5 ) から LS‑Meansを求めるための SAS プログラム例,及び対応する ESTIMATEステートメントによる SASプログラム例を図 3に示す. 図 3の SASプログラムを実行すると, LSMEANSステートメント及び ESTIMATEステートメントにより求 ・ Meansは一致していることが確認できる. めた LS・ a さらに,治療効果の差の推定を考えると,式 ( 9 ) のように表せ,交互作用効果を含まないモデルでは, O M オプションの使用の有無に関わらず,同様の結果となる .OMオプションの有無で LS ・ Meansの結果を比較す るための SASプログラム例及び実行結果を一部抜粋したものを図 4に示す. 図 4の SASプログラムを実行すると, LSMEANSステートメントにより求めた LS‑Meansは,治療効果の 差の推定に関しては一致していることが確認できる.しかし,各治療の LS‑Meansは異なった結果となる. ‑455・

466.

11州~ステートメント川オプション)を用いたプログラム proc qlm data~twoway; class treatment block; model y~treatment block; lsmeans treatment / om cl stderr e ; run;quit; 1 E~UIDlI!Iステートメントを用いたプログラム proc qlm data~twoway; class treatment block; model y~treatment block; estlmate "Treatment 1" エntercept 1 treatment 1 0 block 0.6316 0.3684 / e; est工mate "Treatment 2" 工ntercept 1 treatment 0 1 block 0.6316 0.3684 / e ; run;quit; 図 3:GLMプロシジャによる LS‑Meansの算出 (3) T r e a t m e i 叫 proc ql皿 data~twoway; classtreatmentblock;modely~treatment block; ムs means treatment / ~l y の最小 Z乗 平 均 2 事5% 信頼痕界 1 1 一一 2 7 . 5 3 8 2 2 . 1 6 6 3 2 . 9 1 0 31 . 356 2 6 . 3 4 3 3 6 . 3 6 9 効果 T r e a i 抑 制tに対する最小 Z 乗 平 均 1 I 平均の差 LSMean( i ) ‑ L S M e a n( j ) の 95%信績限界 1 2 ‑ 3 . 8 1 8 ‑ 11 .0 3 8 3 . 4 0 2 diff e ; run;quit; 側 オ ヲU Uijり proc qlm data~twoway; classtreatmentblock;modely~treatment block; T r e a J 腕 n t ¥.の最小 Z乗 平 勾 2 6 . 6 7 5 2 3 0. 4 9 3 lsmeans treatment / om cl dlff e ; 1 run;quit; 95% 信 頼 限 界 21 .4 4 3 31 .9 0 7 2 5 . 5 3 0 3 5 . 4 5 6 効果 T 阿 国 間n t/.二対する最小 Z乗 平 均 LS M. 印 刷i }‑ LSMean( j }の9 5 弘信恵援界 ‑ 3 . 8 1 8 ‑ 11 .0 3 8 3 . 4 0 2 平i S }の差 2 図 4:GLMプロシジャによる LS‑Meansの算出 (4) 3 . 2 O MBYLEVELオプションの利用 表 2のデータに対して, LSMEANSステートメントの O Mオプションに加えて, BYLEVELオプションも 用いると,入力データセットにおける各水準のオブザベーション数に依存して,以下のように係数が設定さ れる. I 治療 1 ] c1= n11/n1 . =nll/Ljn1 j=6/9=0.6667 C2=n n1 . =n 3333 j=3/9=0. 1 2/ 1 2/Ljn1 【治療 2 ] c n2 . =n21/Ljn2j=6/10=0.6 2 1/ 1=n C2 =n n2 . =n22/Ljn2j=4/10=0. 4 2 2/ ‑ 4 5 6 ‑ l

467.

OM オプションのみを使用した場合,各治療に対して共通の係数 C !, C 2 を用いた • BYLEVELオプションも加 えると,各治療に対する係数をそれぞれ計算する. すなわち, OMオプションを用いると,治療 i の L S ‑ M e a n sはそれぞれ 6~ 3 E [町, ] = μ+α1+ ‑ ; : : ‑ β 1 +ー9β2 ‑ . '9" 6~ 4 E [ Y 2 ]= μ+α 2+.~~ßI+ ー β2 1 0 " ゐ 1 0 と表記でき,治療効果の差の L S・M e a n sは 且 aa‑‑‑ ん . . .s ' ' ︑ ︑ AU ー l ︐ ( 6 6L ( 3 4i E[ , Y]‑E[日 =α1一 向 + 1 一一 I s I+ 1 一一 │ β 2 ¥9 10r' ¥9 10) ム となり,式 ( 7 )や式 ( 9 ) と異なり, α のみで表せない.係数行列を考えると,式 ( 8 ) の代わりに 1 1 1 1 1 L=I 1 1 0 0 . 5 。 0 . 6 6 6 7 0 . 3 3 3 3 0 . 6 0 . 5 4286 0 . 5 7 1 4 1 1 0. を用いて, 1 。 0. 4 0 L sを計算している. LSMEANSステートメントの OMオプション及び BYLEVELオプションを利用して, L S ‑ M e a n sを求めるた めの S ASプログラム例,及び対応する ESTIMATEステートメントによる SASプログラム例を図 5に示す. L ステートメントm1J肌[Usオプション)を用いたプログラム I proc glm data~twoway; class treatment block; model y~treatment block; lsmeans treatment I om bylevel cl stder工 e; run;quit; 1訂~ステートメントを用いたプログラム I proc glm data~twoway; cユass treatment block; model y~t 工 eatment block; estimate "Treatment 1" lntercept 1 treatment 1 0 block 0.6667 0.3333 I e; estlmate "Treatment 2" intercept 1 treatment 0 1 block 0.6 0.4 I e; run;quit; 図 5:GLMプロシジャによる L S ‑ M e a n sの算出 ( 5 ) 図 5の S ASプログラムを実行すると, LSMEANSステートメント及び ESTIMATEステートメントにより求 S ‑ M e a n sは一致していることが確認できる めた L さらに, OMオプション及び BYLEVELオプションとデフォルトの L S ‑ M e a n sの結果を比較するための SAS プログラム例及び実行結果を一部抜粋したものを図 6に示す. ‑457‑

468.

OI~ オプションなし(デフォルト T r e αt m e n l vの最小 2乗 平 均 1 2 7 . 5 3 8 proc glm data~twoway; classtreatmentblock;modelyニ treatmentblock; 2 31 . 35 6 95% 信額限界 2 2 . 1 6 6 3 2 . 9 1 0 2 6 . 3 4 3 3 6 . 3 6 9 効果 T r e a肺混同に対する最小 Z乗 平 均 印 刷j ) の 95% 信穣恩界 L 平均の差 LSMean(i)‑LSM 3 . 8 1 8 ‑ 11 .0 3 8 3 . 4 0 2 2 ; lsmeans t工eatment / cl diff e , run;quit; E O~.=)I'I .a'UII オプションあり proc glm data~twoway; classtreatmentblock;modely~treatment block; lsmeans treatment / 0皿 T r e a t m e n t vの最小 Z乗 平J S j 1 26制 4 2 3 0 . 7 ∞ 95%信顛盟主界 21 .2 1 9 31 .6 7 0 2 5 . 7 4 3 3 5 . 6 5 7 効果 T r e α 肺 剛, t/.二重せする量/ 1 '2乗 平 治 i )‑LSM 四 n ( j ) の 95% 信 頼 銀 界 L 平均の差 LSMean( ー 4 . 2 5 6 ‑ 11 .4 5 8 2 . 9 4 7 2 bylevel cl diff e ; run;quit; 図 6:GLMプロシジャによる LS・Meansの算出 (6) 図 6の SASプログラムを実行すると, LSMEANSステートメントにより求めた LS‑Meansは , O Mオプシ ヨン及び BYLEVELオプションを利用すると,デフォルトと結果が一致しないことがわかる.治療効果の差 の推定を考える場合,式(10 )のように表せ,式 ( 7 ) とは大きく異なる表記となるため,結果は一致しない ことになる. 3 . 3 ATオプションの利用 ら =μ+α+βJ十 6・zμ +&ijk .EF ( ︑ ‑ ‑ モデ、ル式 ( 4 ) に連続量 Z i j kを説明変数に含んだモデル(11 )を考える. このとき,治療しブロック j に対して, LSMEANSステートメントによって求まる LS‑Meansは s, +s2 .= <' E[Y ; ]=μ+α;+. . c . . . ! . . . . す ニ +z.d ( 1 2 ) 竺生叫 +z.d E [Y : j]=μ+ と表記でき,パラメータベクトル pを , p=(μαlαzβlβ2 δy dhF ︑ ︑d E ε 0 . 5 0 0 1D 1 55 o o1‑c olω JF3 l 1: ︐ a ︑ ︐n・U A U 係数行列 L を z Z z z とすると, LS‑Meansは,推定パラメータベクトル。から求まる LJIである 係数として,算術平均 Eが用いられていることがわかる. ‑ 4 5 8 ‑ 式 ( 1 2 ) におけるパラメータ δの

469.

ここで,表 2のデータは z =1 4 . 5 2 6 3であると仮定する.このとき, LSMEANSステートメントの ATオプ ションを利用して, LS‑Meansを求めるための SASプログラム例,及び対応する ESTIMATEステートメント による SASプログラム例を図 7に示す. .~ステートメント ESTIM皿 ス テ ー ト メ ン ト l proc glm data~twoway; proc glm data twoway; ニ class treatment block; class treatment block; model y~treatment block z ; model y~treatment block z ; lsmeans treatment I cl stderr e; estlmate "Treatrnent 1 " run;quit; エntercept 1 treatment 1 0 block 0.5 0.5 z 14.5263 I e; I estlrnate "T工 eatment 2" proc glm data~twoway; ェntercept 1 treatment 0 1 class treatment block; block 0.5 0.5 z 14.5263 I e; model y~treatment block z ; lsmeans treatment I cl stderr e at z~14.5263; run; quit; run;quit; 図 7:GLMプロシジャによる LS‑Meansの算出 ( 7 ) LSMEANSステートメントの ATオプションを用いると,図 7における百七 ことによって Z二 14.5263" の値を変える zの代わりに任意の値を係数として用いることができる. 4 PLMプロシジャによる LS‑Meansの算出 前節まで,モデル推定後の LS‑Meansの算出まで、のプロセスについて, GLMプロシジャ内の記述方法を示 した .OMオプションのようなオプションを用いた結果が必要となった場合,オプションを追記した上で, 再び GLMプロシジャを実行しなければならない このような操作は,オブザベーション数が多い場合やモ デル式が複雑である場合,モデル推定に再度多くの時間を要することになる. 4 . 1 PLMプロシジャの概要 SAS/STATV9.22より, GLMプロシジャ等のプロシジャを用いて推定されているモデル情報を呼び出し, 統計量やグラフ表示などを行うことのできる, PLMプロシジャが追加された. PLMプロシジャを利用するにあたっては,まず GLMプロシジャ等のプロシジャを実行する際に STORE ステートメントを用いて,プロシジャから得られるモデ、ノレ情報,すなわちアイテムストアをバイナリファイ ルとして保存する. STOREステートメントは,表 lに示したプロシジャで実行できる.そして, PLMプロ シジャの RESTOREステートメントを用いて,アイテムストアとして保存したモデル情報を呼び出し,統計 量やグラフ表示などを行うことができる.モデ、ル情報に基づく実行であるため,再度の入力データセットの 参照,線形モデ、ルのプロシジャを実行することなく,モデ、ル推定後のプロセスを実行できる. ‑459‑

470.

4 . 2 LSMEANSステートメントによる実行 GLMプロシジャによるモデル情報を"阿o w a y f i t " という名前のアイテムストアに保存し. PLMプロシジ ヤで実行するまでの SASプログラム例を図 8に示す.表 2のデータに対して,交E作用効果を含むモデル式 (1)による解析を考えている. I [II]lJJステートメントによるアイテムストアの保存 proc glm data~twoway; 川プロシジャによる山l!Hlll.'lの算出 proc plm restore=twowayfit; c1ass treatmentb1ock; mode1 y~treatment Ib1ock; lsmeans treatment / c1; store twowayfit; lsmeans b10ck / c1; run; lsmeans treatment*b1ock / c1; quit run; 図 8:GLM及び PLMプロシジャによる LS‑Meansの算出 ( 1 ) 図 8の SASプログラムの実行結果のうち,治療とブロックの交互作用効果に対する LS‑Meansとして .ODS GRAPHICSによる出力結果を図 9に示す. I L¥Iブ ロ シ 川 こ 山 ' 1 , 力 川 プ ロ シ シ 山 川: 1力 最 小 2栗平均 T開 atm・同事 8 1 0 曲 . . 、 卵、健編根扉 量' 1 2乗平均 T聞 .b 鴨 川 場8 1 0 0 k . . 35 i I ' E ト3 0 帳 35 時 暫 眠 ・ 孟晴告訴 " 20 11 11 12 Y阿 武......吋ヨ田k 12 21 22 T,・‑曽田成婚ヨi 田k 21 図 9:GLM及び PLMプロシジャによる LS‑Meansの算出 ( 2 ) 図 9 のように. GLMプロシジャでは各水準の LS ・ Meansがプロットされる一方、 PLMプロシジャでは信 頼区間も出力される点で有用といえる. 0のような SASプログラムを実行することによ なお,アイテムストアとして保存したモデ ル情報は,図 1 って確認できる. proc pl 皿 r estore=twowayfiti show a11; run; 図1 0:すべてのモデル情報の表示を行う SASプログラム ‑ 4 6 0・

471.

4 . 3 LSMESTIMTATEステートメントによる実行 SAS/STATV9.22より, LSMESTIMATEステートメントが追加された.モデ、ルパラメータの線形式を用いる ESTIMATEステートメントと異なり, LSMESTIMATEステートメントでは LS ・M eansの線形式を用いる.浜 田 ( 2 0 1 3 ) は,決まりきった対比較等の不必要な項目まで冗長に出力されてしまう LSMEANSステートメ ントに比べて,特定の群間比較の LS‑Meansのみを出力できる LSMESTIMATEステートメントを推奨して いる.しかし,表 1で示したように, GLMプロ、ンジャでは LSMESTIMATEステートメントはサポート されていない.そこで, GLMプロシジャによるモデ、ル情報を用いて, PLMプロシジャで LSMESTIMATE ステートメントによる推定を行う方法を示す. t w o w a y f i t " を用いて, PLMプロシジャによって LSMESTIMATE 図 8において保存したアイテムストア " ステートメントによる SASプログラム例を図 1 1に示す. 1のように, LSMESTIMATEステートメントでは, L S‑Meansを算出したい変数とその係数のみを指定 図1 すれば, ESTIMATEステートメントを用いて求めた図 2と同様の結果を得ることができる. I川 rtall 1l 川ステ一山卜を川いたブログラム I p r o cplmr e s t o r e = t w o w a y f i t ; le ; l s m e s t i m a t et r e a t m e n t" T r e a t m e n t1 1 0 / c 1 1 le ; l s m e s t i m a t et r e a t m e n t" T r e a t m e n t 2" 0 1 / c l s m e s t i m a t eb l o c k" B l o c k 1" 1 0 / c le ; l s m e s t i m a t eb l o c k" B l o c k 2" 0 1 / c le ; l o c k" T r e a t m e n t1 B l o c k 1" 1 0 0 0 / c le ; l s m e s t i m a t et r e a t m e n t *b l o c k" T r e a t m e n t1 B l o c k2" 0 1 0 0 / c le ; l s m e s t i m a t et r e a t m e n t *b l s m e s t i m a t et r e a t m e n t *b l o c k" T r e a t m e n t2 B l o c k 1" 0 0 1 0 / c le ; l o c k" T r e a t m e n t2 B l o c k2" 0 0 0 1 / c le ; l s m e s t i m a t et r e a t m e n t *b r u n ; 図1 1 :GLM及び PLMプロシジャによる LS‑Meansの算出 ( 3 ) 4 . 4 SLICEステートメントによる実行 SLICEステートメントは, LSMESTIMATEステートメントと同様に, SAS/STATV9.22から追加された機能 であり,カテゴリ変数が 2次以上の交E作用項に対し, 1つの変数の水準をスライスした解析ができる. LSMEANSステートメントと同じオプションを用いることができる. LSMESTIMATEステートメントと同様 に. GLMプロシジャではサポートされていない. 図 8において保存したアイテムストア " t w o w a y f i t " を用いて, PLMプロシジャによって SLICEステートメ ントによる SASプログラム例及び出力結果を図 1 2に示す. 図1 2は , GLMプロシジャによる出力結果を比較対照として出力している. GLMプロシジャによる対比較 の結果においては, ODSGRAPHICSが冗長に出力されてしまう一方, PLMプロシジャの SUCEステー トメントを用いると,特定の水準に対する交互作用効果の結果のみ出力できる. ‑ 4 6 1・

472.

I・La1Jブ IIIJ シジ γI~I~ ステートメント l 川 リ プ ロ シ ジ ャ 川 ICE ス ト ト メ ン 卜 proc glm data~twoway; proc pl 皿 r estore=twowayfiti c1ass treatmentblock; mode1 y~treatment Ib 1ock; slice treatment lsmeans treatment * b10ck / diff c1 adjust~s 工 mu1ate( 工 eport 女 b10ck / diff c1 sliceby(b1ock~"1"); seed~4989); run; run;quiti yの比較ー T r e a t m e n t * B l o c k 40 30 yの比較 T r e a t m e n t * B l o c k 、 、 、 ζ 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 ¥、 ヘ 〉 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 3 5 21 12 30 21 22 2 5 、 20 20 2221 2o 3 0 8 l p h a = O . 0 5での霊 { S i m u陥 柚d踊蜜) " 1 1 12 2o 40 ・ I p h a 2 5 30 3 5 屯0 5での霊 一一一・有置でないーーーーー省量 自由ー,宥量でないー園田園一有量 図1 2 :GLM及 び PLMプロシジャによる LS‑Meansの算出 ( 4 ) 5 まとめ 本稿では,線形モデルによる解析を行うためのプロシジャによるモデルの推定後に算出する LS・Meansにつ いて, LSMEANSステートメントで算出される数理を示した上で, ESTIMATEステートメントを用いて SAS プログラム上で明示的に概説した.次に, LSMEANSステートメントのオプション機能として, O Mオプシ ヨン, BYLEVELオプション, ATオプションを用いた LS・Meansの算出方法を詳述した.さらに,線形モデ ルによる解析を行うためのプロシジャによって,推定されたモテ、ル情報をアイテムストアとして保存した上 で , PLMプロシジャによる推定を行う方法を解説した.加えて, LSMESTIMATEステートメント及び SLICE ステートメントによる解析方法についても示した. 表 lに示したように,現在の SASのパージョンでは, LS・Means算出のためのステートメントの選択肢は 幅広く,多くのプロシジャで実行できる.特に, LSMEANSステートメントは, ESTIMATEステートメント よりもはるかに簡潔な SASプログラムで LS‑Meansを算出できるといえる.さらに, O Mオプションを指定 すれば,入力データセットにおける各水準のオブザベーション数に依存して係数を設定できる.例えば,ラ ンダム化臨床試験のデータ解析を考えた場合,割付因子として調整した共変量を説明変数に含めて,群聞の LS‑Meansの差の推定を行うことが多い.このとき, LS‑Meansの差であれば, O Mオプションを指定した結 ‑ 4 6 2 ‑

473.

果はデフォルトの結果と一致する.しかし, Lふ Meansの差ではなく,各群の LS‑Meansを求めることに関心 がある場合,割付因子として調整している説明変数に対する係数を指定できる, LSMEANSステートメント の O Mオプションは有用であるといえる.また,非線形なデータに対して,ある特定の説明変数の値におけ る LS・Meansの推定を行う場合, LSMEANSステートメントの ATオプションが有用になると考えられる. 参考文献 [ 1 ]C訂 w .MakingComparisonsFair:HowLS・MeansUnifシtheAnalysisofLinearModels.ProceedingsoftheSAS G l o b a lForum.Cary , NC:SASI n s t i t u t eI n c .,2 0 1 4 .A v a i l a b l ea t h t t o : / / s u o o o r t . s a s . c o m l r e s o u r c e s / o a o e r s / o r o c e e d i n g s1 4 / S A S 0 6 0 ‑2 0 1 4 .o d f . r o c e e d i n g soft h eSASG l o b a l [ 2 ]HighR .P l o t t i n gD i f f e r e n c e samongLSMEANSi nG e n e r a l i z e dL i n e a rM o d e l s .P , NC:SASI n s t i t u t eI n c ., 2 0 1 4 .A v a i l a b l ea t Forum.Cary h t t o : / / s u o o o r t . s a s . c o m l r e s o u r c e s / o a o e r s / o r o c e e d i n g s1 4 / 1 9 0 2 ‑ 2 01 4 . o d 王 [ 3 ] Kieman K,T o b i a s R,G i b b sP ,Tao J . Making CONTRAST and ESTIMATE S t a t e m e n t s Made E a s y : The .P r o c e e d i n g so f t h eSASG l o b a lForum.Cぽ y, NC:SASI n s t i t u t el n c ., 2 0 1 1 .A v a i l a b l ea t LSMESTIMATES t a t e m e nt h悦0 : / / s u o o o r t . s a s . c o m l r e s o u r c e s / o a o e r s / o r o c e e d i n g s1 1 1 3 5 1 ‑ 2 01 1 . o d f . ぷ5 TAT( . J り9 . 3U s e rs G u i d e, Cary , NC, USA:SASI n s t i t u t eI n c ;2 0 1 1 . [ 4 ]SASI n s t i t u t eI n c .SA [ 5 ] 関根暁史.PLMプロシジャによる回帰分析と予測の分離.SASユ ー ザ ー 総 会 論 文 集 2013,2 7 5 ‑ 2 9 0 . [ 6 ]竹内啓,高橋行雄,大橋靖雄,芳賀敏郎.SASによる実験データの解析.東京大学出版会, 1 9 8 9 . [ 7 ]浜田知久馬.SAS生存時間解析プロシジャの最新の機能拡張.SASユ ー ザ ー 総 会 論 文 集 20日 ,3 ‑ 7 2 . [ 8 ] 吉田早織,魚住龍史.線形モデルにおける CLASS ス テ ー ト メ ン ト の 機 能 SAS ユ ー ザ ー 総 会 論 文 集 2 0 1 4 . 連絡先 E ‑ m a i l :1 1 o Z l I mi( ( U k u h o . k v o t o ‑ u . a c . i o ‑463‑

474.

SASによる二項比率の差の非劣性検定の比較 武藤彬正宮島育哉榊原伊織 株式会社タクミインフォメーションテクノロジー E x a c tmethodo f n o n ‑ i n f e r i o r i t yt e s tf o rtwob i n o m i a lp r o p o r t i o n su s i n gSAS Ak i m a s aMuto l k u y aMiyajima I o r iS a k a k i b a r a TakumiI n f o r m a t i o nT e c h n o l o g yI n c . 要旨 非劣性検定とは、新規の薬剤の治療効果が既存の薬剤の治療効果と比較して、ある程度以上は劣って いないことを示す検定である。特に二項比率の差の非劣性検定では、新規の薬剤の治療効果と既存の薬 剤の治療効果の比率の差が、一定の評価基準(非劣性マージン)を下回らないことを示す事である。 SAS9.4では Wald , HauckandAnderson, F a r r i n g t o na n dManningとし、った検定統計量が利用可能だが、漸 近正規性により p ‑ v a l u eを算出するため、例数が少ない場合には Type1E r r o rを起こす確率が名目の有意 水準を上回ることがある。一方で、例数が少ない場合でも名目の水準を上回らない二項分布の確率関数 を直接的に用いた E x a c tな方法や、 E x a c tな検定手法の計算効率を向上させた ExactLikeな方法も提案さ れている。本研究では、これらの検定手法について紹介し比較するとともに、そのプログラムを提供す る 。 キーワード:非劣性検定 x a c tな方法 二項比率の差 E FREQプロシジャ E x a c tL i k eな方法 Type1E r r o r Noninf R is kDi f f 1 .I n t r o d u c t i o n 非劣性検定とは、新規の薬剤の治療効果が既存の薬剤の治療効果に比べて、ある程度以上には劣って r いないことを示す検定である。すなわち、新規の薬剤の治療効果1r 1と既存の薬剤の治療効果 1 2の差 δ=7r1‑7r2が、一定の評価基準非劣性マージン:[¥0([¥0>0)を下回らないことを示す事である。 非劣性と関連する概念に、優越性という概念がある。優越性検定とは、新規の薬剤の治療効果が、既 存の薬剤の治療効果に比べ優れていることを示す検定である。仮説検定と信頼区間の関連性を用いると、 非劣性、優越性及び劣性の関係は次に示す F i g u r e1のようになる。 ‑ 4 6 4・

475.

l Casel I Ca日 2 i トー‑島ー十→ Case3 I 優越性 ト 一 一 一 ‑ 1 幽 ト 一 一 一 → 非毛主咋 i 劣性 ト ー 一 一ι 4 ・ 一 一 一 一 → 。 。 一品 + F i g u r e1 優越性と非劣性/劣性の関係 Figurel における Casel は、信頼下限が -~o と 0 の線を超えているので、新薬は既存薬に対し「優越 性あり・非劣性あり J となる場合を示している。 Case2 は、信頼下限が-~。の線を超えているが、 0 の 線を超えていないので「優越性なし・非劣性あり J となる場合を示している。また、 Case3 は-~。と 0 の線のいずれも超えていないので「優越性なし・非劣性なし」すなわち劣性の場合を示している。 2 .N o t a t i o nandMethod X ]および X2は、それぞれ独立した二項分布に従う確率変数とする。 X1のサンフ。ルサイズを問、二 項比率を 1 "とし、 X ~ B(n¥,,,¥)と示し、 X の サ ン プ ル サ イ ズ を n 、 二 項 比 率 を " 2とし、 1 2 2 X2~ B(n2, i C 2)と示す。非劣性検定での、帰無仮説と対立仮説は、非劣性マージン企。を用いて次のよ うに表わせる。 Ho " , " 0 o: . ' . 1‑ , .2 ~-~ H1:"1 ‑ "2 >-~O 母比率の差を δ=. 7 r1 π 2 とし、標本比率の差を、 X, Xo δニ i r j‑ i r2 =ーム ‑‑2 とする。すなわち、帰無 n ] 仮説での期待値は次の式で与えられる。 E ( δ)="1 ‑"2=-~o また、 δの分散は、 π ]( 1 ‑" 1 ), " 2( 1 ‑" 2 ) V (δ)=一一一一一十一一一一一 n1 である。 ‑ 4 6 5・ n2 n2

476.

2 .1.近似的な手法 非劣性を統計的に確かめるには、非劣性マージンを含めた仮説検定、すなわち非劣性検定を行う必要 がある。二項比率の差の検定を行う場合、新薬の標本比率7[,と既存薬の標本比率7[2の差に非劣a生マー ジン doを加え、それを標準偏差で除した z= が検定統計量となる。 ただし、標準偏差には未知のパラメーターである7[,と7[ 2が含まれている。未知のパラメーターの推 定方法が複数あり、それに応じた検定統計量が提案されている。例えば、次のような検定統計量が提案 されている。 2 . 1 . 1 . Wald検定統計量 r r J r 1と九がそれぞれ最尤推定量となる。すなわち、 1とJ 2はそれぞれ独立しているとみなした場合、 J 対立仮説のもとでの Wald検定統計量は、次のように表せる。 ︽ 〆 a 一 4 一 J 今 句︐ゐ一 ︐ ︑一 π 一 一 ' ヨ 'EI‑‑﹄ ︽ h 一 J ︑1‑ AZ一 π 一 一 ︑ ・+ ( J I " 1‑ J I " 2)+企 。 .• l ‑ i 一 〆 ︐ ︑ ‑ ‑ E 一 π A Zw= 2 . 1 . 2 . FarringtonandManning検定統計量 F a r r i n g t o na n dM a n n i n g ( 1 9 9 0 )で示された F a r r i n g t o na n dManning検定統計量は未知のパラメーターであ る7[ 2の推定に、帰無仮説のもとでの最尤推定量、即ち制約付き最尤推定値粍利用する統計量である。 以下、 F a r r i n g t o na n dManning検定統計量を ZFと表記する。帰無仮説の制約のもとでJr 2の最尤推定量は、 2 X 2 Z 弓 A MIノ JA ‑ ‑ ‑ A1 f ︐ ︐x2f勺 AU AU MY ︐‑ Z n u 1i .. A品 Iy ‑ 4 6 6・ L1 ZFは、求めたJr 2を用いることで次のように表せる。 ︐ ︐︑ ︑ ヲ 白 + z r a ‑ ‑ 1111'Jノ ︑ ︑ mx ︑ ︑〆''E1111E 司 司& ︑ 一 一︑ F x4 ︐ ︑ 一 一 x x 一 一 五 ︐︐.︑ ︒ pd 11111 ︑ ﹄︐ノ 的ろ ︑ ︑/ Illl 次の尤度関数を用いて求めることができる。

477.

Zr= ( I r [‑I r2)+L 10 F [(九九 ) ( 1一万2 +企 。), l r 2(1民) 一 一 一 一 一 n [ n2 2 . 1ふ HauckandAnderson検定統計量 H a u c ka n dA n d e r s o n(1986)で示された H a u c ka n dA n d e r s o n検定統計量は、上で述べてきた統計量と異な り、標準偏差に含まれる未知のパラメーターの推定を行うのではなく、連続調整を行い、近似効率を向 上させたものである。以下、 H a u c ka n dAnd e r s o n検定統計量を ZHと表記する。 一 一H Z ‑)y ‑今ん ‑‑ 一n ︐ ︑ ‑一田n︐ 一 m l‑:M ー ︑ t 一〆 一句ム C C ただし、 である。 2 . 2 .SASに搭載されている検定手法 S A S 9.4に搭載されている検定手法は、 Zw、ZF、ZHを利用した検定手法である。これらの検定は FREQ プロシジャ内の T ABLESステートメントに R I S K D I F Fオプションを指定し、さらに R I S K D I F Fオプショ ンに N ONINFオプションを指定することで実行できる。 P R O CF R 印 D A T A=ぐλ方データム; t a b l e s ぐ独立変致:>*ぐ従厚変針:>/ r i s k d i f f ( n o n i n f ) : R U N : デフォルトでは、検定統計量は、 Z wを利用し、非劣性マージンは 0,2となっている。例えば、検定統 F、非劣性マージンを 0,1と設定する場合は次のような指定を行う。 計量を Z P R O CF R E QD A T A=ζλ 方データ); t a bI e s( ! ! I i . J L ,変設:>*ぐ従虜変指:>/ r i s k d i f f ( n o n i n f . 1 m a r g i n= 0 m e t h o d= f m ) ; R U N ; 検定統計量は、 METHOD= オプションで指定を行うことで、変更できる。 Z wならば、 [METHOD= WALD]、 ZFならば[METHOD=F M ]、 ZHならば [METHOD=H A ]と指定する。 ‑ 4 6 7 ‑

478.

2 . 3 . Exactな方法 Exact な方法では、検定統計量を基準値として用し、(本研究では ZFを用いる)、帰無仮説のもとで取り 得るすべての母比率について基準値より稀な観測値 (XpXz )の組み合わせをとる確率を算出する。得られ た組み合わせごとの確率の内、上極限を p‑ v a l u eとする。 p‑valueと有意水準を比較し、 p‑value壬α であれば帰無仮説は棄却される。 次に、帰無仮説より ξ‑"2二一企。とし、 π i f2 とする。帰無仮説のもと p‑valueを算出する式 を示す。 p‑v a l u eE =s u p " ε i 九1 ]九 。( Z F三z A xp x 1J Z " ) 2) 二 」 s u p " ε ただし、 I [ z F<:ZF ( X " X ' ) ] :定義関数とする。 2 . 4 . ExactLikeな方法 KangandC h e n ( 2 0 0 0 )で、示された E x a c tL i k eな方法は、取り得るすべての母比率について計算する Exact な方法とは異なり、帰無仮説のもとで最尤推定値を用い、 p‑v a l u eを算出し検定を行う。帰無仮説の 0 もとで、観測値 ( X1 , x~) より推定された "2 の最尤推定量を牙とし、 p ‑ v a l u eを算出する式を示す。 i i ) = 諮 ( : : ) ( : : ) i i‑ s O Y '( 1 ‑ i i +s O Y '叫 p‑value=九 。 ( z ~ Z (x~ ,x g) I F F 3 . 検定方法の比較 SAS では、漸近正規性を用いた近似的な方法で、 p ‑valueを算出している。しかし近似的な方法以 外にも、二項分布の確率関数を用いた Exactな方法、 Exactな方法と近似的な方法を組み合わせた方法(以 下 、 ExactLikeな方法と呼ぶ)などの p ‑valueを算出する方法が提案されている。 本研究において、検定手法の評価する指標は、 Type1E r r o rを起こす確率と、検出力とする。 Type1E r r o r を起こす確率は、安全性の指標であり、名目の有意水準 αを超えずに近いことが望ましい。検出力は、 感度の指標であり、高いほど望ましい。つまり、 Type1E r r o rを起こす確率が α を超えず、より α に近い ことに加え、検出力が高いことが、優れた統計手法の条件といえる。ただし、 Type1E r r o rを起こす確率 が高ければ検出力が高くなり、 Type1E r r o rを起こす確率が低ければ検出力も低くなる傾向がある。 ‑ 4 6 8 ‑

479.

以下に、 Zw、 ZFを用いた近似的な方法と検定統計量に ZFを用いた Exactな方法、 ExactLikeな方法 について、 Type1E r r o rを起こす確率、検出力を 10000回のシミュレーションにより計算した結果を示す。 F i g u r e2 . 1は企。 = 0 . 1とし、 Figure2.2は 、 doニ 0 . 2 5とした結果である。 5 今 (ヌ)包詳 O向 q d E vbH322touH 凶R 必斗 ヌ ( 8 0 ・ 1 70 0 20 1 0 30 40 50 60 0 . 1 S a m p l eS i z e 0 . 2 0 . 3 0. 4 0 . 5 0 . 6 0 . 7 P r o p o r t i o n Figure2 .1 . Type1Errorを起こす確率 01= 02a od1 t1= 0 . 7VS.π2= 0 . 8 Figure2 . 2 . 検出力 01= 02= 5 0aodπ1=πz F i g u r e2 . 1は縦軸を Type1E r r o rを起こす確率、横軸を η とするグラフである。また、 α は 2.5%とする。 Zwを用いた Wald検定などの近似法は、 TypeIE r r o rを起こす確率が度々 α超える。しかし、 E x a c tな方 法では、 α を超えることはない。 ExactLikeな方法では、 Type1E r r o rを起こす確率が α を超えることが 少なく、 Exactな方法より全体的に α に近い。 F i g u r e2ユは縦軸を検出力、横軸を二項比率π (1= 7 1 : 2 )とするグラフである。近似的な方法は、検出力が 高い。 ExactLikeな方法と Exactな方法では、 ExactLikeな方法の方が検出力高いことがわかる。 Type1E r r o rを起こす確率が α を超えることが少ない E x a c tL i k eな方法、 α を超えない Exactな方法は SASで提供されていない。そこで本研究は、この 2つの検定手法について詳細を述べた後、そのプログ ラムを提供する。 4 . プログラム 4 .1 . ikeな方法 Exactな方法、 及 び ExactL 協MACRONoninf̲EXL(N . M . Alpha . Method 二 1 *新薬の n数 * 1 .x =1 *新薬の有効数 * 1 1 .Y =1 *既存薬の有効数 * 1 1 *既存薬の n数* 1 *有意水準 * 1 . Delta = 1* 非劣性マージン (O~1) *1 片 手 法 の 選 択 (EXACTo r乱 I K E )* 1 DATA Noninf EXL ‑ 4 6 9 ‑

480.

k e e pNxMyA l p h aD e l t aP 1 hP 2 hR i s k D i f fP 1 LP 2 LP v a l u eD e c i s o n; *====初期設定=ロ*; N=& N ;x=& x; M=& M ;y=品y; A l p h a=& A l p h a; e l t a; D e l t a=品D pi=c o n s t a n t( 市i " ) p ̲i n t v aI=O . 1 ∞ *====各群の比率・比率の差を算出====*: P 1 h=x/N ;P 2 h=y/M ; R i s k D i f f=P 1 h‑P 2 h *===二項比率の差の最尤推定を算出 P 2を推定====*; a=N+M b= ( ‑ 1 ) * (N+ M+ x+ y+ D e l t a* (N+ 2*M)) c=M* (D e l t a* *2)+ D e l t a* (2*y+ N+ M)+ x+ y ; e l t a) d=‑ 1 *y*D e l t a* (1+ D v= (b/ (3*a))* *3̲b*c/ (6* (a* *2))+ d/ (2*a) u=s i g n ( v ) *s q r t (b紳 2/ (3*a) 紳 2‑c/ (3*a)) *vが極小の場合の処理*. i fv=0t h e nw= (P i +a r c o s (0))/3 ; e l s ed o w c o s=v/ (u* *3) r c o s (w c o s))/3 • w= (p i +a e n d P L=2*u*c o s (w)‑b/ (3*a) *====推定値から検定統計量を算出ニ二二*; P 1 L=P L‑D e l t a ; P 2 L=P L 2 L本( 1̲P 2 L))/M ) O m e g a=s q r t ( (P1L * (1̲P 1 L))/N+ (P Z l = (P l h‑P 2 h+ D e l t a)/O m e g a; 覧i f% u p c a s e (& M e t h o d)=E X A C T明t h e n% d o; * = = = =E x a c tM e t h o d= = = = * ; *P ‑ v a l u eの算出*; *各p=p 2で、各x i .y iの組合せの尤度、検定統計量を算出、 P ‑ v a l u eを計算*; P v a l u e=0 ‑ 4 7 0 ‑

481.

s t a ̲ c n t=D e l t a/p ̲ i n t v a I e n d ̲ c n t= 1/p ̲ i n t v a l; s t a ̲ c n t=r o u n d (s t a ̲ c n t • 0.1) e n d ̲ c n t= r o u n d (e n d ̲ c n t .0 . 1) d op c n t= s t a ̲ c n tt oe n d ̲ c n tb y1 P=p c n t *p̲intval P Vc n t= 0 ; d ox i =0t oN d oy i =0 t oM ; c o m b (N • x i ); n C x= m C y= c o m b (M .y i ); *尤度の計算 O 冷のための処理を追加*. i f (P̲D e l t a= 0)a n d (x i= 0)t h e ne=1 ; * *xi e l s ee= (P̲D e l t a) e l t a= 0)a n d (N‑x i= 0)t h e nf=1 i f (1‑P+ D e l s ef= (1̲P+ D e l t a)* *(N‑xi ) i f (P‑D e l t a= 0)a n d (y i= 0)t h e ng=1 * *yi e l s eg= P i f (1̲P= 0)a n d (M‑y i= 0)t h e nh=1 e l s eh= (1̲P)* *(M‑yi) C x* m C y*e*f* g* h P h O=n =sqrt( (P *(1‑P))/N O m e g a + ( (P‑D eI t a)ホ( 1̲P+ D e l t a))/M ) P l i =xi /N; P2i =yi /M ; e l t a)/Omega ; Z l i = (P l i ‑P 2 i +D i fZ l く= Z l it h e nP v ̲ c n t =s u m (P v ̲ c n t .PhO) e n d e n d P vc n tt h e nP v a l u e= P vc n t i fP v a l u e< e n d 略e n d• 自e l s e免i f% u p c a s e (& M e t h o d)=E L I K E首t h e n% d o; * = = = =ExactLikeMethod= = = = * ; ホ P=P 2 Lで、ある x i .y iのときの尤度、検定統計量を算出、 P=P 2 L P vc n t= 0 ; d ox i = 0t oN d oy i = 0t oM ; ‑ 4 7 1・ P ‑ v a l u eを計算*.

482.

n C x=c o m b (N• x i); m C y=c o m b (M.y i); *尤度の計算 σ o のための処理を追加申; i f (P̲D e l t a=0)a n d (x i二 o )thene=1 e l s e e= (P̲D e l t a)* *x i i f (1̲P+D e l t a=0)a n d (N̲x i =0)t h e nf=1 e l s ef= (1̲P+D e l t a)* * (N̲x i) i f (P̲D e l t a=0)a n d (y i =0)t h e ng=1 e l s eg=P* *y i * (M̲y i ) h= (1̲P)* C yホ e*f本 g*h P h O= n C xホ m O m e g a=s q r t ( ((P̲D e l t a)* (1̲P+D e l t a))/N +(P*(l‑P))/M) ; P 1 i =x i /N; P 2 i =y i /M ; Z l i = (P1i ̲P 2 i +D e l t a)/O m e g a; i fZ l< =Z l it h e nP v ̲ c n t=s u m (P v ̲ c n t • PhO) e n d; e n d P v a l u e=P vc n t % e n d; * = = = =P ‑ v a l u eの切り上げニ===*; P v a l u e=c e iI z (P v a l u e* 1 0 0 0 0)/1 0 0 0 0; *====有意水準との判定====*; i fP v a l u e< =A l p h at h e nD e c i s o n=" * ". e l s eD e c i s o n=" " o u t p u tN o n i n f ̲ E X L• R U N * = = = R e p o r tO u t p u t = = = = * ; P R O CR E P O R Td a t a=N o n i n f ̲ E X Ln o w dI s=1 5 0p s=3 0c e n t e rs p li t = " / "; m n("I n D a t aI n f o r m a ti o n/ "(可 r o u p1 "NxP 1h) (市 r o u p 2 "MyP2h) ("Ri s k Di f f "Ri s k Di f f)) c o1u (" E s ti m a t e/u n d e rt h eN u1 1H y p o t h e si s/ "P 1LP 2 LD e1 t a) rAlphaPvalueDecison) (" N o n ‑ I n f e r i o r i t y/T e s tR e s u l t d e f i n eN /d i s p l a yw i d t h=8 c e n t e r" N "; d e f i n ex /d i s p l a yw i d t h=8 c e n t e r" S a m p l e " ‑ 4 7 2 ‑

483.

d e f i n eP 1 h /d i s p l a yw i d t h=1 2c e n t e r" P r o p o r t i o n " d e f i n eM /d i s p l a yw i d t h=8 c e n t e r" N " d e f i n ey /d i s p l a yw i d t h=8 c e n t e r" S a m p l e " d e f i n eP 2 h /d i s p l a yw i d t h=1 2 c e n t e r" P r o p o r t i o n " d e f i n eR i s k D i f f/d i s p l a yw i d t h=1 4c e n t e r可 r o u p 1 ‑ G r o u p 2 " d e f i n eP 1 L /d i s p l a yw i d t h=8 c e n t e r" G r o u p 1 "f o r m a t=8 . 4 d e f i n eP 2 L o u p 2 "f o r m a t=8 . 4 /d i s p l a yw i d t h=8 c e n t e r可 r d e f i n eD e l t a /d i s p l a yw i d t h=8 c e n t e r" D e l t a " d e f i n eA l p h a /d i s p l a yw i d t h=8 c e n t e r" A l p h a " d e f i n eP v a l u e /d i s p l a yw i d t h=8 c e n t e r" P ‑ V a l u e "f o r m a t=8 . 4 d e f i n eD e c i s o n /d i s p l a yw i d t h=8 c e n t e r" D e c i s o n " R U N 略M E N DN o n i n fE X L 4 . 2 . プログラム実行例 協N o n i n たE X L ( N = 1 0 0,M=100,x=30,yニ60,Alpha=O.05,Delta=0.4,Method=Exact) │目肋n i n たEXL(N=100,M=100,x=30,y=60,Alpha=0侃 Delt刊 4,~凶 参考・引用文献 F a r r i n g t o n,C . P .a n dG.M a n n i n g( 1 9 9 0 ) .T e s ts t a t i s t i c sa n ds a m p l es i z ef o r r n u l a ef o rc o m p a r a t i v eb i n o m i a lt r i a l sw i t h t a t i s t i c si nM e d i c i n e, 9 , p p .1 4 4 7 ‑ 1 4 5 4 n u l lh y p o t h e s i so f n o n ‑ z e r or i s kd i f f e r e n c eo rn o n ‑ u n i t yr e l a t i v er i s k .S H a u c k,W.W.a n dA n d e r s o n,S .( 1 9 8 6 ),A c o m p a r i s o no fl a r g e ‑ s a m p l ec o n f i d e n c ei n t e r v a lm e t h o d sf o rt h e d i f f e r e n c eo ft w ob i n o m i a lp r o b a b i l i t i e s,TheAmericanS t a t i s t i c i a n, 4 0,3 1 8 ‑ 3 2 2 . , S .a n dJ .J .C h e n ( 2 0 0 0 ) .Ana p p r o x i m a t eu n c o n d i t i o n a lt e s to f n o n ‑ i n 伽 i o r i t yb e t w e e nt w op r o p o r t i o n s .S t a t i s t i c s K a n g 1 9, p p .2 0 8 9 ‑ 2 1 0 0 . I nM e d i c i n e, ‑ 4 7 3 ‑

484.

│医療政府・問、大学同組、川尚一一蝕 ‑ 線形モデルにおける C L A S Sステートメントの機能 0吉田早織 1 魚住龍史 2 1 日本化薬株式会社医薬データセンター 2京都大学大学院医学研究科 T h ef a s c i n a t i n gf e a t u r e sf o rt h eCLASS i nt h ec o n t e x to fl i n e a rm o d e l s S a o r iYoshida1 andR y u j iUozumi2 1C l i n i c a lDataManagementandB i o s t a t i s t i c s,NipponKayakuC O .,L t d 2K yotoU n i v e r s i t yGraduateSchoolo fMedicine 均1 1 ド い 齢 W l J 9 │医療政問台体、大学問z 要旨: 多くの線形モデルのプロシジャにサポー卜されて いる C LASSステートメントについて,デザイン行 列(ダミー変数行列)の生成方法とプロシジャご 旦およびオプション機能に とのデフォルトの整 E ついて紹介する. , , , , キーワード:CLASS LOGISTIC GENMOD PARAM ESTIMATE ‑ 4 7 4 ‑

485.

社内でのある出来事 費 量 • カテゴリカルな 課題ある応答変数 ( 2値ヂータ)に対して,説明変 数を用いて モデル化し各薬剤群における推定を行いたい F a I 一 間 一 LOGISTICプロシジャ; i¥ 金 町 一 一 A嘗 f 川一ノ なぜか僕の結巣と 合わないんだ... LOGISTICプロシジャ j オプションあり オプションなし ! ~ー…Eムーーー~-♂ー山 叫 ふ一 一 一 一 ; ; ; r 九 一 CLASSステートメントの役割 C凶 Sステートメント:自動的にダミー変数を作成) 『亡ユ v モテ、ル推定後のプロセス:LSMEANS, CONTRAST.ESTIMATE .LSMESTIMATE プロシジャごとにダミー変数生成方法の デフォルト&オプションが異なる 4 和 475‑

486.

線買え壬デ jレにおける CLASSステートメント 一般線形モデル 。REG,GLM 口ジスティックモデル 。LOGISTIC V8‑ 。GLMSELECT 比例ハザードモデ、ル 。PHREG V9.2‑ V9.4‑ 浜田 ( 2 0 0 0 ) 。HPREG 容今回のトピック野 @線形モデルにおけるダミー変数 .LOGISTICプロシジャによるダミー変数の 指定例 .CLASSステートメン卜の WARNING&ERROR さん, 8さん, Cさん)の SASプログラム .3人 (A 及び出力結果の検証 ‑ 4 7 6 ‑

487.

ょ線形モデ、ルにおけるダミー変数 ( 1 ) ‑カテゴリーを数値 (0,1)で表したもの e x )T r e a tがA, B, Pという変数を持っとき 。 ,, β +β x +β2X2+β3X3 JP ダミー変数行列 1 ! l い B T r e a t Aの効果: 込山ふ o 0 0 1 0 I E P 0 。 0 so+β "xl+β'2xO+広 xO=β +βl ,TreatAとPの効果の差 TreatA:β。 +βl ‑ )T r e a tP:β +β3 。 β' , ‑s3 よる線形モテ、 jレにおけるダミー変数 ( 2 ) ‑カテゴリーを数値 (0, 1 ,‑1)で表したもの 1" e x )T r e a tがA, B, Pという変数を持つとき 。 ,, β +β x +β2X2 ダミー変数行列 2 い B T r e a t Aの効果 。 。 β +β"xl+β~ xO=β +βl "T r e a t AとPの効果の差 。 TreatA:β +βl ー) T r e a tP:β。 ‑β'‑s2 , 2β'1+β2 ‑ 4 7 7 ‑ X A V 4 0 O P; イ I‑ 1 I

488.

1 議 ダミー変数の生成例 緩 急 不強 LOGISTIC プロシジャによる ・ 手掛 ダミー変数の指定 機 CLASSステートメントで PARAM=を指定することで ダミー変数の生成方法を指定できる procl o g i s t i cd a t a=N e u r a l g i a ; c l a s sTreatmentSex/ 1 p a r a m = e f f e c t 1 ; modelP a i n=TreatmentSex; r u n ; <SASデータにモデルを当てはめる> . ,SASHelplこ記載されているデータ "Neuralgia" ,Treatment(A,B,P),Sex(F,M)を説明変数, Pain No)を応答変数としたモデル (Yes, 10 ‑ 4 7 8・

489.

効果法 ( PARAM=EFFECT) 電 極 ・平均効果との違いを比較 分類変数の水準の情報ゆ 最尤推定値の分析多 J デザイン変数句ーを;炉戸側 γ べ 芯 ぜ 苧 叫 ム チ パラメータ 自由度1推定協 標準髄;るィ 2猿 iChiSq T r e a t m e n t l A 1ー…十 0 ι 分類ぷよ種 i 善 i 8畷 o 1 '1 0 : 阪E 線拡 1 ‑ 0. 43380.3224 1.81050.17851 獲が迄菱総芝 ~p ‑ 1 iて干プ i T r e a t m e n ; t A1 1 I ・ 0.86760. 4623 3.52190.0606 I S ex 議 平 ず い ‑ , ~Bi 1 ‑ 0 . 8 6 7 6 ;0. 4623 3.5219: 0 . 0 6 0 6 Sex F 1 ‑ 089590.3568 6.304 0.012 d 義弘畿 ぺ 目 . ,TreatmentAの推定 e s t i m a t e" es t i m a t eA"i n t1Treatment10Sex0 ; f i 繋滋趨露懇機務総綴纏盗事議i 推定締 :ヲさ推定値:標準誌を:私値 e s t i m a t eA' ‑ 1 . 3 0 1 3 0 . 5 7 3 9 ' 2.27 0 . 0 2 3 4 ! ー 1 1 GLM法 (PARAM=GLM) φ最後のレベルとの比較 推定 一そりい : ω推定l 直!標準語差「尋値一 estimateA ‑ 1 . 3 0 1 3 0.5739 ‑ 2 . 2 7 バ p I z l 0 . 0 2 3 4 ' 1 2 ‑479 司

490.
[beta]
参照法.
(
P
A
R
A
M
=
R
E
F
)
最尤推定値の分析

,
T
r
e
a
t
m
e
n
tAの推定
s
t
i
m
a
t
eA"i
n
t1Treatment10Sex0
.
5;
e
s
t
i
m
a
t
ee
推定

:ラJ
め
し
… j推定櫨;標準誤差じz櫨 1h
「
5
i
Z
1

r
e
s
t
l
m
a
f
e
A‑1.3013 0.5739

2.27 0.0234

・

1
3

み争

.?‑累積順序法 (PARAM=ORDINA
φ
J
I
頂序のある効果聞の比較

最尤推定値の分析
:梅準
Wald ! Pr>
パラメータ! 自由度推定傭
1
誤
費
量 j
カイ 2乗 ChiSq

)思慰鰭隠し

1 0.
4055 0.58390.
48220.
4874
1 ・2.60270.84349.5237 0
.
0
0
2
i
A 1 5
.
5
0
E
‑
1
70.7785 0
1
I
F 1 1
.
7
9
1
8 0.7136 6.304 0
.
0
1
2

T
r
e
a
t
m
e
n
ti
B
Sex

.
,TreatmentAの推定
推定

「
予
ミjl" 推定値 j
標準誤差
!
e
s
t
i
m
a
t
eA ‑1.3013

0.5739

z
'
{
i
直
‑
2
.
2
7
1
4

‑480・

491.
[beta]
ょ;か多項式法 (PARAM=POLY)
+2乗
, 3
乗の効果を推定する

推定

γヲベ]J:;l
‑
推定積了標準誤差云値 γPr>I
z
T
c
冷stimatl
巳列国 1.301ミ 0.573ん
9
ょ
1
5

LASSステートメントの詳細設定

i
変数の順序設定│

,ORDER=DATAI
FORMATEDI
FREQI
INTERNAL
• DATA:データセットに出力した順
強

FORMATTED:FORMAT順(デフォルト)FREQ:数が多い順

~ INTERNAL:フォーマッ卜されていない値順

.
,DESCENDING
降順にする

│基準値の設定!

"REF=l
a
b
e
'
lI
F
I
R
S
TI
LAST

PARAM=EFFECT
PARAM=REF
のときのみ

像l
a
b
e
l
'で基準変数値の選択

• FIRST.LASTで最初の変数か最後の変数を選択
16

‑
4
8
1・

492.

CLASSステートメントの WARNING&ERROR(1) (DREF=は.EFFECT法 orREF法でしか使えないが,他の 手法で基準を指定するには? e x )o r d i n a l 5 ; 去 園時 プラセボ基準 にしたい o D e s c e n d i n gで順番を変える c l a s sTREATMENTIp a r a m = o r d i n a l descending; 1 7 CLASSステートメントの WARNING&ERROR(2) (OLSMEANSステートメント .SL lCE ステートメントを使うと WARNINGが出力される procl o g i s t i cd a t a=d a t a; I O f " " I 、 c l a s sTreatmentSex; modelP a i n=TreatmentSex; I Ismeans Treatment; I r u n ; I E 、 ・ ・ WARNING:Themodeldoesn o thaveaGLMp a r a m e t e r i z a t i o n .T h i s p a r a m e t e r i z a t i o ni sr e q u i r e df o rt h eしSMEANS, しSMESTIMATE, andSL lCEstatemen. tThesestatementsareignored. f l 1LSMEANSステートメント .SLlCEステートメントはGLM法 のみ i classTI tmentSexIparam=glm; 悶 1 8 ‑482・

493.

CLASSステートメントの 叱~WfIJ W ARNING&ERROR(3) ぬ 陸 型 REF='label'でエラーが出力される e x )TREATMENT='B'を基準としたい c l a s sTREATMENTSEXIparam=refr e f=B '; │ERROR2 2 ‑ 3 2 2 :構文エラーです。次の 1つを指定してください:FIRST ,LAS T . @変数ごとに個別に設定する 一 一 . I日 L̲̲ i 匂 :;時 c l a s sTREATMENT(ref=B ' ) SEX(descending)Iparam=ref; 1 9 CLASSステートメントの 山 WARNING&ERROR( 併 4 ) ωGLI 山1 酬 V I M される 畿 ・ ・ 、、 procglimmixd a t a = d a t a; I. h c l a s sTreatmentSexIo r d e r = f i r s t ;I F modelP a i n=TreatmentSex: I I ERROR22‑322・構文エラーです。次の 1つを指定してください:,; TRUNCATE ERROR2 0 2 ‑ 3 2 2 :オプションまたはパラメータを認識できません。無視します。 艦IORDER=( 1 1 頂序)の指定は, PROCステートメント内で記 述できる(詳細な指定はできない) .GLM法のみのプロシジャは PROCステートメント内となる procglimmixd a t a = d a t ao r d e r = i n t e r n a l ; 20 ‑ 4 8 3 ‑ I

494.

• PARAM= EFFECT GLM 寒空 昏 ダミー変数生成法のサポート • • GLM GLM LOGISTICGEMNODPHREGMIXEDGL lMMIXFMM SELECT ̲I̲!.O 鋪 . 幽醐雌* 副. 鵬 ER 議よ義 l r H E O R R M D 6 M M E L T POLYNOMIAL POLY REFERENCE 霊 弘 REF ORTHEFFECT 橿 * : 7 会 LF ORTHORD時 ERM a ORTHOTH ORTHPOLY 都。 。 0 叫 閣 官 。 o 0 。 . . 。 蹴 0‑ 。 。 。。 0 。耐 。 。 。 。。 。 則 。 醐 。 刷刷 司雌・酬幽盟腫睡 ORTHREF ・ e・ 各プロシジャにおける 場網開肺 幽趨 撤 O O * : 女 ・ 開照摘。属輔副属酬附蹄, 輯 欄 鵬輔副曜 O醐華麗轟 O プ 鰯 輔開削 車盤 2 臨 童女 帽 骨 趨醜 司 除 量 F 彊 崩 事O 難 干 警輔醐 輝暢暢 u サ雷鳴 薗 寝 脳礎‑, 塁審E 島富 幽 札 場 もO 0 : ' ̲ : E 富鴎島. 慣 ' 摘 女:デフオJ レ ト 2 1 塾 経 • 3人のプログラムを検証 電量. procgenmodd a t a = N e u r a l g i adescending; c l a s sTreatmentSex; 吋o g i td i s t = b i n ; modelP a i n=TreatmentSex I l i n k e s t i m a t e" e s t i m a t eA"i n t1Treatment100Sex0 . 50 . 5 ; 22 ‑ 4 8 4 ‑

495.

Aさんの方法 司 聾 GENMOOプロシジャオプションなし procgenmodd a t a = N e u r a l g i ad e s c e n d i n g ; c l a s sTreatmentSex; modelP a i n=TreatmentSexI l i n k = l o g i td i s t = b i n ; . 50 . 5 ; e s t i m a t e" e s t i m a t eA"i n t1Treatment100Sex0 r u n ; ω い一一一一 i ザ GENMOD プロシジャの へご芝生竺町子山/ x 1 GしM法 Treatment A • TreatmentAの効果を見るため他の効果 (Sex)は平均とする B P 。 YA=β + βTreat1+05βSM+05βSex2 Sex F M x 。。 。 。 。。 。 。 X2 3 23 Bさんの方法 電 島 LOGISTIC プロシジャオプションなし j 。 。 X1 Treatment A B P Sex ~ e stimate estimateA i n t1Treatment1; X2 1 F M 2 4 ‑ 4 8 5 ‑

496.

Cさんの方法 procl o g i s t i cd a t a = N e u r a l g i a ; a r a m = r e f ; c l a s sTreatmentSexIp modelPain(EVENT='Yes')=TreatmentS e x ; e s t i m a t e" e s t i m a t eA "i n t1Treatment100Sex0 . 50 ; : 5 : ; r u n ; W A R N I N G : ‑M o r ec o e f f i c i e n t st h a nl e v e l ss p e c i f i e df o re f f e c t men . t山 So 附 me 叩 c ∞ ω … ω o 叩 C e ピ附 REF法を指定 ・ 4T r e a t m e n t A の効果を見るため他の効果 ( S e x )は平均とする ( 0 ) Y A=β。 + β T r e a t l + 0 5 βSex REF法 x 1 x 2 T r e a t m e n t A 1 0 S e x B 0 1 P 0 0 F あ e s t i m a t ee s t i m a t e Ai n t1T r e a t m e n t10 M S e x0 . 5 ; 0 25 撃事 まとめ GLM法 @信 量 陸 8 GL開法 一 Treatment A 1 B 0 P 0 Sex 。。 。 。 。 x1 X2 F 1 X3 M 0 『 司 ‑ 司 ・ 圃 司 圃 . ・ ・ , ・ ・ ・ ‑‑ LSMEANS,CONTRAST ,ESTIMATE,LSMESTIMATE 26 ‑ 4 8 6 ‑

497.

ゆ 参考文献 C a r p e n t e rAL.ProgrammingWi 血 CLASS:K e e p i n gYourO p t i o n sOp e n .P r o c e e d i n g so f t h eSASG l o b a l , NC:SASI n s t i t u t eI n c ., 2 0 1 4 .A v a i l a b l ea t F o r u m .Cary h抗tl:llsuPJ1o!tsas.~QmI!esQlJn,es!patlC!!s/口rQceedilll!sl4/1270司2014.odf. P a s t aD J .P a r a m e t e r i z i n gModelst oT e s tt h eH y p o t h e s e sYouWan t :CodingI n d i c a t o rV a r i a b l e sand M o d i f i e dC o n t i n u o u sV a r i a b l e s .P r o c e e d i n g so f t h e3 0 t hAnnualSASU s e r sGroupI n t e r n a t i o n a l C o n f e r e n c e .Cary , NC:SASI n s t i t u t eI n c ., 2 0 0 5 .A v a i l a b l ea t h t t o・ //www2.回 s . c o m l o r o c e e d i nl ! s / s ul ! i 3 0 / 2 I2 ‑ 3 0 . o d f . , P a s t a , D J .Heado f t h eCLASS:I m p r e s syo 町 c o l l e a g u e sw i t has u p e r i o ru n d e r s t a n d i n gof P r i t c h a r dML t h eCLASSs t a t e m e n ti nPROCLOGISTIC.P r o c e e d i n g so f t h e2 9 t hAnnualSASU s e r sGroup I n t e r n a t i o n a lC o n f e r e n c e .Cary , NC:SASI n s t i t u t eI n c ., 2 0 0 4 .A v a i l a b l ea t 句: / / w w w 2 . s a s . c Q l ' w p r o c e e d i n J !s / s u g I 2 9 / 1 9 4 ‑ 2 9 . o d f . h t 3 :U s e r ' sG u i d e .C a r y , NC, USA:SASI n s t i t u t eI n c .,2 0 1 1 . SASI n s t i t u t eI n c .SAS/STAT(R)9. SASI n s t i t u t eI n c .SAS/STAT(R)1 2 . 3 :U s e r ' sG u i d e :H i g h ‑ P e げo rmanceP r o c e d u r e s .Cary , NC, USA: SASI n s t i t u t eI n c ., 2 0 1 3 . 魚住龍史.LS‑Means再考 ‑GLMとPLMによるモデル推定後のプロセスー.SAS ユーザー総会論文 集2 0 1 4 . 竹内啓,高橋行雄,大橋靖雄,芳賀敏郎 .SASによる実験データの解析.東京大学出版会, 1 9 8 9 . 浜田知久馬 . V . 8における LOGISTICの機能拡張.日本 SAS ユーザー会 (SUGI ・J)論文集 2000 ,1 3 ‑ 3 8 . 浜田知久馬 .SAS 生存時間解析プロシジャの最新の機能拡張 .SAS ユ ー ザ ー 総 会 論 文 集 20日 ,1 8 5 1 9 9 . 27 ‑ 4 8 7 ‑

498.

SASによる二項比率における正確な信頼区間の比較 原茂恵美子 1 ) 武藤彬正 1 ) 宮島育哉 2 ) 榊原伊織 2 ) 1 ) 株式会社タクミインフォメーションテクノロジーシステム開発推進部 2 ) 株式会社タクミインフォメーションテクノロジービジネスソリューション部 ComparisonofFiveExactConfidencel n t e r v a l sf o rt h e8inomialP r o p o r t i o nu s i n gSAS 2 ) EmikoHaramo1)Ak imasaMuto1)I k l 明 Mi 河 ima2)I o r iSakak 伽 a 1 ) SystemDevelopmentDepartment, TakumiI n f o r m a t i o nTechnologyI n c . , TakumiI n f o r m a t i o nTechnologyI n c . 2 ) 8 u s i n e s sS o l u t i o n sDepartment A b s t r a c t SASh a sC l o p p e r ‑ P e a r s o nc o n f i d e n c ei n t e r v a lb a s e dona ne x a c tt e s tu s i n gb i n o m i n a lp r o p o r t i o n s .8uti th a sbeen i n d i c a t e dt h a tt h i smethodi se x t r e m e l yc o n s e r v a t i v e .百lIss t u d yi n t r o d u c e sf i v ee x a c tc o n f i d e n c ei n t e r v a l swheret h e a c t u a lc o v e r a g ep r o b a b i l i t yd o e sn o tf a l lu n d e rt h en o m i n a lc o v e r a g ep r o b a b i l i t y .Thesec o n f i d e n c ei n t e r v a l sc o n t a i nt h e methodsn o timplementedi nSAS.F u r t h e r , wec a l c u l a t et h ee x p e c t e dl e n g t ho f t h ec o n f i d e n c ei n t e r v a l sand c o m p a r e / v e r i 今t h ea c c u r a c yoft h ec o v e r a g ep r o b a b i l i t i e s .Asar e s u l t, wef o u n dt h a tt h eq u a l i t yo ft h ec o n f i d e n c e i n t e r v a lb a s e dont h eStemet e s ti si t sa v a i l a b i l i t yf o rs m a l ls a m p l e s .Wea l s op r e s e n taSASmacroprograma b o u ta c a l c u l a t i o no fc o n f i d e n c ei n t e 円 a . l Keyw o r d s :8 i n o m i n a lP r o p o r t i o n ;C o n f i d e n c el n t e r v a l ;E x a c tMethod 1 .I n t r o d u c t i o n S t u d i e sonc o n f i d e n c ei n t e r v a l sf o rb i n o m i a lp r o p o r t i o n sh a v eb e e np e r f o r m e ds i n c eal o n gt i m eagoandc o n t i n u et o b ep e r f o r m e d .8ecauset h eWaldi n t e r v a li se a s yt oc a l c u l a t e,i ti so f t e nu s e da st h ec o n f i d e n c ei n t e r v a lf o rb i n o m i a l ,whenu s i n gt h i sc o n f i d e n c ei n t e r v a l, t h ea c t u a lc o v e r a g ep r o b a b i l i t yo f t e nf a l l su n d e rt h en o m i n a l p r o p o r t i o n s .However c o v e r a g ep r o b a b i l i t yi ns m a l lc a s e s . e v e r a lc o n f i d e n c ei n t e r v a l swheret h ea c t u a lc o v e r a g ep r o b a b i l i t yd o e sn o tf a l lu n d e rt h e Ont h eo t h e rhand,s n o m i n a lc o v e r a g ep r o b a b i l i t ya r es u g g e s t e d .C l o p p e r and P e a r s o n( 19 3 4 )s u g g e s t ac o n s 汀u c t i o nmethod f o ra ec o n f i d e n c ei n t e r v a li samethodf o rt h e c o n f i d e n c ei n t e r v a lb a s e dona ne x a c tt e s tu s i n gb i n o m i n a lp r o p o r t i o n s .Th b u ti th a sb e e ni n d i c a t e dt h a t a c t u a lc o v e r a g ep r o b a b i l i t yn o tt of a l lu n d e rt h en o m i n a lc o v e r a g ep r o b a b i l i t ya ta l lt i m e s, t h i smethodi se x t r e m e l yc o n s e r v a t i v e( A g r e s t iandC o u l l( 1 9 9 8 ) ) .l na d d i t i o n, s e v e r a lo t h e re x a c tmethodshaveb e e n , nop a p e r sh a v ecomparedt h e s ee x a c tc o n f i d e n c ei n t e r v a l si nd e t a i. l s u g g e s t e d .However T h i ss t u d yi n t r o d u c e sf i v ee x a c tc o n f i d e n c ei n t e r v a l swheret h ea c t u a lc o v e r a g ep r o b a b i l i t yd o e sn o tf a l lu n d e rt h e n o m i n a lc o v e r a g ep r o b a b i l i t y ;moreover , wec a l c u l a t et h ee x p e c t e dl e n g t ho ft h ec o n f i d e n c ei n t e r v a landc o m p a r e / v e r i f y t h ea c c u r a c yoft h ec o v e r a g ep r o b a b i l i t i e s ‑ 4 8 8 ‑

499.
[beta]
2
. NotationandMethod
n
d
e
p
e
n
d
e
n
trandomv
a
r
i
a
b
l
e
s
.S
u
p
p
o
s
et
h
a
tXf
o
l
l
o
w
sab
i
n
o
m
i
n
a
ld
i
s
t
r
i
b
u
t
i
o
nw
i
t
hp
a
r
a
m
e
t
e
r
sn,
π
.
L
e
tXbei

2
.
1Clopper‑PearsonConfidenceInterval
TheC
l
o
p
p
e
r
‑
P
e
a
r
s
o
nc
o
n
f
i
d
e
n
c
ei
n
t
e
r
v
a
lc
a
nb
ew
r
i
t
t
e
na
s

[1'i( X M
x+(n‑x+l)

伊

)
1

1
2
)x+1
+(n‑x)IF
(
x
+
1
)
ぷn‑x
)
(
a
I
2
)
2

x+ ,
2
x
(
α

whereF
a
.
b
(
α
)i
st
h
eu
p
p
e
r1
0
0
(
品位)%q
u
a
r
t
i
l
efroma
nF
‑
d
i
s
t
r
i
b
u
t
i
o
nw
i
t
haa
n
dbd
e
g
r
e
e
soff
r
e
e
d
o
m

2
.
2ExactLikelihoodRatioConfidenceInterval
Thee
x
a
c
tl
i
k
e
l
i
h
o
o
dr
a
t
i
o(LR)c
o
n
f
i
d
e
n
c
ei
n
t
e
r
v
a
li
sb
a
s
e
doni
n
v
e
r
t
i
n
gt
h
ea
c
c
e
p
t
a
n
c
er
e
g
i
o
n
sf
o
rt
h
ee
x
a
c
t
b
i
n
o
m
i
a
lt
e
s
t
sofH
o
:π
=
π
'
0
.F
o
l
l
o
w
i
n
gF
l
e
i
s
se
ta
.
l(
2
0
0
3
)a
n
dgivenαandt
r
u
e
πニ π
0,wed
e
f
i
n
et
h
eg
e
n
e
r
a
l
i
z
e
dl
o
gLR
(GLLR)s
t
a
t
i
s
t
i
ca
s
)=xl
n
{
x
l
(
nπ
。
)
}+(
n‑
x
)l
n
{
(
n‑
x
)
/
{
n(
l‑π
。
)
}
GLLR(1Z'0Ix

F
o
r1Z'0=0,
GLLRi
so
n
l
yd
e
f
i
n
e
df
o
rx=0
;f
o
r1Z'o=1
,GLLRi
so
n
l
yd
e
f
i
n
e
df
o
rx=n
.Wed
e
f
i
n
et
h
ea
t
t
a
i
n
e
dLR
p
‑
v
a
l
u
e出
~Inl

p-value う~ tVroO一朴

,

。

。

wheret
h
esumi
st
a
k
e
no
v
e
rt
h
es
e
ttofxv
a
l
u
e
sf
o
rwhichGLLR(π I
x,)三GLLR(π I
x,
)e
x
c
l
u
d
i
n
gt
h
o
s
ev
a
l
u
e
swhere
h
ee
x
a
c
tLRc
o
n
f
i
d
e
n
c
es
e
ti
st
h
es
e
tofa
l
l
π
os
u
c
ht
h
a
tt
h
ep
‑
v
a
l
u
e三α
GLLRi
sn
o
td
e
f
i
n
e
d
.Then,t

2
.
3ExactScoreConfidenceI
n
t
e
r
v
a
l

o
:
Thee
x
a
c
ts
c
o
r
ec
o
n
f
i
d
e
n
c
e(
S
C
)i
n
t
e
r
v
a
li
sb
a
s
e
doni
n
v
e
r
t
i
n
gt
h
ea
c
c
e
p
t
a
n
c
er
c
g
i
o
n
sf
o
rt
h
ee
x
a
c
ts
c
o
r
et
e
s
t
sofH
π=π0・F
o
l
l
o
w
i
n
gH町 i(
2
0
0
6
)a
n
dgivenαandt
r
u
e
π
=
π
'
0,
wed
e
f
i
n
et
h
es
c
o
r
es
t
a
t
i
s
t
i
ca
s
π
0
1x
)=(
x‑
n
πo
iI(
n
π
。
(
ト π。
)
)
SC(
F
o
rπ0=0,
SCi
so
n
l
yd
e
f
i
n
e
df
o
rx 0a
n
dSC=O
.F
o
rπ
。
=1,SCi
so
n
l
yd
e
f
i
n
e
df
o
rx=nandSC=O
.Wed
e
f
i
n
e
t
h
ea
t
t
a
i
n
e
ds
c
o
r
ep
‑
v
a
l
u
ea
s

=
抑
制

l一7[0
)

p‑value

。

wheret
h
esumi
st
a
k
e
no
v
e
rt
h
es
e
tto
fx,
v
a
l
u
e
sf
o
rwhichSC(
πI
x
)
,どSC
(
1
Z
'
oIx
),
e
x
c
i
u
d
i
n
gt
h
o
s
ev
a
l
u
e
swhereSCi
s
t
h
ee
x
a
c
ts
c
o
r
ec
o
n
f
i
d
e
n
c
es
e
ti
st
h
es
e
to
fa
l
l
π
os
u
c
ht
h
a
tt
h
ep
‑
v
a
l
u
e三α
n
o
td
e
f
i
n
e
d
.Then,

4StemeConfidenceInterval
2.

‑
4
8
9
‑

500.

Th ei n t e r v a lp r o p o s e dbyR e i c z i g e l(2003)i sd e f i n e dbyi n v e r t i n g白 ee x a c tb i n o m i a l旬 s tw i t ha c c e p t a n c er e g i o n s, i n c l u d i n gt h emostp r o b a b l ev a l u e soft h eb i n o m i a lv a r i a b l e, andt h e nt a k i n gt h emostp r o b a b l e, f o l l o w e dbyt h en e x t mostp r o b a b l e , u n t i lt h e i rt o t a lp r o b a b i l i t yr e a c h e st h er e q u i r e dl e v e l, f o rexample, 95%. Assumet h a twewantt oi n v e 此 at e s tofH o :πJ =πof o rt h eb i n o m i a lparameterπtoo b t a i na95%c o n f i d e n c ei n t e r v a l a s e donn=5o b s e r v a t i o n s .D e n o t eXJt ob et h eo b s e r v e dnumberofs u c c e s s e s .Theb a s i ci d e ai st h a ta95% f o r7cb 。 c o n f i d e n c es e ts h o u l dc o n s i s tofa l ls u c hv a l u e s7Cooft h ep a r a m e t e rf o rwhichH o :約 二 π i sn o tr e j e c t e dbyt h et e s ta tt h e 95%l e v e. lF o rs i m p l i c i t y , assumet h a tao n e ‑ d i g i tp r e c i s i o ni ss u f f i c i e n tf o rt h ei n t e r v a le n d p o i n t s, b e c a u s ei ns u c ha c a s e, t h ep r o c e d u r ec a nbed e m o n s t r a t e du s i n gas m a l lt a b l eo f b i n o m i a lp r o b a b i l i t i e s( T a b l e1 ) .I nt h ec a s eofXJ=3, t h er e g i o n0.2t o0.9h a sb e ∞metheacceptanceregion(seetheunderlinedportioninTable1);theminimum7ci st h e , andt h emaximum7ci st h eu p p e rc o n f i d e n c eb o u n d . l o w e rc o n f i d e n c ebound T a b l e1 :B i n o m i a lp r o b a b i l i t i e s (n=6 , α =0 . 1) 0 且ハυ 兵U ζ J A 守 今 ︑ d 今4 2 ∞ O . 00 0 . 1 ∞ ∞ O . 0 . 0 似旧 O .倒的1 O .α 氾 O . 1 2 0 . 0 似J O 0 . 0 1 4 6 0.0984 O . 0 . ( 剛J O 0.3543 1 .0000 0.5314 。 ∞ ∞ 0 . 2 O . 0 1 0 1 5 0 . 0 1 5 4 0 . 0 8 1 9 0.2458 0 . 3 9 3 2 0 . 2 6 2 1 ∞ ∞ 0. 3 0 . 0 7 0 . 0 1 0 2 0 . 0 5 9 5 0 . 1 8 5 2 0 . 3 2 4 1 0.3025 0 .1 l76 ∞ M出 一 盛 山 一 山 一 山 XJ Z 0 . 5 0 . 0 1 5 6 0 . 0 9 3 8 0 . 2 3 4 4 0 . 3 1 2 5 0 . 2 3 4 4 0 . 0 9 3 8 0 . 0 1 5 6 0 . 6 0 . 0 4 6 7 0 . 1 8 6 6 0.3110 0.2765 0 . 1 3 8 2 0 . 0 3 6 9 O . 4 1 ∞ 0 . 7 0 . 8 0 . 9 0 .1 l76 0 . 2 6 2 1 0.5314 1 .0000 0.3025 0 . 3 9 3 2 0.3543 0 似J O . 0 0 . 3 2 4 1 0.2458 0.0984 0.1852 0 . 0 8 1 9 0 . 0 1 4 6 0 . 0 5 9 5 0 . 0 1 5 4 O . 1 2 0 . 0 1 0 2 0 1 . 0 1 5 O O .飢渇7 O . l O . ∞ ∞ 。 ∞ ∞ ∞ 。 O .αm 0 . 0 α旧 O .似X附 O .似J O O O .α J O 。 2.5BlakerConfidenceI n t e r v a l a sp r o p o s e danewe x a c ti n t e r v a lt h a ti sa ne x c e l l e n ta l t e r n a t i v et ot h eS t e r n ei n t e r v a l, andt h a th a s B l a k e r(2000)h o n c e p tofa c c e p t a b i l i t yf u n c t i o n(ACC ) manyc o m m o n a l i t i e sw i t ht h eS t e r n ei n t e r v a . lηlea p p r o a c hb u i l d son由ec ( B l a k e r(2000)). = 叶 宇, , t , , j ( AC C(x) ( iP ) f P)} T a b l e2 :Thea c c e p t a n c er e g i o n so f B i n o m i a lp r o b a b i l i t i e s (n=6 , α =0 . 1) X ζ o ︐ ︑ ︐ S品守司 d 43hanυ 句 O ‑ 0 . 1 0 ・0 . 1脱却 ‑ 0 . 1 0 ‑ 0 . 1 0 0 . 1脱却 ‑ 0 . 1償却 0 . 9 0 0 0 0 . 2 0 . 1 ・ O . I ( ) ( 泊 ‑ 0仰 抑 0 . 0 1 4 3 0 . 3 6 8 6 0 . 9 0 0 0 ‑ 0 . 0 9 8 4 ‑ 0 . 0 8 3 0 ‑ 0 . 0 0 1 1 0 . 5 0 6 8 0 . 9 0 0 0 0 . 2 6 1 0 ∞ ‑ 0 . 0 9 9 9 ∞ ‑0.0987 ∞ ‑0.0841 0. 3 ‑0ω93 ‑ 0 . 0 8 9 1 ‑ 0 . 0 2 9 5 0 . 2 7 3 3 0 . 9 0 0 0 0 . 5 7 5 9 0 . 0 8 8 1 0 . 4 ‑ 0 . 0 9 5 9 ‑ 0 . 0 5 9 0 0 . 1 2 5 9 0 . 5 8 9 0 0 . 9 0 0 0 0 . 3 1 2 5 ‑ 0 . 0 1 2 4 p, 0 . 5 . 0 . 0 8 4 4 0 . 0 2 5 0 0 . 3 5 3 1 0 . 9 0 0 0 0 . 5 8 7 5 0 . 1 1 8 8 . 0 . 0 6 8 8 0 . 6 ‑ 0. 0 1 2 4 0 . 3 1 2 5 0 . 9 0 0 0 0 . 5 8 9 0 0 . 1 2 5 9 ‑ 0 . 0 5 9 0 ‑ 0 . ω 5 9 0 . 7 0 . 0 8 8 1 0 . 5 7 5 9 0 . 9 0 0 0 0 . 2 7 3 3 ‑ 0 . 0 ヨ 9 5 ‑ 0 . 0 8 9 1 4的 9 3 0 . 9 0 . 9 0 0 0 0 . 3 6 8 6 0 . 0 1 4 3 ‑ 0 . 0 8 4 2 ‑ 0 . 0 9 8 7 0 . 8 0 . 2 6 1 0 0 . 9 0 0 0 0 . 5 0 6 8 ‑ 0 . 0 0 1 1 ‑ 0 . 0 8 3 0 ‑ 0 . 0 9 8 4 ‑ 0 .。 押9 ‑ 0 . 0 抑9 ‑ 0 . 1 α m 0 . 9 0 0 0 . 0 . 1 0 0 0 . 0 . 1 0 0 0 ‑ 0 . 1 α m ‑ 0 . 1 0 0 0 ‑ 0 . 1脱却D ‑ 0 . 1 α泊 宮 戸 内 百α : I nt h eAppendix, wep r e s e n taSASmacroprograma b o u tac a l c u l a t i o nmethodf o rt h ef i v ec o n f i d e n c ei n t e r v a l s . 3 . Comparisonofthefiveconfidenceintervals , t h ec o v e r a g ep r o b a b i l i t yandt h ee x p e c t e dl e n g t hwereu s e da st h eb a s i sf o ro u re v a l u a t i o n, and95%of I nt h i ss t u d y ‑ 4 9 0 ‑

501.
[beta]
e
a
c
hc
o
n
f
i
d
e
n
c
ei
n
t
e
r
v
a
lwasc
o
m
p
a
r
e
d
.
Thec
o
v
e
r
a
g
ep
r
o
b
a
b
i
l
i
t
i
e
sw
e
r
ecomputedu
s
i
n
gt
h
ep
r
o
p
o
r
t
i
o
nw
i
t
hw
h
i
c
ht
h
ec
o
n
f
i
d
e
n
c
ei
n
t
e
r
v
a
li
n
c
l
u
d
e
st
h
e
b
i
n
o
m
i
n
a
lp
r
o
p
o
口i
o
n
.As
i
m
u
l
a
t
i
o
no
f1
0
0000r
o
u
n
d
so
f
u
n
d
e
rd
e
f
i
n
e
dv
a
l
u
e
so
f7
1
:w
asc
o
n
d
u
c
t
e
d
.S
i
m
i
l
a
r
l
y
,
t
h
e
r
e
n
c
ei
nt
h
ec
o
n
f
i
d
e
n
c
ei
n
t
e
r
v
a
l
s
.
e
x
p
e
c
t
e
dl
e
n
g
t
h
sw
e
r
ecomputedu
s
i
n
gt
h
emeano
ft
h
ed
i仔e

3
.
1Comparisonofcoveragep
r
o
b
a
b
i
1
i
t
y
F
i
g
u
r
e1s
h
o
w
st
h
ec
o
v
e
r
a
g
ep
r
o
b
a
b
i
l
i
t
i
e
so
f
t
h
ef
i
v
ee
x
a
c
tc
o
n
f
i
d
e
n
c
ei
n
t
e
r
v
a
l
s
.O
v
e
r
a
l
l,a
l
lm
e
t
h
o
d
sd
e
s
c
r
i
b
e
da
n
d1
;i
na
d
d
i
t
i
o
n,t
h
ev
a
l
u
e
sw
e
r
es
l
i
g
h
t
l
yh
i
g
h
e
rnearπ~ 0
.
5
.T
h
i
sf
i
g
u
r
ei
n
d
i
c
a
t
e
s
h
i
g
hc
o
v
e
r
a
g
ep
r
o
b
a
b
i
l
i
t
yf
o
rπ~ 0a
t
h
a
tC
l
o
p
p
e
r
‑
P
e
a
r
s
o
ni
sc
l
e
a
r
l
yac
o
n
s
e
r
v
a
t
i
v
emethodc
o
m
p
a
r
e
dw
i
t
ht
h
eo
t
h
e
rm
e
t
h
o
d
s
.Ther
e
s
u
l
t
so
ft
h
eE
x
a
c
t
GLLRa
n
dt
h
eE
x
a
c
tS
c
o
r
eshowedh
i
g
h
e
rv
a
l
u
e
sd
e
p
e
n
d
i
n
gont
h
ev
a
l
u
eo
f7
1
:
.l
na
d
d
i
t
i
o
n,
t
h
ec
o
v
e
r
a
g
ep
r
o
b
a
b
i
l
i
t
yo
f

S
t
e
r
n
ea
n
dB
l
a
k
e
rw
e
r
es
i
g
n
i
f
i
c
a
n
t
l
yc
l
o
s
e
rt
o0
.
9
5t
h
a
nt
h
eo
t
h
e
rc
o
n
f
i
d
e
n
c
ei
n
t
e
r
v
a
l
s
.
仁o
p
p
e
r
‑
P
e
a
r
s
o
n

09
9
f
l
11¥1¥1¥
0
.
9
8
1
1
1
1
1
0
.
4'

I I

, 11,
¥
'̲II 11
~

1
1

Exa
c
tGLLR

Ilflll/!
Ju
r
~

~

III
1

O
̲9
9
I
Inl ,1
¥
1
1
O.~81 I1 IIII\1

I

1
l
.
'
I
7
I1I
1111 I

1
1

,
)
9
6
1

O
̲%ll1U

Exa
αScorc
1
1
1
1
. iHI

u
̲9
9
I
Inl..

1
'
.
.
. I
1

I1
1
1
1
1
1
1
1
1

09
8
1
1
1¥
11
1
¥1
¥I I
¥
'
.
̲I
F
I

l'

IIIIIJII

0.97111111¥111 l'

""

'1

I
r
"
¥
1

1111

肌仏

09
0.0

帥

O ,~

1
,
0

0,9

π

O%lI I U I I¥
I
09 5t--~.

0. 4 爪 川

1
,
0

π

00

~.__---.-

0,
2

OA

S
飽口lt':

B
l
a
k
e
r

.• i U

O
̲9
9
Inl ,.

1
11
1
1
1
1
1
1
1

,
)
<9
1
1
1
1
1
11
¥1
¥'
1

1
¥ ..0..'1

• I Jlrllllll

0.9711111111¥

l'

I I

I/WIIIII
̲
.
.
.
.
‑
Q,
h

....-..__.~~I

1,
8

π

10

, ,11
f
t )
(

O_ %l 'IU~r\1

I
fl l l l l l O

0
.
95
1
"
" ~_'__L__'"

0
.
0

02

1
11
1
1
1
1
1
1
1 )
(

I 111111111 0

判。

~--'__L._--1

0
.
8

π

1
,
0

0
0

02

U
.
4

O
̲
6

O
.
M

1
,
0

π

F
i
g
u
r
e1 C
o
v
e
r
a
g
ep
r
o
b
a
b
i
l
i
t
i
e
so
ft
h
ef
i
v
ee
x
a
c
tc
o
n
f
i
d
e
n
c
ei
n
t
e
r
v
a
l
s
(
n~ 1
0,as
i
g
n
i
f
i
c
a
n
c
el
e
v
e
lo
f0
.
0
5,a
n
d0
.
0
0
1壬π三0
.
9
9
9
)

n
c
r
e
a
s
e
s(
F
i
g
u
r
e2
)
.Ther
e
s
u
l
to
ff
i
g
u
r
ei
n
d
i
c
a
t
e
st
h
a
tt
h
e
Thec
o
v
e
r
a
g
ep
r
o
b
a
b
i
l
i
t
ya
p
p
e
a
r
sc
l
o
s
et
o95%a
sni
t
h
eE
x
a
c
tS
c
o
r
e,
a
n
dB
l
a
k
e
rbyt
h
ev
a
l
u
eo
fn
.F
o
re
x
a
c
tGLLRa
n
d
c
o
v
e
r
a
g
ep
r
o
b
a
b
i
l
i
t
yv
a
r
i
e
sf
o
rC
l
o
p
p
e
r
‑
P
e
a
r
s
o
n,
t
h
ev
a
l
u
ev
a
r
i
a
t
i
o
ni
ss
m
a
l
la
n
di
ti
sc
l
o
s
e
rt
o95%a
sni
n
c
r
e
a
s
e
s
.
S
t
e
r
n
ei
n
t
e
r
v
a
l
s,
Eぉ
.
a
ctGLLR

C
b
p
p
e
r
‑
P
e
a
r
田 n

Exac
tS
c
o
r
で

0
.
9
1

・
町e
S
t
e

B
l
a
k
e
r

0.99
0.98
0.97
0
.
9

0.96
0.95

F
i
g
u
r
e2 C
o
v
e
r
a
g
ep
r
o
b
a
b
i
l
i
t
i
e
sf
o
rn~ 5t
o9
5
a
n
dπ~ 0
.
5
0
)
(
as
i
g
n
i
f
i
c
a
n
c
el
e
v
e
lo
f
O
.
0
5,

3
.
2ComparisonofExpectedLength

‑
4
9
1
‑

502.

C l o p p e r ‑ P e a r s o ni sc l e a r l yc o n s e r v a t i v ec o m p a r e dw i t ht h eo t h e rm e t h o d s( F i g u r e3 ) .F o rπ=0, t h ee x p e c t e dl e n g t h ,f o rπ=0 . 5, t h ev a l u e sa r el a r g e r .F o rt h eS c o r emethod, t h ev a l u e sa r es m a l l e r v a l u e sa r es m a l l e rf o rGLLR;h o w e v e r c o m p a r e dw i t ht h eo t h e rm e t h o d swhenπ=0 . 5 ;h o w e v e r , f o rπ=0 , t h ev a l u e sa r el a r g e ra n dv a r i e d .I na d d i t i o n, S t e r n e la k e ra r en o ts c a t t e r e di nt h ew i d t hc o m p a r e dw i t ht h eo t h e rm e t h o d s,a n dt h e i rv a l u e sa r es i m i l a r . a n dB 0 . 6 5,一一て. e 叫 LR 0 . 5 5 0. 45 ノ〆 " ' 0 . 3 0 . 4 0 . 5 0 . 2 5 f 0 . 0 0 . 1 0 . 3 0 . 2 0 . 4 0 . 5 " F i g u r e3 E x p e c t e dL e n g t h ( L e f :n=5a t n d0 . 0 0 1三π三0 . 9 9 9, R i g h :n=1 t 0a n d0 . 0 0 1三π: s0.999) 4 .C o n c l u s i o n I nt h i ss t u d y, wei n 位。 d u c ef i v ee x a c tc o n f i d e n c ei n t e r v a l s .E x a c tGLLR,E x a c tS c o r e,S t e r n ec o n f i d e n c ei n t e r v a l a n d8 1 a k e rc o n f i d e n c ei n t e r v a la r en o ti m p l e m e n t e di nSAS.M o r e o v e r ,wep r o p o s e dt h ep r o g r a mf o rt h em e t h o d st o c a l c u l a t et h ec o n f i d e n c ei n t e r v a l so ft h eb i n o m i a lp r o p o r t i o n .Wee x a m i n e df i v ee x a c tc o n f i d e n c ei n t e r v a l st h a tdon o t f a l lu n d e rt h en o m i n a lc o v e r a g ep r o b a b i l i t yi no r d e rt od e t e r m i n et h em o s tu s e f u lmethodf o rs m a l ls a m p l es i z e s .We !v e r i f i e dt h ea c c u r a c yo ft h ec o v e r a g e c a l c u l a t e dt h ee x p e c t e dl e n g t ho ft h ec o n f i d e n c ei n t e r v a l sa n dc o m p a r ed p r o b a b i l i t i e s .F o rt h eC l o p p e r ‑ P e a r s o nmethodi m p l e m e n t e di nSAS,wef o u n dt h a tt h ee x p e c t e dl e n g t ha n dc o v e r a g e p r o b a b i l i t yi se v 巴nm orec o n s e r v a t i v et h a nt h eo t h e rm e t h o d sa sar e s u l to fs i m u l a t i o no f1 0 0, 0 0 0 .F o rt h ee x a c tGLLR method,t h ee v a l u a t e dv a l u e sw e r en e a rt h ee d g eo ft h ee x p e c t e dl e n g 白 h o w e v e r ,f o r7r 0 . 5,t h ev a l u e sw e r e i m i l a rt ot h eC l o p p e r ‑ P e a r s o nm e t h o d .F o rt h eE x a c tS c o r e method,t h ev a l u e si nt h ec o v e r a g e c o n s e r v a t i v e,s 0t e n d e dt oa p p e a rh i g hd e p e n d i n go n π,a n dt h ev a r i a t i o nwass i g n i f i c a n t l yr e l a t e dt ov a r i a t i o n so f p r o b a b i l i t yf o rn=1 n .M o r e o v e r ,t h ec a l c u l a t e de x p e c t e dl e n g t ha p p e a r e d印 刷e r e d .Thec o v e r a g ep r o b a b i l i t yo fS t e r n ea n d8 1 a k e rw e r e ,t h e8 1 a k e r s i g n i f i c a n t l yc l o s e rt o0 . 9 5t h a nt h eo t h e rc o n f i d e n c ei n t e r v a l sa n df o rt h ee x p e c t e dl e n g t h s .However methodshoweds c a t t e r i n gv a l u e so ft h ec o v e r a g ep r o b a b i l i t i e sr e l a t e dt ot h ev a r i a n c eo fn, w h e r e a st h eS t e r n emethod wass t a b l e . I nsummary , wec o n s i d e r e dt h eS t e r n ec o n f i d e n c ei n t e r v a lmethodt ob emoreu s e f u lt h a nt h eo t h e rm e t h o d si ns m a l l s a m p l es i z e s 5 .R e f e r e n c e s A g r e s t i, A .a n dC o u l l, B .A .( 19 9 8 ) .A p p r o x i m a t ei sb e t t e rt h a ne x a c t "f o ri n t e r v a le s t i m a t i o no fb i n o m i a lp r o p o r t i o n s . TheAmericanS t a t i s t i c i a n5 2,1 1 9 ‑ 1 2 6 ‑ 4 9 2 ‑

503.

B l a k e r , H .( 2 0 0 0 ) .C o n f i d e n c ec u r v e sandi m p r o v e de x a c tc o n f i d e n c ei n t e r v a l sf o rd i s c r e t ed i s t r i b u t i o n s .T h eC a n a d i a n 7 8 37 9 8 . J o u r n a lo f S t a t i s t i c s28, 嶋 ,C. J .a ndP e a r s o n, E . S .( 19 3 4 ) .Theu s eo fc o n f i d e n c eo rf i d u c i a l l i m i t si l l u s t r a t e di nt h ec a s eo ft h eb i n o m i a l C l o p p e r B i o m e t r i k a26, 4 0 4 ‑ 4 1 3 .andP a i k ,M.C.( 2 0 0 3 ) .S t a t i s t i c a lm e t h o d sf o rr a t 回 , andp r o p o r t i o n s,3 r de d i t i o n .NewYork F l e i s s,J .L . ,L e v i n,B J o h n W i l e yandS o n s . H i りi , K .( 2 0 0 6 ) .E x a c ta n a l y s i so fd i s c r e t ed a t a .NewY o r k :Chapmana n dH a ll J CRC J .( 2 0 0 3 ) .C o n f i d e n c ei n t e r v a l sf o rt h eb i n o m i a lp a r a m e t e r :somenewc o n s i d e r a t i o n s .S t a t i s t i c si nM e d i c i n e R e i c z i g e l, 2 2, 6 1 1 ‑ 6 21 . Appendix 1 * + ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ 一 一 一 一 一 一 ー + 一 一 一 一 一 一 一 ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ 一 一 一 一 一 一 一 一 ‑ ‑ ‑ ‑ ‑ ‑ 一 一 一 一 一 一 一 一 一 ー 一 一 一 + I DESCRlPTION: I Takumil n f o r m a t i o nT e c h n o l o g y IVERSION: ISAS9. 4 ILANGUAGE: I J a p a n e s e IPRODUCT: I BASE/GRAPH/STAT I FILENAME: .s a s I F i v e ̲Exact + ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ + ー 一 一 一 一 ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ 一 一 一 ー 一 司 一 一 ‑ ‑ ‑ ‑ 一 一 ー ‑ ‑ ‑ ‑ ‑ ‑ ‑ ー 一 一 一 一 一 一 一 一 一 一 一 一 一 + I HISTORY: I E.Haramo 2 0 1 4 / 0 5 / 2 9l n i t i a lCoding + 一 一 ー 一 一 ー 一 ‑ ‑ ‑ ‑ ‑ ‑ ‑ 一 一 ‑ 一 一 一 ー + ー ー 一 一 一 回 一 ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ・ ー ー 一 一 ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ 一 一 ・ 一 ‑ 一 一 一 一 一 一 一 + i 亀 o p t i o n sn o d a t e; d a t awork.C P; s e tw o r k . O u t 2; n=, x=); %macroF i v e ̲E x a c t(a l p h a=, l e n g t hSTAT$1 0 0; STAT=" C l o p p e r ‑ P e a r s o n "; %ホ1.C l o p p e r ‑ P e a r s o nC o n f i d e n c el n t e r v a l事 ; Low =r o u n d (XL̲BIN, 0 . 0 0 0 0 1 ); d a t awor k .O u t 1; Up 1二 o; v a l=&n‑&x;o u t p u t; &x;o u t p u t ; k e e pSTATLowUp; n m i=1 ;val= =r o u n d (XU ̲BIN,0 . 0 0 0 0 1); r u n : p r o cf r e qd a t a=w o r k . O u t ln o p r i n t; w e i g h tv a l lz e r o s; i n o m i a la l p h a=& a l p h a ; t a b l ei1b o u t p u to u t=w o r k . O u t 2b i n o m i a l; ‑ 4 9 3 ‑

504.

p r o cmeansd a t a=w o r k . O u t lnwayn o p r i n t; %*2 .E x a c tGLLRC o n f i d e n c eI n t e r v a l* ; c 1 a s sSTATp; d a t aw o r k .Ou t l(d r o p=p̲); l e n g t hSTAT$1 0 0; varBin; STAT="GLLR"; ou 句 p u to u t=w o r k .O u t 2 dop̲=OtolOOOby1 ; (where=(p v a l>=&alpha))sum=p v a l; p=p̲1 l000; i f r u n; &x= OandO<=P< 1 p r o cmeansd a 組 =w ork.Ou t 2nwayn o p r i n t; t h e nGLLR=((&n‑&x)*l o g ((&n・&x) c 1 a s sSTAT; /(&n*(1・ p)))); Vぽ p ; e l s e i f &x=&nandO< P<=I o u t p u to u t=work.GLLRMIN=LowMAX=Up; t h e nGLLR=(&x事 l o g (&x/(&n事 p))); 。 r u n, : <P<I e l s ei f ・ t h e nGLLR=(&x l o g (&x/(&n事 p))) +((&n・&x)申 l o g ((&n・&x) %*3 .E x a c tS c o r eC o n f i d e n c eI n t e r v a l* ; /(&n*(l・p)))); ー); d a t aw o r k . O u t l(drop=p e l s eGLLR=.; l e n g t hSTAT$1 0 0; dot=Oto&n; STAT="S ∞向"; t= OandO<=P< 1 i f dop ー= Oto1000by1 ; p=p̲1 l000; t h e nGLLRi=( (&n‑t )率 l o g ((&n・t ) / (&n事(1・p)))); i f&x=0andP=0t h e nSCORE=0; e l s e i f t=&nandO< P<=1 e l s ei f O=<&x=<&nandO<P<I t h e nGLL R i=(t*l o g (t/(&n事 p))); t h e nSCORE=((&x・ (&nホ p)) 事 事 2) 。 /(&n率 p事(I・ p)); <P<l e l s ei f t h e nGLL R i=(t市 l o g (t I(&nホ p))) e l s ei f&x=&nandP=1t h e nSCORE=0; +((&n・t )噂 l o g ((&n・t ) e l s eSCORE=.; / (&n・(I・p)))); dot=Oto&n; e l s eGLL R i=.; i f t=0andP=0t h e nSCOREi=0; i f t=O e l s ei f O=<t=<&nand0<P<I t h e nBin=p r o b b n m l (p, &n, t); t h e nSCOREi=((t・(&n*p))帥 2) /(&n*p*(l・p)); e l s e &n, t) Bin=p r o b b n m l (p, e l s ei f t=&nandP=1t h e nSCOREi=0; ‑p r o b b n m l (p, &n, t・ 1); e l s eSCOREi=.; i fn (GLLR, GLLRi)=2andGLL R i>=GLLR i f t=0t h e nBin=p r o b b n m l (p, &n, t ) ; thenou ゆu t ; e l s e Bin=p r o b b n m l (p, &n, t) &n, t・1); ‑p r o b b n m l (p, end; i fn (SCORE, SCOREi)=2 end; andSCOREi>=SCOREt h e no u t p u t; r u n; ‑ 4 9 4・

505.

Prob̲AD=0; e n d ; BProb̲AD=.; e n d ; FLG=O; run; e n d ; r o b ; Prob̲AD+p p r o cmeansd a t a=w o r k . O u t lnwayn o p r i n t; BProb̲AD=l a g 1 (Prob̲AD); c l a s sSTATP; varBin; 1 & a l p h a ) )t h e nFLG=0; i f (BProb̲AD<( o u t p u to u t=w o r k . O u t 2 e l s e (w h e r e=(p v a l>ニ &alpha))sum=p v a l; FLG=1・ run, r u n ; p r o cmeansd a t a=wor k .O ut2nwayn o p r i n t; w h e r ex=&xa n dFLG=0; p r o cmeansd a t a=w o r k . O u t 2nwayn o p r i n t; c l a s sSTAT; c l a s sSTAT; varp; varp; o u t p u to u t=w o r k . S c o r eMIN=Low恥1AXニ Up; o u t p u to u t=w o r k . S t e m eMIN=LowMAX=Up; r u n ; r u n ; %.4 .StemeC o n f i d e n c eI n t e r v a l穴 % ホ5 .B l a k e rC o n f i d e n c eI n t e r v a l. ; d a t aw o r k . O u t l ; d a t aw o r k . O u t l; l e n g t hSTAT$1 0 0; l e n g 吐1STAT$IOO; STAT=" S t e m e "; STAT=" B l a k e r "; dox=Oto&n; dop̲=Oto1 0 0 0 ; dox=Oto&n; dop̲=Oto1 0 0 0 ; p=p̲/1 0 0 0 ; p=p̲/lOOO; P r o b=p d f (もi n o m ', x, p, &n); i f x=0t h e np l=1; r o b b n m l (p, &n, x 1); e l s e p l=1・ p o u t p u t ; 岨 p2=p r o b b n m l (p, &n, x); e n d ; o u t p u t ; e n d ; e n d ; run; e n d ; r u n ; p r o cs o r td a t a=wor k .O u t l; byPd e s c e n d i n gP r o b; d a t awork.Ou t 2; r u n ; s e twor k .O u t l ; 1 .0; dou=&ntoOby・ &n, u); p x l=p r o b b n m l (p, d a t awor k .O u t 2; s e tw o r k .Out1; i f p x 1>= p l t h e nx l=u; i f p x 1>=(1‑p2 )thenx2=u; byp; e n d ; i f f i r s t . p血endo; ‑ 4 9 5 ‑

506.

i f xl=Othenal=pl; e l s e a l=p l+p r o b b n m l (p, &n, x l 1); da 組 w ork.OUTDS; 且 a 2=p2+1・ probbnml(p, &n, x 2); setwork.C P aωept=m i n (a l, a 2); work.GLLR i f(a c c e p t‑&alpha)>=0; w o r k . S c o r e w o r k . S t e r n e r u n; w o r k . B l a k e r; I run; p r o cmeansd a t a=work.Ou t 2nwayn o p r i n t; wherex=&x; c l a s sSTAT; p r o cp r i n tl a b e lnoobs; p; v a rSTATLowUp; V紅 f o r m a tLowUp8. 3; o u t p u to u t=w o r k . B l a k e rMIN=LowMAX=Up; l a b e lSTAT="E x a c tC o n f i d e n c eI n t e r v a l" r u n; Low="LowerC o n f i d e n c eI n t e r v a l" T i t l e" E x a c tC o n f i d e n c eI n t e r v a l(N =& N, X=&x) "; Up="UpperC o n f i d e n c eI n t e r v a l "; r u 且・, %mend; %Five̲Exact(a l p h a=0 . 0 5, n=1 0, x=3); E x a c tC o n f i d e n c eI n t e r v a 1(N =1 0, X=3) E x a c t C o n f i d e n c e I n t e r v a l C l o p p e r ‑ P e a r s o n GLLR S c o r e S t e r n e B l a k e r Lower C o n f i d e n c e I n t e r v a l Upper C o n f i d e n c e I n t e r v a l 0. 393 0 . 9 1 3 0 . 6 1 6 0 . 6 0 0 0 . 6 0 2 0 . 6 0 6 0. 11 6 0 . 1 1 6 0 . 11 6 0. 11 6 ‑ 4 9 6・

507.

l臨 政 府 自 治 体 、 大 学 に よ る 口 シ ス テ ム の 実 証 … ー 齢 オッズ、比の信頼区間の構成法の比較 飯塚政人,猪嶋恭平,浜田知久馬 東京理科大学工学研究科 Comparisono fconfidence i n t e r v a l sf o rt h eoddsr a t i o Masatol i z u k a,KyoheiInoshima,ChikumaHamada GraduateSchoolo fE n g i n e e r i n g, TokyoU n i v e r s i t yo fScience l医僚、政府関、大学による工コシステムゐ実証 s … 要旨: LOGISTICプロシジャで利用可能なオッズ比の信頼 区聞の構成法を紹介する. また,各信頼区間の被覆確率等を比較した結果を示 し推奨すべき方法を報告する. プロシジャ キーワード:信頼区間,オッズ比,被覆確率, LOGISTIC ‑ 4 9 7・ ~iD

508.

医療政府間大学中羽弘の実証~~蝕 ~9 発表構成 》研究背景 》研究目的 》研究方法 》結果・考察 》まとめと今後の課題 │臨政問台体!大学Iこよ紅即ステゆ知…ー蝕 オッズ、比について [2] オッズ、 イベントが起こる確率と起こらない確率の比 オッズ、比 ある条件のもとのオッズと別の条件のもとのオッズの比 オッズ、比は医薬研究で、よく用いられる 標準的に用いられる信頼区間は Wald信頼区間 [3,6J ‑ 4 9 8 ‑ ~9

509.

! こ 治 ~E:!ゐ証…融WlJ9 2x2分割表 群1 群2 陽性 n l l η12 陰性 η21 η22 計 n .1 n . 2 母数 π1 π2 オッズ比(真値) (lー π1) πd OR= π2/(1‑π2) 2 ) π 1 ( 1一 π 1 ) π 2 ( 1ー π オッズ比(推定値) d R‑ 主dn12 n21/nZ2 n11n2 2 n12n2 1 . ] . ‑ 1 1 ‑ . . │医療政府開期こよる工コシ万ムの実い オッズ、比の信頼区間 .Wald信頼区間 .WaldFirth信頼区間 .PL(尤度比)信頼区間 .PLFirth(尤度比 Fiバh)信頼区間 .Exact(正確検定)信頼区間 Midp 信頼区間 JfL6ddT! シ とbシむよも長島昔話な信頼民間人 ‑ 4 9 9 ‑ 2日

510.

ぷ1IIIIIIIIンワ 医療、政府・自治体、大学によるロシズテゆ実証!!f!!II付金 ・ 信頼区間の構成 ( 1) 回 α/2X W l J [ 1 Wald信頼区間間 P ( 帆 + ( z 炉問 ぬ)=走+之+之+之 .Z αが標準正規分布の 1 ∞(1‑f)%点 ‑分散:Var( Iog 泌総..行γ J 医療、政府・自治体、大学によるヱコジステムの翼龍~ザー鎌倉 品 信頼区間の構成 ( 2 ) ・ I( PL(尤度比)信頼区間 [ 2 ] ‑2 ogLCBo ) ) くx f C α ) )一logL(ぬ ・ . X t C l o g L :対数尤度 α ) :カイ二乗分布の上側 α%点 ・ θ。:信頼隈界値 • F i同hの補正 ・尤度に情報行列の行列式の0 . 5乗をかけ最尤推定 ・ ゆ ( 前 哨 ‑ 5 0 0 句 , . ra . ~J 1 1 1 r J I

511.

1 子 炉 刊 医療政府開蝉によ紅訪問鰯…ー総会 9 W l J 信頼区間の構成 ( 3 ) 属 E x a c t (正確検定 )[2, 3 ] 上限ω u : z ; 2 m 叩 n u)=? , l )H ( x l n . ., nv 凶 下限ω L:Z2f1h)H(xinA111, ωL)=? .上側確率 : L 主 詑 : ? 子1.,n.l : m ω,り)H(xl同n,町n n. ω o ρ) .下側確率:玄;立 邸 ( 伊 似 附 仏l 1 . ' l 1 H:非心超幾何分布の確率関数 1=nl +n'l‑n . . ・ │ 時 、 町 ・ 問 、 大 学 問 工 コ マ ダ ム 主 主 主 ム ミ ユ + 総 会 ~I]9 信頼区間の構成 ( 4 ) 掴 M idp 信頼区間 上 限ωU: z;iZx川 H(xln.., nvn .l1ω u)+jH(Xo)=? 下限ωL : Z 2 ; 1 7 1 ) H ( x │ η ,n1.1n凶 L)+iH(Xo)=? 10 ‑ 5 0 1 ‑

512.

│臨‑附昨今熔はる工コ奴テムの実証一齢 9 W l J 2x2分割表の実例 [5] 幼児の発達障害の結果を示す 2x2 分割表 PVL群(ケース群)コントロール群 有り 2 無し 24 25 合計 26 26 n11n , . , . 2x25 オッズ、比の推定値:ぬ=」Lど = 一 一 一 =2 . 0 8 3 n1Zn 2 1 1x24 1 1 ‑ o . │ 医 療 、 政 府 ・ 叫 大 学 に よ 泊 以 別 組 SAS.:J.‑t}' 2 0 1 9 LOGISTICプロシジャで6つの信頼区間を出力 PROCLOGISTICDATA=DATA; MODELEXPOSURE=RESPONSEI CLODDS=80TH: FREQCOUNT; Wald信頼区間, PL(尤度比)信頼区間を出力 CLODDS=BOTHFIRTH とすることで F i同h ; 去を加味して出力 EXACTRESPONSEI RUN; Exact(正確検定)信頼区聞を出力 CLTYPE=MIDP ESTIMATE=ODDS: とする乙とで Midp信頼区間を出力 12 ‑ 5 0 2 ‑

513.

医語、政府・自治体、大学による工コシステムの実証[:Riトザ時総会 m 6種類の信頼区間の比較 ・ 同 C o n f i d e n c eI n t e Ism曲.. d 由国b . 信頼区間 w a l d 信頼下限 信頼上限 Wald 0 . 1 7 7 2 4 . 5 1 I l l W a l d F i 地 0 . 2 0 4 1 4 . 7 3 i l lPL 0 . 1 8 8 4 6 . 5 3 p L F ih l I i 代 0 . 2 1 5 1 9 . 9 6 E x a c t 0 . 1 0 1 1 2 7 . 7 6 0 . 1 4 8 6 3 . 7 5 w a l d 罰 則 、 P L P I . : 倫 愉 e x a c t 耐d p ~ 一 r 5 掬 唱._~【干 1 0 1 5 OR ! o お !J~ ※95% 信頼区間算出 ト即日品問よる口シ加点 sムムl!~ 2 0 1 9 本研究の目的 》症例数やオッズ比の真の値を変えて、 6種類の手法につい て信頼区間の被覆確率を評価し、適切な方法を検討 明 503 ・ d

514.
[beta]
臨
政
府
関
均
一
一2
2
d
坊
主
証
一
一

l

~9

信頼区間の被覆確率
口被覆確率 (CoverageP
r
o
b
a
b
i
l
i
t
y
):
C(
L
l
)
》信頼区聞が真値を含む確率

C
(
πvπ
2
)
=
z
:
:
i
=
o
z
:
;
i
=
o
I
(
ηル η
2
1
'
π
V7r2
)
Iη唱
、

Inヲ 1

¥
'
ι 111

¥"211

xL
̲~. Iπ1n11(1‑π1)n1.‑n叶一白 π
l2n21(
1ー π2)n2.‑η21
I1
,信頼区間が真値を含む

/
(
η刊肌っ7r咽7rヲ)=
ベ
、

0,
信頼区間が真値を含まない

A ~"'-~~"-- .L'--&."

園。│信頼水準則の信頼区間の場合
!被覆確率が95%に近い信頼区間が望ましい
1
5

│
時1
1
1
戸1
1
.
注1
1
均
実
証
一
一 2
0
1
4
信頼区間の評価基準
口2
種類の評価基準で適切な信頼区間を検討
》被覆確率が95%に最も近い信頼区間
》被覆確率が保守的になる信頼区間

一…一一一一一一
,, 1~20.

,
00

,,2=20と し た 治 合 由 敏 司 . . . .

側
'
畠
鋼匝

E璽璽E
←
一
・
0

一一
06

2

一
一 一
‑
̲
'

‑
5
0
4
‑

OS

515.
[beta]
|医額、政府関大学はる四ステー誌ム~齢

~9

被覆確率を求める際の設定

l
i
i
j
×
{
;
:
}
×l
Z
1
)
(
^ 1
^
1
2
2
1
オ
i
×
4040

1
" l0.5 J" L
0
.
9
9

1
0 30
4040 I

i 2
I 4

r V
iJ:
1i
I

L0
.
9
9

│信頼区間:両側 95%水準│
1
7

l‑問、…ェコシーら会読ん総会 加{
川 =20.n2=20とした楊合の被置確率

∞

z~Lfir蝋

‑I

0
.
4 0
.
6 0
.
8

1
.
0
0
.
0

盟国梢僻色璽

1

0
.
9
8
0
.
9
6
0
.
9
4

.
.
l
0
.
9
2

ii
樽0
.
9
0

剛

∞

l'
鰯1

0
.
9
8
0
.
9
6
0
.
9
4

0
.
9
2

o鈎
0
.
0 0
.
2 0
.
4 0
.
6 0
.
8

1
.
0
0
.
0

K2

Ixl

一
一
ー‑ 0
.1一一 ‑
.0.51
1.

‑
5
0
5・

516.

│医額政府明大学による工コシステムー…‑紬 ~9 1朗 吋 li‑‑jii 42 99 日 0 0 . 9 0 0 . 0 0 . 2 0 . 4 0 . 6 0 . 8 1 . 0 0 . 0 0 . 2 0 . 4 0 . 6 08 1 . 0 0 . 0 0 . 2 0 . 4 0 . 6 0 . 8 1 .0 を ?Z l買 I ‑ 一 一 一‑0.1 一一‑ 0.51 19 i 医療政府自治体鳩山由ステムの実証 SAS:l-if-a~ 0 . 0 0 . 2 0 . 4 0 . 6 0 . 8 1 . 0 0 . 0 0 . 2 0 . 4 0 . 6 0 . 8 ) [ 2 1 . 0 0 . 0 0 . 2 1 ] (1 一 一 一 一 時 凪1 一一一o.5 l ‑ 5 0 6 帽 0 . 4 0 . 6 0 . 8 21 9 1 .0

517.

│臨政府関想以担コシス均均一… ~11l~ ~I'斗ιJI 094 092~ 時 歯 固 0 . 9 0 闘 鰯 1田 0 . 9 8 0 . 9 6 0 . 9 4寸 0 . 9 2寸 0 . 9 0寸十 γ一 一 十 一 一 一 寸 一 一 → o 0. 2 0 . 4 0 . 6 0 . 8 且 γ一 一 十 … 十 十 一 γ 1 0 0 . 0 0 . 2 0 . 4 0 . 6 0 . 8 π1 1 OR 一一一?一一一 2 1 . 0 0 . 0 02 0 . 4 0 . 6 ‑ ‑ ‑l 2 1 I 慮、政府・問、雄同町一一一一m1 9 十 1 0 0 . 0 0 . 2 一 一 F r1 1 OR ω 寸 0 . 4 0 . 6 0 . 8 ー ー ー‑ 1 一一一 E ‑507・ 1 0 0 . 0 0 . 2 ー ‑ ‑ 0 . 4 且6 0 . 8 10 4 1 22

518.

W l J [ 1 |闘政府間贈による口減取れ~ー齢 0 < 4 0 < 6 0 < 8 @s … … ー が み. . W1J[1 │ 聞 、 政 府 自i 哨 まとめ 口被覆確率が95%1こ近い信頼区間 ~PLFirth 信頼区間 ~Midpi言頼区間 ロ保守的である信頼区間 ~Exact( 正確検定)信頼区間 今後の課題 ロ保守的でより名義水準に近くなるような信頼区間の提案 ロ層を併合した場合の適切な共通オッズ、比の信頼区間を 評価する ‑ 5 0 8 ‑

519.

l 一 定 、 政 府 ・ 自 時議長極鰐務停f A i ‑ ‑2 0 1 9 i 参考文献 [ 1 ]A .Agrest . iandY .Min,Unconditionalsmall‑sample con打dencei n t e r v a l sf o rt h eoddsr a t i o,B i o s t a t i s t i c s,3 ,3 379‑386.2002. [ 2 ]A.Agresti,CategoricalDataAnalysis,SecondE d i t i o n : WILEYINTERSCIENCE,2003. [ 3 ]J .し F l e i s s,B .L e v i n,M.ChoP a i l く, S t a t i s t i c a lMethods h i r dE d i t i o n:WILEY f o rRatesandP r o p o r t i o n s,T INTERSCIENCE .2003. .G.,Con打denceI n t e r v a l sf o rP r o p o r t i o n s [ 4 ]Newcombe,R f f e c tS i z e,Chapman& Hall/CRC, andRelatedMeasuresofE 2012. l 医制問郡今I 聖接響詩 2 0 1 4 参考文献 [ 5 ]OKUMURA.A .eta , . l Hypocarbia的 PretermI n f a n t s W i t hP e r i v e n t r i c u l a rLeukomalacia:TheR e / a t i o n BetweenHypocarbiaandMechanicalV e n t i l a t i o n, P e d i a t r i c s,107, 469 ‑475,2001. [ 6 ]Woodward,Epidemiology:StudyDesignandData / CRC,2004. A n a l y s i s,Chapman&Hall 26 ‑ 5 0 9 ‑

520.

│医癒政府関大学による工コ以テムの恥即付金 ~9 ネットワークメタアナリシスによる 無作為化比較試験の統合 福井伸行 株式会社データフオーシーズ 乙黒俊也,磯崎充宏 日本たばこ産業株式会社 Combinationo frandomizedc o n t r o l l e dt r i a l s i nNetworkMetaA n a l y s i s 四 NobuyukiF u k u i Data4C'sK .K . ToshiyaOtoguro,M i t s u h i r oI s o z a k i JapanTobaccoI n c . 医癒政府関 要旨: 医療統計の分野で近年,ネットワークメタアナリシス という手法が注目を集めている。 本発表ではネットワークメタアナリシスのポイントを 解説し, procmcmc を用いた解析の実例を紹介す る 。 キーワード:メタアナリシス,ネットワークメタアナリシス.mcmc ‑ 5 1 0 ・

521.

│医療政府白山学一コシス均実iE i SAS.:l‑+f蝕 ~9 A g e n d a 1 . 背景 》メタアナリシス再考 》ネットワークメタアナリシスへの拡張 2 . ネットワークメタアナリシスの概要 》直接比較と間接比較の統合 ~ i n c o n s i s t e n c y 3 . ネットワークメタアナリシスの統計モデル c o n s i s t e n c yModel i n c o n s i s t e n c yModel 4 . 実践例 ~ ~ 5 . まとめ [医療政府開大…一弘の実証…一胎 A g e n d a 1 背景 》メタアナリシス再考 》ネットワークメタアナリシスへの拡張 ‑ 5 1 1 ・ 2 0 1 9

522.
[beta]
問、政府・抑止♂拐域単長…

9

w
l
]

1 背景
》メタアナリシス再考

メタアナリシス
複数の無作為化比較試験の結果を集め,
1
. 治療効果の重み付き平均を求める。(試験結果の統合を行う。)
2
. 治療効果のバラっき(異質性)を検討する。
ための統計モデル。

1 鴎、政府自治体点臥む平方デム;;~ ~:S2-"-.*

2
0
1
[
1

1
. 背景
》メタアナリシス再考
①最下部のダイヤが推定値の統合結果を示している。
②試験全体のパラっき(異質性)を統計量で定量的に評価することも可能。
桁混

.
d
"

守edr
l
"l
l
t
l
v
e
ri~k(9S%cr)

+
a
‑
s

VitaminE(n注目}
5
t,
'
l 199九
C判AOS1996
L'mlリリR

AτsCl円"
ATB亡 ¥998
G
I
S
S
I1'
J
9
9
HOPE2000
SPACf2000
t
1A1S2
:0
01
p
p
;
>1
0
0
ι

+・?

2001
I
I
P
S100:
2
WAVE1υUl
5U,V
I,MAX700
,
1
W'15200

‑
‑
‑
x
子
一
一
一
ー
‑

、

②

①

lζARE2008
P付 512008
0,
,
,r
,, 1 I‑
4
1
,

W
e
l
g
t
l
t f
!
x
e
d.
.
.
f
f
e
c
tr
e
l
a
t
i
v
e
則 市 k(95%(I)
021
100

064(010L 1)
6
)
0&2り
( 4)t
̲09
1
)
(
),
( ~ (,3
7:.
̲107
)

331

(,)日(く}昌 3t 11
6
)

1677

開
。 (QS8t 109)

守口話

.
:104)
096(088t

1
11 1

105(
0世b
: 110'
:
12

0う4(
033,
( 0
89)
o39(
01
1(,~ 1J
9
)

261
01苧

U 94(
011(,' 11
6
)
U7
'
>(
032L 17
1
1
100l
U9う少 10ち)
11
4(
07
'
>t
"40
0
)
098(071¥ 1Jι
}

'
)
u

。
1
1

)1}
80[
,
リち2:

!38

u9l(082t
; U))
041(
0J
‑‑
t 0f
;
l
引
0昔8(
G8it 1:
0
)

10000 097(094¥, ~01)
01
F
a
v
o
u
r
ssupplements

, 叫"
"ωnlrol
F

‑512‑

MyungSKe.
ta
l,2013

523.

問、政府一謀議務務響湾岸一一 W l J 9 1 背景 》ネットワークメタアナリシスへの拡張 ‑メタアナリシスは高いエピ、テ、ンスをもたらす優れた統計手 法である ・通常のメタアナリシスは異なる試験の同じベアの比較結果 を統合する ・異なる試験の異なるべアの比較結果を統合し、総合的に 比較を行うことをモチベーションとしてネットワークメタアナ リシスが提案された。 0 0 I 丸一台体大学悶 Agenda 2 . ネットワークメタアナリシスの概要 》直接比較と間接比較の統合 ' Y i n c o n s i s t e n c y 513‑ ー

524.

‑ I ω は羽るロ勾?親 叫 一 W l J 9│ …川. ι μ J ω 川い .. 川…人川 川 冷川恥 f ? ν 戸 γ y 川一 医鴎療、政蜘府.自帥治綿体、岬蝉 f 2 . ネットワークメタアナリシスの概要 》 直接比較と間接比較の統合 ネットワークメタアナリシス 複数の無作為化比較試験を集め,直接比較と間接比較あるいは 間接比較問士の統合を行うための統計モデル。 9 一致問治体大学Iこよー弘ゐ言語一一 W l J 2 . ネットワークメタアナリシスの概要 》 直接比較と間接比較の統合 (例) プラセボ vs治療A.プラセボ vs治療 s,治療Avs治療 Bの 3つの無作為化比較試験の結果を統合する。 治療A て ~/ 82 P 2 A3 〉治療 B プラセボ 83 (A1‑ P1)+( 九一 82) ‑ 5 1 4 ‑

525.

旬、問叫んー溺心付金 ~9 2 . ネットワークメタアナリシスの概要 》 直接比較と間接比較の統合 (例) プラセボ vs治療A.プラセボ vs治療B,治療Avs治療C, 治療 Bvs治療Cの4つの無作為化比較試験との結果を統合 する。 (A3‑C (C 84) 3)+ 4+ 副聞底思調EZ 調EE 盟EE 盟 A1 繍 裂 撃 82 え A3 台療A/~ 治療B ~/ C3 84 治療C C 4 プラセボ (A1‑Pl)+( 九一 82) … │医額一均三時指I 2 ネットワークメタアナリシスの概要 ) > ~9 inconsistency ‑ 先の例では暗黙のうちに各試験の各治療群は同等と仮定。 しかし、下の例で2つの試験のプラセボ群は同等であるとは限ら ない(試験の実施年代や除外基準の違い,背景因子のずれ)0 • AB間の比較の経路によって効果の差に不一致 ( i n c o n s i s t e n c y ) が生じる可能性。 治療A ζ ユ治療 B ~/ プラセボ ( A1‑ P l )+( P "‑82) ‑ 5 1 5 ‑

526.

│医療政府自治体大学問ロシス弘の実証…一齢 ‑ 2 . ネットワークメタアナリシスの概要 ~ i n c o n s i s t e n c y 不一致性 ( i n c o n s i s t e n c y )は 2群聞の異質性 ( h e t e r o g e n e i t y )とは 独立に生じうる。 A2 置 1 ; :I 寸: l ; :Jγ1 P 7 As A6 会斗プラセボ群に 無視できない 88 遣いがあるかも 闘 政 府 間 大 学 は … ス テ ム ゐ 実i E i SAS.:l‑"f‑lUt 2 0 1 9 2 . ネットワークメタアナリシスの概要 ~ i n c o n s i s t e n c y ネットワークネタアナリシスの枠組みでは i n c o n s i s t e n c yの検出が 可能。 次章で、 一致性を仮定したモデル ・不一致性を検出するための基本的なモデル を紹介する。 5 1 6 ‑ ー

527.

~llJ[1 │医療政府間大学問一弘の実証…一総会 Agenda 3 . ネットワークメタアナリシスの統計モデル ~ ~ c o n s i s t e n c yModel i n c o n s i s t e n c yModel 15 I 宇 : 甲 府 ・ 自 治 体 岬I 弱持続持ゐ哨 加 山 3 ネットワークメタアナリシスの統計モデル ~ consistencymodel ‑ネットワークメタアナリシスの基本となるモデル 0 .治療群間差に次のような一致性の仮定を置く。 例 dBC= dAB+dAC EI 書置聖書園E盟理厩国富 ゲ、: B C dBC ‑ 5 1 7‑

528.

~9 匡痕政府開示による工コシステムの実証 S胤 + 蝕 3 . ネットワークメタアナリシスの統計モデル T > c o n s i s t e n c ym o d e l 観測データは次のような確率分布に従うと仮定する。 T1 , A‑B i n o m i a l ( P 1 ,A'町,A) T 1 , B‑ B i n o m i a l ( p ゅ η 1, 8 ) n2, r2, 8/ 8 r2, c /n2, C T3, c /n3, C P 1,A=l o g i s t i C( J . L 1 ) P l, 8=l o g i s t i c ( μ 1 + δ1 , A8 ) δ l,A8‑Normal(dA8'σ2) 変量効果 「時点府自跡婚によ一一均一 3 ネットワークメタアナリシスの統計モデル T > c o n s i s t e n c ym o d e l ワ 白 ︐/ 1kl s/ BEE σ F ヲ ﹄ rI2 ︑ ︑2 U ESJ aノ q ' h ρ)++Alc ︑ J1j. 1 B c σ z ︑F d︐ ︐ M . u 日 1M︐ 6 6 i J 1︑ 九九町 LF ル 冒 m‑m‑mhhh¥i/ ‑‑‑一 1 1 1 A A p p n ‑ μ μ μ ‑ d d ・︑〆 g s ' k f l u f f ‑ ‑ h r s E zI'Iueccri‑‑︑ a aali‑‑/IBI・ ‑ ︐ ︑ ︐ ‑m. m.聞 は は は ooomv.g.mv BBB 一 一 一 一 一 一 BK d J374MMMιι ηηηppp/til¥ r2, 8/n2, 8 ︑︑ ︑ 1 試験に 3つ以上の治療群があるときは注意が必要。 AB聞の差とAC聞の差に相聞があるため, 多変量正規分布にしなければならない。 ‑ 5 1 8 ‑

529.

│医宿、政府関均一平均テムゐ宗一一 3 ネットワークメタアナリシスの統計モデル ~ inconsistencymodel ‑観測データが従う確率分布は consistencymodelと同じ 0 .治療群間差の一致性の仮定にパラメータ ( i n c o n s i s t e n c y parameter)を追加する。 このパラメータを調べることで,不一致性を評価する。 (例) dBC=dAB+dAC+WABC E留置霊彊置翠盟臨霊園 活 J送 機 5線 量 帽 で dBC 医僚政府間大…エコシス弘の実証一齢 W J 9 1 Agenda 4 . 実践例 20 ‑ 5 1 9 ‑

530.

~9 i医 額 、 政 府 師 、 大 学 問 口 シ ス テ ム の 実 証 炉 供 総 会 面 園 謡 垣 国 ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ . 1 . 1 . 1 . 1 1‑ 1 1 1I 伽 唱 機 導繍僻 加物 盤僚 A SSS555S ぬ制 a hh 内町同町ご吋町向 /////// 333 Mhbh h ︐乃 伽鱗鱗畿吋 ー 町 問 駒 ωwf し同州鰍易額;品川内 継問m 美弘 薬剤 51‑3335 qS η η R n ・n r ︐ 薬剤 問 //// 薬剤 議一一 酬 川欄 時時岬岬岬叫岬岬崎町 縦割剖割創釧剖凱剖訓印刷加剖蜘印刷蜘 E官悶E軍票開置理1m器調書1rI商圏 n10,3 T I 0. 3 / nl0s . s / . T I 0 議 hv 一 TU,3/n.山欝欝議襲撃ち,~/向日 T 1 2 s .!n12,S 九日 In山繍欝繍 r"~/"'3~ T 1 3, 3/nU , 3 o W の町出︐ 舟町吻 h 田沼墨田園園罰盟国盟国盟国悶悶悶園 ・・目付加川 n14 T14. 5 / . 5 r16~1向日 密 接 , 日 / 同 市 r μ l 医療政府間大…一弘の実証一一総会 ~9 4 . 実践例 薬剤2 川~~位3(2) 薬剤4 /才 / ~ 薬剤 1 く 薬剤 3 d 1 5 ( 2 ) d 3 5 ( 8 ) 薬剤 5 ‑520‑ d 3 4 ( 1 )

531.
[beta]
問、一体;均出場蒜-~
4 実践例

• p
r
ocmcmc
を使って、最尤推定を実行する。
・変量効果 δk,
ij‑Normal(dか σ
2
)のパラメータ di
σおよび
j,
i
n
c
o
n
s
i
s
t
e
n
c
yparamterwの分散!こ無情報事前分布を仮

l
t
f
N

定する階層ベイズモデルとしてモデリング。

m l
ω
a
m
m
a
(
ω
0
.
01100)
σ‑伊
g
w‑Normal(O,
r2)
r‑gamma(0.01100)

ャ
ー
一
向
学
!
と
よ
る
さ
ぞ
弱
点
…
四
綿 間[9
4
. 実践例
インプットデ一室主立土

a
r
m
l
‑
a
r
m
3
: 薬剤の番号
r
e
s
p
o
n
s
e
l
‑
r
e
s
p
o
n
s
e
3
: 反応数
t
o
t
a
l
l
‑
t
o
t
a
1
3
: 例数
n
a
: 各試験の治療群数

惣醐図園盟国間鵬劉陸慰問開間関雲閣闘到翻閤間関関
2

3

月z

T
l,
3

2

5

T
Z,
2

T
25

2

s

r
"

T3$

n3,2

3

5

T
3
4.

T
,
S
4

n, n S

2

5

T
5.
2

T
5,
5

,
2
n5

n
s
,
5

3

5

九3

γ
6
.
5

n

免6
s

5

γ
1
.
5

'
*
n1
.
2
'

n
l
.
3 1
l
t
,5 3

nj
?
,
2
' n
2
.
S

,.

1
l
s
.
s

,
,
2 n7,
3 n7,
5

2

3

2

5

2

5

九2

3

5

T
1
O
.
ョ

3

5

T
1
1
.
3

T
5
11,

l
.
.
5
nll.3 Rl

2

5

T
1
2
.
2

町2
,
5

n
1
2
.
2 n12.
5

5

巧.2

T
7
.
3

.
r
.
2

T
e
.
s

均~

n

nS,
2

r
t
a
,
s

T
9
.
S

~,2

~.5

T
lO.$

司王 O

,
:
i ~o.s

,円 相

3

5

九日

九3
.
5

n12

3

5

T
1
3
.
3

'
1
4
5

1
l
t3
.
3 n1
.
5
4

3

4

F
刊ョ

円'.
.

T
1
6,
1

'
1
6,
2

.
,
'
口1

T
1
1,
5

2

5

河一5

‑
5
2
1・

3

1
l
J4
,
31
!
t
4
.
4

5
γ
1.

n
1
6
.
1 町 62
, nl6.S 3

532.

% ぷ ミ ; 万 三 i医額、政府・自治体、大学による工コシステムの錨[:fj!:jザ蝕 . i . "• ~~IIIu 4 . 実践例 。 r o cmcmcオプション p r o c mcmc data ; ObservedData n m c ; 100 自白 n b i ; 1000 thin ; 5 mlsslng ; a c /*欠 i R ' j値を含むオブザベーシヨンをモデルに含める*/ /*Drc を出力する*/ dic statistics(alpha ; 0 . 0 5 ) ; (summary interval)j ・ ・ ・ ・ ・ ・‑(後述)・ ・ ・ ・ ・ ・ ・ r 、 u n j l医 療 政 府 自 治 体 大 学 問 工 コ シ ス テ ム の 実 証 一 … 4 . 実践例 事前分布の指定 prior d̲1̲5 normal(0,s d ;1 0 ) j , s d ;1 0 )j prior d̲2̲5 normal(白 prior d̲3̲5 normal(白 , s d ;1 0 )j prior d̲3̲4~ n(0,s d ;1 白 )j prior凶̲1̲2̲5 ~ normal(白 , s d ;t a u ) j priorw̲2̲3̲5 ‑normal(自 , s d ;t a u ) j parms d̲1̲5 d̲2̲5 d̲3̲5 d̲3̲4 凶̲ 1̲2̲5w̲2̲3̲5 0 j 陶 陶 陶 ) d 1 S‑Normal(0.102 d2 ) s‑Normal(0.102 ) d3 s‑Normal(0.102 ) d3 4‑Normal(O.102 W12S‑Normal( 0 .T2 ) W23s‑Normal(0.T2) 0 0 ) ; priortau ‑gamma(0.01,scale ; 1 par 問5 t au 1 ; T‑gamma(O.OL100) 0 0 0 ) j prior sigma ‑gamma(0.01,scale ; 1 parms sigma 1 j σ‑gamma(O.OL100) array mu[17]j prior m u : normal(0,s d ;1 0 ) j parms m u :白 ; 陶 ‑ 5 2 2・ ~1jJo

533.

ん 1 長期… m\l.~i6lRi'I3~f:1í*~*~iÉ~~~;;~ 医 吋問、神{とよ組=託子 4 . 実践例 一致性の仮定, inconsistencvparameterの導入 array d[5,5 ] d11‑d15 d21‑d25 d31‑d35 d41‑d45 d51‑d55; do i ; 1 to 5 ; do j ; 1 to 5 ; d[i,j ] ; 白 ; end; end; d12 ; d 1 5 ‑d 2 5 + 凶 1̲2̲5; d15 ; d̲1̲5; " d23 ; d 2 5 ‑d 3 5 + 凶 2̲3̲5; " ‑ ‑ . . d25 ; d̲2̲5; ̲̲̲ ご¥ d34=d:ζ4; ‑tInconsistencymode1の場合 d35 ; d̲3̲5; 4 1 薬剤 2 d12 薬剤1 〉ゐi f f4 薬剤 d15 薬剤 5 医 療 蔵 相 … ‑ 紘 一 一 ~9 4 . 実践例 ﹂ ﹁i﹁ 統計モデル C D md12 ; d[arm1,arm2]; i干 n a ; 2 then md13 ; 白 j else if na ; 3 then md13 ; d[arm1,arm3]; 1干 na ; 2 then d o ; 511 ; sigma**2; 512 ;日 J 521 ; o ; 522 ; 1 ; end; else i 干 n a ; 3 then d o ; ; 511 ; sigma**2; 512 ; sigma本 本 2/ 2 521 ; sigma**2 / 2 ; 522 ; sigma**2; e n d ; 円以 q ' a σ qL J''E1︑ 1 2/' JUJU 22ικ ︐ aF ︐ ︐ ︑ ︑〆t i 向 ' g z /1 1 ¥ ︑ ︑ N ' ' b a t i ¥i︐/ ︑ ︑ 5 2 3 ‑ ー ︐ f ' ' a ' t random vdelta ‑ mvn(vmd,5 ) subject ; ̲obs̲; ト多変量正規分布の 分散共分散行列の定義 九 6九6 array vdelta[2] delta12 delta13; array vmd[2] md12 md13; array 5[2,2 ] 511 512 521 5 2 2 ; 多変量正規分布の 平均ベクトルの定義 つ の )

534.

│医療、政府自治体増によるーシステムーム… 4 . 実践例 統計モデル② pl ~ logistic(mu[StudyNum])j p2 ~ logistic(mu[StudyNum] + delta12)j p3 ~ logistic(mu[StudyNum] + delta13)j γ 〉 ~9 … = Ph 一=叶吋 , A 1 暗 0 0 g Ph 九 h, B l o g i s t i = ゆ h+Oh,AB) P九C =l o g i s t i c ( μh+Oh,AC ) 千 n a ~ 2 then i l p ~ lpdfbin(responsel,totall,p l ) +l p d千bin(respons巴2,tota12,p 2 )j else i 干n a ~ 3then l p~ l p d干bin(responsel,totall,p l ) +l p d千bin(response2,tota12,p 2 ) +l p d干bin(response3,tota13,p 3 ) j TM‑Bi附n I T h . 点 , , . B B‑B 蜘加 i r 附 n 1 叩 om o 削i 凶 a l 伊 ( Ph 砂, 仇 T , . h 九 h 恥 よ c C‑Bin 悶 om o則 i a l ( P h ι , . h広 C ひ C, n , . hC) model general(lp)j │医藤政府間大学中コシス弘の実証一一総会 4 . 実践例 誼墨主主窒 │当日の発表で紹介します│ ) . . v " ‑ 5 2 4・ ~9

535.

W1J~ │医療政府自治体大…弘の実証 s … 会 Agenda 5 . まとめ 3 1 号事政府・時点時報轍務長;一一 t m J 9 5 まとめ ‑ネットワークメタアナリシスは直接比較と間接比較あるいは 間接比較同士を統合するための統計モデル。 ・直接比較と間接比較の結果を統合を考えるうえで, i n c o n s i s t e n c y )を考慮に入れる必要がある 不一致性 ( .一致性を仮定したうえで試験結果を統合するための c o n s i s t e n c ymodelと不一致性を評価するための i n c o n s i s t e n c ymodelによる解析を SASのmcmc プロシージャを 使って実施した。 ・一般的にネットワークメタアナリシスは結果の解釈が非常に難し い統計手法である。今後の研究の発展に期待したい。 0 ‑ 5 2 5 ‑

536.

医 億 一 一 一 一 一 … 参考文献 1 . LumleyT .Networkmet ヨ ーa n a l y s i sf o ri n d i r e c tt r e a t m e n tcomparisons.S t a tMed 2002;21:2313‑24 2 . LuG.AdesAE.Combinationo fd i r e c tandi n d i r e c tevidencei nmixedt r e a t m e n t comparisons.S t a tMed2004;23・ 3105‑24 n c o n s i s t e n c yi nmixedt r e a t m e n t 3 . LuG,AdesAE.Assessingevidencei t a tAssoc2006;101: 4 7 7 ‑ 5 9 compansοns JA斤1S 4 . DiasS,WeltonNJ,C a l d w e l lDM,AdesAE.Checkingc o n s i s t e n c yi nmixed t a tMed2 0 1 0 ; 2 9 : 9 3 2 ‑ 4 4 . t r e a t m e n tcomparisonm e t a ‑ a n a l y s i s .S 5 . NICEDSUTECHNICALSUPPORTDOCUMENT2 ‑ 5 .NICEDECISION 怠d s u . o r a . u k l E v i d e n c e ‑ S v n t h e s i s ‑ T S D ‑ SUPPORTUNIT.h l t o : / / w w w . n i c series%282391675%29.htm 6 . GordonH .Guyatte. ta l,TheGRADEWorkingGroup.GRADEg u i d e l i n e s :8 R a t i n gt h eq u a l i t yo fevidencedi n d i r e c t n e s s .JC l i nEpid2011; 6 4 : 1 3 0 3 ‑ 1 3 10 目 目 ‑526‑

537.

FREQプロシジャによる割合の差の信頼区間 ‑V9.4における機能拡張と性能評価‑ 飯 塚 政 人 l 魚 住 龍 史 2 浜田知久馬 l 東京理科大学大学院 l 2京都大学大学院 工学研究科経営工学専攻 医学研究科 医学統計生物情報学 C o n f i d e n c ei n t e r v a l sf o rt h ed i f f e r e n c eb e t w e e np r o p o r t i o n sbyFREQp r o c e d u r c 4andp e r f o r m a n c ee v a l u a t i o n s Enhancementsi nSAS9. izuka1,R y u j iUozumi2 ,a n dChikumahamada1 MasatoI , , 1 D e p a r t m e n tofManagementS c i e n c eG r a d u a t eS c h o o lo f E n g i n e e r i n gTokyoU n i v e r s i t yo f S c i e n c e 2 D e p a r t m e n to f B i o m e d i c a lS t a t i s t i c sa n dB i o i n f o r m a t i c s,KyotoU n i v e r s i t yG r a d u a t eS c h o o lofMedicine 要旨 V 9 . 3では FREQプロシジャの悶 SKDIFFによる割合の差の信頼区間として, 8種類の方法による信頼区 聞が構成できた.そして今回新たにリリースされた V9.4においても, FREQプロシ、ジャの機能が拡張さ ) A g r e s t i‑ C a f f o信頼区間, れ , RISKDIFFによる割合の差の信頼区間の構成方法として, 3種 類 の 方 法 (1 2 ) M i e t t i n e n ‑ N u r m i n e n信頼区間, 3)Mee信頼区間)が追加された. 本稿では, V9.4から新たに迫力目された 3種類の構成方法を概説するとともに,被覆確率による性能評価 を行い, V9.3までの信頼区間と比較する.さらに,ケース・スタディとして,優越性・同等性の臨床試 験を想定した下,信頼区間幅やシミュレーションによる検出力について性能評価を行い,それぞれの場 合において推奨すべき信頼区間の構成方法を報告する. キーワード:FREQ,RISKDIFF,2項割合の差,信頼区間,被覆確率 1.はじめに 医薬研究の統計的評価をする際は,信頼区間の使用が推奨されている.医薬統計の教科書で, 2群の割合 5,1 5 ] .2群の割合 の差の信頼区聞の推定は, Wald型の両側 95%信頼区間を示していることが少なくない [ の差の信頼区間を考える上で,想定する 2x2分割表を表 lに示す. ‑527‑

538.

表1.2 x 2分割表 有効 無効 計 有効割合 母数 薬剤群 nl1 n12 n1 nl1 P1 = 均 一 ー η1 1[1 対照群 n21 n22 τ l 2 ' ・ n21 1[2 計 n ' l n ' 2 n P2 =一一 n2 ・ n・1 P =一 一 n このとき, 2群の有効割合の差の真値を/1= π 1一π2 ,その推定値を五=P1 ‑ P2 と表す. ここで, V9.4で割合の差の信頼区聞を出力させるための FREQプロシジャの構文をプログラムに示し, FREQプロシジャの TABLEステートメントにおけるR1SKDIFFオプションにより構成できる割合の差の信頼 区間を表 2に示す.なお,正確な検定に基づく信頼区間は EXACTステートメントの記述も必要となる. プログラム :FREQプロシジャによる割合の差の信頼区間 proc freq data=data; tables group*response I 工iskdiff(cl 二 type); exact method; run; 表 2.F 阻 Qプロシジャにおける信頼区間の構成方法 F a r r i n g t o n一Manning信頼区間 [ 4 ] FM 。 。 。 。 A g r e s t i・C a f f o信 頼 区 間 [1 ] ACI AGRESTICAFFO 古 ミ Mee信頼区間 [ 8 ] MN(CORRECT ニ M EE) i : r M I e t t i n e n ‑ Nu ITni n e n信頼区間 [ 9 ] MNIMN Newcombeスコア信頼区間[1 1 ] 阻 NEWCOMBEI SCO 。 。 。 。 信頼区間め構成方法 間S KDIFF(CL= = 砂pe) Wald信頼区間 WALD [ 2,5 ] WALD(CORRECT) Wald(連続修正)[ 2,5 ] Hauck‑Anderson信頼区間 EXACTmethod SASVersIon1 [ 7 ] HA i : r IWILSON 1 ] Newcombeスコア(連続修正)信頼区間[1 NEWCOMBEI SCO 旺 I WILSON(CORRECT) 正確な検定に基づく信頼区間 [ 1 3 ] EXACT* R 1SKDIFF 正確な検定に基づく信頼区間 (FMスコア) [ 3 ] EXACT* RISKDIFF (FMSCORE) O:V9.3から利用可能,会:V9.4から新たに追加 ‑ 5 2 8 ‑

539.

V9.3では 8種類の方法による信頼区聞が構成でき,飯塚,浜田 ( 2 0 1 3 )は , 8種類の信頼区間の性能評価を 1 7 ] . そして今回新たにリリースされた V9.4におい 行い, Newcombeスコア信頼区聞が最も良いと報告した [ ても, F阻 Q プロシジャの機能が拡張され,新たに 3種類の方法が追加された. 本稿では, V9.4から新たに追加された 3種類の構成方法を概説するとともに,被覆確率による性能評価を 行い, V9.3までの信頼区間と比較する.さらに,ケース・スタディとして,論文公表されている臨床試験(優 6,1 6 ] から得られた割合の数値を想定した下,信頼区間幅,モンテカルロシミュレ 越性試験,同等性試験) [ ーションによる検出力の性能評価を行い,それぞれの場合において推奨すべき信頼区間の構成方法を報告す る. 第 2節では,本研究で扱う 1 1種類の信頼区間の数理を示す.第 3節では,被覆確率の算出法,評価方法に ついて述べる.第 4 節では,得られた結果から各信頼区間の特徴を明らかにし,第 5節では,ケース・ス タデ、ィとして,実データの割合を想定した下で評価を行う.そして第 6 節でまとめを示す. 2 . 信頼区間の構成法の数理 2 .1 . Wald信頼区間 Wa1d信頼区間の構成は, Aの漸近正規性より以下の信頼区間で表される構成法. 白1(1‑P1).P2(1‑P2) 1 ‑ τァ一+一τァ一 l F L l : tZα/2 ( ︐ . ︑ 今回 Wald信頼区間の特徴は,企のとりえる範囲である[・ 1 , 1 ]を超えて上限もしくは下限が形成されることがある. 1 2=n 2 2=0のとき信頼区聞が ( 0,0 ) となる. また, η11=η21=0,η ユ Wald(連続修正)信頼区間 2 Wald信頼区間に連続性の修正を加えた構成法. /1 .1 ¥ . .I n l .T n 2 .. /p1(1‑P 1 ) .P2(1‑P 2 )¥ &士 I. . " .~ +zα/2 1 一一一一一 一+一一一一 I "L' ¥.(. , 1 n1 ・ , ‑‑ n 2 ' I ( 2 ) Wa1d信頼区間の特徴と同様に,企のとりえる範囲である [ ‑ 1, 1 ]を超えて上限もしくは下限が形成されることが ある. 2. 3 . Hauck‑Anderson信頼区間 Hauck ・An d e r s o n信頼区間は, Wald信頼区間より分散を大きくし,連続性の修正を加えた構成法. ( I ん ( 3 ) 五 Wa1d信頼区間の特徴と同様に, Aのとりえる範囲である[・ 1 , 1 ]を超えて上限もしくは下限が形成されることが ある. ‑529・

540.

2. 4 . Farrington‑Manning信頼区間 F a r r i g t o n ‑ M a n n i n g信頼区間は,帰無仮説 Ho:π1‑πzの下で分散を考えている構成法. . , . . ! p( 1‑p). p(1‑p) & 士 Zα/z I 一τ一一+一τ一一 , ι 1・ ( 4 ) ' ι 2 Wald信頼区間の特徴と同様に,企のとりえる範囲である[ー 1 , 1 ]を超えて上限もしくは下限が形成されることが 0,0 ) となる. ある.また, n1 1= ηZl=0,η1Z=nz z=0のとき信頼区聞が ( 2 . 5 . Agresti‑Caffo信頼区間 I+ + Z‑ 槍 ︑︐ ノ ‑ ヲ ム p z一 守i ‑ ‑ ︐i $ι q ︐ 寧 申 J‑ + $1‑ ︐ ︑ ヲ ︐ p ‑一 一一+ 本 ー rst ‑4& 咽A ti‑qL 也事 +一+ 一 一2 n r tA一 フ 臼 句ム‑ Et‑ 一 一 p 一n n i 1ム 一 ‑ + 一+ ︑ 1‑; p η一η 一 ・ フh d ︐ J' α Z ︿ 十一 A 一 2 〆 ︐ .︑ ‑ 勾 ︐ 唱 ‑ ‑ 一 一 z ‑z 一 p . A g r e s t i ‑ C a f f o信頼区間の構成は, 2x2分割表の各セルに l度数足して, Wald信頼区間を導いた構成法, ( 5 ) ( 6 ) A g r e s t i ‑ C a f f o信頼区間の特徴は,/1のとりえる範囲である [ ‑ 1, 1 ]を超えて上限もしくは下限が形成されることが ある. 2 . 6 . Mee信頼区間 Mee信頼区間の構成は,スコア型の信頼区間として以下のように考える. 戸1 ) 戸z ( 1‑p z ) I p 1 ( 1一 l t i‑/ 11 三Z αん卜で一一+一一一一 "" n 1 . nz 3次方程式を解くことによって得られる. 3 す 白 日 P 1とめは制限付き最尤推定値であり ( 7 ) 日U 咽A FL n a‑K κ L ( 8 ) ここで,戸z‑戸1+/1と表せ ,L3=n,L z=( n z .+ 2n1 ) / 1‑n‑n1 n 1 ./ 1‑ n‑ 2n11)/ 1+ η11+ nZ 1‑ nzv L1=( ・ 1, L o=n11/ 1( 1‑/1)である. 2 . 7 . Miettinen‑Nunninen信頼区間 M i e t t i n e r トN u r r n i n e n信頼区間の構成は, Meeの信頼区間に例数を加味し分散を大きくした構成法. ( 9 ) 2 . 8 . Newcombeスコア信頼区間 Newcombeスコア信頼区間は,単群の割合の W i l s o nスコア信頼区間 [ 1 3 ] に基づいた構成法. (上限)=五 + . . j(U1‑ P1)Z+(pz一Lz)z ( 1 0 ) (下限)二五 +. j(P1‑L1) 2+(Uz‑pz)Z ( 1 1 ) ‑ 5 3 0 ‑

541.
[beta]
ここでんと U1は,単群の害j
I
合の Wilsonスコア信頼区間の上限と下限を表し,以下のように求める.
,
π唱(
1ー πJ
|πl-Pll=zα/21~工ナム

(
12
)

同様に L
ilsonスコア信頼区間の上限と下限を表す.
2とU
2は,もう片方の群の割合の W
(
1
3
)

│
π
2‑P
2
1=Za/2

2
.
9
. Newcombeスコア(連続修正)信頼区間
1
3
]に
Newcombeスコア(連続修正)信頼区間は,単群の割合の Wi1sonスコア(連続修正)信頼区間 [

基づいた構成法. Newcombeスコア信頼区間の上限(10
) ,下限(
1
1
)の構成法は同様だが ,L1とU1は,単群の割
合の Wi1sonスコア(連続修正)信頼区間の上限と下限を表し,以下のように求める.

l(1‑πλ
唱

│
π
1一 仇 │‑EZ=Zα/2jム

z
‑
L

(
14
)

同様に L2とU2は,もう片方の群の割合の Wilsonスコア(連続修正)信頼区間の上限と下限を表す.

一
手=

│
π
2‑P
2
1

(
1
5
)

Za/2

w
'
'
'
2
"

2.
10
.正確な検定に基づく信頼区間
正確な検定に基づく信頼区間の構成は,以下のように考える.
(上限)

=叫叫 (ll)>~)

(
16
)

叫ll:Pu(ll)>~)

(
17
)

(下限) = 5

九と P
uは
,

ω

4
ベ

町
P
U
凶
円仲
ω
的
A
円
門
)
か
い
=
=
山
訂
(
寸
門
円
5
s
T
仏
3
f
程
稿
(
.
A
倍
Z
包
Z
Z
Z
t川

ω
π

凶
│
A
帆μ
ω
町2
)

仏
吋

凡
P
則
l
(
附
l
a
l

(
1
8
)

(
1
9
)

で表せられ ,A:2x2分割表 (
n
l
"n
2
'
)
'T
:2x2分割表の任意の値の検定統計量, t
o
:観測された値の検定統計量
を表している.ここで用いられている検定統計量は,
(
2
0
)

T
:
P
l‑P
2
となる.またf(nl
n
2
1
l
l
l
,
π
2
)は
, 2x2
分割表の同時確率を表しており,以下のように表される.
l,
/η唱
、

,

l(
f(nll , n211 ム π2)=1~."・) (
l
l+π2
)
nl
1-ll 一 π2)nl.~nll
¥nl
l

In,
.、
、
一
I
~.~. )π;21(1 一 π2)n 2 ・ ~n21

¥
n
2
1
'

正確な検定に基づく信頼区間の特徴は,全てのπ
zについて名義有意水準以下となる.

‑
5
3
1・

(
2
1
)

542.

2 . 1 1 .正確な検定 (FMスコア)に基づく信頼区間 正確な検定 (FMスコア)に基づく信頼区間は, J‑ ‑ n2 ︐ ︑nu‑ ノ‑ 一‑‑ 門 u‑ 41‑ ‑ A一 一 71 一 N P 一 し h= 十 一 l ︑ = r s E 'A‑‑‑ P 一一一一 ‑ n1 一 ︑ i ‑‑ T : ( 1 5 ) の検定統計量をスコア型(7)に変えた構成法. ( 2 2 ) 3 . 評価基準 3 .1.被覆確率 信頼区間の性能を評価する際の主な評価指標として被覆確率を用いる.信頼区間の被覆確率 ( c o v e r a g e p r o b a b i l i ザ)とは,信頼区聞が対象の真値を含む確率のことである.被覆権率C P ( π1>π 2 )は以下の式で表され る. 印 Mz)=2 20 山~$川2i)π1 n l1 (1- π1)η1411(Cド21 (1 πz戸川 = エ エ 山 臼 ( 2 3 ) U)f( 町1>n 2i I川 ) I(L 三~ $ U )は,指示関数であり,割合の差の真値Aが上限 Uと下限Lの間に入っていれば lとなり,その他 は 0となる関数である.信頼区間の幅を広げれば被覆確率は lに近づき,逆に狭めることで 0 に近づくが, 被覆確率は信頼区間の名義水準に近くなることが望ましい.両側水準 αの信頼区間を求めたときに,被覆確率 1一α)よりも小さい場合には,真値を含まない確率が αより大きく,英語でいうリベラルの対訳として革 が( 1 α)より大きい場合には,信頼区間の幅が必要以上に広いため,保守 新的と表現する.一方,被覆確率が ( 的と表現する.本稿では,被覆確率を用いて, 2種類の基準で信頼区間の構成方法の性能を評価した. 1つ 1一α )に近いことである, 2つ目は,実際は有意でないのに有意であると判定してしまう 目は,被覆確率が ( αエラーを常に一定以下に保持するように,被覆確率が常に(1 α)よりも大きいことである. 3ユ 信 頼 区 間 幅 被覆確率が各信頼区間の構成法でほぼ等しい場合,信頼区間の幅が小さい方が推定精度の点において,好 まれる.信頼区間幅は,第 5節における評価に用いる. 3 . 3 . 検出力 ( P o w e r ) 対立仮説が真の場合,帰無仮説を正しく棄却する確率を表す.第一種の過誤確率が名義水準に保たれてい る場合,検出力は高いほど良い.そして通常の第田中日臨床試験において,検出力は 80%以上に設定される. 信頼区間幅同様,検出力も第 5節における評価に用いる. Power= 有意になった回数 シミュレーション回数 ‑ 5 3 2 ‑ ( 2 4 )

543.

4 . 割合の差の信頼区間の構成法の比較 国1 , 図 2は,各群のサンプルサイズ、の総数n を4 0とし川 =ηz=2 0とした場合(図 1 )とnl=1 0, η 1=3 0とし た場合(図 2 )で , π 1=0 . 1, 0 . 5,π z=0 . 0 , 10 . 0 2, … ,0 9 9のように条件を変え, 95% 信頼区聞を形成したときの , 被覆確率を示した図である.また表 3は π 1=0 . 0 , 10 . 0 2, … ,0 9 9,π z=0 . 0 , 10 . 0 2, … ,0 9 9の下,サンプルサイ 1=n z=2 0,η 1=nz=5 0,そして異なる場合の n1 =1 0,n z=3 0の被覆確率の平均値と ズが等しい場合のη 最小値を示した図である. FREQプロシジャのデフォルトで表示される Wald信頼区間は,被覆確率が非常に小さくなっていることが わかる.また連続修正を加味した Wald (連続修正)信頼区間も,真値引が 0や lに近くなると被覆確率が名 義水準から大きく外れてしまう場合がある.この傾向は,総数nが同じで、各群のサンフ。ルサイズが異なった場 合でも同様であり,より顕著となる. 表 3から,被覆確率が名義水準で、ある 9 5%に近い信頼区間としては,スコア型の信頼区間である, M e e信 i e t t i n e n ・N u r m i n e n信頼区間であることがわかる.また N e w c o m b eスコア信頼区間も被覆確率が名義 頼区間, M 水準である 9 5%に近い. N e w c o m b eスコア信頼区間は,各群のサンプルサイズ、が異なった場合でも被覆確率 の値にあまり影響をうけることなく,各群のサンプルサイズが等しい場合とあまり変わらない.ただし,7rb π 2 の値が 0や lに近づくと名義水準を外れてしまうことがある. 保守的である信頼区間の構成法は,表 3の被覆確率の最小{直 ( M i n ) より,正確な検定に基づく信頼区間, F Mスコア)に基づく信頼区間, N e w c o m b eスコア(連続修正)信頼区間の 3つである.各群の 正確な検定 ( サンプルサイズが等しい場合は,正確な検定 ( F Mスコア)に基づく信頼区聞が保守的かっ名義水準に近い . 5付近と予想さ 値となっている.各群のサンプルサイズがアンバランスな場合は,単群試験などで真値が 0 れる場合には,正確な検定に基づく信頼区聞が名義水準に近い値となっており推奨される. しかし真値が 0 や lに近い値となると,極端に名義水準を外れてしまう傾向があるので,群の真値に関する情報が乏しい場 合は正確な検定 ( F Mスコア)に基づく信頼区間の使用が推奨される. . サンプルサイズ別被覆確率の平均値 ( M e a n ) と最小値 表3 ( M i n ) n 1 '= n2・=20n1・=1 1 2・=50η1.=10n2・=30 Mean Min Mean Min Mean Min . 9 3 6 0.952 0.9420.958 0.917 I A gr e s t i ‑ C a f f o 0 . 9 5 5 0 0 . 9 6 2 0 . 9 1 2 0.964 0.9320.949 0.785 F a r r i n g t o n ‑ M a n n i n g . 8 8 4 0.958 0.9180.949 0.740 Hauck‑Anderson 0 . 9 5 7 0 Miettinen‑Nurminen 0.951 0.9320.950 0.9310.956 0.926 Mee 0 . 9 4 8 0 . 9 1 7 0.949 0.9310.953 0.926 Newcombeスコア 0 . 9 5 1 0 . 9 2 0 0.951 0.934 0.952 0.928 Newcombeスコア(修正) 0.974 0.951 0.967 0.9550.977 0.957 0 . 9 3 0 0 . 8 0 50.942 0.8890.899 0.659 Wald 0 . 9 0 0 0.967 0.9440.955 0.740 I W a l d(修正} 0.969 正確 0 . 9 7 8 0.9520.974 0.9550.978 0.955 正確 (FMスコア) 0.963 0.9510.959 0.9510.975 0.957 5 3 3 ‑ ー

544.
[beta]
n1=20,n2=20とした場合の被覆確率
紛蛸

信努議若手、

1
.
00
0
.
9
8
0
.
9
6
0
.
9
4

¥i

ρ

いお

f

千
三
週

、
紅 ~tf"井j...Li(Vlt~llll.Yl'('1、

a

~I~ルl{t!i'n甘みN'Iイ

司
恥
.
.
.
.
・
"

¥

止

同
げ
(4

i
Y
P
"

0
.
9
2
0
.
9
0

唱
議

i

1
.0
0

時0
.
9
8
様 0
.
9
6

〈i vuudJ

S
ω
4

~";",,.,

、州 榊 対1
2
4
l

t
し
へ
、vHk

Y
W
F
1

~YV'r' ll,.'l- ''\'す'1.~"'l

~i .,,,・刊~!~' ;'-,'f'~可

州WY
前

0
.
9
2

︐
.

0
.
9
0
ドーョミ令務

k
山州!崎、,
;ごみ判明州 下i
も榊附長;;

︒

AUnMua
a
a守 内 ︐ ι U
内
Aunwunmngnwunud
nU ︽
UnU U
︽ n U

奮
さ
さ
霊

1

,

g

0
.
00
.
2 0.
40
.
60
.
8 1
.
0
0
.
00
.
20
.
40
.
60
.
8 1
.0
0
.
00
.
20
.
40
.
60
.
8 1
.0
0
.
00
.
20
.
40
.
60
.
8 1
.
0

]
(
2
11
1
'1

0
.
1

一一一.0.51

図1.各群のサンプルサイズを 20とした被覆確率

n1=10,n2=30とした場合の被謹確率
1
.0
0
0
.
9
8
0
.
9
6
0
.
9
4

内
礼川 州ω W
/~,J{'- ylr ",""/'I 川町桃〆iR

rー
へ 開制吋
〆
向

噌
作
,
¥
.へ
出

0
.
9
2

J
l i.い叩日"M~州,,1

nilJ
w

I~

色

0
.
9
0
Z
是
忌

?
九
?
計

1
.
00

時 0
.
9
8
様 0
.
9
6 ~;;叫且す計う
E094
0
.
9
2

よ

込i i

1
餅

ね恥骨怖糊

,
w

,
.
.
.
,
.
.
‑
"
"
‑
‑
‑
‑
司
科
三
、

τ

l
A
t
i
W紳'!介1iif込1,,1,哨、,~

p
t

0
.
9
0
1
.00

~ ?炉内側

0
.
9
8
0
.
9
6
0
.
9
4

~、小川町-,,/J,よ叫いか.'1

一f
ゎ 地九
i
必凶九
J州
ザ
ド

1

0
.
9
2
0
.
9
0

1

I

I

t

0
.
00
.
20
.
40
.
60
.
8 1
.
0
0
.
00
.
20
.
40
.
60
.
8 1
.0
0
.
00
.
20
.
40
.
60
.
8 1
.0
0
.
00
.
20
.
40
.
60
.
8 1
.0

]
(
2

11
1
'1

一
一
一
一 0.1 一一一.0.51

図 2. 各群のサンプルサイズを 10,30とした被覆確率

‑
5
3
4
‑

545.
[beta]
5
. ケース・スタデイ
臨床試験から得られた 2値データに対して統計解析を行う場合,非劣性試験や同等性試験においては,信

)前節で検討した例数と同程度の優越性試験から得られ
頼区間に基づく意思決定を行う.そこで本節では, i
たデータ, i
i
) 同等性試験から得られたデータ,に基づき構成した 11種類の信頼区間に対する評価を行う.

5
.1.優越性試験
表 4は,関節リウマチ患者を対象とした第 I
I相試験から得られた,ある有効性評価項目の結果の一部を示
す [
6
]
. 図 3は,表 4 のデータから構成した 1
1種類の 95%
信頼区間を図示したもの及び,各信頼区間の上限,
下限,区間幅を具体的な数値として示したものである.示した図表より,構成法によって区間の広がり方が
異なっていることがわかる.特に連続修正を加味している構成法の区間幅が広く,最も区間幅が狭い
Farrington‑Manning信頼区間と比べると区間幅の違いが顕著である.また,正確な検定に基づく構成法も区間

幅が広い. Miettinen‑Nurminen信頼区間,

Newcombeスコア信頼区間, Wald信頼区間, Mee信頼区間の幅は

狭いことがわかる.
表4
. 優越性試験から得られた結果
有効

無効

計

有効割合

差

試験群

3

25

28

0.107

0.078

対照群

1

34

3
5

0.029

Con
釘d
e
n
c
e1
n
t
e
r
v
a
l
sf
o
rt
h
eD
i
f
f
e
r
e
n
c
eo
fP
r
o
p
o
r
t
i
o
n
s

信頼区間

。

Alr~ヰ Ca作。

F
a
r
r
i
n腔担:a
n
n
i
n
g
Hauck‑Anderson

信領下眼 信頼上限 区間幅

相
"
O
S
I
:
i
‑
C
a
f
f

0
.
0
1
4

0
.
0
8
3
80
.
0
0
9
1

a
r
叶n
g
旬n
‑Manning

目
。014

0
.
0
8
2
40
.
0
0
1
8

Hauck‑
Anderson

0
.
0
5
6
8

0
.
1
0
0
60
.
0
4
4
0

M
i
e
t
t
i
n
e
n
‑
N
u
r
m
i
n
e
n

0
.
0
1
4
5

0
.
0
8
2 0
.
0
0
8
2

.
,
ewcom
回 λコア

0
.
0
1
4
5

0
.
0
8
2 0
.
0
0
8
1

Mee

←ー<>‑‑i

M
i
e
t
t
i
n
e
n
‑
N
u
r
m
i
n
e
n
トベト叶

Newcombeスコア
トー@ー→

Newcombeスコア{修正)
Wald

ト‑<←→

Wald(修正}

‑

白一一叫&‑‑

正篠

正櫨 (FMスコア}

。

O
.

。
偶

0
.
0
8

010

l
N
a
l
d

0
.
0
1
4
5

0
.
0
8
2
E0
.
0
0
8
1

.
,
ewco
巾 eスコアt
修正}

0
.
0
5
1

0
.
1
0
5 0
.
0
5
3
6

l
N
a
l
d(修正}

0
.
0
4
2
4

.
!0
0
.
1
14
.
0
7
2
4

~ee

0
.
0
1
4
5

0
.
0
8
2 0
.
0
0
8
1

0
.
0
6
6
4

0.098~

0
.
0
6
8
4

.
0
2
9自
0
.
0
9
8 0

」 陣確
0
.
1
2

肉D

医
健 (FMスコア}

0
.
0
3
1自

図3
. 95%信頼区間及び区間幅

5ユ 同 等 性 試 験
表 5は,関節リウマチ患者を対象とした第 I
I
I相試験から得られた,ある有効性評価項目の結果の一部を示
す [16]. 同等性マージンを [‑15%,15%] として,有効割合の差の 95%信頼区聞が同等性マージン内に含まれ
れば,同等と意思決定を行う.

‑
5
3
5
‑

546.

表5 . 同等性試験から得られた結果 有効 無効 計 有効割合 差 0 . 0 5 6 試験群 98 248 0. 39 5 対照群 85 251 0 . 3 3 9 C o n f i d e n c eI n t e r v a ' sf o rt h eo d d sr a t i o Aer e8 t ! ‑C. f f 。 , Farrínato~-Mannínl Hauck‑ Anderson Miettinen‑Nurminen Miettinen‑Nurminen‑Mee ・ ・ N wcombeスコア N wcombeスコア【修正} Wald W副~修正} 正櫨 正確 (FMスコア) 4国 0 . 0 0 a 皿 0 .1 5 ~I 。 RD 図4 . 95%信頼区間及び区間幅 図 4は,表 5のデータから構成した I I種類の 95% 信頼区間を図示したもの及び,信頼区間の上限,下限, 区間幅を具体的な数値として示したものである.示した図表より,構成法によって区間の広がり方と区間幅 の位置が若干異なっていることがわかる.特に連続修正を加味している構成法と正確な検定に基づく構成法 の幅が比較的に広くなっている.なお,本ケース・スタディでは例数が多くかっ 40% 近い有効割合のため, その他では区間幅に大きな違いはみられない. 次に,表 6に様々な条件の下で求めた 1 0 0 0 0回のシミュレーションによる検出力を示す. P l,P2は各群に おける有効割合, n l,n2は各群の例数を表す.同等性試験なので, P lと P2が近い値を想定した下でシミュ レーションを行った.具体的に述べると,対照群の有効割合 P2は試験群の有効割合 P lより大きくなること はないという想定の下 (Pl~P2) , P l = O . I,0ム 0 . 5とし, P2は P l一 ( 0o r0 . 0 5o r0 . 1 )を想定した.また, A g r e s t i ‑ C a f f o信頼区間, F a r r i n g t o n‑Manning信頼区間, H a u c k ‑ An d e r s o n信頼区間, M i e t t i n e r トN urminen信頼 区間, Newcombeスコア, Newcombeスコア(連続修正) ,Wald( 連続修正)信頼区間をそれぞれ, AC,FM, HA,M N,NS,NSC,WALDCと表記する.なお,正確な検定に基づく信頼区間については,コンヒ。ュータ の性能より求められないため,記述していない. 表 6より, P l,P2の値が小さく,例数が少ない場合は, Wald信頼区間の検出力が上がることがわかる. 他の条件の場合では, A g r e s t i ‑ C a f f o信頼区間, Newcombeスコア信頼区間の検出力が他の信頼区間に比べて高 いことがわかる.また,サンプルサイズの議論となるが,例数が太字になっている箇所は,検出力が 80% 超 えているところである.割合の分散が大きくなる有効割合の真値 0 . 5付近では,検出力 80%を超えるために は,例数を多く必要とすることがわかる. ‑536‑

547.

表6 . 各条件の下で求めた信頼区間別の検出力 P 1 Pフ n l nフ Ar F恥1 HA 恥fN MFF N只 NSC 0 . 1 0 . 1 0 . 0 5 0 . 0 5 1 0 0 248 1 0 0 2 5 1 0 . 7 5 0 . 9 8 0 . 7 5 0 . 9 8 0 . 7 2 0 . 9 8 0 . 6 9 0 . 9 8 0 . 6 9 0 . 9 8 0 . 6 9 0 . 9 8 0 . 6 4 0 . 9 7 0 . 7 7 0 . 9 8 0 . 6 9 0 . 9 7 1 . 0 0 1 .00 0 . 8 7 1 .00 1 .00 1 .00 0 . 1 1 0 . 2 5 0 . 2 9 45 0. 0 . 2 4 0 . 7 1 0 . 7 8 0 . 9 4 0 . 2 9 0 . 9 1 0 . 9 6 1 .00 0 . 0 6 0 . 2 0 0 . 2 4 0 . 3 6 0 . 1 3 0 . 6 1 0 . 6 9 0 . 8 9 0 . 1 7 0 . 8 4 0 . 9 1 0 . 9 9 099 0 . 9 9 0 . 9 9 0 . 9 9 0 . 9 9 100 0 . 8 4 1 .00 0 . 8 4 1 .00 1 .00 1 . 0 0 0 . 1 1 0 . 2 5 0 . 2 9 45 0. 0 . 2 4 0 . 7 1 0 . 7 9 0 . 9 5 0 . 3 0 0 . 9 1 0 . 9 6 1 . 0 0 1 .00 0 . 8 5 1 .00 1 .00 1 . 0 0 0 . 1 2 0 . 2 5 0 . 3 0 0 . 4 6 0 . 2 5 0 . 7 1 0 . 7 9 0 . 9 5 0 . 3 1 0 . 9 2 0 . 9 6 1 . 0 0 1 .00 0 . 8 0 1 .00 1 .00 1 .00 0 . 0 9 0 . 2 3 0 . 2 7 44 0. 0 . 1 9 0 . 6 9 0 . 7 7 0 . 9 4 0 . 2 3 0 . 9 0 0 . 9 5 1 .00 1 . 0 0 1 .00 0 . 8 8 1 .00 1 .00 1 .00 0 . 1 1 0 . 2 5 0 . 2 9 0. 45 0 . 2 4 0 . 7 1 0 . 7 9 0 . 9 4 0 . 2 9 0 . 9 1 0 . 9 9 1 .00 0 . 8 5 1 .00 1 .00 100 0 . 0 9 0 . 2 3 0 . 2 7 0. 44 0 . 1 8 0 . 6 9 0 . 7 7 0 . 9 4 0 . 2 1 0 . 9 0 0 . 9 5 1 .00 0 . 0 2 0 . 1 8 0 . 2 1 0 . 3 4 0 . 0 4 0 . 5 8 0 . 6 7 0 . 8 8 0 . 0 6 0 . 8 2 0 . 9 0 0 . 9 9 0 . 0 6 0 . 0 6 0 . 2 0 0 . 2 4 0 . 3 6 0 . 1 3 0 . 2 0 0 . 2 4 0 . 3 6 0 . 1 3 0 . 0 2 0 . 1 9 0 . 0 6 0 . 2 0 0 . 2 2 0 . 3 4 0 . 0 4 0 . 2 4 0 . 3 6 0 . 6 1 0 . 7 0 0 . 6 1 0 . 7 0 0 . 5 8 0 . 6 7 0 . 8 9 0 . 8 9 0 . 8 8 0 . 1 7 0 . 1 7 0 . 0 6 0 . 8 9 0 . 1 7 0 . 8 4 0 . 8 4 0 . 8 2 0 . 8 4 0 . 9 2 0 . 9 9 0 . 9 2 0 . 9 9 0 . 9 0 0 . 9 2 0 . 9 9 0 . 1 0 . 0 5 300 300 0 . 1 0 . 0 5 雪0 0 500 0 . 3 0 . 2 500 500 1 . 0 0 1 .00 0 . 8 8 1 .00 1 .00 1 .00 0 . 1 2 0 . 2 5 0 . 3 0 0 . 4 6 0 . 1 0 . 1 1 0 0 1 0 0 0 . 1 0 . 1 0 . 1 0. 1 1 0. 0 . 1 248 300 500 2 5 1 300 500 0 . 3 0 . 3 0 . 2 5 0 . 2 5 1 0 0 248 1 0 0 2 5 1 0 . 2 5 0 . 7 1 0 . 3 0 . 3 0 . 3 0 . 3 0 . 2 5 0 . 2 5 0 . 3 0 . 3 300 500 1 0 0 248 300 500 1 0 0 2 5 1 0 . 7 9 0 . 9 5 0 . 3 1 0 . 9 2 0 . 3 0 . 3 300 300 0 . 9 6 0 . 3 0 . 2 1 0 0 1 0 0 0 . 3 0 . 3 0 . 2 0 . 2 248 300 2 5 1 300 0 . 3 0 . 3 500 500 1 . 0 0 0 . 5 0. 4 1 0 0 1 0 0 0 . 0 6 0 . 5 0 . 5 0 . 5 0 . 5 4 0. 4 0. 0. 4 45 0. 248 300 500 1 0 0 2 5 1 300 500 1 0 0 0 . 2 0 0 . 2 4 0 . 3 6 0 . 1 3 0 . 5 0 . 5 45 0. 45 0. 248 300 2 5 1 300 0 . 6 1 0 . 7 0 0 . 5 0. 45 500 500 0 . 8 9 0 . 5 0 . 5 1 0 0 1 0 0 0 . 1 7 0 . 5 0 . 5 0 . 5 0 . 5 248 300 2 5 1 300 0 . 8 4 0 . 9 2 0 . 5 0 . 5 500 500 0 . 9 9 目 目 目 1 .00 1 .00 1 .00 0 . 1 1 0 . 2 5 0 . 2 9 0. 45 0 . 2 4 0 . 7 1 0 . 7 9 0 . 9 4 0 . 3 0 0 . 9 1 0 . 9 6 1 .00 0 . 0 6 0 . 2 0 0 . 2 4 0 . 3 6 0 . 1 3 0 . 6 1 0 . 7 0 0 . 8 9 0 . 1 7 0 . 8 4 0 . 9 2 0 . 9 9 0 . 9 9 WALD WALDC 0 . 9 6 1 .00 0 . 1 3 0 . 6 1 0 . 7 0 1 .00 0 . 8 1 1 .00 1 .00 1 .00 0 . 0 8 0 . 2 2 0 . 2 6 0. 43 0 . 1 6 0 . 6 7 0 . 7 6 0 . 9 4 0 . 1 7 0 . 8 9 0 . 9 5 1 .00 0 . 0 2 0 . 1 8 0 . 2 1 0 . 3 4 0 . 0 4 0 . 5 8 0 . 6 7 0 . 8 8 0 . 0 5 0 . 8 2 0 . 9 0 0 . 9 9 まとめ 本稿では, SASの V9. 4 の F旺 Q プロシジャから新たに追加された 3種類の構成方法を含めた 1 1種類の信 頼区間の構成方法の特徴について,被覆確率を評価指標として比較した.その結果,被覆確率が名義水準に 平均的に近かったのは M i e t t i n e n ・N urminen信頼区間と Newcombeスコア信頼区間であった.また,ケース・ スタディの結果から,検出力が比較的高い信頼区間は, Newcombeスコアであったため, Newcombeスコア信 頼区聞が推奨される信頼区間であることが確認された保守的な信頼区間は,正確な検定に基づく信頼区間, 正確な検定 (FMスコア)に基づく信頼区間, Newcombeスコア(連続修正)信頼区間で、あった.保守的な信 頼区間の中で、も被覆確率が名義水準に近かった信頼区間は,正確な検定 (FMスコア)に基づく信頼区間で あったため,保守的な信頼区間の中で推奨される信頼区間は正確な検定 (FMスコア)に基づく信頼区間で ‑537‑

548.

あった.しかし,各群において例数が異なる場合で,単群等の試験などで真値が 0 . 5付近であると予想でき る場合には,正確な検定に基づく信頼区間の使用も検討される. 参考文献 [ 1 ]A g r e s t i,A .andC a f f o . ,8 . , Simpleande f f e c t i v ec o n f i d e n c ei n t e r c a l sf o rp r o p o r t i o n sandd i f f e r e n c e sofp r o p o r t i o n s d d i n gtwos u c c e s s e sandtwof a i l u r e s,T h eAmericanS t a t i s t i c i a n, 54, 280‑288, 2 0 0 0 . r e s u l t合oma [ 2 ]A g r e s t i, A .C a t e g o r i c a lDataA n a l y s i s,SecondE d i t i o n :JohnWiley& Sons,2 0 0 3 . [ 3 ]Chan,1 .S ., . F Zhang,Z .,T e s t ‑ b a s e de x a c tc o n f i d e n c ei n t e r v a l sf o rt h ed i f f e r e n c eoftwob i n o m i a lpropo 口i o n s, B i o m e t r i c s,55,1202‑1209,1 9 9 9 . [ 4 ]F a r r i n g t o n,C .P .andManning,G .,T e s ts t a t i s t i c sands a m p l es i z ef o r m u l a ef o rc o m p a r a t i v eb i n o m i a lt r i a l sw i t hn u l l S t a t i s t i c si nM e d i c i n e ,9,1447‑1454,1 9 9 0 . h y p o t h e s i so f n o n ‑ z e r or i s kd i f f e r e n c eo rn o n ‑ u n i t yr e l a t i v er i s k, 1 .L . , Levin,B .,P a i k,M.C .,S t a t i s t i c a lM e t h o d sf o rR a t e sandP r o p o r t i o n s,T h i r dE d i t i o 月:JohnWiley& [ 5 ]F l e i s s司 Sons, 2 0 0 3 . .e ta , . l Tabalumab,ananti‑BAFFmonoclonala n t i b o d y 、i np a t i e n t sw i t ha c t i v er h e u m a t o i da r t h r i t i s [ 6 ]G e n o v e s e .M.C n n a l so f t h eR h e u m a t i cD i s e a s e s,72,1461‑1468 2 0 1 3 . w i t ha ni n a d e q u a t er e s p o n s et oTNFi n h i b i t o r s .A 司 [ 7 ]Hauck、W.W.andAnderson,S Ac o m p a r i s o no fl a r g e ‑ s a m p l ec o n f i d e n c ei n t e r v a lmethodsf o rt h ed i f f e r e n c eoftwo 門 h eAmericanS t a t i s t i c i a n, 40,318‑322,1 9 8 6 . b i n o m i a lp r o b a b i l i t i e s,T R .W C o n f i d e n c eboundsf o rt h ed i f f e r e n c ebetween同 op r o b a b i l i t i e s, B i o m e t l ・ i c s, 40,1 1 7 5 ‑ 1 1 7 6,1984 [ 8 ]Mee, 川 O .S .andNurminen, M., Comparativea n a l y s i softwor a t e s, S t a t i s t i c si nM e d i c i n e,4,213‑226,1 9 8 5 . [ 9 ]M i e t t i n e n, .G .,C o n f i d e n c eI n t e r v a l s戸rP r o p o r t i o n sandR e l a t e dM e a s u r e s of, E酔c tS i z e,Chapman & [ 1 0 ] Newcombe,R 2 0 1 2 . Hall/CRC, .G .I n t e r v a le s t i m a t i o nf o rt h ed i f f e r e n c ebetweeni n d e p e n d e n tp r o p o r t i o n s : C o n p a r i s o nofe l e v e n [ 1 1 ]N巳wcombe,R ー S t a t i s t i c si nM e d i c i n e,1 7,873‑890,1 9 9 8 . methods, .G . andNurminen M.,I nD e f e n c eo fS c o r eI n t e r v a l sf o rP r o p o r t i o n s andt h e i rD i f f e r e n c e s, [ 1 2 ] Newcombe,R 句 C o m m l l n i c a t i o n si nS t al I s t i c s‑T h e o η andM e t h o d s, 40,7,1 2 7 1・1 2 8 2, 20日. [ 1 3 ]S a n t n e r .T . J .e ta , . lS m a l l ‑ s a m p l ec o m p a r i s o n sofc o n f i d e n c ei n t e r v a l sf o rt h ed i f f e r e n c eoftwo i n d e p e n d e n t b i n o m i a lp r o p o r t i o n s,C o m p l l t a t i o n a lS t a t i s t i c s& DataA n a l y s i s,5 1,5791‑5799, 2 0 0 7 . .B .,P r o b a b l ei n f e r e n c e,t h e lawo fs u c c e s s i o n,and s t a t i s t i c a li n f e r c n c e,J o u r n a loft h eAmerican [ 1 4 ] Wilson,E 9 2 7 . S t a t i s t i c a lA s s o c i a t i o n,22,209‑212、1 E p i d e m i o l o g y :S t l l d yD e s i g nandDataA n a l y s i s, Chapman& Hall/CRC, 2 0 0 4 . [ 1 5 ]Woodward, [ 1 6 ]Y o o .D.H.e ta , . l A randomised,d o u b l e ‑ b l i n d,p a r a l l e l ‑ g r o u ps t u d yt od e m o n s t r a t ee q u i v a l e n c ei ne f f i c a c yand s a f e t yofCT‑PI3comparedw i t hi n n o v a t o ri nf 1iximabwhenc o a d m i n i s t e r e dw i t hm e t h o t r e x a t ei np a t i e n t sw i t ha c t i v e y .A n n a l soft h eR h e l l m a t i cD i s 問。, 72,1613‑1620, 2 0 1 3 . r h e u m a t o i da r t h r i t i s :t h ePLANETRA山 d [ 1 7 ] 飯塚政人,浜田知久馬. 2 群の割合の差における信頼区間の構成法の比較. SAS ユーザー総会論文集, 461‑473, 2 0 1 3 . ‑538‑

549.

MCMCプロシジャを用いたN o r m a l i z e dP o w e rP r i o rの実用的な実装 武田純 アステラス製薬株式会社開発本部データサイエンス部 P r a c t i c a l l m p l e m e n t a t i o no f N o r m a l i z e dPowerP r i o rw i t hMCMCP r o c e d u r e J u nT a k e d a G l o b a lD e v e l o p m e n t, A s t e l l a sPharmaI n c . D a t aS c i e n c e, 要旨 B a y e s流モデリングの基本は,パラメータの事前分布をデータで更新して事後分布を得ることである。 その派生として事前分布を「過去のデータ」で更新し,更新された分布を新たに事前分布とみなして「現 在のデータ」で更新することも考えられる。その際「過去のデータ」の尤度関数を l未満のべき数を用 いてべき乗することにより,その重みを弱めることを意図して導出した事前分布を PowerP r i o rと呼ぶ。 PowerP r i o rのべき数の部分を定数ではなく確率変数とみなしたモデルも存在するが,定数の場合のモデ ルからの単純な拡張はべき数の事後分布が過小な値をとる傾向にある。そこである値による基準化も施 した N o r m a l i z e dPowerP r i o r(もしくは M o d i f i e dPowerP r i o r ) が提案されている。 N o r m a l i z e dPowerP r i o r の実装上の問題点は,この基準化のための値の算出に積分計算を伴うこと,及びその値を MCMCサン プラーに組み込むことにある。 o r m a l i z e dPowerP r i o rを実現する実用的な方法を提示する。 本論文では, MCMCプロシジャを用いて N 積分計算は MCMCプロシジャの外側でモンテカルロシミュレーションにより実装され,求められた値 は FCMPプロシジャにより定義された関数を通して MCMCプロシジャ内から参照される。一般的な方 法論とともに 2項分布モデルのもとでの具体的な実装方針も示し,その事後分布から N o r m a l i z e dPower P r i o rの性質を考察する。 キーワード:B a y e s i a nm o d e l i n g,h i s t o r i c a ld a t a,N o r m a l i z e dPowerP r i o r,M o d i f i e dPowerP r i o r,MCMCプ ロシジャ, FCMPプロシジャ 1.はじめに B a y e s流モデリング基本は,パラメータの事前分布をデータで更新して事後分布を得ることである。その 派生として,更新された事後分布を新たな事前分布とみなし,さらに別のデータで更新するといった手順の 繰り返しも考えられる。一連の過程は B a y e s更新とも呼ばれ,パラメータの最終的な事後分布は最初の事前 分布とそれぞれのデータの尤度の積に比例する。この枠組みの特徴は,データごとに特に重みづけを行わな いことである。仮に得られるデータの順番が異なったとしても,最終的な事後分布は変わらない。 ー5 39‑

550.

データが過去,現在と 2段階で得られた状況を考える。これらのデータに Bayes更新を当てはめてもよい が,過去より現在のデータに重きを置く,言い換えれば情報量を割り引し、たもとで過去のデータの情報を用 いて推論を行いたい場合も想定される。また事前分布を現在のデータで更新する枠組みに,情報量を割り引 いたもとで過去のデータを活用して推論の精度を高めたい場合もあるであろう。 r i o r( [ 5 ]など)が提案されている。 PowerP r i o rとは, 過去のデータの情報量を割り引く方法として, PowerP 現在のデータ ( c u r r e n td a t a ) から見た事前分布を,過去のデータを得る前の事前分布 ( i n i t i a lp r i o rと呼ばれる) h i s t o r i c a ld a t a ) の積により定義される。過去のデータの情報量 と l未満のべき数でべき乗した過去のデータ ( は,べき数によりコントロールされる。 1,こ近ければ過去のデータを最大限に活用し, 0に近ければ過去のデ ータはパラメータの事後分布にほとんど影響を与えなくなる。 PowerP r i o rを用いる際には,べき数を定める必要がある。べき数の定め方としては,専門家の意見 [ 9 ]に基 づし、た定数とするほか,べき数そのものを確率変数とし,そこに事前分布を与えることも提案されている ( [ 5 ] など)。 本論文ではべき数を確率変数として扱う PowerP r i o rの lつである, N o r m a l i z e dPowerP r i o r( M o d i f i e dPower P r i o rとも呼ばれる, [ 2 ] [ 3 ] [ 9 ] [ 1 0 ] ) に注目し, SASによる実装の方法論を提示する。 2節では他の PowerP r i o r との関連も含めて, NormalizedPowerP r i o rの理論を解説する。 N o r m a l i z e dPowerP r i o rを用いる際の問題点は, 必要とされるある種の積分計算であり, 3節にて SAS内でその積分計算を行う実用的な方法論を示す。 4節 r i o rを用いた事後分布の計算結果を他の PowerPriorと比較 では 2項分布モデルのもとで, NormalizedPowerP して示し, 5節でまとめる。 2P o w e rP r i o rの概要 本節では PowerPriorの数理についてまとめる。まずべき数を定数としたもとでの PowerP r i o rである条件付 r i o rを示し,その派生として I b r a h i ma n dChen型 PowerP r i o r及び N o r m a l i z e dPowerP r i o rについて示 き PowerP 9 ]を参考にしている。簡単のため,以降の議論において事前分布は全て p r o p e r す。なお多く用語や表記は文献 [ (積分が発散しなし、)であると仮定する。 2 .1条件付き Power Prior D。を過去のデータ(確率変数の実現値としての値のほか,共変量も含む), D を Do と同じ構造を持つ現 在のデータ,。を推論の対象となるパラメータのベクトル, π。(8) をパラメータベクトルに対する過去のデ、 : ;1 ) を定数とした ータを得る前の事前分布としてもとでの,べき乗パラメータ α。(とりうる値は 0三 αo: PowerPriorπ(8IDo , α。)は以下に定義される ( [ 5 ]など): 屯︑ 。 ︑︐ノ l ' ' E 。 πc(8IDo , α )α L(DoI8)α o π ( 8 ) ここに L(DoI8) はパラメータ 0 のデータ D。に関する尤度とする。以上で定義された町 ( θ IDo, α。)が現 在のデータ D に対する事前分布となる。 α。=1 ならば(1)は Do の情報を最大限に利用することになり, π。( 8 ) のデータ D。及び D による通常の Bayes更新に対応する。また α。=0 ならば ,D。の情報は一切用 ‑ 5 4 0 ‑

551.
[beta]
いられず, π。(
9
) は D のみで更新される。 α。が所与であることから, (1)を条件付き (Conditional
)Power
1
) に基準化定数を含めた式は以下に示される:
P
r
i
o
rと呼ぶことにする。 (

。
。

。

π (
L(DoI9)ao
9
)
L(DoI
9
)α
o
π (
9
)
πC(θIDo,
α。
)= r • 1
'
'
‑vl''''~rI_ '
"
,
:
,
.
.
.
.
.
‑
π(
んL('
Dolθ)
ao
9
)d9
g(α I
D
o
)

。

v/

(
2
)

ここに g(aoIDo)=ん
L(DoI9)α
o
π。
(9)d9 である。

α。は「専門家の意見 j によって決められる (
[
9
]
) ほか,異なる α
。から構成された条件付き PowerP
r
i
o
r
の中から,事後分布に関する偏差情報量基準 (Deviancel
n
f
o
r
m
a
t
i
o
nC
r
i
t
e
r
i
o
n,
DIC)が最もノトさいものを選ぶ,
すなわちモデル選択により定める方法論も存在する (
[
6
]
)。

2.2Ibrahim‑Chen型 Power Prior
Bayes流の考え方をより追求するのなら α。も確率変数として取り扱うことになる。なおその場合, α。自

体を直接定める必要はなくなるが, α。の事前分布とその定数ノ fラメータは決める必要がある。 α
。に事前分
布を与えることによる (
1
) からの最も素直な修正は,以下に示される式であろう (
[
5
]など):

。

)
。

πd 9,
aoIDo) αL(Dolθ
)
α。
π(
9
)
π
(
α

(
3
)

ここに π
(
α。)は α。に関する事前分布であり, 0
:
<
:
;ao:
<
:
;1 であることから通常 8分布が想定される。以降は
(
3
) を Ibrahim‑Chen型 PowerP
r
i
o
rと呼ぶことにする。 (
3
) に基準化定数を含めた式は以下に示される:

。

π (
L(DoI9)ao
9
)
π(
ao
)
π
I仁 (9,
αI
D
o
)=‑‑:‑;
山~,~f
o
' L(DoI9)α
o
π。
(
θ
)
π
(
α。
)d9dα。

。

ん

(
4
‑
1
)

L
(
D
o
I
9
)
α
o
π。
(
9
)
π
(
α。
)

f
0
1g(αolDo)π(α。
)dα。

(
4・2
)

Ibrahim‑Chen型 PowerP
r
i
o
rは比較的広く用いられているが,し、くつかの研究で α。の事後分布が小さな値

を取りやすいことが指摘されている (
[
2
]
[
3
]
[
1
0
]
)
。つまり α。の事後分布が 0 付近に集まりやすく,過去の
データを推論に活用する枠組みであるにもかかわらず,実際には過去のデータが θ の事後分布にほとんど影
響を与えていないという問題点が挙げられてきた。
更に Ibrahim‑Chen型 PowerP
r
i
o
rは L(DoI
9
) に定数を乗じた際に,分布が変わるという特徴を持つ。例え
ば 2項分布モデルを考える。試行数を n,成功確率を p,実際に得られた成功数を r とした場合, 2項分布
の確率関数には n
!
j
(
r
!(n‑r
)
!
).
p
r(1‑p
)
n
‑
r となる。そこでは L(DoI
9
) に 2項係数 n
!
j
(
r
!(n‑r
)
!
) を含
めるか否かによって異なる πIc(9IDo
,
α。)が得られる。すなわち (
n
!
j
(
r
!(
η ‑ r
)
!
)
)α
o が乗じられるか否かの
違いが生じる。この不定性,言い換えれば尤度原理を満たさない点も Ibrahim‑Chen型 PowerP
r
i
o
rの欠点と見
[
2
]
)
。
られることがある (

‑
5
4
1
‑

552.
[beta]
2
.
3NormalizedPowerPrior
。を確率変数として取り扱う修正を施したものであるが,一旦基準化 (
n
o
r
m
a
l
i
z
a
t
i
o
n
)
(
3
)は(1)に直接 α
された式 (
2
) に対して α
。を確率変数として取り扱う修正を施したものが,以下の N
o
r
m
a
l
i
z
e
dP
o
w
e
rP
r
i
o
r

(
M
o
d
i
f
i
e
dP
o
w
e
rP
r
i
o
rとも呼ばれる)である (
[
2
]
[
3
]
[
1
0
]
)
:

。

。

L
(
D
o
I
9
)向 π(
9
)
" L ( Do
I
9
)
α
o
π (
9
)
a
o
I
D
o
)= π(
a
o
)=
η
(
α。
)
(
9,
んL(Dolθ)aoπ
O
(
θ)d97rl
a
o
)=‑
‑
‑
‑
‑
g
(
α
o
l
D
o
)

(
5
)

N
o
r
m
a
l
i
z
e
dP
o
w
e
rP
r
i
o
rは以下の良い性質を持つ:
1
. I
b
r
a
h
i
m
‑
C
h
e
n型ほど α
。の事後分布が小さい値を取る傾向にない。

2
. I
b
r
a
h
i
m
‑
C
h
e
n型とは異なり L(Do
I
9
) に定数を乗じても分布は不変である。

o
r
m
a
l
i
z
e
dP
o
w
e
rP
r
i
o
rを用いる場合,新たに以下の問題が生じる:
一方 N
。が更新されるたびに g(
α
。I
D
o
) を求める必要がある。 α
。更新の度に数値
1
. MCMCサンプラー内で α
積分を行うのでは,計算が非常に高負荷になるという問題を生じる (
[
4
]
[
9
]
)
。
2
.

9 が多次元の場合,数値積分は l次元の場合に比べて格段に難しくなる。

3.4節ではモンテカルロシミュレーションによる積分とその積分結果の線形補完により,これらの問題を回
避する方法を示す。

3
.M
C
M
Cプロシジャによる Power Priorの実装
以下,各種 P
o
w
e
rP
r
i
o
rについて,一般的な実装法と,データが 2項分布に従う場合の具体的な例について
示す。

2項分布モデルの例

o
w
e
rP
r
i
o
r実装の例示と 4節の数値例で用いている 2項分布モデルを示す。現在の
ここでは 3節における P
1
>
,
Y
N,
n1
,
…,
n
N
} と表される。ここに m は i番目のデータの組における試行の数であり,
データは D ={Y

Y
i はそのうち成功した数 ,N はそのようなデータの組の数である。過去のデータについても同様に,

Do={
Y
01>'
Y
O
N
O
'η
01>… ,
n
O
N
o
} と表記することにする。パラメータベクトルを 9=P (
1パラメータ)とした
もとで,各確率分布を以下のように定める:

P‑8
(
1,
1
)

(
6
‑
1
)

Y
O
i‑8
i
n
(
n
O
i
'
p
)

(
6
‑
2
)

Y
i‑8
i
n
(
n
i
'
p
)

(
6
‑
3
)

。
‑

α 8
(1
.1
)

(
6
‑
4
)

ここに 8
(
α,b
) はパラメータ α, b を持つ 8分布, 8
i
n
(
n
,
p
)は成功確率 p のもとで n 回の試行に関する 2

5
4
2
‑

ー

553.

項分布を表す。また Y 01>…' Y O N O ' Y l '. YN は互いに独立であるとする。 ( 6 ‑ 1 ) はパラメータの事前分布.( 6 ・2 ) り は過去のデ}タの生成に関する分布(過去のデータの尤度).( 6・3 ) は現在のデータの生成に関する分布(現在 のデータの尤度). ( 6 ・4 ) はべき数に関する事前分布に対応する。 3 .1データセットの構造 一般論 過去のデータと現在のデータを合わせて一つのデータセットとする。データセットは以下の変数を含む: 1 . データ(確率変数ベクトルの実現値)。 2 . データ(確率変数ベクトルに関わる広い意味で、の共変量)。通常の共変量のほか, 2項分布の試行回数, 対数線形モデルにおけるオフセット項など,推論の対象とならず値の与えられているパラメータも含 む 。 3 . オブザベーションが過去のデータのものなのか現在のデータのものなのかを区別する変数。 4 . オブザベーションのキ一項目。 MCMCプロシジャが複数のオプザベーションに対して処理を行う中で, 過去データに属するオブザベーションの中で特定の処理を l回のみ行うために使用。 . は通常の解析で現れる変数である。 P o w e r P r i o rの実装にあたって,特に 3 . と4 . が追加されている。 1 . と 2 2項分布モデルの例 . Do= { Y O l= 10, Y o 2= 5 ' Y 0 3= 5, nOl =2 5, n02 = 5 0, n03 = 2 5 , } D ={ Y l= 5 ' Y 2= 例えば NO= 3,N = 2 15,nOl = 50, n02 = 5 0 } の場合,データセットの構成は表 1のようになる。 表1 : 2項分布モデルにおけるデータセット例 オブザベーション番号 HISTCUR 3 。 。 。 4 l 2 RECID Y N 1 0 2 5 2 5 5 0 3 5 2 5 5 5 0 1 5 5 0 2 5 HISTCUR は そ れ ぞ れ の オ ブ ザ ベ ー シ ョ ン が 過 去 も し く は 現 在 の ど ち ら に 属 す る デ ー タ か を 示 し (HIST̲CUR=Oが過去. HIST̲CUR=1が現在). RECIDはオブザベーションのキ一項目で, HIST̲CURと組 み合わせることにより,オプザベーションが一意に特定される。なお 4節の数値例においては過去,現在そ れぞれ複数の実現値を Iつにまとめた表 2の形のデータセットを用いる。そこではデータの組に関する添え 字が必要なくなるため . Do={ Y o=20, no= 1 0 0 },D ={y= 20, n= 100} と表すことにする。 表 2:2項分布モデルにおけるデータセット例(過去,現在のデータをそれぞれ lレコードで表現) オプザベーシヨン番号 I HIST̲CUR 。 2 5 4 3・ ー

554.

3.2 条件付き Power Priorの実装 一般論 MCMCプロシジャにおいて条件付き PowerP r i o rを実装する方法は,文献 [ 1 1 ] で示されている: ~ modelステートメントは確率分布ではなく,プロシジャ内で指定された対数尤度を g e n e r a l関数により 呼び出す。 》 データセットのオブザベーションごとの対数尤度は logpdf関数や I p d fXXX関数 (XXXは確率分布を 特定するキーワード)を用いる,もしくはユーザー自身が対数尤度関数を書き下すことにより指定す る 。 》 過去のデータに対応するオブザベーションについては,対数尤度を α 。倍する。 》 α。はマルコフ連鎖やデータセットのオブザベーションに関して不変であるため, b e g i n c n s t l e n d c n s tス テートメント内で定数であることを明示しておく(必須ではないが,間違いを未然に防ぐ手段になり う る ) 。 2項分布モデルの例 以下に過去,現在のデータがデータセット ALLDATAに 3.1節に示されたフォーマットで格納されている (。=0 . 3とする): 場合のサンプルコードを示す α p r o cmcmcdata=ALLDATA; parmsP0 . 5 ; n d c n s t ;/*定数として α。=0.3を指定*/ b e g i n c n s t ;AO=Oム e p r i o rP‑b e t a ( l, 1 ) ; 悶 = AO*lo 即d f ( ' b i n o m i a l ', Y, P, N ) ;叩 d ; if(HIST̲CUR=O)t h e nd o ;LLI if(HIST̲CUR エ 1 )t h e nd o ;LLIKE ニ l o g p d f ( ' b i n o m i a , ' lY, P, N ) ;e n d ; modelg e n e r a l ( L L I K E ) ; r u n ; 2項分布の対数尤度に対して,過去のデータに対応するデータのみ重み AO(=a o )が与えられる。 3.3Ibrahim‑Chen型 Power Priorの実装 一般論 条件付き PowerP r i o rのコードにおいて, α。に定数ではなく事前分布を与えるように修正する。 parmsステ r i o rステートメントにより事前分布を指定する。 ートメントで該当する変数が確率変数であることを明示し, p 2項分布モデルの例 以下にサンプルコードを示す: p r o cmcmcdata=ALLDATA; parmsP O . 5 ; parmsAO0 . 5 ;/*この行を追加。 b e g i n c n s t l e n d c n s tステートメントを削除*/ p r i o rP‑b e t a (1 , 1 ) ; ‑ 5 4 4 ‑

555.
[beta]
p
r
i
o
rAO‑b
e
t
a
(11
)
;/*この行を追加。*/
i
f(HIST
̲CUR
ニ 0
)t
h
e
nd
o
;LLIKEニ A
O
*
l
o
g
p
d
f
(凶 o
m
i
a
l
',
Y,
P
,
N
)
;e
n
d
;
if(H1ST̲CUR
ニ1
)t
h
e
nd
o
;L
L
I
K
E
=
l
o
g
p
d
f
(
'
b
i
n
o
m
i
a
l
',
Y,
P
,
N
)
;e
n
d
;
modelg
e
n
e
r
a
l
(
L
L
I
K
E
)
;

n
m
なお 1
2項係数を含まない I
b
r
a
h
i
m
‑
C
h
e
n型 PowerP
r
i
o
r(詳細は 4
.
2節において記載)については, 5行目を以
下に置き換えることになる.
if(HIST̲CUR
ニ 0
)t
h
e
nd
o
;L
L
I
K
E
=
A
O
*
(
l
o
g
p
d
f
(
'
b
i
n
o
m
i
a
l
',
X,
P
,
Nトlcomb(N,
X
)
)
;e
n
d
;
o
g
p
d
f関数は 2項係数を含んでいるため,そこから l
o
g
(
n
!
/
(
x
!(n‑x
)
!
)
)
) を引く操作
b
i
n
o
m
i
a
lを引数とした l

を行っている。

3.4 Normalized Power Priorの実装
一 般論

以下 a
),b
),及び c
) により実装する。
a
) モンテカルロシミュレーションによる積分計算の近似

データステップにて以下の手順により,データセットを作成する。
1
.

十分大きな Me に対して,

π0(8) に従う独立な確率変数ベクトルの列 81,
…,
8Me をモンテカルロ

シミュレーションにより生成する。
2
.

十分大きな Ma に対して, αO
.
i=
i/Ma (
i=0,
…,
Mα
) を定義し,近似により以下を得る.

L

"
"
記
Mθ

9
(
αO,iI
D
o
)= L
(
Do
1
8
)
aO,i
r
r
o
(
8
)d
8

iぎ 9
L
(民│叫 )
ao
0
.
i
.

(
7
)

3
. 第 t オブザベーションに 90.i‑1 が格納されるような (Ma+1
) レコード、を持つデータセットを作
成する。

b
)FCMPプロシジャによる関数の定義

以下に示す 9(・I
D
o
)を近似した関数 g
(
.I
D
o
) を FCMPプロシジャにより定義する:

。

》

関数の引数は α (
0$αo$1
) とする。

T

r
e
a
d
̲a
r
r
a
y 関数を用いて,データセットに格納された 90,0
'目,,
.90,Mα の値を FCMPプロシジャに渡す。

》

関数の返り値を線形補完により求める。すなわち αO
.
i
' <α
。く α
O
.
i
'
+
l となる i
' を特定したのち,

。
‑

α
(

+90,i'を返り値とする α
(。
=α O,
i
'の場合は 90,
i
' を返り

aO,
i
'
)X(
90/+1‑ 90,
i
')
/
(
α O,
i
'+1一α
o
,
i
'
)

値とする)。

c
)MCMCプロシジャにおける NormalizedPowerP
r
i
o
rの実装
MCMCプロシジャ内では, I
b
r
a
h
i
m
‑
C
h
e
n型 PowerP
r
i
o
r実装のためのコードに対して修正を施す。すなわ

ち
,

対数尤度において l
o
g
[g(・I
D
o
)
]の引き算が行われるようにする。 g('I
D
o
)は過去のデータ全体に対

する尤度の基準化であることから, MCMCプロシジャに渡されるデータセットのレコードが複数であって

‑545‑

556.

もこの引き算は 1回のみ行われるように指定する。その際に 3 . 1節で述べた,オブザベーションのキ一項 目が役に立つ。 2項分布モデルの例 まず L(Dolp)a O • i を求めるサンプルコードを以下に示す (aO.i = 0 . 0 1のもとでの 1つの p の実現値(=B j, コード内では THETA ̲P)を生成するためのコード): p r o cs o r td a t a =ALLDATAou t = HISTDAT;byHIST ̲CURREC ̲ I D ;whereHIST ̲CUR=O;nm; d a t aLIKE ̲AO; ̲CUR; s e tHlSTDAT;byHIST r e t a i nLLIKE; AO=O.01;THETA̲P ヰ 佃d ( " b e t a ", 1 ,1 ) ; t .HISTCURt h e nd o ;LLIKE=O;e n d ; i f f i r s 即d f l : ' b i n o m i a , ' lX, THETA ̲ P , N); LLIKEO=1o LLIKE=LLIKE+LLIKEO; t .HIST̲CURt h e nd o ; i f 1 a s LIKEAO= 回 p (AO*LLI 阻); o u t p u t ; e n d ; nm: , 途中の計算を尤度ではなく対数尤度を用いて行うことにより,数値計算上の不安定性の回避を試みている。 実際は以下の手順を踏む: 1 . THETAPをM(J 回発生させる。 Ma のもとでの 2 . それぞれの THETAP の値に対して,全ての aO.i = O/Ma, l/Ma, . . . , (Ma一 l)/Ma, Ma/ L(Dolp)a O • i を計算する (M(J x( Ma+1 ) 通りの計算が必要になる)。計算結果は別レコードにアウトプッ トする。 3 . UNIVA 則 ATE プ ロ シ ジ ャ な ど で , 共 通 の a O . i t の平均値を得る。すなわち, ごとの L ( D o l p ) ao . 9 0 . i( i= 0, …, Ma) を得る。 4 . 9 0 . i を値として持つ l変数のデータセット M A Tlを作成する。レコード数は (M α+1) となる。なお 3 . において平均値以外の記述統計量も求めて複数の変数として M A Tlに格納するのなら,積分のシミュレ ーションによる近似に関する診断の一助になる。 Tlを (M )x1行列と見立てて FCMPプロシジャから読み込む。 5 . MA a+ 1 1 . と 2 . においては,複数の p の実現値,複数の α ω における,過去のデータに関する複数のオブザベー ションに対する処理となる。よってコンピュータのリソースが許すのなら SQLプロシジャなどでデカルト積 の形のデータを作っておくことにより,比較的シンプルなプログラムを書くことができる。 (・IDo) の実装のサンプルコードである(マクロ変数 M Aに Ma が格 以下は FCMPプロシジャによる関数 o 納されているものとする): ‑ 5 4 6 ‑

557.

p r o cfcmpoutlib=WOR K .TEMP.G; f u n c t i o nG(AO); 汀a yMAT2[%eval(& M ̲A .+1 )1 ,1 ]/n o s y m b o l s ; a RC=read̲array("MA Tl , " MAT2); I̲AO=AO*(&M̲A.)+I; I̲AO̲R=ceil(AO*(&M̲A.)+ 1 ) ; I̲AO̲L=floor(AO*(&M ̲A.)+1 ) ; ] ; Y̲L=MAT2[I̲AO̲L,I ] ; Y̲R=MAT2[I̲AO̲R,I ;e n d ; i f1AO L=I AO Rt h e nd o ;Yニ Y L e l s ed o ;Y=(I̲AO‑I̲AO̲L)ペ Y̲R‑Y̲L)/ ( I ̲AO̲R‑I̲AO L)+Y ̲L ;e n d ; ← r e t u m ( Y ) ; e n d s u b ; r u n ; o p t i o n sc m p l i b=WORK.TEMP; 最後の o p t i o n sステートメントにより,関数 G が使用可能になる。 以下が MCMCプロシジャの使用に関するサンプルとなる: p r o cmcmcdata=ALLDATA; parmsP0 . 5 ; parmsAO0 . 5 ; p r i o rP‑b e t a (1 , 1 ) ; p r i o rAO‑b e t a ( l, 1 ) ; , ' lY,P , N ) ;e n d ; if(HIST̲CUR=O)t h e nd o ;LLIKE=AO*logpdf('binomia i f(HIST ̲CUR ニo andREC ID 1 )t h e nd o ;LLIKE=LLIKE‑log(G(AO));e n d ;/*この行のみ追加*/ 二 if(HIST̲CUR=I)t h e nd o ;L L I K E = l o g p d f ( ' b i n o m i a l ', Y, P, N ) ;e n d ; modelg e n e r a 1 ( L L I K E ) : n m I b r a h i m ‑ C h e n型 PowerPriorのコードから l行のみ追加されている。線形補完による積分計算の近似は MCMC サンプラー内でも行うことは可能と思われるが,コードが煩雑になることは明らかなため,関数呼び出しを 行う方法を採用した。 4 . 数値例 本節では 3節で提示した方法論について, 2項分布モデ、ルのもとで例示する。 4 . 1 シナリオ及び M C M Cの設定 例示には 3節で実装方針を示した 2項分布モデ、ルを用いる。表 3に例示で用いた仮想、データを示した。シ ‑ 5 4 7 ‑

558.

ナリオ 1 ‑ 2, 1 ・4 ,2 ‑ 2,2 ‑ 4は文献[10 ] で示されているものである。現象をより理解するため,更にシナリ オ1 ‑ 1, 1 ・3 ,2・1 ,2・3を追加した。 SASコード実装における各種パラメータについては表 4に示した。 表3 : 仮想データ 過去のデータ 現在のデータ ( x o / n o ) ( x / n ) 1 ‑ 1 6 / 3 0 6 / 3 0 過去と現在のデータが閉じ性 1 ‑ 2 2 0 / 1 0 0 2 0 / 1 0 0 質を持つもとでデータ量が異 l 1 ‑ 3 6 0 / 3 0 0 6 0 / 3 0 0 なる。 1 ‑ 4 2 0 0 / 1 0 0 0 2 0 0 1 1 0 0 0 2 ‑ 1 3 / 3 0 6 / 3 0 過去と現在のデータが異なる 2 ‑ 2 1 0 / 1 0 0 2 0 / 1 0 0 性質を持つもとでデータ量が 2 ‑ 3 3 0 / 3 0 0 6 0 / 3 0 0 異なる。 2 ‑ 4 1 0 0 1 1 0 0 0 2 0 0 / 1 0 0 0 シナリオ 解釈 表4 :SASコード実装における各種パラメータ ノ号ラメータ 値 M a :g ( ・)の近似の細かさ 1 0 0 0( a o, o=0, 000, aO, l =0 , 001," aO, 999 = 0 . 9 9 9, a O , 1000 = 1 .000) Mo:積分を近似するシミュ 1 0 0 0 0 0 レーションの繰り返し数 MCMCの b u r n ‑ i nの長さ 10000 MCMCのチェーンの長さ 1 0 0 0 0 0( b u r n ‑ i nを含まず) MCMCにおける t h i n n i n g t h i n n i n gは行わない 4 . 2べき数を確率変数とした Power Priorの事後分布 本節では以下の 3つの PowerPriorを用いて例示を行う(<>内は略号): > 2項係数を含まないIbrahim‑Chen型 PowerP r i o r< I C N > . 。事前分布の尤度関数は, 2項係数を含まない 以下となる: L Do l p )=p Y o ( 1 ‑p ) n o ‑ Y o 1( > > 2項係数を含む Ibrahim‑Chen型 PowerP r i o r<ICY> ,。事前分布の尤度関数は 2項係数を含む以下となる: Lz(Dolp)= n o ! pYO(1‑p)町 一Y o Y o l( no‑y o ) l l p ),L2(Do l p )のいずれを用いても同じ分布となる。数 > > NormalizedPowerP r i o r<NPP>. 。理論上 L1(Do p ) を用いた。 値計算においては L2(Dol 文献 [ 1 0 ] では ICN と NPPについて例示がなされている。これらの PowerP r i o rにおいては,基準化定数 5 4 8 ‑ ー

559.

を無視すれば α。の事後分布の周辺密度関数を r 関数で表現することができる。よって現在のデータが得ら れた後の確率変数 α。に関して,一定の区間内の値を取りうる確率や,モーメントなどの計算を l次元の数 値積分で行うことが可能となる。 表 5に各シナリオについて 3つの PowerP r i o rを用いたもとでの α。の事後平均と 95% 信用区間を示した。 以下の傾向が読み取られる: 》 いずれのシナリオにおいても事後平均は ICN,ICY,NPPの順に大きくなる。 》 過去と現在のデータが同じa性質を持つ場合(シナリオ 1-1~1-4) , ICNは標本サイズが小さいもとでも α。の事後分布は 0に近い値をとりがちであり,襟本サイズが大きくなるにつれて分布は 0に収束する。 一方 NPPにおいては標本サイズに関わらず平均は 0 . 5を上回り,信用区間幅もほぼ一定である。 ICY は lCNと NPPの間の結果となった。 》 過去と現在のデータが異なる性質を持つ場合(シナリオ 2・1 ~2-4) ,標本サイズが大きくなるにつれて 事後分布は 0に収束する。ただし ICNは標本サイズが小さいもとでもすで、に事後平均が小さい値であ る一方, NPPは標本サイズの増加に伴い事後平均が急速に 0に接近する。 ICYは ICNと NPPの聞の 結果となった。 :a oを確率変数とした PowerP r i o rのもとでの α。の事後平均及び 95% 信用区間(括弧内) 表5 シナリオ 2 項係数を含まない o r m a l i z e d Power P r i o rI 2項係数を含む l b r a h i m ・ Chen N r i o r( I C Y ) I b r a h i m ‑ C h e n型 PowerP r i o r 型 PowerP (NP P ) ( I C N ) l1 0 . 0 6 6( 0 . 0 0 2, 0 . 2 4 0 ) 0 . 3 4 0( 0 . 0 1 0, 0 . 9 2 5 ) 0 . 5 6 8( 0 . 0 5 9, 0 . 9 8 1 ) 1 ‑ 2 0 . 0 2 0( 0 . 0 0 0, 0 . 0 7 4 ) 0 . 3 0 1( 0 . 0 1 0, 0 . 8 9 4 ) 0 . 5 7 1( 0 . 0 6 8,0 . 9 8 0 ) 1 ‑ 3 0 . 0 0 7( 0 . 0 0 0,0 . 0 2 4 ) 0 . 2 6 9( 0 . 0 0 8,0 . 8 4 9 ) 0 . 5 7 7( 0 . 0 7 2,0 . 9 8 3 ) 1 ‑ 4 0 . 0 0 2( 0 . 0 0 0, 0 . 0 0 7 ) 0 . 2 3 9( 0 . 0 0 6, 0 . 8 0 2 ) 0 . 5 7 9( 0 . 0 7 4,0 . 9 8 0 ) 2 ‑ 1 0 . 0 9 1( 0 . 0 0 2,0 . 3 4 0 ) 0 . 3 0 3( 0 . 0 0 9,0 . 9 0 6 ) 0 . 5 2 4( 0 . 0 4 60 . 9 7 5 ) 2 ‑ 2 0 . 0 2 8( 0 . 0 0 1, 0 . 1 0 2 ) 19 7( 0 . 0 0 5, 0 . 7 5 1 ) 0. 0. 43 1( 0 . 0 3 0, 0 . 9 6 0 ) 2 ‑ 3 0 . 0 0 9( 0 . 0 0 0,0 . 0 3 4 ) 0 . 0 9 0( 0 . 0 0 2, 0 . 3 7 8 ) 0 . 1 9 8( 0 . 0 1 1, 0 . 7 1 7 ) 2 ‑ 4 0 . 0 0 3( 0 . 0 0 0, 0 . 0 1 0 ) 0 . 0 2 7( 0 . 0 0 1, 0 . 1 0 2 ) 0 . 0 4 5( 0 . 0 0 3, 0 . 1 4 8 ) 同 司 また表 6において, p の事後平均と 95% 信用区間を示した(なお文献 [ 1 0 ]では p の事後分布については 特に触れられていなし、)。傾向を以下にまとめた・ 》 標本サイズの小さいシナリオでは事後平均が 0 . 2を超えているものがある。これは p の事前分布が 8(1, 1 ) であるためであり(試行を 2回行し、 l回成功した場合のデータと等価の情報量。文献 [ 8 ] など に解説あり),その影響が過去,現在のデータに比べて打ち消されていないためである。 》 過去と現在のデータが同じ性質を持つ場合,事後平均は ICN,ICY,NPP間で大きくは違わないが, 信頼区間の幅は ICN,ICY,NPPの順に狭くなってし、く。表 lの結果に示される通り,この順に過去 のデータの情報をより多く取り込むためである。 》 過去と現在のデータが異なる性質を持つ場合,標本サイズを大きくするにつれ, ICNは 0 . 2より大き し、値から 0 . 2に近づいていくのに対し, ICY,NPPは 0 . 2より小さい値から 0 . 2に近づいていく。また ‑549‑

560.

ICYより NPPの事後平均の値が小さい。これらは表 lにおける α。の事後分布平均により示される, 過去のデータの取り込みの度合の違いに起因する。 α。が大きな値をとるシナリオと PowerP r i o rの組 み合わせほど過去のデータの影響をより受けるため, p の事後平均はより小さな値となる。 ICNは過 , 11 ) の影響のほうが大きいため,事後平均が 0 . 2より大き 去のデータの影響よりも元の事前分布 8( くなったと思われる。 PowcrP r i o r問で α。の事後平均の差が顕著なシナリオ 2 ‑ 1,2 ‑ 2では, p の信頼 区間幅は ICN,ICY,NPPの順に狭くなってし、く。一方, α。の事後分布が 0に近づいているシナリオ 2ふ 2‑4においては, PowerP r i o r間で p の信頼区間幅の違いはほとんどない。 表6 : α。を確率変数とした PowerP r i o rのもとでの p の事後平均及び 95%信用区間(括弧内) シナリオ 2 項係数を含まない 2 項係数を含む I b r a h i m ‑ C h e n Normalized Power P r i o r I b r a h i m ‑ C h e n型 PowerP r i o r 型 PowerP r i o r( I C Y ) (NPP) ( I C N ) 1 ‑ 1 0 . 2 1 7( 0 . 0 9 8, 0 . 3 6 7 ) 0 . 2 1 5( 0 . 1 0 3, 0 . 3 5 3 ) 0 . 2 1 3( 0 . 1 1 0, 0刀 9 ) 1 ‑ 2 0 . 2 0 6( 0 . 1 3 4, 0 . 2 8 9 ) 0 . 2 0 5( 0 . 1 3 9, 0 . 2 8 0 ) 0 . 2 0 4( 0 . 1 4 4, 0 . 2 7 3 ) ・3 1 0 . 2 0 2( 0 . 1 5 9, 0 . 2 4 9 ) 0 . 2 4 4 ) 0 . 2 0 2( 0 . 1 6 2, 0 . 2 0 1( 0 . 1 6 6, 0 . 2 4 0 ) 1 ‑ 4 0 . 2 0 1( 0 . 1 7 60 . 2 2 6 ) . 2 2 4 ) 0 . 2 0 0( 0 . 1 7 8、0 0 . 2 0 1( 0 . 1 8 1, 0 . 2 2 1 ) 2 ‑ 1 0 . 2 1 0( 0 . 0 9 3, 0 . 3 6 1 ) 0 . 1 9 5( 0 . 0 8 8, 0 . 3 3 8 ) 0 . 1 8 2( 0 . 0 8 6, 0 . 3 1 2 ) 2 ‑ 2 0 . 2 8 5 ) 0 . 2 0 3( 0 . 1 3 1, 0 . 2 7 1 ) 0 . 1 9 1( 0 . 1 2 4, 0 . 1 7 7( 0 . 1 1 6,0 . 2 5 6 ) 2 ‑ 3 0 . 2 0 1( 0 . 1 5 7、0 . 2 4 8 ) 0 . 2 4 1 ) 0 . 1 9 4( 0 . 1 5 1, 0 . 1 8 7( 0 . 1 4 3, 0 . 2 3 4 ) 4 2‑ 0 . 2 0 0( 0 . 1 7 6、0 . 2 2 6 ) 0 . 1 9 8( 0 . 1 7 4, 0 . 2 2 4 ) 0 . 1 9 6( 0 . 1 7 2, 0 . 2 2 2 ) 表 lにおける標本サイズの増加に伴う α。事後分布の形状の変化を視覚的に確認するため,図 lに事後分 0,1 ) 上の推定のため,端の推定が若干歪んでいる)。 布のカーネル密度推定の結果を示した(なお有限区間 ( 特に NPPにおいて,シナリオ 1 ・1 ~1-4 において事後分布の形状はほとんど変わらないが,シナリオ 2-1 ~2-4 においては分布が左にシフトしていくことが分かる。 5 . おわりに 本報告では Norma1izedPowerP r i o rの実用的な実装法について,実例を交えて提示した。方法論は FCMP プロシジャでユーザーにより定義された関数を, MCMCプロシジャから呼び出すことが可能であることを活 数の値に対応する積分 用した。関数呼び出しの度に数値積分を行うことを回避するため,予め指定されたヲ l 値を求めておき,関数呼び出しの際には求めてある積分値を線形補完することにより返り値を求めた。積分 計算は,被積分間数の性質を利用しモンテカルロシミュレーションにより求めた。 数値例では, 2項分布モデルのもとで NormalizedPowerP r i o rの性質を示した。そのもとでのパラメータは 0,1 ) と有限なため,提示された方法で比較的安定した結 比率に関する l変数のみで,またその積分範囲は ( 果が得られたと考えられる。しかしパラメータが複数,もしくは積分範囲が無限区間となった場合は,結果 が不安定になる可能性もある。特にモンテカルロシミュレーションによる積分計算の部分については,周辺 7 ]1 3章)と同様の問題に注意する必要がある。 尤度の計算(文献 [ ‑550‑

561.

( a ) ( b ) 50 ー 一 一 時 Scenario1 ‑ 1 ‑‑Sce r 祖r i o1 ・2 ‑‑‑Scenano1 ・3 ・ ・ ・ ・ S cenano1 ‑ 4 40 50 一一‑Scenario2~1 由 一 一 Scena討。 2・2 ‑‑‑Scena 吋02 ・,3 ••..•. Scena 同 。2 ・ 4 40 n 30 30 20 『 0,6 0 . 4 0 . 8 。S 1 . 0 ) (piw ( d ) 幽 一e o 1 . 0 の り 〆︐︑ ( e ) 1 . 5 日告 i 也 市 一 一 Scenano2 ・,1 ‑‑Scer 国n o2 ・ 2 ‑‑‑S c e n a r i o 2 ・ 3 ・ ・ . . . .Scenano2‑4 8i . 1 . 0 6ji 41f九 0 . 5 一 一 一 Scenario11 一 周 ー Scer、 a r i o1 ・2 ・ ‑‑‑S c e n a r i o1 ・3 ••• S c e ra r i o1 ・4 、 0 . 0、 0 . 0 ho 一一一日 マ 品 a 0 . 0 Z 司 ︑ hnu 1 . 0 一 一 一コ︒ 広1 u 内 U u 内 liij!40 4E 0 . 8 、 司 町 一 也、 0 . 6 0 . 4 S c e n a r i o2 ‑ 1 S c e n a r i o2 ・ 2 ‑‑‑S c e ra r i o2 ‑ 3 ••••.• S c e n a r i o2 ・ 4 償 却 町 一 A H A ω‑Scenario1 ・ 1 一一‑Scenario1 ・2 ‑‑‑S c e n a r i o1 ・3 ..•..• S c e n a r i o14 nuE3nu 4I 0 . 2 1,0 0 . 2 0. 4 0 . 6 0 . 8 1 . 0 " U、¥ ' , 、 仁 . . . ‑ ' ‑ : : ‑ ̲ と 」 ー ← z シ 寸、 ‑ ‑ ‑ ‑ ‑ 、 一 二 竺 一 一 一 ‑ . . . : : ミ ミ o 2 J 一~.,~._",~,,,,,,夙--ーーーーヶーー叩_.ーーマ o 町 。 0 . 2 0. 4 0 . 6 0 . 8 1 . 0 図 lα。の事後分布のカーネル密度推定。 (a),(b):2項係数を含まなし、 Ibrahim‑Chen型 PowerPrior(ICN)。 ( c ),( d ) :2項係数を含む Ibrahim‑Chen型 PowerPrior(ICY)o ( e ),( f ) :NormalizedPowerPrior(NPP)。 事 5 5 1 ‑

562.

2項分布モデルの数値例では,過去と現在のデータの性質が同じ場合は, N o r m a l i z e d Power P r i o rが I b r a h i m ‑ C h e n型 PowerP r i o rと比べて,過去のデータの情報をより活用することが示された。一方,過去と現 o r m a l i z e dPowerP r i o rも過去のデータ 在のデータの性質が異なる場合,それぞれの情報量が増えるにつれ, N の情報を活用しなくなる。言い換えれば,過去と現在のデータの違いがよりはっきりするのなら,過去の情 報の活用を控えるという特徴である。このような,過去のデータに対するデータ適応的な重みづけは望まし い特徴と考えられる ( [ 2 ] [ 3 ] [ 1 0 ] )。 N o r m a l i z e dPowerP r i o rを更に発展させさた CommensuratePowerP r i o rも提案されているが([1 ] ),べき数に 加えて新たなパラメータを導入しており,実装にはかなりの工夫が必要になると思われる。よって複雑なモ デルにおいても N o r m a l i z e dPowerP r i o rがデータ適応的な重みづけの性質を持ち,また計算結果の数値的安定 性が受け入れられるのであれば,本論文で示した方法論は有益になると考えられる。 参考文献 [ 1 ]HobbsBP , C a r l i nBP , Mandrekar町 、a ndS a r g e n tO J .( 2 0 1 1 ) .H i e r a r c h i c a lcommensurateandpowerp r i o rm o d e l s i o m e t r i c s,6 7,1 0 4 7 ・1 0 5 6 . f o ra d a p t i v ei n c o r p o r a t i o no f h i s t o r i c a li n f o r m a t i o ni nc l i n i c a lt r i a l s .B YeKa n dS m i t hE P .( 2 0 0 6 ) .E v a l u a t i n gw a t e rq u a l i t yu s i n gpowerp r i o r st oi n c o 叩o r a t eh i s t o r i c a l [ 2 ]OuanY, i n f o r m a t i o n .E n v i r o n m e t r i c s,1 7, 9 5 ‑ 1 0 6 . [ 3 ]OuanY,S m i t hEP ,a ndYeK .( 2 0 0 6 ) .U s i n gpowerp r i o r st oi m p r o v et h eb i n o m i a lt e s to f w a t e rq u a l i t y .J o u r n a l01 A g r i c u l t u r a l ,B i o l o g i c a landE n v i r o n m e n t a lS t a t i s t i c s1 1,1 5 1 ‑ 1 6 8 . 司 o t eont h epowerp r i o r 'byNeuenschwanderB,B r a n s o nM a n d [ 4 ]G a j e w s k iB J .( 2 0 1 0 ) .Commentson An t a t i s t i c si n凡l e d i c i n e,2 9,7 0 8 ‑ 7 1 0 S p i e g e l h a l t e rO J .S [ 5 ]I b r a h i mJGa n dChenMH.( 2 0 0 0 ) .Powerp r i o rd i s t r i b u t i o n sf o rr e g r e s s i o nm o d e l s .S t a t i s t i c a lS c i e 月c e,1 5, 46 ‑ ‑ 6 0 . Ha ndChuH .( 2 0 1 2 ) .B a y e s i a nm e t h o d si nc l i n i c a lt r i a l s :aB a y e s i a na n a l y s i sofECOG仕i a l s [ 6 ]I b r a h i mJG,ChenM, 9 0 .BMCM e d i c a lR e s e a r c hM e t h o d o l o g y,1 2,1 8 3 . E1684andEl6 [ 7 ] 小西貞則,越智義道,大森裕治 ( 2 0 0 8 ) . 計算機統計学の方法 ブートストラップ・ EM アノレゴリズム‑ MCMC‑. 朝倉書応. [ 8 ]Lunn0,J a c k s o nC,B e s tN,ThomasA,a n dS p i e g e l h a l t e r0 ( 2 0 1 2 ) .T h eBUGSB o o k :AP r a c t i c a l ! n t r o d u c t i o nt o y s払 ChapmanandH a l. l BayesianA附 l [ 9 ]N eelonBa n dO'M a l l e yA J .( 2 0 1 0 ) .B a y e s i a na n a l y s i su s i n gpowerp r i o r sw i t ha p p l i c a t i o nt op e d i a t r i cq u a l i t yof c a r e .J o u r n a l0 1 B i o m e t r i c s& B i o s t a t i s t i c s、1、1 0 3 . [ 1 0 ]NeuenschwanderB,B r a n s o nM a n dS p i e g e l h a l t e rO J .( 2 0 0 9 ) .An o t eont h epowerp r i o r .S t a t i s t i c si nM e d i c i n e, 28, 司 3 5 6 2 ‑ 3 5 6 6 . [ 1 1 ]SASI n s t i t u t eI n c .( 2 0 1 2 ) .B a y e s i a nb i n o m i a lmodelw i t hpowerp r i o ru s i n gt h eMCMCp r o c e d u r e .( 2 0 1 4 / 0 6 / 2 7に SASI n s t i t u t eI n c . のウェブサイトにて存在を確認). ‑552‑

563.

多重補完法における P a t t e m‑ M i x t u r eモデルに基づく感度分析 伊藤陽一 l 西本尚樹2 I北海道大学大学院医学研究科医学統計学分野 2北海道科学大学保健医療学部 S e n s i t i v i t ya n a l y s i sw i t ht h ep a t t e m ‑ m i x t u r emodela p p r o a c ht om u l t i p l ei m p u t a t i o n Y o i c h iM.I to l,NaokiN i s h i m o t o 2 n i v e r s i t yofHokkaidoG r a d u a t eS c h o o lofMedicine 1D e p a r t m e n to f B i o s t a t i s t i c s,U a c u l t yo f H e a l t hS c i e n c e s, HokkaidoU n i v e r s i t yo f S c i e n c e 2D e p a r t m e n to f R a d i o l o g i c a lT e c h n o l o g yF 要旨 近年、臨床試験の主要評価項目の解析において、欠測値を考慮、した解析が推奨されている。多重補完 法( m u l t i p l ei m p u t a t i o nm e t h o d s )は、欠測値を補完するモデルを用いて欠測値の補完を行い、欠測値が埋め られた完全データを複数作成し、完全データに対して予定された解析を行い、得られた複数の結果を併 合する手法である。平均値補完など、単一の値を埋めて解析する手法と比較して、バラツキの過少評価 を防ぐことができるため、欠測値を伴ったデータに対する手法として主要な手法のーっとなっている。 しかし、多重補完法では、欠測の補完にあたっては、対象者が観測された値に従って、欠測が起こって i s s i n ga tRandom(MAR)を仮定しており、対象者が欠測値そのものの値に従って欠測が起こ いるとする M M i s s i n gNot a t Random; MNAR))場合には結果にバイアスが入ることが知られている。この っている ( MNARの状況下では、バイアスのない推定値を求めることはできないため、結果変数が欠測にどの程度 の影響を受けているかを調べる感度解析が行われることが多い。 P a t t e m ‑ M i x t u r e モデ、ルは、この感度解 析を行うために提案されているモデ、ルで、ある。 SAS9.4から MIプロシジャに MNARステートメントが a t t e m ‑ M i x t u r eモデ、ルに基づいた感度解析が実行可能となった。本論文では、 MIプロ、ンジャ 追加され、 P における MNARステートメントの使用方法について解説を行う。 キーワード:多重補完法, P a t t e m ‑ M i x t u r eモデル, MIプロシジャ, MNARステートメント はじめに 近年、臨床試験の主要評価項目の解析においては、欠測データが臨床試験の結果に大きく影響を与えるこ I 値を考慮、した解析が推奨されている 1 )。米国食品医薬品局 ( F o o da n dD r u g とが指摘され、欠損J A d m i n i s t r a t i o n ;F D A )が 、 2 0 0 8年に全米研究評議会 ( N a t i o n a lR e s e a r c hC o u n c i l ;N R C ) の専門家ノミネル r e v e n t i o nandtreatmento fmissingdatai nc l i n i c a lt r i a l s "という報告 に対して依頼して作成された "Thep 書においても、欠測データの発生に関する仮定に対する感度解析を行うことが推奨されている 2)。 叩 553‑

564.

欠測の仮定 欠損J Iの仮定は、欠測が共変量 ( X)、補助変数 (V)、結果変数 (Y)のいずれにも依存しない M CAR ( M i s s i n g M i s s i n ga tR a n d o m )、欠測した値にも依存する Completely a tR a n d o m )、観測された値のみに依存する MAR ( MNAR( M i s s i n gNota tR a n d o m )に分類される。条件付分布の記法を用いると、 MNARに関する分布が MARや MCAR のときに、下記のように簡略化されることが分かる。ここで、 VobSは観測された補助変数、 V misは欠測した補 助変数、九 bsは観測された結果変数、 Y misは欠測した結果変数を表す。 M N A R : [MIX, 九bs.Vmis, Y 凡 is] obs, M A R : [MIX, 九bs'Vm山 Yobs, Y MIX, Vobs'九bs, ] mis]=[ M C A R : [MIX, 九bSIVmis, 九bs, Y M ] mis]=[ 欠測値を埋める解析方法 ( S i n g l e imputation,Multiple i m p u t a t i o n ) 欠測値に対して単一の値で補完する S i n g l ei m p u t a t i o nのうち経時的な測定を伴う臨床試験で、広く用いられ ているのが、 LOCF( L a s tO b s e r v a t i o nC a r r yFo r w a r d )法である。 LOCF法は、経時的に観察される結果変数のう ち途中で打ち切りになった症例については、最終観察値をもって、試験終了時点の観察値とするものである。 アルツハイマー病などの QoLS c o r eの自然悪化を伴う疾患に対する薬剤の治療目的は、悪化をできる限り遅 らせることになるが、ある薬剤がプラセボと比較して早期に治療打ち切りが起こるとすると、 LOCF では、 薬剤の方がプラセボよりも、結果が良くなるというバイアスが入る(図 1 )3)。 ! LOCFB i a s 企TEE‑' 首邑喝︑ 鳥 " " 明 ︑ 帯電 真‑¥ ︑ ︑ ︑ ︑ ︑ ︑ ︑ ︑ ¥群 ¥ポ ¥セ ・︑‑フ J o u OU的 出﹄ ¥プ ︑ ︑ ︑ LOCFによって得られた値 LOCFB i a s 時間 図 ILOCFB i a sの概念図 、 MCARの下で、あったとしても、バイアスを生じ得る。また、欠測を単一の値で補 このように、 LOCFは 完するため、欠測に伴う不確実性について考慮できていない。したがって、 LOCF は欠測に対する解析方法 として、全く推奨できない。 LOCF以外の S i n g l ei m p u t a t i o nの方法としては、 BOCF( B a s e l i n eO b s e r v a t i o nC a r r yF o r w a r d )法 、 r e g r e s s i o n i m p u t a t i o n、h o td e c ki m p u t a t i o nなどがある。 BOCF法は、最終観察値ではなく、試験開始時点の値をもって、 ‑ 5 5 4 ‑

565.

試験終了時点の値する方法であるが、 LOCF法と同様に、バイアスが入り得る。 R e g r e s s i o ni m p u t a t i o n法は、 観測されている値を用いて、欠測値を予測する同帰モデ、ルを構築し、予測値によって欠測値を補完する方法 である。 Hotdecki m p u t a t i o n法は、欠測している結果変数以外の変数が類似している症例を選択し、その症例 の結果変数をもって、結果変数の欠測を補完する方法である。どちらの方法も、欠測値を予測するプロセス が妥当であれば、 LOCF法や BOCF法で生じるようなノ tイアスは減少させることができるが、欠測を単一の 値で補完することによるバラツキの過少評価が生じる。 u l t i p l ei m p u t a t i o n法である。 M u l t i p l ei m p u t a t i o n法では、欠測 このバラツキの過少評価を改善する方法が、 M 値の予測分布からサンプリングを行い、欠測値を補完する。補完された完全データに対して通常の解析を実 行する。その操作を複数回実行し、解析結果の平均を取る。この際に、欠測を補完したことに伴うバラツキ u l t i p l ei m p u t a t i o n法の重要な利点は、最終解析に用いられない補助変数を補完モデ についても考慮される。 M ルに用いることができる点である。多重補完I 去における予測分布は、 MARを仮定すると、ベイズ法における 事後分布となる。 感度解析の原理と方法 これまでに紹介した解析は MARを前提としてきた。主要な解析は MARを前提とした解析を行い、観測デ ータの MARからの業離は、 MNARを前提とした解析方法による感度解析で検討されるべきだと考える。解 析の枠組みとして、 2つの仮定を考える。 ( i )欠測データの分布に関する検証不能な仮定と ( i i ) 観測データの分 布に関する検証可能な仮定である。完全データの分布は以下のように分割できる。 [ 九b s ' Y m i s, MIX]= [ 九b s, MIX]X [ Y m i s l九b s, M, X ] Y o b s 'M, X ]が仮定 ( i )に関するもの、[九 b s 'MIX]が仮定( i i )に関するものである。 [ Y m i sl i x t u r eModelアプローチと S e l e c t i o nModelアプローチが提案されている。 感度解析手法としては、 PattemM SAS9.4で追加された MIプロシジャにおける MNARステートメントによって、 P a t t e mM i x t u r eModelアプロ a t t e mM i x t u r eModelの考え方は、欠測のパターン ーチに基づく感度解析を行うことができるようになった。 P が先にあり、そのパターンごとに Y m日の分布が異なるというものである。条件付き分布の記法を用いると以 下のように記述できる。 P a t t e mM i x t u r eModel [ 九b 伽S ρ, } 弘 L ; 弘 ? η m IS, MI 刈 X ]= [ 九b 伽s '} 弘 い 7 も 7 η 1 山 l 問 M, 幻 X ]X [MI 刈 X l 山引 [ Y O b S, Y MIX]=[ Y m i s l九b s, M, X ]X [ 九bsIM, X ]X [ M I X ] m i s, 例として、結果変数が lつで、補助変数がない場合について示す。 P a t t e mM i x t u r eModelの場合、観測できるかできなし、かで、結果変数Yの期待値が異なる。 E(YIR=0 )=E(Y lR =1 )+f : . 。 μ =μ 1+f : . ー5 5 5 ‑

566.

この期待値の違いを表すAが感度解析ノ ζラメータである。より一般的には、関数gO を用いて、下記のように 書ける。 。 μ =g‑1(g( μ 1 )+企) 完全データにおける結果変数の期待値μは、欠測確率を πとすると以下のようになる。 μ=πμ1+(1π)g‑1(gω1)+企) この式において、んと πを観測データから得られたんと先に置き替え、企ごとに μを求めることによって、感度 解析を行う。 SASの M Iプロシジャにおける Pattern‑MixtureModel SASでの簡単な解析例を示す。臨床試験において、ベースライン共変量%と割付群 T r t ( 1 :実薬 0 :プラセボ)に は欠測がないものとする。主要評価項目九に対して、下記の解析を行うことを考える。 r t+βz九 九=μ +s 1T このとき、 s 1が薬剤の効果を推定していることになる。臨床試験においては、薬剤j に効果がないという仮 定のもと解析を行うことが自然なので、九の欠襖IJに対しては、プラセボ群のデータのみを用いて埋めること が妥当である Q これはプラセボ群のデータのみを用いて、 P a t t e mM i x t u r eModelにおける l l =0の下での補完を 考えていくことになる。欠測データの構造としては、以下のようになる。 yO y 1 o1 0 . 5 2 1 2 1 1 . 3 6 0 4 o8 . 5 8 7 18 . 5 1 7 8 o 9 . 3 2 7 4 o 9 . 7 5 1 9 4369 o 9 . 3 4 9 5 9. 11 1 . 5 1 9 2 1 3 . 2 3 4 4 11 0 . 7 8 4 1 9 . 7 7 1 7 1 0 . 9 4 0 7 110.145510.8279 8 . 2 4 6 39 . 6 8 4 4 'Obs丁目 1 2 3 4 5 6 7 8 9 10 このとき、下記のプログラムによって、プラセボ群のみを用いた多重補完を行うことができる。 p r o cmidata=Monols e e d = 1 4 8 2 3n i m p u t e = 1 0out = o u t e x I 5 ; c l a s sT r t ; monotoner e g( l d e t a i l s ) ; mnarm o d e l (y l/modelobs=( T r t = ' 的); varyOy l ; r u n ‑556‑

567.

MNARステートメントでは、単調な欠測か、欠測が他の変数の条件付き分布として特定できることを前提 としているので、 MONTONEステートメントか FCSステートメントを同時に指定する必要がある。 MNAR ステートメントの modelオプション内の modelobsによって、どの対象者を用いて補完するかを指定すること r t= 0のプラセボ群のみを用いて補完するよう指定している。また、補完に用いる変数 ができる。ここではT は九と九のみである。 Methodとして、 Monotoneが指定されており、 Monotoneステートメントで r e gオプションが指定されてい るので、 MIプロシジャは回帰モデ、/レに基づいて九補完を行っている。 TheMIProcedure ModelI n f o r m a t i o n WORK.MON01 DataSet Monotone Method 10 NumberofImputations Seedf o rrandomnumbergenerator14823 MonotoneModelS p e c i f i c a t i o n 'Method Regression Imputed V a r i a b l e s y 1 M i s s i n gd a t apa 肘 m テーブルでは、それぞれの m i s s i n gp a t t e mの頻度が集計される。下記の例では、 25%の欠 測が生じていることが分かる。 MissingDataP a t t e r n s GroupyOy1FreqPercent 1XX 2X. GroupMeans yO y1 75 7 5 . 0 0 9.99699310.709706 25 25.0010.181488 MNARステートメントで modelオプションを指定しているため、以下の出力がなされる。 ObservationsUsed f o rI m p u t a t i o n ModelsUnderMNAR Assumption ImputedObservations V a r i a b l e y 1 T同 =0 ー557 ・

568.

D e t a i l sオプションを指定しているため、補完に用いた回帰モデルの回帰係数が出力されている。 R e g r e s s i o nM o d e l sf o rMonotoneMethod I m p u t e d E f f e c t O b s ‑ D a t a I m p u t a t i o n V a r i a b l e 2 4 3 5 6 7 8 9 1 0 y 1 I n t e r c e p t‑ 0 . 3 0 1 6 9 ‑ 0 . 1 7 4 2 6 5 ‑ 0 . 2 8 0 4 0 4 ‑ 0 . 2 7 5 1 8 3 0 . 0 9 0 6 0 1・0. 45 7 4 8 0 ‑ 0 . 2 4 1 9 0 9 ‑ 0 . 5 0 1 3 5 1 ‑ 0 . 0 5 8 4 6 0 ‑ 0. 43 6 6 5 0 ‑ 0 . 5 0 9 9 4 9 y 1 y O 0 . 6 9 3 6 4 0 . 6 4 1 7 3 3 0 . 6 2 9 9 7 0 0 . 5 0 7 7 7 6 0 . 7 5 2 2 8 30 . 8 3 1 0 0 10 . 9 7 0 0 7 5 0 . 7 2 4 5 8 4 0 . 6 2 3 6 3 8 0 . 5 6 3 4 9 9 0 . 6 2 1 2 8 0 補完された結果は以下のようになり、 MIANALYZEプロシジャによって解析可能なデータセットが作られる。 Obs̲lmputation̲ T同 yO y1 1 010.521211.3604 2 1 08 . 5 8 7 1 8.5178 3 1 0 9.3274 9.5786 4 1 0 9.7519 9.6060 5 4369 1 0 9.3495 9. 6 1 111.519213.2344 7 1 110.784110.7873 8 1 1 9.771710.9407 9 1110.145510.8279 10 1 1 8.2463 9.6844 ~* 0の下での補完例については、講演にて紹介する。 参考文献 1 . L i t t l eRJ,D ' A g o s t i n oR CohenM L, D i c k e r s i nK, EmersonSS, F a r r a rJT ,e ta . lThep r e v e n t i o nandt r e a t m e n t 吟 ofm i s s i n gd a t ai nc l i n i c a lt r i a l s . N Engl JMed. 2012 Oct4 ; 3 6 7 ( 1 4 ) : 1 3 5 5 ‑ 6 0 . PubMedPMID: 23034025. Epub 2 0 1 2 / 1 0 / 0 5 .e n g . 2 . N a t i o n a lR e s e a r c hC o u n c i l( U . S . ) .P a n e lonH a n d l i n gM i s s i n gDatai nC l i n i c a lT r i a l s .,N a t i o n a lR e s e a r c h C o u n c i l( U . Sふ CommitteeonN a t i o n a lS t a t i s t i c s .,N a t i o n a lAcademiesP r e s s( U . S . ) .Thep r e v e n t i o nandt r e a t m e n tof m i s s i n gd a t ai nc l i n i c a lt r i a l s .Washington, D . C . :N a t i o n a lAcademiesP r e s s ;2 0 1 0 .xv ,144p .p . 3 . , TempleR .Thep r e v e n t i o nandt r e a t m e n tofm i s s i n gd a t ai nc l i n i c a lt r i a l s :anFDAp e r s p e c t i v eon O ' N e i l lRT t h ei m p o r t a n c eofd e a l i n gw i t hi t .C l i n i c a lpharmacologyandt h e r a p e u t i c s .2012M a r ; 9 1 ( 3 ) : 5 5 0 ‑ 4 .PubMedPMID: 22318615. ‑558 咽

569.

問、政問伝J詞と弘通報議暫;~j::..,-.. 2 0 1 9 隠れマルコフモデルによる予測モデルの 構築 稲葉洋介/株式会社新日本科学 宮岡悦良/東京理科大学 C o n s t r u c t i n gp r e d i c t i o nmodel byHiddenMarkovModel YosukeInaba/ShinNipponBiomedical L a b o r a t o r i e s EtuoMiyaoka/Tokyou n i v e r s i t yo fscience 臨腕時大学に~~~弘の実証一触 要旨: 隠れマルコフモデルを用いた予測モテ、 lレ を SAS/ lML を用いて実装し、実際のデータに適用した。 F o r e c a s t i n gs t a t ep r e d i c t i o nh i d d e nmarkovmodelf l u ‑ 5 5 9 ‑ 9 W l J

570.

~I~9 │医療政府間大学による工コシステ切実証 f:H.s:3:紬 隠れマルコフモデ、ルとは ・観測不可能なマルコフチェーンの状態列 (ParameterProcess) 、及び各状態をパラメータに持つ確率分布からの観測可能 な出力により構成される確率モデル 演⁝測 績政府郎知による勾?スデ必読んや絡会 )川能 能⁝可 可⁝不 観一観 力一態 出⁝状 I 9 W l J 定義:マルコフチェーン (1) c(t) ={Ctε{l .....m}ltεN}離散確率変数列 任意の tE Nに対して C (けが以下を満たす時、 C(t) をマルコフチェーンと 呼ぶ。 Pr(C +1I c(t))=P r(C +1 I ct ) t t マルコフチェーンのパラメータ ヴリ:=Pr(C , + tニjI C、三 i ):推移確率 (特にウ 'l̲Jが sに依存せずに決まる時、このマルコフチェーンを h o r n o g e n i o u s と呼ぶ。) Fリニヴリ:推移確率行列 ‑560 帽

571.

医 療 政 府 自 治 体 大 … ヱM 弘の実証…山総会 . 定義:マルコフチェーン ( 2 ) d:={ P r ( C [ニ 1 ) .P l ・ ( C l= 2 )・ …. P l ・ ( 日 = m)}:初期確率 ※ 1.=(19・ …1 )として o 1= 1 特 に 向 士 dの時、このマルコフチェーンを定常的 ( s t a t i o n a I 川 と 呼 ぶα 戸 、 政 府 ・ 郎 大 手i 平均尚一一 ~9 定義:ポアソン分布 定数人 >0に対し、自然数を値にとる確率変数 X が以下を満たす時、 X は ポアソン分布に従うと言う。 、 L‑λ =元「 p(X) 以後、平均 λのポアソン分布を ? o i88071(入)と表記する。 性質・ポアソン分布は再生性を持つ。すなわち x~ ?oi!ison(入).Y~?ο18 .9 ‑ 5 6 1 ‑

572.

1 1 坊 主 主 三11 u と よ る l医 制 問 台 体 、 大 学 ~I]9 付 金 定義:ポアソン隠れマルコフモデ、ル t. c マルコフ性を満たす P n r a r n e t e rP r o c e s s t x t : c からの出力 f f この時、 {Ct.Xt}は以下を満たす時に穂れマルコフモデルと呼ぶ。 Pr(C C(t~l)) tI Pr(X X( tー 1 ) .C( t ) ) tI = Pr(C C(t~l)) tI ( 1 ) ェ Pr(X tIC(t)) ( 2 ) 特に C( t ) がポアソン分布に従う時、ポアソン曙れマルコフモデルと呼ぶ。 1 1 ] 如 ー 付 金 m ! 二i if f ! ? J W 医療、政府・自治体、矧羽工コジズ歩 一 ポアソン隠れマルコフモデルの パラメータ 入 :ニ(入 1: …司入 r n ) 各状態のポアソン分布のパラメータ rij :=(川) 推移確率行列 δ:ニ ( 1 ' 51・… J川 ) 初期確率 ‑ 5 6 2 ‑ I

573.

医瞭政府明大学問ロシステムの実証一総会 W J 9 予測分布 ( f o r e c a s td i s t r i b u t i o n )( 1 ) 11>0として、 Pr(X ' )ニ a Pl) = T+h =:1・ IX(T Pr(X(Tlニ a ( T l XT+h 二 : 1 ') Pr(X(T)= a ( T l ) hp αTr (x)l αT1 φT:ニ αT/α T 1 ' として、 Pr(XT+h =:1・ IX(T)=a ( T ) )=のT r " p ( : r ) l ' l医 療 政 府 関 大 学 に よ る ヱ コ シ ス テ ム 尚 一 … ~I]9 予測分布 ( f o r e c a s td i s t r i b u t i o n )( 2 ) 従って、予測分布は L~i(h)Pi(X) Pr(XT+h=川 X(T)=a ( T l )= ;=1 ここで、乙はベクトル φ Tr"の 1番目の要素。 ‑ 5 6 3・

574.

|医問問中学はる~の実証一総会 ~I]9 状態予測 (stateprediction) Pr(CT+! t =iI X(T)=x(T))=αTrh, ( i)/LT=φ Tr", (i ) ただし、 A, (i )は行列 A の t番目の列を示す。 日 ι γ 1 1 晴夫会:川 e 闘、政府・自治体、大学によるロジ税傑笹山~会 Reference • WZ u c c h i n iandLL .MacDonald(2009).HiddenMarkovModels f o rTimeS e r i e s, CRCP r e s s . • RDurbin, SEddy , AKorgh, andG M i t c h i s o n ( 1 9 9 8 ) .B i o l o g i c a l SequenceA n a l y s i s : P r o b a b i l i cModelso fP r o t e i n sandN u c l e i c A c i d s .CambridgeU n i v e r s i t yP r e s s . • Baum, L .E .,P e t r i e, T ., Soules, G.andWeiss,N .( 1 9 7 0 ) .A maximizationtechniqueo c c u r r i n gi nthes t a t i s t i c a la n a l y s i so f n n . M a t h .S t a t i s. t p r o b a b i l i s t i cf u n c t i o n so fMarkovc h a i n s .A 41, 164・171 小西貞貝1 ],越智義道,大森裕浩.計算統計学の方法朝 倉書庖 ‑ 5 6 4 ‑ 目 ~llJ[1

575.

ICLIFETESTプロシジャを用いた区間打切りデータの解析と 既存プロシジャによる結果との比較 西本尚樹、伊藤陽一 北海道科学大学保健医療学部診療放射線学科 北海道大学大学院医学研究科医学統計学分野 I n t e r v a lc e n s o r e dd a t aa n a l y s i sa n di t sa t t r i b u t eu s i n gICLIFETESTPROCEDURE o i c h iM.I t o2 NaokiN i s h i m o t o1,Y 1 .D e p a r t m e n tofR a d i o l o g i c a lT e c h n o l o g 司 . yF a c u l t yo fH e a l t hS c i e n c e sHokkaidoU n i v e r s i t yofS c i e n c e 2 .D e p a r t m e n to fB i o s t a t i s t i c s,U n i v e r s i t yo fHokkaidoG r a d u a t eS c h o o lofM e d i c i n e 要旨 医薬品の臨床試験において、生存時間を推定する際に打ち切りの取扱方法によって結果にバイアスが 入る可能性がある。生存時間解析において打ち切りは、右側打ち切りとして扱われる事が多いが、非致 死性のアウトカムであった場合、左側打切り、もしくは区間打ち切りとなることがある。区間打ち切り とは、定期的に検査を受けていである時点の検査が陽性であったとき、その前の時点の検査で陰性であ った時点と、陽性となった時点のどこかでイベントが起こっているが、詳細なイベント発生時点が特定 できない状態とされる。この現象は、悪性度の低い腫療や糖尿病の合併症である網膜症等、イベントの 発生が捕らえづらい評価項目で起こる。 医学分野においては、 LIFETESTプロ、ンジャを用いて、ノンパラメトリックな生存時間の群間比較が 行われているが、区間打切りのデータを解析するためには、 LIFEREGプロ、ンジャでパラメトリックな手 法を使わざるを得なかった。 このほど SAS9.4より、 ICLIFETESTプロ、ンジャが追加された。 ICLIFETESTプ口、ンジャは、区間打切り のデータに対して、ノンパラメトリックな推定を可能にするプロ、ンジャである。これによりLlFEREG プロシジャで指定する W e i b u l l分布等のパラメトリックな分布を仮定することなく、生存時間の比較を 行うことが可能となった。本論文では、 ICLIFETESTプロ、ンジャの使用方法と性質について解説する。 キーワード:生存時間解析、区間打切り、 ICLIFETESTプロ、ンジャ 1.北且 円万司、 医薬品の臨床試験において、生存 H 寺聞を推定する際に打ち切りの取扱方法によって結果にバイアスが入る 可能性がある。生存時間解析において打ち切りは、右側打ち切りとして扱われる事が多いが、糖尿病におけ る網膜症など、非致死性のアウトカムで精密検査を受けて陽性と判定される場合など、左側打切り、もしく は区間打ち切りとなることがある 1)。区間打ち切りとは、定期的に検査を受けていて、ある時点の検査が陽 ‑ 5 6 5 ‑

576.

性で、あったとき、その前の検査で陰性であった時点と、陽性となった時点のどこかでイベントが起こってい るが、詳細なイベント発生時点が特定できない状態とされる。この現象は、悪性度の低い腫療や糖尿病の合 併症である網膜症、思春期の開始時点等、イベントの発生がとらえづらい評価項目で起こる。また工学の領 域では、飛行機の部品の破損、原子炉の圧力管、鉄道の枕木の破損等の定期的な点検によって発見されるイ ベントが該当する。区間打切りには、 CurrentStatus Dataと呼ばれるデータも存在する。これは、ある個 人や個体に対して観察期間中一度しか観察を行わない場合を指しており、被験者 1の観察時点、を C iとすると、 0,C i ]または ( C i,∞)のどちらかであるという状態を指す 2)。すなわち、被験者 1についてイベ 区聞が ( ントの発生時間 Ti が Ti~Ci であれば、 (0, C i ] の区間となるのに対して、 C iくT iであれば ( C i,∞)となる。 これは、実験動物にできた腫療を観察するのに解剖しなければいけない等が該当する。 医学領域においては、 LIFETESTプロシジャを用いて、ノンパラメトリックな生存時間の群間比較が通常行 われるが、左側打切り、区間打切りのデータを解析するためには、 LIFEREGプロシジャでパラメトリックな 手法を使わざるを得なかった。このほど S A S 9 .4より、 ICLIFETESTプロシジャが追加された。 ICLIFETESTプ ロシジャは、区間打切りのデータに対して、ノンパラメトリックな推定を可能にするプロシジャである。こ れにより LIFEREGプロシジャで指定する Weibull分布等のパラメトリックな分布を仮定することなく、生存 時間の比較を行うことが可能となった。 2 .目的 本論文の目的は、 ICLIFETESTプロシジャの使用方法について解説し、その特徴を明らかにすることとした。 3 .方法 3 . 1区間打切りデータの定式化 i ニ1 …nまでの被験者 iが、ある定められた期間 0=αω くαi 1く…く α im< ∞に観察されたとする。被験者 1 1 が時点、 a j, j ‑ 1で、イベントを起こさなかったとすると、被験者 iは次の時点 a i jで、観察され、区間α (l,] 川 ij で、イ ベントが起こったか否かを判定される。被験者 iの生存時間を T iとすると、区間打切りは区間 ( L i,R i ]に対 して、以下の関係を持って表現される。 L iく Ti壬 R i これにより、 F j ( t )を生存時間 T iの累積分布関数として、 N人の独立した被験者から得られる尤度関数 Lは 、 日(Fi(LJ一帆)) L= で表される。データ { ( L i,R i],ド 1 , … ,n )から、生存曲線が S( t )=Pr( Ti >t )のもとで、非重複区間 { ( q 1, p 1 J, ・ ・ , ( q m, p m ] )が導かれる。生存関数のノンパラメトリック最尤推定量 ( n o n p a r a m e t r i cmaximum likelihood 巴日 timator、N P M L E )は、非重複区間 ( q 1, p 1 J, … , ( q m, p m ]は、より少ない時にのみ減少する。従って、 J u m p probabilitiesは、これらの区間のみで推定する必要がある 3.4)。生存関数は、これらの非重複区間の一部ま た全部で減少し、非重複区間以外では、一定であることが仮定されている。応答変数である生存時間に対し て打切りのメカニズ、ムが独立であり、個々の被験者が最終的にはイベントを起こすと仮定すると、生存時間 Lυ R i l, j= 1, …, m}の尤度は、疑似パラメータである e j { め=Pr(qjく T壬 Pj),j= 1, …, m}から データ{町 ε( ‑ 5 6 6 ‑

577.
[beta]
1
=

構成される。パラメーターベクトノレ9=(
91,
.
.
.
.
9
9
j=1という制約の下で、尤度 L(O)を最大化す
m)は、エ 1
るように推定される。

刷=[~,イ
ここで、 zリは、 (
q
j
.p;Jが (L j • RJに含まれていれば lを、含まれていなければ 0を示す。最尤法は、 {
{
}
1
'.
.
.
.{
}
m
}を
推定し、生存関数のノンパラメトリック最尤推定量を決定する。
(

t<q1

1

S
(
t
)= ~)'j
(
}
k
I
"‑'k=j+1
.
¥
0

Pj:
5t:
5qj+1

t~ Pm

P
e
t
oは、制限付きニュートン・ラフソン法を使用することで、対数尤度の最大値を探索する方法を提唱した
。しかし、疑似パラメータが多い場合、最適化できない。また、ニュートン・ラフソン法では、グ、ローパル

3
)

な最大値が保証されない。 T
u
r
n
b
u
l
lは、尤度関数の最大化は、 s
e
l
f
‑
c
o
n
s
i
s
t
e
n
c
yequationと等価であるこ
とを証明し、 EMアルゴリズムを用いて解が得られることを示した 430

e
,
=~す
‑ .n

Z
i
j
8
j

) nム"';=1L
l
:
'
=1Z
i
k9
k

3
.
2I
C
L
I
F
E
T
E
S
Tプロシジャの文法とサンプルデータの解析
1
C
L
I
F
E
T
E
S
Tプロシジャの文法を以下に示す。 TIMEステートメント以外は、他のプロシ、ジャで使用されてい
る記法とほぼ同様である。特徴的な記法は、 TIMEステートメントで、引数となるには、区間の開始時間及び
終了時間を指定する。開始時刻を欠測としてピリオドを指定した場合には、左側打切りとなり、いわゆる
c
u
r
r
e
n
ts
t
a
t
u
s dataと呼ばれる研究開始時点から一度のみの計測を行うデータとなる。また、終了時点を
欠測としてピリオドを指定した場合には、右側打切りとなり、解析時点でイベントを起こしていない状態を
表現する。開始時点、終了時点が共に欠測している場合には、その区間を欠測として扱う。
P
R
O
CI
C
L
I
F
E
T
E
S
T<
o
p
t
i
o
n
s
>;
BYv
a
r
i
a
b
l
e
s;
FREQv
a
r
i
a
b
l
e;
STRATAv
a
r
i
a
b
l
e
s
o
p
t
i
o
n
s
>;
TESTv
a
r
i
a
b
l
e く/
TIME (
v
a
r
i
a
b
l
e
.
v
a
r
i
a
b
l巴)
I
C
L
I
F
E
T
E
S
Tステートメントには、 DATA=オプション以外に、 I
M
P
U
T
Eオプションがある。 I
N
P
U
T
Eオプションは、
欠測データの補完法の一つである m
u
l
t
i
p
l
ei
m
p
u
t
a
t
i
o
nに対して、標準誤差や一般化ログランク統計量に対
する共分散行列を推定するために、 s
e
e
dなどの詳細を指定するものである。 I
M
P
U
T
E
(
S
E
E
D
=
X
X
X
X
)のように、
XXXXの部分を指定する。デフォルトでは、ランダムに指定される。
また、生存関数の推定量を計算する方法は、上記で述べたように種々の方法が提案されており、 I
C
L
I
F
E
T
E
S
T
町B
ULL、I
C
Mまたは EMICM
プロシジャにおいても、推定方法を指定することができる。 METHOD=オプションで TU

‑
5
6
7
578.

のいずれかを指定することができる。 T U R N B U L Lを指定すると、 T u r n b u l lが論文の中で提案した方法で、計算 する 4)。これは、 EMアルゴリズムであり、 T U R N B U L Lの代わりに、 METHODE Mでも同じ結果が得られる。しか 二 しながら、推定すべきパラメータの数がそれほど多くなくとも、 E Mアルゴリズムは解への収束の遅さが知ら o n v e xm i n o r a n t )とWellnerら れている。そこで、 Groeneboomらが提案した I C Mアルゴリズム ( i t e r a t i v巴 c が提案した EM‑ICMアルゴリズム ( E Mi t e r a t i v ec o n v e xm i n o r a n t )が 、 EMアルゴリズムをよりも NPMLEを計 算するためにより e f f i c i e n tな方法でありため、デフォルトでは、 EMICMで計算される引)。 生存関数の推定に用いたデータには、 Appendix1に示す Finkelsteinらの論文で使用された乳がん切除術 後の c o s m e t i cd e t e r i o r a t i o nのリスクをレトロスベクティブに比較したデータを用いた。放射線治療を受け た群 ( R T群)と化学療法と放射線治療の両方を受けた群 ( R T + R C T群)の生存時間のデータを用いた。被験者は、 4ヶ月から 6ヶ月毎に追跡され、 d e t e r i o r a t i o nに至る区間打切りのデータが収集された。 9 4人のデータの うち、右側打切りは 38人、残りの 56人が区間打切りまたは左側打切りとなった。それぞれの治療群のデー タを結合し、データセット BCSとした。 以下に、 1 CLIFETESTプロシジャを用いた S A Sコードを示す。 o d sg r a p h i c so n ; s e r s' o d sh t m lb o d y = 'I C L I F E T E S T . h t m l 'p a t h = ' C :¥U ニB C SI M P U T E ( S E E Dニ 1 2 3 4 ); PROC I C L I F E T E S TPLOTS=(survival l o g s u r v ) DATA STRATA T RT; TIME ( l T i m e, r T i m e ) ; R U N ; PLOTS=オプションでは、推定された生存関数のグラフ及び推定値の対数変換したものを負の値にしたものの グラフを表示するよう指定した。 STRATAステートメントでは、治療群 TRT(RTまたは R T + R C T )を指定した。 TIME ステートメントでは、区間の開始と終了にlTi m e及び r T i m eを指定した。 既存手法の結果を示すために、 LIFEREGプロシジャを用いた区間打切りデータの解析方法を以下に示した。 I C L I F E T E S Tプロシジャでは、lTi m eに相当するデータが 0、すなわち開始時点の場合、自動的に左側打切り として解析されるが、 LIFEREGプロシジャでは、欠測としなければ左側打切りとして処理されない。そこで、 新たに B C S 2というデータセットを作成し、 l T i m eが 0のデータを欠測値に置き換えた。 PLOBPLOTステートメントで、カプランマイヤータイプのプロットを作成した。これは、累積確率分布が直線 になるか否かをみて、確率分布の当てはまりを判定する。 O U T P U Tステートメントでは、累積確率の推定値を BCS2̲LROUTデータセットに出力した。 DATA B C S 2 ; S E TB C S ; I Fl T i m e =0 t h e nl T i m e 二 . , run, O D S GRAPHICS O N ; PROCLIFEREGDATA=BCS2 ‑ 5 6 8 ‑

579.

CLASS T R T ; T i m e ) MODEL(lTime,r 二 TRT/DIST=Weibull; PROBPLOTPPOS KM 二 D F = P R O B ; OUTPUT OUT BCS2LROUT C 二 run, 4 .結果 4 .l IC L I F E T E S Tプロシジャによる生存確率の推定値 TheICLIFETESTPro田 dure T加 I C L I F E TESTProcedure Stratum2 :t r tニ RT+RCT Stratum1.t r t=RT Non 回 目m e t r i cS u r v i v a lE stimates 叶cS u r v i v a lE st i m a t e s Non同 町 met P r o b a b i l i t yE s t i m a t e I m p u t a t i o n Standard E 。 円 r Time‑‑ 孟 Sur l 日 一i 同 … 4 。 αX l O 10000 ∞ 000 日 00463 0 . 9 5 3 7 00354 I m p u t a t i o n Standar 寸 E r r o r 。 4 ∞ 000 1∞ 口 口 00000 5 5 1 3 3 o0L 09567 0 . 0 3 3 2 7 00797 0 . 9 2 0 3 00458 8 1 1 00866 09134 00413 1 1 日1684 0 . 8 3 1 6 00580 1 2 1 6 0.1558 0 . 8 4 4 ε 00567 1 2 24 02391 07609 00629 1 7 18 0 . 3 0 1 2 0.6988 00764 25 33 03318 06682 00706 1 9 1 9 04423 05577 00835 34 38 口4136 05864 00739 20 24 05580 口 之 044 00771 40 4 6 口5344 o465o 00756 25 30 06579 03421 00740 4 8 l 門 千 1 αX l O 口0000 ∞ 000 3 1 35 07288 0. 2712 00674 36 44 宮 日 088 0 . 1 1 0 4 00482 48 48 0 . 9制 8 00552 00352 60 I n f 日∞o 00000 ooocコ QuartileE s timates 34 4 8 2 0 LOGLOG 1 9I 25 8 34 1 7 LOGLOG 1 2 1 9 t l t Table 1ノンパラメトリックの生存確率の推定値及び四分位点の推定値と 9 5弘信頼区間。 ( A ) R T群のノンパラ B )R T群の四分位点の推定値、 ( C )R T+RCT群のノンパラメトリックの生存確 メトリックの生存確率の推定値、 ( D ) RT+RCT群の四分位点の推定値。区間打切りが生じているため、 deteriorationの起こる確 率の推定値、 ( 率と起こさずに生存する確率のノンパラメトリック推定値は、非重複区間の集合として計算される。これら の推定値は、同ーの区間において一定である。 ‑569‑

580.

EstimatedSurvival Function Z 0 8 1 iJ: 「「 l 喜 01 0 0 2 0 6 0 4 ( ) Time t r t ‑一一一肝ー一一‑RT.RCT F i g . l 区間打切りについて推定された生存関数。 T a b l e l ( A ), ( B )で計算されたように、生 存確率の推定値は Turnbull区間内では決定されない。従って、 ICLIFETESTプロシジャで は、非重複区間の聞を点線でつなぐ表示がなされる。 NODASHオプションで非表示にするこ とも可能である。 Negatlve LogofEstimated Survival Function 30 , 25 一 20 , , , , , 、 , 苦 ' , 手 品 '5 H 。 一 。, ‑ , 9 , 一 0 . 5 。 。 o r o 60 ~ Time t r t ‑一一‑RT 一一一‑RT哨 C了 F i g .2負の対数変換を施したノンパラメトリック生存確率の推定値。 ‑ 5 7 0 ‑

581.

E s t i m a t e dS u r v i v a lF u n c t i o n w油 価 格 R剖n t w i s eC剖偏d副首.. umits 0 . 8 F ﹄ リ 一一五回A D﹄丘一時﹀一﹀﹄コ 0 . 6 ω 0 . 4 e ' •• ‑ ' 、• 司 O 0. 2 B 毒 島 、 、 ~.・‘ー 自 0 . 0 ・‑ ・ 也、 靴.晶司同 d 0 60 40 却 Time 一 一 一 ‑RT 一 一 一 一 ‑RT+RCTI [ ! ! i一 や ̲J F i g .3f i g .1に 9 5 明信頼区聞を追加した図。 p l o t s 二オプションに、 S U R V I V A L ( C L )と指定する ことで描画する。 4 . 2L I F E R E Gプロシジャにより推定した累積発症率 A p p e n d i x2に L I F E R E Gプロシジャにより推定した累積発症率を示した。 W e i b u l l分布などを当てはめること で、累積発症率を推定することはできるが、推定された区間打切りの累積発症率をグラフに表示する際に、 累積発症率を示す時聞が一意に決まらないため、推定値のみを示した。 5 .考察 これまでは、区間打切りのデータについては、 L I F E R E Gプロシジャを用いて、 W e i b u l l分布などの確率分布 を当てはめて推定するか、 S A Sマクロを用いてノンパラメトリックな生存確率を推定する方法など、選択肢 M ‑ I C Mなどの推定方法を簡便に扱うことができるよう が限られていたが、プロシジャ化されたことにより、 E になった。 C L I F E T E S Tプロ、ンジャの使用方法を説明した。オプションが豊富に用意されており、最尤推 本論文では、 I e l l n e rらが提案した EM‑ICMアルゴリズムが、す 定量の計算においても、 3種類の手法が利用可能である。 W でにデフォルトで指定されており、 N PMLEを推定するための高速な手法が利用可能である。また、各オプシ I F E R E Gプロシジャの記法と非常に ョンの記法は、既存の生存時間を扱うプ口、ンジャと一貫性があり、特に L よく似ているため、記法の再学習の必要性が軽減されている。 I C L I F E T E S Tプロシジャは、 L I F E R E Gプロシジ ‑ 5 7 1 ・

582.

ャの記法に加えて、左側打切りの扱いが、 0時点でも左側打切りとして処理されるなど、解析担当者にとっ てコード変換の負担が軽減するようになっている。 u r n b u l lが論文の中で述べている非重複区間の特 区間打切りのデータから生存確率を推定するためには、 T 定が必要になる。カプラン・マイヤー曲線の描画には、非重複区間の描画が課題であったが、 F i g .1の ( A )、 ( B )で示される j u m pp r o b a b i l i t yの推定が簡便になり、これも点線を導入することで、非重複区聞をまたぐ L O T S =オプションに C Lを指定することで、 9 5弘信頼 カプラン・マイヤー曲線の描画が可能になった。また、 P 区間の描画を ODS経由で使用することが可能になった。 I C L I F E T E S Tプロシジャが登場したことにより、より簡便に区間打切りのデータを扱うことが可能になるも のと考えられる。 5 .結論 本論文では、区間打切りデータからノンパラメトリックな生存確率を推定する I C L I F E T E S Tプロシジャを解 説した。生存確率を推定するために、 E M ‑ I C Mアルゴリズムなどが実装されており、より高速に推定可能であ る。プロシジャ化されたことから、既存の L I F E R E Gプロシジャなどと、記法に一貫性をもち、区間打切りデ ータの解析及び研究に貢献するものと考えられる。 参考文献 1 ) 大橋靖雄,浜田知久馬 . : ! E f f ,時点穿'M#f :SASによ o ! : . 笠妙高#東京大学出版会;1 9 9 5 . 2 ) t a t i s t i c a lmodels andmethodsf o r瓦f e t i m ed a t a . 2nd e d . Hoboken,N . J . : Lawless J F .S W i l e y ‑ I n t e r s c i e n c e ;2 0 0 3 . 3 ) P e t oR . Experimental Survival Curves f o rI n t e r v a l ‑ C e n s o r e dD a t a .A p p l i e dS t a t i s t i c s . 1 9 7 3 ; 2 2 : 8 6 ・9 1 . 4 ) Th r n b u l lBW.TheE m p i r i c a lD i s t r i b u t i o nFu n c t i o nwithAr b i t r a r i l yGrouped,Censoredand Tr uncatedD a t a .み u r n a l o f t h e必 フ' . Y a lS t a t i s t i c a lS o c i e 初 S e r i e sB .1 9 7 6 ; 3 8 : 2 9 0 ー 2 9 5 . 5 ) D e m p s t e rAP,L a i r dNM,R u b i nDB .MaximumL i k e l i h o o df r o mI n c o m p l e t eDatav i at h eEMAlg o r i 仕1. ゐu r n a J o f必 eRo yaJS t a t i s t i c a J&仰訟の~ S e r i e sB.1 9 7 7 ; 3 9 : 1・3 8 . 6 ) Groeneboom P,Wellner JA .I n f o r m a t i o nBoundsandN o n p a r a m e t r i cMI 紅 imumL ik e . 助 ωd E s t i m a t i o n .NewY o r k :B i r k h a u s e r ;1 9 9 2 . 7 ) WellnerJA,ZhanY .A HybridAl gorithmf o rComputationo ft h eNonparametricMaximum L i k e l i h o o dEstimatorfrom CensoredD a t a .ゐ u r n a loft h eAm e r i c a nS t a t i s t i c a lAs s o c i a t i o n . 1 9 9 7 ; 9 2 : 9 45‑ 9 5 9 . APPENDIX1 ICUFETESTプロシジャの e x a m p l eデータ。 d a t aR T : i n p u tI T i m er T i m e@@: t r t= ' R T ; ' d a t a l i n e s ; 4 5 . 2537 3 7 61 0 46 . 0 5 ‑ 5 7 2 ‑

583.

o7 2640 18 4 6 .4 6 .2 4 4 6 . 2734 3 6 71 6 3644 511 1 7 .4 6 . 1935 71 4 3648 1 72 5 3744 3 7 .2 4 0840.32 411172533 1 5 .4 6 . 1926 1 11 5 1 11 8 3 7 3 8 .3 4 2 2 4 6 512 3 6 4 6 d a t aR C T ; i n p u tI T i m er T i m e@@; 廿t=' R T +RC T ' ; d a t a l i n e s ; 812 0 5 3034 022 5 8 1 3 2431 1220 1017 821 1 72 7 1 1 1 72 3 3340 4 9 2430 3 1 .1 1 1624 1339 1419 13.1932 4 8 1113 3 4 .3 4 1620 1 3 . 3036 1825 1624 1824 1726 3 5 . 1660 32.15223539 2 3 .1 11 7 2 1 4448 2232 1120 1417 1035 4 8 RUN; d a ' 匂 8 CS; s e tRTRCT; r u n ; 吋s u r v i v a ll o g s u 刊)d ata=8CSi m p u t e ( s e e d = 1 2 3 4 ) ; PROCICUFETESTp l o t s STRATAT R T ; T 1ME( IT i m e,r T i m e ) ; RUN; ‑573・

584.
[beta]
Appendix2LIFEREGプロシジャによる累積発症率の推定値
RT+RCT群
RT群

[
!
!
im
e
l
,,!
i
m
i
it.
:
t
l
~B~l 問責

E

45
官5

.RT
37開

41'

0.
50
.
28347

48
30
…
50:

3
7
'

.RT

05 0.4662~

4,

6
'

10RT

510田宮73
0.

5,

45

RT

05 059印 5

混同同町崎

一
町
一
山

5'RT

05

7RT

05

40RT

05 0
.
2
9
8
9
2

RT

05'0
.
1
7
8四

E官 官4
t
i
3
3
1

05 0
.
4
5
1
5
2

(;~

05 002449

t
i
5

1
1
1
6

0.
5 01
.6376

1
3
14

‑

一
ー

制⁝刊

同町開

0.
5
白36由 4

一 口5 0.7~87呂
0. 5 叩3
1
05 0.
541721
05 0.
69
官5
8
05 0.
1
S850
口5 口33331

30RT‑
+
f
むT
.RTiRJT
RTiRJT
~4 RT
iRJT
3
9 RTiRJT

68,

1
3

t
i
9
1

1
9

11'
11
.1

34

13

34
1
6

~O RT
iRJT

05 0
.
2
6
8四

8RT

05

官9

40

RT

3官
4

.
I
R
T

05 0.
39139,

31i

1
1 RT

05 口四 714

17
33

官5'RT

.6376
05 01

RT

05 0
.
4
団印

34, 15

。RT

05 0
.
1
3
5
9
4

05 05
団3
3

35

45

RT

05 059
皿5

3白

19

26 RT

05 0
.
1
9
2
6
6

311

1
1

1
5 RT

05 0朋 474

38i

1
1

1
8,
RT

05 0 474

39
401

3
7
'

RT

05 0
.
4
6
6
2
2

官
官

RT

0
.
2
3
7
5官
05,

38

.RT

05 0
.
4
8
0
7
6

‑ 叶

.
a

開閉

05 0
.
4
2
1
6
9
05 002449

36

12 RT
.宵T

46

.RT

05 059田 5

05 0
.
4
5
1
5
2

口5 0.~5170'
口5 日41438

4

8RT桐 OT

05 004231

1
1

1
3 RTiRJT
RTiRJT

05 日1
9
8
6
0
1
口5 日
.
74570

RTiRJT

05 0
.
7
4
5
7
0

必

05 059回 5

‑
5
7
4
‑

19.RTiRJT
RT<
何JT
RT‑
+
f
むT

3 n U S E S 7 5 6 官 5 5 3 1 1 4 9 ‑ 1 4D09
1311113131321n4421
114
一
一
↓
E4FJtAK寸ι校駅配吋一2
日ぺ
J
F
Us
JE
l
19
Z4
2J
2
一i
s
‑⁝S 一事⁝章一EZE
⁝
事

RT

寸

RT<
何
コT

~3

0.
5 0590
'
25

宮4

…

0.
50
.
12
4
α
)
'

伺 町 作T

官6
6
05 0
.
1
9

一

ベ

0.
50
.
1
9
8
6
0
!

ャ

2
1 RTiRJT

'
R
T

7
0
1

一

.RTiRJT
…

35 RT

1
.1
'

一一一寸

時

t
i
t
i
'
t
i
1
'

す
…

4
t
i

1
1

一

05 004179

05 0
.
4
6
6
2
2

5

511

16 RT

RT

,̲
"
:
"
1
45

05;口.
1
7
官8
9
0.
5;
0360041

~7 町叩T-

町 人 間 冊T

官E 3 7

46

17.RTiRJT

0.
5 031439

5
'01
.6376
0.

4
3
1

10
1
7

田日朝刊

05 0
.
4
6
6
2
2

仇
ぬ
い
千

05;
O.~~咽 3

55;
5
t
i

町

25!RT

34

官
口 RT
iRJT

34RT

44RT

41
.
日

3
1 町 叩T

1
官

1
7

17

令
一
?

24

591

宮5 j 3 7

示

54

叫守

官41

! 41

0.
50
.
2
5
1
7

50
.
2
6
8田
0.
0.
5 059白 5

05 O
[
同1
79

331

口5 白血目

町 刊T

RT

05 0
.
4
5
1
5
2

d

8聞+町T ‑

52
53;

8

14'RT

3~1

d

58;

48RT

‑ぃ一一… 今 … 一

5

1 13

0. 5 パ

34聞 冊 T
0.
5 0.
67
3
3口
!
… …
官
官 R
T<
冊
コT
0.
5
1
.

日5 0590
'
25

7

二
割

51!

口5 0
.
1官4CIコ

5RT+
F
むT

05 059印 5

36

i

伺

t
.
‑
r
叩B
‑
:町民

1~ RT
iRJT

RT

世3,

官官

8

.RT

沢T

官4
'

m
e

日時 l
l
T
i I
rTimeI
t
r
t

05 0.
57731

31

町
一

‑
I
J

OBS
11

3~

宵T
iRJT

3
6 RTiRJT

05 033331'
05 0
.
2
5
170

官5RT
iRJT

05 0.
67330i
05 日387591

官4RT
‑
+
R
口T

05 033331

何
コT

05 038759

RTiRJT

05 日36
由4

RTiRJTI

05 0.
76185

官4RT<
~6

一0
一
5 033331

60RT‑
+
f
むT'
RT<
冊 T
RTiRJT

05 0.
71107
口5 日3回 目

3
9 RTiRJT

05 0
.
7
6
18
5

RTiRJT

05 051734

~~

1
7 RT‑
+
f
むT'

05 0
1
.9850

町 南 コT

口5 0
.
4
6
6
8
4

4 s 附 + 冊T
I

05 日
.
87460

3~ i
R
TiRJT

05 0
.
4
9
2
3
7

20RTiRJT

05 0
.
1
9
8
6
0

1
7,
RTiRJT
3
5 RT<
伺OT
RTiRJT

05 0.~7877'
05 口1
7官8
9,
回目白話

585.

│ 臨 問J自ん長崎懇顎 2 0 1 4 傾向スコアを用いた共変量の調整における バイアスと標準誤差のふるまいについて 松井優作 東京理科大学大学院理学研究科数理情報科学専攻 下川朝有、川崎洋平、富岡悦良 J 元当時議持続丸一 医療、政府叩 W]9 要旨: 医療研究において、治療群と対照群のような二群における効果の違い を推定するとき、研究デザインは大きく介入研究と観察研究に分けら れる。前向きの介入研究で、は処置を無作為に選ぶことが可能なため、 群聞において共変量が偏らないことが期待できる。一方、後ろ向きの 観察研究では無作為に選ぶことができないため、共変量の偏りを調整 する必要がある。共変量の調整法としては、重回帰モデルのあてはめ、 層別化、マッチング、などの手法が用いられている。しかしこれらの手法 は共変量の数が増えると調整が困難になるなどの問題がある。そこで 共変量を傾向スコアと呼ばれる値に集約し調整に用いる手法が提案さ れた。傾向スコアは観察研究において生じる交絡因子の影響を除去し、 疑似ランダム化されているような状況を作るために用いられる。本研 究では応答変数を二値と仮定し、傾向スコアによる調整法を用いて推 定したオッズ比と従来の重回帰モテ)レのあてはめにより推定したオッ ズ上ヒを SASによるシミュレーションを用いて比較した。結果として、特定 の状況下において傾向スコアによる調整法ではバイアスが大きくなる 場合があることが確認された。 ‑ 5 7 5 ‑

586.
[beta]
・

‑
o仁
AM‑‑‑vb

t

乙 t! と~."; l 議汚(\)量褒共ごt/J I:lミ:警守'"こ,::'~. U
三J
えf
す人j
rr:fj
E
Eミ
ト
, 、{¥)芸員長室長票率 35KT川、 f

t

者量殺 f
鈴
主
'
,
:
' ~.:}:~士以東
チ?事干!議鮮高F聖!~盛舛究部学賢明T・^ 主

見
:
x
;
草r
gヰエ掌:制Ii、 両論 lilマ

脇被tf,動僻附.;:~~~t!l;':>~,,::鴨脚畑判明紬韓蛸詳細蜘〈州議h側猷織強

、」主件
主ラ
量4
、
i

ゐ

一
孟
"
・
.
.
,
;
‑
:
̲
.

'J 亨:0む長;~,忌れども :.1 報処二誌(-;;t .
¥
\J韓関伎でう孝章構a ,プー J 、リォ>~主主拾三

己申 )'~~~~~l~~i世構掃:3型軽照 λít> 号号式志1< トザ守巴繋横長,幸三三、ミ長:忠一
, t私 τそ 13詰面積幻 4Jz 託、話I ニ l~患が衆参管j JlttD' ;f,s: 1治 .S 1'モぬき iがIt型"'去、 r'~'
I 也君~U主主量~t .古文ー, 脅す載棋i
a
:
主
ご;
fJ:
6
'
e
o掛川翠l::主将"J'tJ
j
:存
主主銀、~~li 識 C~J~~ 共,必こタパ詰き3・ 2会~.::.:.之、警i ゴ 1~~.tH黙 T 、 J 司 F足時守!Jl;i
"',~.t:~ ア〈オ; {
"
)
.
J,¥ :できF 事~!pl 薫 ιi 玄:.j:.'l;h翠輔 3 量望聖子ょ.竺 4客 JU払 13t11・
;;t~ 4(\~,主~."二、 j '
,¥、ぞ.'JJJt él' ,j期;古来:司~(\):主主ご守、よそ: y ,, 1ト ~If{ ~l

d

e
.
t
ニ
i
t
"

町

..-,.:そ耕主理主様。率直線変容 J 3:~J"' 1 ht:l~悟~~:; .
:
i
"
f.
t~てに;五三!世1 帥

r
.

六
?
七

二、事..
、
I
}J
1
:e
iIJ 阻 ~.I @A .:1 手、持~品交t :b'\;f~>~;.1 J J'Ìぅ jt~ そぐに,_I.,~r :
}
.
5
f

量t.~..l.)開干さお懸構ふも二 i寸 f' ~ro1蛾 ,.J 蛮Jil.l'::')量二室幾寛容 ~~;.t!!~T~さ

" l'::-\J 宝輩 ~J ..t.ニ 1 合福r:r &ro .J l ~ぞ:r-積回:輩。来聾主 jl~^ に・ T,戸 JTf
主流 .Y、
1
号、果舎十六一 J
宣車お ‑
:
.
1J
2
一
、
J
.
r
.
三
,
.
:d:
t:
'
1~A:>.~ ,
.
L
.̲
:
.
‑
会
全
〆;
J
t
λ 守、
,:l :r f; 主主 m~ ,;るも fi マtcX F
2
1・;ケ fJ?イ f
t
;
;
入
t
.
:
'
'
¥
"
む弐.ff. 竺T11ii 釜-i.~.~'. ~~二 .r~ a
:
l
.
'
,
'
,
す
き
き1

制
昔
、
:
去
、

・

J
I
B
E
l
a
‑
‑
‑
‑
‑
r
‑
E
R
t
E
'
e
r
‑
E
t
o
f
t
‑
︐
t
t
f
B
l
L'i
lzet?tBash‑‑sleis‑‑EE‑‑E

γ ー予 η~~もや掛伊引当京芸 :2-i 量;H~柑型車開.:;込矢島If;.合措 tf-fZ ♂対 ι ,
一会議町議比寺田 ~/J~. 二 i 撃眠、J'対司聖士!轟: ~It:t l 駒込てこ.': (千法会注モ =
.
}
t

589.

動画による統計表現 新しい統計の要約 関根暁史 株式会社 ACRONET/生物統計部 Dynamics t a t i s t i c a lg r a p h s S a t o s h iS e k i n e l B i o s t a t i s t i c sDep . tDataS c i e n c eD i v i s i o n ACRONETCorp. 要旨 SASには動画を簡単に作成できる機能がある。数式に依存しない形で、多くの人に統計の概念を伝え ることができるであろう動画の試作品を作成したので紹介する。 キーワード:SASグラフ, GIF 1.はじめに SASには、複数枚の SASグラフをコマ送りにして動画としてしまう機能が備わっている lmo この機 能を活かし、ほとんど数学を使わない動画の形で統計を表現してみたら、統計初心者にも統計学の根本 動的な分割表 J I 動的な・・・」としづ章立てとし が伝わると考えた。本論文では「動的な三次元図 J I て、統計学にも様々な分野があるが、分野にとらわれることなく、それぞれの章に最適と思われるテー マを用意し、そのテーマの説明補助となり得るような動画の見本を試作した。本論文中の動画は、当日 発表用スライド(パワーポイント)をご参照頂きたい。 2 .動画作成プログラム c , ,ω附 叫 1 & ! HP o o u ! a t 'がも 31 .5 ・ ( 1. 6 0 1 SAS社ホームページに図 O 作成のプログラムが掲載されている ' h t t p : / / s u p p o r t . s a s . c o m l k b / 2 5 1 2 5 5 . h t m l J 。図 0はアメリカ合衆国の地 図における州の色が経時的に塗られていくというものである。同プ ログラムは拡張子 GIFとなる動画を作成して吐き出す。この GIFフ ァイルはパワーポイン卜に貼りつければ、スライドショーにすると 駆動するので、プレゼンテーションの最中に動画を見せることが可 能である。またプレゼンテーションを行う環境は SASがインストー 図O .S A S社 H P掲載のプログラム ‑ 5 7 9 ‑

590.

ルされている必要もない。同プログラムを小加工して流用するだけで、 SASグラフが描ける人ならば誰でも 簡単に動画が作成可能である。よって以降の動画は図 0の作成プログラムを元に作成することとする。 3 . 動的な三次元図 iSASによるデータ解析入門 J(東京大学出版会i)p.135~ に掲載 のデータ normalは相関係数r= 0 . 6の時の 2次元正規分布を示し ている。図 0のプログラムを利用して、この相関係数 rを 0か . 9まで 0 . 1ずつ変化させた三次元図を作成することを考える。 ら0 図 O のプログラムで回転していたのは & s t a t e というマクロ変数 s t a t e .とおいて、 s t a t e = Ot o0 . 9by のみであったので、相関係数r=& s aを用意して、図 0のプログラムをそ 0 . 1 となるデータセット u 図 1二次元正規分布 のまま実行すれば図 lが完成する。本プログラムのソースコー ドは巻末のプログラム lに掲載した。 さらに参考文献のを参照頂くこと で、図 2のように高品位にするこ とも可能である。図 2では 2枚の 別々の図が同時に動いているが、 コマ送りの速度を同じにしている ので同期して動いて見える。コマ 送りの速度は、 delay=の値を SAS 図2 .二次元正規分布(高品位) 側から設定すればよい。パワーポ イントにおいて、同時に複数枚の動画を動かいたい際は、ディレイタイムを同じとすることで、無理に 1枚 絵に仕立てる必要はない。本章では確率密度と相関との関係を示す動画として紹介した。 4 .動的な分割表 カィ 2 桑f 轟 →1 0 0 .0 0 省備 度数とともに色の濃淡が変化する分割表を考 P~O ∞∞o∞ えた。(喫煙・非喫煙) x (有病・無病)の 2 70 無病 X2分表(人工データ)であるが、周辺分布を 同 喫煙 。 。 固定しながら各セルを l例ずつ変化させてい く。セル色の濃淡は標準化残差の値と紐付いて 5 0 非喫煙 印 開 1 冊 いる。すなわち色の濃いセルには度数が集中し ているし、色の薄いセルは期待値と比較して度 ー70 a 栂 ・ 1 1 : 強 差 数の少ないことが判る。全てのセルの度数が期 待値と変わらない場合は、一様の平面が出来る。 図3 .カイ 2乗検定 この一様性が崩れるほどカイ 2 乗値が跳ね上 がる。 P値は 5%有意の時、赤字で表現される が、喫煙・無病が多い方向性で 5%有意になる際は、緑色となる。 ‑580・

591.

カィ 2乗 値 8.89 P ‑ O .0 0 2 8 6 9 1 カイ 2 J 量餓 5 0 .,,7 P ‑ O . O α泊。自G 有構 1 1 0痛 無病 有摘 哩煙 1 曲 哩煙 3 曲 非唖爆 3 冊 非理鰻 1 凹 150 250 4 曲 290 C 州統計量二 6 . 9 0 P‑O.0044736 省揖 4 曲 日本人以桝 日本人 カィ 2 乗4 轟 8 . 0 8 110 ∞86237 P=O 徹病 4 剖 唖睡 la y検 ぇ B . e s owI pcOα氾α)00 ( 2記長の傾ザ.主異存る 4 叫 非理鰹 。 判 3 6 0 8 叩 全体 図4 .層別力イ 2乗検定 図 3の概念の分割表を 2枚同時に動かすことを考える。日本人と日本人以外のそれぞれ 4 0 0例ずつの分割表 0 0例のセル度数は全く変化させないようにする。 のセル度数は変化させるが、全体(日本人+日本人以外) 8 この図 4の状態で、全体と日本人では 5%有意で、あるが、日本人以外は喫煙・無病の方向性で 5%有意の状態 である。表の傾向性はセル色の濃い部分をたどれば見えてきて、この図中には傾向性の矢印を書き込んでい る。図 4は、日本人と日本人以外は別の傾向性を持っているにもかかわらず、全体の P値が有意となってい る。これは右下の B r e s l o w ‑ D a y検定にも反映されていて、 B r e s l o w ‑ D a y検定が 5% 有意の時 ( 2表の傾向性異 なる)"と赤字で表示するようにした。すなわち当該図表はシンプソンのパラドクスを示したものである。日 本人と日本人以外が、最後まで全体と同じ傾向のまま有意にならないという人工的データを作成して本動画 を作成した。つまり全体の有意をもたらしているのは、喫煙か非喫煙がではなく、国別という原因が作用し ているのではなし、かという例を示した。 5 .動的な折れ線 1 , 5 0 0 o b sのデータを a n a l y s i s D a t a( 3分の 2 )と 15000bsのデ一世 白 品 作 成 用 / ¥とルドアウト ・ ‑ ー 回帰式を当てはめる t e s t D a t a( 3分の 1 )に分割し、 a n a l y s i s側で線形重回 帰式を作成してその回帰式を t e s t側に適用すること を考える。変数選択を伴う回帰分析において、 a n a l y s i s側 、 t e s t側とともに ASE (残差平方和を N 数で割ったもの)を計算して逐次お互いの ASEを 回帰式を作成 ー5 8 1 ‑

592.

比較する。 a n a 1 y s i s側は最小 2乗法によって ASEを減らしていくが、 t e s t側は言わば受身的に ASEを計算さ せられることになる。本データは SASヘルプの GLMSELECTの章にあるものを用いているが ( E x a m p 1 e4 2 . 2 U s i n gV a l i d a t i o na n dC r o s sV a l i d a t i o n )、本回帰分析は下記のソースコードの通りに行った。 p r o cg 1 m s e 1 e c td a t a = a n a 1 y s i s D a t at e s t d a t a = t e stDa t a ; c l a s sc1c 2c 3 (o r d e r =d瓜 a ) ; mode1y= c1 1 c 2 1 c 3 1 x1 1 x 2 1 x 3 1 x 4 1 x 5 1 x 5 1 x 6 1 x 7 1 x 8 1 x 9 1 x1 0 I x1 1 1 x 1 2 1 x 1 3 1 x 1 4 1 x 1 5 1 x 1 6 1 x 1 7 1 x 1 8 1 x 1 9 1 x 2 0@2 /s e 1 e c t i o n = s t e p w i s e ( s e 1 e c tニ s l ) h i e r a r c h y = s i n g 1 e ; r u n ; Y h a ta n a l y s i s ( 1 0 0 0 o b s )r = AS王 (AverageSquared Error) ケ‑‑̲. . . 30 Y Y h a tt e s t ( 5 0 0 o b s ) r = 6 0 。, / // 。 3 0 ‑ ・ ‑ 6 0 . 0 analysis 一帯一 t est 5 0 . 0 4 0 . 0 ./〆 〆 3 0 . 0 2 0 . 0 曲 Y 。 s 1 0 1 5 2 0 変数選択のステップ 図5 .線形重回帰分析における過学習の概念 上記プログラムを実行した時の ASEの変動の過程を見たものが図 5である。左に補助的に Y と Y h a tの散布 図を相関係数とともに付けている。変数選択のステップが進むごとに a n a 1 y s i s側 、 t e s t側ともに ASEは下が 50 の対角線に近づいていく(相関係数は上昇していく)。しかし 1 0ステップ目で t e s t り、散布図の分布は 4 側は ASEが最小(相関係数は 0 . 7 9 0 )になった後、 1 1 ステップ以降 ASEは上昇していくことになる。よって a n a 1 y s i s側は過学習をしていることが考えられ、 a n a 1 y s i s側のステップは 1 0ステップ目付近で止めておくこと がバイアス減少のために相応しいと思われる。本動画は回帰分析における過学習の概念を伝えるものであり、 1 1ステップ目以降になると OverLeaming" と赤字で表示するようにしている。 ‑582‑

593.

6 .動的な座標軸 1 0教科 5 0人分の人工データを用意して因子分析を行って見る。下記教科データは iSASによるデータ解析 入門 J3 ) p . 1 9 3掲載の認知課題データを小加工したものである。 6 0 1 5 2 1 7 8 1 5 2 1 8 0 1 6 3 1 7 0 1 5 4 1 76 本データを n f a c t = 2の FACTORプロシジャに供する。プロシジャのデフォルトのまま主成分解を解くもの )。既に因子軸の回転前から とする。第 1因子を縦軸、第 2因子を横軸として因子負荷量の散布図を描く(図 6 第 1因子は 10教科の総合得点を、第 2因子はいわゆる文理を意味していることが想像できる。回転前因子 負荷量の分散 ( 2乗和)は、(第 1因子,第 2因子) = ( 3 . 7 2 2,1 .3 9 5 )であった。この因子軸をパリマックス法によ って直交回転させてみる。 t .必。 回転前因子負荷量 鋼管 一簿繍時 第1 隠予 英踊 館学 鴎継 絢 電 車 化掌 dピ:~.1列島理 分散 ( 2.和} 3 . 7 2 2 増瑠 第2 因子 0527 0 . 6 1 7 0 . 7 悶 5 2 1 7 備 o7 6 2 政治・糧溝 世界史 ‑0割高 6 。 0 . 4 2 8 4 7 a 。 。 。 慌 陣 生暢 日本実 。 0 . 6 2 2 犯 0 . 5 9 6 0429 0 . 1 8 0 ‑0 . 4 7 8 ‑0. 3 1 6 ‑0. 0 7 5 ‑0お3 1 . 3 9 5 回転後因子負荷量 予 組a櫛 .. . . 予 . 創 ・ ' " 0622 ゅ ω5 0 . 4 。 0 . 4 2 8 ‑0. 3 8 7 英組 . . 掌 騎 聞樋 鞠理 化学 生鞠 日本史 世界史 箆転角=‑ 00 ・ 地理 取i 白経費 分散 ( 2講和} 0 . 5 2 7 o6 1 7 0 . 7 創 5 2 1 0 . 7 0 5 o7 6 2 0 . 6 0 4 3 . 7 2 2 。 0596 0 . 4 2 9 0 . 1関 ‑0. 4 7 8 ‑0. 3 1 6 ‑0 . 0 7 5 ‑0 . 3 ω 1 .3 9 5 図6 .因子分析における直交回転の概念 動画では ‑45 方向に座標軸を回すことによってパリマックス回転をイメージした。パリマックス回転後、(第 0 1因子,第 2国子) = ( 2 . 6 8 7,2. 42 ω となり分散がより平均化した。「数学Ji 物理Jなどに着目すると、回転後 因子負荷量の第 1因子にはほとんど寄与しなくなった。逆に「国語 J i日本史 Jなどに着目して見ると第 2 因子には寄与しなくなって、単純構造が得られていることが判る。第 1因子は 文系能力"を、第 2因子は 理系能力"を表していると解釈できるので回転の終わりに赤字で表示した。本動画は、回転前・回転後で 座標軸の直交性が崩れていないということと、各教科聞の因子負荷量の内積(相関性)に変化が無いということ を示すために作成した。 幽 583・

594.

7 .動的なデンドログラム 6章の人工データをそのまま用いて、変数のクラスター分析を行うこととする。デフォルトの VARCLUSプ ロシジャ 5)によりクラスター数を上昇させていく実験を行う。初期状態の分割クラスター数が lの時の分散 . 3 7 2とは、 6章の第 1因子の分散 3 . 7 2 2 (すなわち主成分分析の第 1固有値)を教科数 10で割った 説明率 0 値と一致する。分割クラスター数を 2とした時、文系的な第 lクラスター(英・国・日・世・地・政)と理系的 な第 2クラスター(数・物・化・生)に割り付けられる。因子分析のオーソブリク回転によって第 l次割付がな される。回転後因子負荷量の絶対値が第 l因子の方により寄与していた教科は第 lクラスターに割り付けら れ、第 2因子の方により寄与していた教科は第 2クラスターに割り付けられたのである。実際のアルゴリズ ムは k‑means クラスタリングによく類似していて、因子分析のオーソブリク回転以降に、主成分分析による 第 2次部付へと反復されるのであるが、本データでは m a x i r e r =1で全て十分収束してしまうので反復の詳しい 解説は割愛する。分割クラスター数=2において、第 lクラスターの中での主成分分析の第 l固有値は 2 . 7 3 9、 第 2クラスターの中での主成分分析の第 l固有値は 2 . 1 5 3であるので、合計値 4 . 8 9 2を 1 0で割ったものが分 → 2の上昇で、説明率 0 . 3 7 2→ 0. 48 9に上昇した。 散説明率となっており、クラスター数 l 視協歪7 車 工1 主成分分続出 車1 圏萄憧 V a r i a b l e 葺』車 揮1 クラスター 藁・融・圏・鞠.i t .生日,世・地融 3 . 7 2 2 融掌 閣錨 鞠理 化学 生物 日現依史 E 盤界史 地理 政治経溝 '02209720 . 9 2 2 08120 . 8 2 20712 0 . 7 2 20 . 6 7 20622 0 . 5 7 2052204720 . 4 2 20 . 3 7 2 Prop町全 i o nofVarianceE x p l a i n e d .変数の階層的クラスター分析 図7 その後動画を見ていくと、理系の中でも「数物クラスター」・「生化学クラスター Jに割れたり、文系の中で も「言語クラスター(英・国 ) J が現れたりする。 1 0教科しかないので 1 0個のクラスターまで分割して、分散 説明率が元の lとなって終了である(固有値もそれぞれ lずっとなって終わる)。本動画は、 VARCLUSプロ シジャがクラスター分析とは言っても主成分・因子分析に近い考え方をしていること紹介するために作成し て見た。 ‑584‑

595.

8 .動的なしきい ある臨床検査薬を考える。 500例の有病群は正規分布 N(70, 1 52)に従っており、 9, 500例の無病群は正規分布 N(40, 1 52)に従っている(すなわち有病率 5%)。しきい値を超えた場合を陽性(+)とみなし、それ以外は陰性(ー) である。しきい値を 30から上昇させたとき、感度と特異度の変化を図 8に表した。しきい値は ROC曲線上 も動いている。 しきい値=30 hτ1 品 感度(真陽性率) 10 06 . . . 除 勧 . 04 加 01 00 00 02 04 06 08 τ 品 10 1戸特異1J:(偽陽性率) P ( ‑ I N ) =0 . 2 5 7 ( ) Hl ! ( I ・ . 鴫 ,.,締鴇鮒持続・~ P ( + I D ) =0.998 ,." 1鳴 、 指 図8 .R O C曲車泉としきい値 9 .動的な ROC 500例の有病群は正規分布に従っており、標準偏差は 1 5のまま平均が 5 5から 80に変化させる。 9 , 500例 の無病群は正規分布に従っており、標準偏差は 1 5のまま平均が 5 5から 30に変化させる ( 2群は等分散として いる)。群間差が開くに従って ROC曲線の AUCが 0 . 5から上昇する様子を図 9に示した。 t ‑検定にも考え方 が近いので群間差のト統計量の表示も添えた。 A U C=O .5 0 1 感度(真陽性率) 。 。 8 . 者 . 06 01 02 。 2 0" 06 08 10 1 特集度(偽陽性率} 宅街憲司. 務調量の tI 量計量ぉ 0 . 1 6 図9 . A U Cと群間差の関係 ‑585‑

596.

1 0 .動的なカプランマイヤー図 本章ではカプランマイヤー図を動かすということだけではなく、 SG グラフを動画にするということを同時 に試みている。 g o p t i o nである GIF ANIMD e v i c eD r i v e rは残念ながら SGグラフ(すなわち o d sgraphiωonにて 出力されるグラフ)はサポートしていない。しかしー工夫することで SGグラフを動画にすることができる叱 本プログラムのソースコードは巻末のプログラム 2に掲載した(グラフ中の検定統計量表示部分は、紙面の関 係上割愛させて頂いた)が、 SGグラフを動画化する手順を以下に記す。 :od 国g r a p h i c s機能によって SGグラ ・手順 1 ωsg r a p h i c sIr e s e t町田g e n a m e = ' 'WRK̲''; p r o cl i f e t e s td a t a = L I F E ;‑ 飽 ANNO; d a n g )として吐 フを外部ファイル(拡張子 p 外部ファイルWRK に吐き出す き出す 手順 2:外部ファイルをそのまま ANNOTATEデータセット化してしまう nm; p r 田 g a n n oa n n o= ANNO;r u n ; 外部ファイルWRKを ANNOTATE データセット化 a n n o 手順 3:ANNOTATEデータセットを g プロシジャに呼び込んで回転させ、あた かも SGプロ、ンジャが回転していること ANNOTATE データセットを にしてしまう Gグラフ肉に呼び込む 積極叡法による生存権定 1 . 0 ー一ー一ーーーーーーーーーー ーーー一ー、一一一一一 ‑ t一一一一一一一一一 L ̲ ー一ーーー 」一ーー 0 . 8 , 0 . 6 j ー t 骨1 也4 02 ログランヴ機定 P = O . 1 6 8 1 一般化ウィルコヲソン検定 P = O . 1 5 9 3 0 . 0 │争打ち切り│ 。 5 1 5 1 0 時間 (8) 2 0 IT町一一内側倒的一一一賄側~ 図1 0 .ログランク検定とウィルコクソン検定の比較 図 10 は、プラセボ群と実薬群の生存率を 20~600 日まで追跡した時の、ログランク検定と一般化ウィルコク ソン検定の違いを示した動画である。最初は実薬群の生存率が勝っているように見えるが、 3 0 0 日付近で生 存率が逆転するという人工データを作った。一般化ウィルコクソン検定は比較的初期の差を見ているのに対 し、ログランク検定は時間軸の後方の差を見ているのがお判りいただけるとと思う九 ‑ 5 8 6・

597.
[beta]
1
1
.動的なクラスター
有名なフイツシャーのアヤメのデータ(19
3
6
)を用いて、 k
‑
m
e
a
n
sクラスタリングの概念を動画にすることと
した(図 1
1
)。データには 4変数あるが、二次元の散布図で表現したいため、そのうち花弁の幅・花弁の長さ
5
0件のデータを FASTCLUSプロシジャによって 3分割する。反復数を少なく
のみを用いることとする。本 1

したいため、初期シードはそれぞれのクラスターに近いデータを代表値とした。左にはオリジナルの種(セト
サ・パーシカラー・パージニカ)ごとの散布図を参考までに置いた。
ヲ語予シ
舗前}

.••
F

︐でも

パー

a

花弁の舗{醐}
3
0,
‑
ー
四
岨
目
ー
・

吋

vd

?M都

"・, ・
.
."

Z132吋elait‑illit‑‑sjeJt均

‑
・
.
̲
‑
.
̲
.
・
‑

・"・

目
・
一
一
一
⁝

L.5
・4

•

‑
‑
‑
U
ゅ
・

"

寸
一
‑‑

t
E
*
"
.
.
(

。

0'"

c

。。。
。
o
0
申
。
曲
。
。0ω
o 0
。
ω
叫1) 000

0

田 由

2
0

0

山

<
1
)

3
建,撃の燥さ{繍)

o

00 0
Q:l
l(.U
0((>>

o Q認"""'
。
。。
00

c
r

O(J (
)

1
0

(;0

o
o

。。

0=0

0
"
"
o岨

田 川

認
:
o
;
.
.
{
;

1
0

2
0

3
0

4
0

5
0

6
0

7
0

花弁の長さ (
n
m
)

図1
1
. k‑meansクラスタリングの概念
動画では先ず初期シード(代表値)が設定され、それぞれ 3つのシードからユークリッド距離が近い点がそ
れぞれ 3つのクラスターに割り付けられる。それぞれのクラスターの重心が計算され、その重心を第 2のシ
ードとしてクラスタリングが繰り返される。前回の割付と矛盾がなかった場合、収束したとみなし、クラス
5
0件のうち 8件が左図と比較して誤答で
タリングは終了する。この l回の実験は計 4回の反復で終了し、 1

あったが最終クラスターはオリジナルのデータに近い分類となった。

1
2
. まとめ
動画は大量の情報を l枚に集約して表現することができる。プレゼンテーションにおいて結果だけでなくプ
ロセスを説明するのに適している。複数枚のタイプの異なる動画を同期的に動かすことで、統計量の多面的
な連動を表現することができる。動画とすることで何かシミュレーション(実験的なこと)を行っているこ
とを伝えることができ、説明を簡略化できる。上記の動画は全て SAS9.2を用いて作成した(※ )0 SASで動画
を作成することは特殊な外部オプションを必要とせず容易なことなので、ご自身のニーズ に合った動画作成
にチャレンジして頂きたい。

(
※)
S
A
S
9
.
3以上で実行される場合は、メイン SASウインドウの上部にあるメニューからツール→オプション

→プリファレンスを選択、結果タブを表示し、 IHTMLを作成する Jのチェックを外し、「リストを作成する」
にチェックを入れて実行すると上手く行くでしょう。

‑
5
8
7
‑

598.

参考文献 1 )長 谷 川 要 ( 2 0 0 2 ) . スピログラフを再現しよう ‑GIFANIMD e v i c eD r i v e rを用いたアニメーション図形の 作成一, 日本 S ASユーザー会 2 )岸 本 容 司 ( 2 0 0 3 ) . SASグラフによる動く万華鏡の作成,日本 SASユーザー会 3 )竹 内 啓 ( 1 9 9 4 ) . SASによるデータ解析入門[第 2版],東京大学出版会 4 )関 根 暁 史 ( 2 0 1 2 ) . 色を自在に操る (HSVカラーコードのすすめ), SASユーザー総会 5 )岸本淳司(19 9 6 ) . 変数のクラスタリングー PROCVARCLUS再発見 ,日本 SASユーザー会 6 )X i nZ h a n g( 2 0 1 3 ) .E x t e n d e dSASGIFANIMD e v i c eU s a g eo nT a b l eR e p o r t i n ga n dT e m p l a t e ‑ B a s e dG r a p h i c s,SAS G l o b a lF o r u m 7 )大 橋 靖 雄 (1 9 9 5 ) . 生存時間解析 SASによる生物統計,東京大学出版会 ‑ 5 8 8 ‑

599.

付録 /*プログラム 1* / %macroo n e s t a t e (s t a t e, d s) ; d a t an o r m a l ; r = & s t a t e . ;p a i = 3 . 1 4 1 5 9 3 ; ( l ベ2*pai*(1・r**2)**0.5)); c= dox= ・2t o2by0 . 0 5 ; = ・2t o2by0 . 0 5 ; doy d = c * e x p ( ー( 0 . 5 / ( 1・r 林 2 ) * ( x * * 2 ・ 2 * r * x * y + y * * 2 ) ) ) ; o u t p u t ; e n d ; e n d ; r u n ; 寸lO m a l ; p r o cg3dd a t a = r 町=d/ r o t a t e = 2 0t i l t = 斗0 ; p l o t y r u n ;q Ul t ; %mend; d a t au s a ; dos t a t e = Ot o0 . 9by0 . 1 ;o u t p u t ;e n d ; r u n ; d a t a̲ n u l l 一 ; s e tu s ae n d = d o n e ; f i l e'~URL 指定~¥:normal.sas'; i fn = 1 t h e np u t" f i l e n a m eanimmap'~URL 指定~¥NORMAL.gif;" / " g o p t i o n s r e s e 七= g o p t i o n s d e v i c e = g i f a n i m gsfmode = r e p l a c e gsfname=animrnap x p i x e l s = 6 0 0 =4OO" y p i x e l s " c b a c k = w h i t ei t e r a t i o n = Od e l a y = 1 5 0d i s p o s a l = b a c k g r o u n dn o b o r d e rh t i t l e = 1 3 p t ; " ; e l s ei f n =2 t h e np u t" g o p t i o n sg s f i n o d e = a p p e n d ; " ; i fdonet h e np u t" g o p t i o n sg e p i l o g = ' 3 B ' x ; " ; 凶 t a t e ( 's t a t e"u s a) ; ' ; put'%on r u n ; %inc'~U紅指定~¥normal. sas'; ‑589・

600.

/*プログラム 2* / p r o cf o r m a t ; v a l u et r t1 ="実薬 ( N = 4 0 ) "2ニ"プラセボ(N=40 ) " ; r u n : d a t aLIFE; i n p u tTRTTIMECENSOR@@; f o r m a tTRTt r t . : l a b e lTRT="治療 "TIME="時間(日) "CENSOR="打ち切り". c a r d s ; 18 。 。 。 。 。 21 11 2 0 25 11 8 0 26 124 0 28 136 0 210 0 148 0 214 0 168 0 219 0 184 0 222 0 195 0 232 0 11020 234 0 11090 240 0 11180 246 0 11320 250 0 11440 254 0 11560 262 0 11680 264 0 11740 266 0 11840 268 0 11920 272 0 11980 274 0 12190 280 1 12201 282 0 12320 286 0 12440 296 0 12520 21050 12640 21200 1 2 7 0 . 0 21600 12900 22800 ‑590‑

601.

13000 23000 13200 24010 13330 25010 13500 26000 13640 26100 14000 26500 14640 26780 15020 26940 15550 27000 15590 27010 16010 28000 16020 29000 r u n ; %macroo n e s t a t e (s t a t e) ; o d sg r a p h i c s/r e s e tw i d t h = 6 i nh e i g h t ニ4 i nimagename="WRK"; s t a t e . ; p r o cl i f e t e s tdata=LIFEmaxtime & 二 t i m eTIME*CENSOR(1 ) ; s t r a t aTRT; n m dataANNO; l e n g t hf u n c t i o ns t y l e$32; r e t a i nx s y sy s y s' 3 'h s y s' 3 'when' a ' ; f u n c t i o n = ' m o v e ' ;x = O ;y = O ;o u t p u t ; =JOO; f u n c t i o n = ' i m a g e ' ;x=IOO;y ニ " WRK.png";s t y l e = ' f i t ' ;o u t p u t ; i m g p a t h r u n ; p r o cgannoanno=ANNO;r u n ; %mend; d a t au s a ; dos t a t e = 2 0t o600by2 0 ;o u t p u t ;e n d ; r u n ; ‑591‑

602.

d a t an u l l; s e tu s ae n d = d o n e ; f i l e'~URL 指定~¥KM.sas'; i f n =1 t h e np u t" f i l e n a m eanimmap'~URL 指定~¥カプランマイヤー .gif';" / " g o p t i o n s r e s e t = g o p t i o n s d e v i c e = g i f a n i m g s白n o d e = r e p l a c e g s f u a m e ニ a nimmap x p i x e l s = 6 0 1 y p i x e l s = 4 0 1 " ニo d e l a y = 2 0 0d i s p o s a l = b a c k g r o u n db o r d e rh t i t l e = 1 3 p t; " ; " c b a c k = w h i t ei t e r a t i o n e l s ei fn ニ 2 t h e np u t" g o p t i o n sg s f m o d e = a p p e n d ; " ; i fd o n et h e np u t" g o p t i o n sg e p i l o g = ' 3 B ' x ; " ; p u t' % o n e s t a t e ( 's t a t e ν ; r u n %inc'~URL 指定~¥KM.sas'; ‑ 5 9 2 ‑

603.

! 医 療 、 政 府 間 点 こ ー均 五 戸 ム : I . ‑ f J ‑aa 21 9 伝統芸能実演家の動的データベースの作成 坂部裕美子 公益財団法人統計情報研究開発センター研究開発本部 C r e a t i o no ft h eDynamicDatabaseabout t h eT r a d i t i o n a l ‑ P e r f o r m i n g ‑ A r t sPerformers Yumil くo S akabe Research‑and‑DevelopmentHeadquarters, S t a t i s t i c a l l n f o r m a t i o nI n s t i t u t ef o rC o n s u l t i n gand A n a l y s i s │臨政府間消防 要旨: 伝統芸能の実演者に聞する長期データ中から、ある任意の年次時点 で活動していた実演家のみを抜き出し、比較用の属性を付加して動 的データベースを作成するプログラムを開発した。その適用例を紹介 する。 r r a y ステートメント、 mergeステートメント、 updateステー キーワード:a プロシジャ トメント、 rank 帽 593・

604.
[beta]
E,
i
B
l
l
f
t
f
.
m~äf*,:*:主主霊童宣言三三三田
I ノ I‑r
ノヌム込 υノ
犯
,
'
.
:
:
5
ξl工

I

│

‑筆者は、伝統芸能の上演傾向等を年度ごと
に集計・比較するという研究をしている
・年度ごとの公演概況集計結果の参照用資料
として、当時の実演家の付帯情報をまとめた
DBが必要
・実演者リストは、現実的には単年度版が市販
されることが多く、観客としてはその方が使い
やすい。しかし、データ整備・更新作業面から
は、積年版の単一ファイルの方が好都合

~9

医寵政府眺大学によ紅コ以テムの恥綿一

趨併論6

_E~四哩__~_ ___!)~r:rle _~l

2奏 二
3奏三

ぬ曾

E
量判EW1油L
E
:~相k.AU_i由也
I

向 er
̲
lD

I

2

4 劃田
5ふ
た五1!5

6 ふた穴

7ぜん七

1
1

1
2
1
3
1
1
1
5

2
0
1
0
1
9
明 L
:
:
:
tト
1
回 5r
z
t
.
,
二
1
9
日(山三
1
9
陥O仁い四
1
9
明日、五
1
9
9
0
1
9
8
5
2
0
0
0
2
0
0
5
2
0
0
5

7
0

3~

6
0
5
0

3
3

4
0
3
0

2

2
0
8
0

1
1H‑
1
2n
二
1
3 打三
1
4n
回
1
5抽 五

7
0
6
0
5
0

2
1

"1
3
3
3<
'

4
0

1
6まえ六

初

刊
印

"師二
"師三

"ιt吃E

5
0
4
0
3
0

2
5にい五
2
6 さきで
2
7 さき七

2
0

M拘

1
9
日
1
9
削
1
9
7
0
叩
1
9
1
9
9
0
1
9
9
5
2
0
0
0
2
閃5
1
9
3
5
1
9
4
5
1
9
5
5
1
9
5
5
1
9
7
0
1
9
&
0
¥
9
9
5
2
0
0
0
2
0
0
5
2
氾1
0
1
9
3
0
1
9
3
5
1
9
5
5
¥
9
6
0
1
9
9
0
1
9
9
0
1
9
9
5
2
0
0
0
2
0
0
5
2
0
0
5

1
9
9
5 ぜん
1
9
9
0 ぜん
ぜん
ぜん
2
0
0
0 ぜんE
ぜん六
ぜん七
ぜん八
ぜん九
ぜん十
1
9
9
0 まえー
2
0
0
0 まえ二
1
9
9
5 まえ三
まえ四
まえ五
まえ"
まえ七
ま
えj
¥
まえ九
まえ十
¥
9
8
0 さき一
さきこ
さき三
2
0
0
f さき四
さき五
さき六
さき七
きき八
き者九
さき十

.

̲
̲
̲
,
.l̲___':.~~

刊山内肘

1
9
6
0
1
9
7
0
1
9
9
0
1
9
8
5
1
9
9
0

19~O

ミ
'
t
"e

9999

mo

1
9
3
0

Mmm別 W M W M W

¥
9
¥
0
1
S
20
1
9
3
0
1
9
4
0
1
9
5
0
1
9
6
0
1
9
7
0
¥
9
8
0
1
9
8
5
1
9
9
0
1
9
1
D
1
9
2
0
1
9
3
0
1
9
4
0
1
9
5
0
1
9帥
1
9
7
0
1
9
8
0
1
9
8
5
I
Q
gO
¥
9
1
0
¥
9
2
0
1
9
3
0
¥
9
4
0

士
川

刃

8
9
1
0
1
1
1
2
1
3
1
4
1
5
1
6
1
7
1
8
1
9
2
0
2
1
2
2
2
3
2
4
2
5
2
6
2
7
2
9
2
9
3
0

b酌|吋~-~必ユ E ←

一二三四
師師師肺

ー
三
王
子
下 日一小川王干丁一[一全十一LLizZ

‑作業イメージ

(注)この図の Player̲IDは作業用の仮番号

‑
5
9
4
‑

605.

‑実際!こ「歌舞伎 J f落語 J f宝塚」の実演家 DB を開発していく過程で、すべてに共通する作 業過程があり、プログラムを共有できるので はないかと考えた ・襲名および改名…該当年度の名前で表示する .昇進…該当年度の階級で表示する ・「共通プログ伶ラム jと「分野ごとの独自指標の 算出 Jを経て、長期 DBから特定の年度の実演 家 DBを抽出表示する パふわ 暢 恥 ク 紘一‑ 調停の内績 ピユ瀬順 一 一 = m 咽a 機阜市入成 輪ずの縛議 務各諸塚 よい落申車 ぃ 民 鶏 ①全演者データから該当年度に活動していた 者のみを抽出し、年齢を計算する % I e tyear=1990; d a t adb̲&year; s e ta l ld a t a ; f o r m a tp l a y e r ̲ I Dnameagec l a s s<F1><F2>; i fr e t i r ene.and&year>r e t i r et h e nd e l e t e ; i fe n t e r>&yeart h e nd e l e t e ; %determ age=& y e a r ‑ b o r n ; keepp l a y e r ̲ I Dnameagec l a s s<F1><F2>; r u n ; 5 9 5 ‑

606.

医吋叫糟!とよ紅コV^7110)~iiE $ . : J . ‑ 1 f ‑ I l . SA 21 9 ②その当時の階級と名称で表示する %macrod e t e r m ; c l a s s = O ; %doi = 1%to5 ; i fname̲&ine"andshumei̲&i=<&yeart h e n name=name & i ; i fshoshin̲&i=<&yeart h e n c l a s s + 1; %end; %mend; E.iBlJf.j.I!1!I~élf*. *!j!IC::~9l::::JV 豆 ~iiE S:1‑1f望E圃 SA │ 斗 刀‑3: 1 7 1 守 1Lノ M ソノム込リノ一司ス夢平 1 又 ‑共通プログラム中の要修正箇所 一階級昇進なし、改名(襲名)あり ・独自項目(実演者 DBからの付加項目) ‑親は誰か(将来的には「歌舞伎俳優か」も考車する) ‑特定の顕彰制度についての受賞歴 ・独自算出指キ票 (DB内で算出するもの) 一家の格(受賞歴を使用) ‑ 5 9 6・ l

607.
[beta]
•r
芸術院会員 J
r人間国宝 J
r文化功労者 J
r文
化勲章 jのうち 2つ以上の顕彰歴のある俳優
)
は「名家」と考えたいいランク 1

・上記の条件を満たす俳優の息子は「特別視 J
したいいランク 2
)
・これらの条件に該当する俳優にフラグを付け

る
→この「家の格」を使用した集計を、過去の SASユーザ
一会で報告済み

datads01・
s
e
tdb̲&year(keep=player̲IDp
r
i
z
e
1
‑
p
r
i
z
e
4
)
;
a
r
r
a
yp
r
z
{
4
}p
r
i
z
e
1
‑
p
r
i
z
e
4
;
f
l
g
0
1
=
O
;
doi
=
1t
o4・
f
l
g
0
1+
(
p
r
z
{
i
}ne.andp
r
z
{
i
}=<&year)
;
e
n
d
;
i
ff
l
g
O1>=2theno
u
t
p
u
t
;
r
u
n
;
「該当年次における受賞状況 jとすることで、
役者自身の「ランクむから「ランク l
Jへの
昇格を反映できる
w
; S~ ~ ,
!
' 器(例:菊正郎 7
)

│

4

‑
5
9
7
‑

々.

608.

1 .親が該当するケースヘ mergeする 2 .当人が該当するケースヘ updateする d a t ad s 0 1 : s e tds01( k e e p = p l a y e r ̲ I D ) ; p r z 0 1= 2 ;r u n ; p r o cs o r tdata=db 一& y e a r ; bys h i s h o ; d a t ads02̲1; mergedb̲&yeards01 ( r e n a m e = ( p l a y e r ̲ I D = s h i s h o ) ) ; bys h i s h o ; r u n ; d a t ads01 s e td s 0 1 ; p r z 0 1= 1; r u n ; p r o cs o r tdata=db̲&year; byp l a y e r ̲ I D ; d a t ads02̲2; updateds02̲1d s 0 1 ; byp l a y e r ̲ I D ; r u n ; I 両方に該当するケースは、 1こ上書きされる より上位の 1 E"iBllf.J.~m~f*" j;;!J!f ; :冨 置 盟 国 園 田 o 万~:EY1寸 1L ノ μ ソノム以ιノ -3者自首 │ ‑共通プログラム中の要修正箇所 ーなし(階級、名称、年齢すべて処理が必要) .独自項目 ‑師匠は誰か .独自算出指標 一入門以降の経過年数 一真打に抜擢昇進したか ー弟子/兄弟弟子の人数 5 9 8 ‑ ー

609.

‑落語家の階級=前座/二つ目/真打 ・抜擢昇進:ニツ目の落語家が、先輩を飛び越 えて真打に昇進するケース ・将来性を高く見込まれて抜擢が行われることが多い。 実際に、昇進後の寄席の出番は、そうでないものより 有意に多い ・「抜いた人数の多寡」よりも「抜擢されたか否か」の方 がその後の活躍への影響が大きい ーシ過去の S A Sユーザー会で分析報告済み 医療政府自治体大学!とよ紅白ステム保証純一儲 ~9 1.未昇進者の真打昇進年に仮の値を入れる d a t ad s 0 1 ; s e ta l l ̲ d a t a ( k e e p = p l a y e r ̲ I Ds h u m e i ̲ 3 ) ; 1 入門後当骸年までの死亡・廃業者も i fshumei̲3=.t h e nshumei̲3=2999; 考慮し、正確な抜擢状況を把握する r u n ; 一 ̲‑ ‑ ‑ , I I(今後の研究で使用する可能性あり) 2 . 真打昇進順位が入門順位より上の人にフラ グを付ける p r o cr a n kdata=ds01out=ds02 t i e s = l o w ; v a rshumei̲3; r a n k ss h o s h i n ; r u n ; d a t ad s 0 2 ;s e td s 0 2 ; i fs h o s h i n < p l a y e r ̲ I Dt h e n1 fg01=1; r u n ; ‑ 5 9 9・

610.

‑落語家のライフサイクルを考察する上で有意 義な指標たりうると考えられる ‑弟子がいるー ( 1)ある程度成功している ( 2 )後進の育成期に入っている •r 弟子の数」や「自身が惣領弟子であるか否 かjも指標のーっとなり得る?(今後の検証 が必要) │医療、政府間点による己努弘同… 1.兄弟弟子の連番をふる p r o cr a n kdata=db 一& yearout=ds03̲1 t i e s = l o w ; v a re n t e r ;r a n k sdeshi̲no;bys h i s h o ; r u n ; 2 . 自分の弟子の人数を付与する p r o cf r e qdata=db̲&year; t a b l e ss h i s h oIn o p r i n to u t =ds04; r u n ; d a t ads03̲2; mergeds03̲1ds04 ( d r o p = p e r c e n t rename=(shisho=player ̲ ID c o u n t = d e s h i ) ) ; byp l a y e r ̲ I D ;r u n ; 国 6 0 0 ‑

611.

‑共通プログラム中の要修正箇所 一階級昇進なし、年齢なし、改名あり(僅かに存在) .独自項目 一所属する組、男役/娘役の別 ートップ就任の有無および就任年 一新人公演の主演および本公演以外の主演状況 .独自算出指標 一入団以降の経過年数 一本公演以外の公演種別主演回数 ‑過去の組替え回数は、その後の活動内容と 関連があると考えられるので、別途項目とし て立てておく /1この部分の作業がこれ以降で 繰り返しになるので、マクロを d a t ad s 0 1 ; I ~ 定義す令 setdb_&yea~忌 p=player_ID c ̲ c l a s s ̲ y e a r :) ; a r r a yc ̲ c l a s s { * }c ̲ c l a s s ̲ y e a r :; cc l a s st = O ; doi = 1t od i m ( c ̲ c l a s s ) ; c ̲ c l a s s ̲ t + ( c ̲ c l a s s { i }ne.andc ̲ c l a s s { i }=<&year) ; e n d ; ‑ 6 0 1 ‑

612.

‑新人公演・バウホール公演・その他の劇場の 主演経験歴を集計する datad s 0 2 ; 一&year( keep=player̲ID s h i n ̲ t o p :vow̲top:o t h e r ̲ t o p :) ; s e tdb %gsum(shin) %gsum(vow) %gsum(other) r u n ; %macrog s u m ( v a r ) ; 一 a r r a y& v a r { * }&var̲top &var̲main=O; doi = 1t od i m ( & v a r ) ; & v a r ̲ m a i n + ( & v a r { i }ne.and& v a r { i }=<&year) ; e n d ; %mend; E璽1 1 1 塁塁盟聖書 AS. : J . ‑ . . , ‑ o a 盟国 ‑収録データの規模は、「全データ jで最大4500件程 で最大400件程度(うち、独自指標 度、「抽出データ J の算出が必要なのは数十件)の見込みなので、処 理時間の問題なく実用化できると考えられる • Outputlこ関しては未開拓だが、もともと結果閲覧が 目的なので、将来的に着手できればと考えている A Sを使っている人は皆無だと思 .この分野の研究に S うので、珍奇な事例報告としてご紹介しました。まだ プログラムに改良の余地はあると思います。 602‑ ー

613.

問、開・帥;芸員梢欝簿むよー ~9 S A SでC D I S CSDTMデータを効率的に利用するため にD e f i n e ‑ X M Lのメタデータを活用する 富永一宏 イーピーヱス株式会社統計解析 1部 Useo fDefine‑XMLMetadataf o rE f f i c i e n t l y MakingCDISCSDTMDatasetsi nSAS Programing KazuhiroTominaga S t a t i s t i c sAnalysisDepartment1,EPSCorporation │関一日I 手伝接持九一 ~I]9 要旨: SASのXML エンジンの機能を利用して Define‑XMLから Metadataを読み 取り、 SDTMの親ドメインと SUPPQUALの結合した後に非標準変数の属 性をデータ利用者が想定していたものに復元する方法。 キーワード SDTM,define.xml,Define‑XML,XMLMap ‑ 6 0 3 ‑

614.

│ 医 療 政 府 関 大 …m ス テ ム の 恥 … 会 W ] 9 イントロダクション • CDISC 標準 ‑ FDA • 2004年から CDISC 標準によるデータ提出が試みられてきた。 一日本 ‑ 申請データ提出フォーマットとして採用された • 2016年から提出が本格的に開始される予定。 0 • CDISC 標準に準拠したデータを作成するために 一例えば、米国を中心 l こCDISC標準に準拠したデータの作成方法が検討されてきた。 ・疾患領域別ガイド、 Questionnaireガイド、 ControlledTerminologyの充実 ーさらに近年は define.xmlを作成する便利なツールも登場。 同揚これまでは、ブzタ作成者側の立場と~てのz 務試みが注目されてきた産 纏酔 l医 療 政 府 開 問 よ る ロ シ ス 弘 の 実 証 SAS .J.‑+f‑紬 ~Ij]9 SDTMの特徴 誌験 1 鼠験2 鼠 験3 ADaM 記~ 特徴 一入力/管理から分離されたデータ 元々のコンセプトは申請データ提出用 l こRawデータを高度に標準化したもの。 一他方、高度に標準化しすぎた部分 (SUPPQUALなど)はデータ利用者には使いづらい。 ‑ 6 0 4 ‑

615.

2 0 1 4 │医樺政府間大…ロシステムの実証一一絡会 同 ロ 的 4 . 目標 今後COISC 標準に準拠したデータが増えてくるならば、 :~はデータ利用者側が『効率的にデータを利用できる方法J が重要になる。; ん 札んよゑふみ忠之ふい叫札ふーム〉ゅよ 吋へぺミジμ い ふ 品 以 v • 課題 一試し l こS DTMデータの利用者の立場になって扱ってみると・・・ • d e f i n e . x m lのメタデータを直接プログラムから読み込みたくなることが分かつた。 • SASでこれを実現できるのか? • 今回の目標 ー今回は以下の簡単なシチュエーションを例に検討してみる。 SOTMの親ドメインにSUPPQUAL を再結合するときに発生する課題と、 d e f i n e . x m l を用いた解決方法をSASプログラムで実現する。 噛 . ̲ . . / l 医療政府間大…口シス弘の実証 SAS. J . ‑if‑ 総 会 ~9 非標準変数を正規化し、 SOTM標準変数のみにする {縦積みに転置する} SOTMデータ利用者はこの手順を H 空樫型事空軍手… J ‑ 6 0 5・

616.

~9 SUPPQUALから転置した時の課題 医僚政府関知よるヱコ以デムの恥…齢 SUPPXX XX PROCTRANSPOSEDATA=SUPPXXPREFIX=̲ ; VARQVAL; BYSTUDYIDRDOMAINUSUBJIDIDVARVAL; IDQNAM; IDLABELQLABEL; WHEREI D V A R = ' X X S E Q ' ; RUN; │USUω1XXSEQ1. . 1 . . . 1 . . . 1. . 1. . 1. . i ABC123 11 〆 ' ‑ ‑ v ‑ ‑ ‑ ‑ ' QVALの型(文字)と長さが 転置後の変数に継承される。 、 元 々 の ー の 型、長さ、 1 I 贋序が復元できない。 f 一人一‑‑y一一ー九一『、 一 . ‑ . 0 I I I I ‑ a 圃 圃r 一 d e f i n e . x m lからメタデータを 読み取る必要 制 非標準変数 l お UPPQUALで値として存在するので 欲しい情報はdefine.xm問 ValueL e v e lMetadataとして格納されている 機 器 会 医積政府関却による四ス均均一蝕 Define‑XML ‑特徴 ‑ CDISC 標準の一つで、メタデータの格納方法を規定したもの • XML ファイルで実装する。 まVl .OとV 2 . 0のz つが存在する。 現在、パージョン l 一簡単に言うと ・ブラウザーで閲覧するデータ定義書。 ‑ 6 0 6 ‑ W l J 9

617.
[beta]
│鴎、腕時滞日記訴訟尚一一嚇

~I]9

Define‑XML
XML
ファイルのメリット・テ、メリット
ーメリット
・プログラムから読み取り可能 (MachineReadable)
コンビュータで表示、閲覧できるという意味ではない。
SASなどのプログラミンゲによって情報を読み取れるという意味。

ーデメリット
・作成するためには、 I
T
技術に詳しいプログラマが必要。
‑ただし、最近 l
まdefine.xml作成ツールが公開されてきて、敷居が下がってきた。

書籍 rlmplementingCDISCUsingSAS‑AnEnd‑to‑EndGuideJのSASマクロ
h旦räl~u p
por
t
.sas.
c
om/pub1
i
s
hi
ng/
au
t
h
o
r
s
/
s
h
o
s
t
a
k
.
h
t
m
l

l
{
1
.0.0ではValueLevelMetadata
一富士通 r
t
s
C
l
i
n
i
c
a
lD
e
f
i
n
e
.
x
m
lGeneratorJ
SASFieldNameの
出ι
丘
胆
l
!
,
i
l
i
t
,
副
主
旦m/sol
旦i
旦m
.
D
i
f
u
L
c
d
i
s
c
t
o
Qぜ に対する Name,

実装方法にまだ問題がある

1

W
J
9

一
¥
政
危
¥
戸
時
、
均
こ
よ
む 支持均一一
SASXMLL
lBNAMEEngine
S
A
SからXML
ファイルを読み取る方法
‑S
A
SXMLL
lB
NAMEE
n
g
i
n
e

ヨ型型きJ

一

d

<Member>
<Name>Tom</Name><Age>62</Age> 、
、
</Member>
<Member>
<Name>Willie</Name>
<Age>70</
Age>
</Member>
<
/
L
is
t
>

ア附

I
:

[
…
温
…

<
L
ist>

セ臥
タm

〈フ x
mlv
e
r
s
i
o
n
=
"l
.O"7>

SASプログラム

自

e ~.~Lファイル
(Member.xml)

XMLMapの設定に従い
XML
ファイルを SASデータセットに変換

!…
、、

内

〈③〉

v

I
~以川川
刈
X
xrv
肌/
のマツピング定義を記載した設定フアイル

‑
6
0
7・

618.
[beta]
│:

治、

と

おステムゐ宗主制汗蝕

.

SASXMLL
lBNAMEEngine
特徴
‑ SASXMLMap
• XML
ファイルのエレメントを SASデータセットの変数にマッピングするための設定フ

アイ J
レ
・設定ファイルの仕織を理解する必要がある。
‑ SAS9
.
4XMLL
lBNAMEEngine:U
s
e
r
'
sGuide
h
立ι
1buppo同 sas.com/documentation/cdl/en/eng!
<!
!
!
l
L
昼4990/HTML/default/
出型旦1TI
m空1凶盟 p̲KE!
j
)
̲
t
m

自動生成ツール
ー

rSASXMLMapperJ
というソフトを使うと XMLMapファイルの雛形を簡単に作

成できる。
h
t
t
P
:
//suppoは sas.com/QQ_V'LnIQP~Lh堕型竺h盟主主主盟主 12

‑ XML
ファイルの書き込み機能が弱い
‑単純な書き込み機能しかないため、 define.xmlのような複雑な XMLファイルを作成
する事はできない。

i医 療 政 府 間 大 … ロ シ ス テ ム 保 証 .."fi.l.~.ï哨
XMLMapファイ jレ
<?xmlv
e
r
s
i
o
n
=
"1
.0"encoding="UTF‑8"?>
,・ version="2.1">
<SXLEMAPname="AUTO GEN
<NAMESPACEScount="O"/>
<TABLdescription="Member"name="Member">
<TABLE‑PATHs
y
n
t
a
xコ"XPath">/L
is
t
!Member<灯ABLE‑PATHよ 日

~9

XMLのエレメント指定は
XPathで記述する
副
長

及

、;

∞

1

叩
<C
COL
附叫
U
J
爪
川
山
M
刷川
N
Jn
旧
川
ame

ame">
<PATHsyntax="XPath">/L
is
t
!Member/Name</PATH> I
<TYPE>character</TYPE>
I
<DATATYPE>string</DATATYPE>

r

I

<LENGTH>10</
ほ NGTH>
</COLUMN>

I

<COLUMNname="Age">
<PATHs
y
n
t
a
xピ'XPath">/List/Member/Age</PATH>
<TYPE>numeric</TYPE>
<DATATYPE>integer</DATATYPE>
</COLUMN>
<
/
T
ABLE>
</SXLEMAP>

デ一タセツトの定義
こニこで指定したm
I
玖袖
λ
B
凱L
ら
E‑
閉
P
州
A
何
A
T
刊
附
H
吋 純l
二明野蝕する勺

で Nameのマッピング定穣;
一 叫 んW

ふいふんふJ

1

I

ト

I

J

‑
6
0
8
‑

Age
のマッピング定書量
夕日"

i

619.
[beta]
1

"f!l-~-'=僻

医癒政府間大…一弘の実証 .
.

W
l
J
[
1

SASXMLMapper

金亡命。~.~" 01 -.日.~~~~"jJJ
• d
e
f
i
n
e
.
x
m
lを読み込むとエラーする場合の対処法
‑ ODMタグのお i
:
s
c
h
e
m
a
L
o
c
a
t
i
o
n
属性を削除すると改善する犠合がある。

.政府間一大学による防ステムの実証

SAS.:l‑"f‑齢

W
l
J
[
1

L
lBNAMEの設定

‑
‑
‑
l

読み込むX叩 ザ ル 吋 旨 定 i

‑設定方法

filenames
x
l
e
l
i
b"
C
:¥Temp
¥Membeは ml";γ
.一一一
filenamesxlemap"
C
:¥Temp¥Member.map"; I_-::-~
XMLMapファイルの指定
libnames
x
l
e
l
i
bxmlv2xmlmap怠 S胸 map;

̲
J

吋

吋

d
a
t
amember;
s
e
ts
x
l
e
l
i
b
.
m
e
m
b
e
r
;
r
u
n
;

データセットは XMLのライブラリから
取り出されて、初めて実体が生成される。

‑
6
0
9
620.

│医療政府開ーは紅コ以加知一帥 ~9 非標準変数の属性を復元する • SUPPQUAL を転置した時の課題 ‑非標準変数の以下の情報が復元できない ・型、長さ、 1慎序 d e f i n e . x m lを読み込む ‑非標準変数の属性情報は ValueLevelMetadataにある • SASXMLL lBNAMEEngineでこの情報を読み取る ・読み取った情報を利用して、非標準変数の属性を復元する。 ‑以下では Define‑XMLV1 .0を想定 Oefine‑XMLV2.0を読み込む場合の注意事項 XMLMap ファイ jレ namespaceの健と変数ラベルの仕様が異なる 0 SAS プログラム 経 QNAMではなく、 QVAL からValueL is tのゆを抽出する。 ・ │医療蜘間大学によるヱコシス問調…齢 ~9 d e f i n e . x m lで読み込む箇所 ‑必要な情報 SOTMデータを利用するときの 全変数の情報覧 1 2 STUOYIO StudyI d e n t i f i e r , , > < t RDQMAIN R e l a t e dDomainA b b r e v i a t i口門 t e x t 12 USUBJID UniqueS u b j e c tI d e n t i f i e r IDVAR I d e n t i f y i n gV a r i a b l e t e x t '8 IDVARVAL I d e n t i f y i n gV a r i a h l eValue t e x t Q l i . 企M ~ Namt 200 t e x t 18 QLABEl Q u a l i f i e rV a r i a b l el a b e l , , > < t 40 QVAL DataValue t e x t 200 、 ー 田 園 田 嶋 明 暗 時 帰 嗣 時 間 同 国 ー 四 回 . , 6 1 0 ‑ ー

621.
[beta]
!
V
‑
E
‑
2

医療問治体点i
ぬ宇治延長
2
8
1
9
d
e
f
i
n
e
.
x
m
lで読み込む箇所
• XMLの構造
・以下は、 SUPPQUALを転置した後│こ、属性を再設定するために必要となる部分。

iODMl

・以下の三つの情報を SASデータセットに変換して取り出す。

Lベ Study I
H

G
l
o
b
a
l
V
a
r
i
a
b
l
e
s

じ
;Fi‑‑Vii‑‑id;iLt;:
品:
;
t

覧 j

時悩崎将 V
a
r
i
a
b
l
eL
e
v
e
lMetadata I

i

変数の情報

9

旬、政府自治体;大学問均均点;均一 W
l
J
d
e
f
i
n
e
.
x
m
l用の XMLMapファイ jレ
XMLMapファイルの骨子
<?xmlversion="LO"encoding="UTF‑8"?>
<SXLEMAPv
e
r
s
i
o
n
=
"
2
.
1
'・〉
<NAMESPACEScount="3">
:
/
/www.cdisc
.org/ns/odm/vL2</NS>
<NSi
d
=
"
l
"p
r
e
f
i
x
=
"う h仕 p
<NSi
d
=
"
2
"p
r
e
f
i
x
=
"
d
e
f
"
>
h
社p
:
/
/www.cdisc.org/ns/def/vl.O</NS>
>h
仕p
・
/
/www.w3.org/1999/xlink</NS>
<NSi
d
=
"
3
"p
r
e
f
i
x
=
"
x
l
i
n
k
'・

I
.
. lI
y
̲
,
ぬ
刷
帥
剖
山叫

非正規化した変数の i
巾
D一 覧 {

</NAMESPACES>

.
<
/
T
ABLE> ‑ 岬 開 油 岬
<TABLEname="Value">,

一

<TABLEname="Dataset"> バ/T
ABLE>
<TABLEname='Variable > ,</TABLE>

明 開 輔 副 恥 叩 刊 一

く

•
』

/SXLEMAP>

‑
6
1
1
‑

T'

DatasetL
e
v
e
lMetadata

¥

データセットの情報と

君~O) IDて1 い
V
a
r
i
a
b
l
eL
e
v
e
lMetadata

変数の情報

I

622.
[beta]
…
…
… l<…"冊
‑
…
"
ラ
一

l
I一
一
時…

Oefine‑XMLVl・
9
用 の XMLMap
ファイル
ValueMetaDeflnel.rnap 滋

,
j
‑
f,

UT "I

叫 <S~,岨室町z わ
叫 胴d
."l'O'."川 町

I
f
̲
,dl

合

. . .

種
雄

⁝
一

r同 .
.
"
do
f
"'
h
n
o
!
!
w
w
w由 。 一 山

… 同z

d 仙[", rn.~

̲wl

V川 〉

T/
o
.
I
ILE̲PATHsynw"
嗣 , " , 制 ザ " 向 山z… … … 斤 刷 e < 恥

哨 " … … … … … 川 " " 酬 1}"emflol<!
TA8t
1PATH>

叫

U"'..n.""'.....m.

‘ PATHoynt"."XP""'_"W ,/{lIODM/{lIS'"dYI{l)~'O".V.
.
叫 … … , " ,

訓….r4T'n'E>

… . . ‑ J O . ATATWE,
'lEHG恥 山 間 肋
UMN.

制

,
00, 川 円 叫 o
.
t
.
T
'
f
p
t
.
,
PATHoynt. , … ヨ 仰 向 l
J
S
'
u
d
y
/
{
I
I
M
.
t Di
1
, V… 円 刷 伺 尚 一.
1
H,
""泊"'吋刊,.,

・

D"‑1A1YP[叩/OATA1YP
',

叫情。,T
H>100</lEN6Tめ

へ
ル

く!COW

叫U 酬可, m.."~'"

,
PATH… 山 札 、 叩 州 市 叩 阿 山 、 山 1
}
'
"明 町 叩A恥

明 一 仰 "
<DMA1Y PE 吋ミ DA1~'叫

…
.
.
一
日

叩"'除

一

岨 叩 叩 . . " U tb
e
l

叩 酬 銅 山 川 町 " 叫 川 町 刷 蜘 1 (
1)V"u乱 叫 11".m".11
伸縮川町柳川ゅ
押

叩

叫~"調町 M 柑畑叫lI~tody!{l…叫醐柑川町駅 ')l....'ψ

,
<
/
T
Y
P
"

Tnu"̲'
‑
A1 Y P < 珊 酬 明 TA
1YPE>

,

'DATA
1YPE>.
.
.
.
吋 制TA
.
1
YP
E

叩 U仙
市相,.

一
⁝
一

一

,一

..jWl
UMN

‘"臥 εn.",.~ '0"
,胤〉
,
TAeL
<p
A
1
制o
v
n,
,
.
="X
山

叫 … 一 、
叩 山 町 州 、 仰 町 " 川 町 omw"
,
o
r
.
!
{
:l
"emOef
, @ > … 何 一
一 …

川 町l)S'"O'
,八印刷 .D".V., 叫 川 町 制 l)".mR.I,川 8tH'"怜

一 一 … … 、
制 ' " 宮 町 … ザ " " 同 " 叫1
帥
'1YPE><n.",'.,仇

,[)AT
A1YP
E
吋 叫 品
'lEHG刊 >100</
LEHGTH>

t
.
o
"
.
v
…
, 川 町"
oD
c
f
I
… 恥

叫

A1YP
E
>
>
附
'
8
'
fDATA1YPE>
'lEHGTH>lω吋
Tめ

相

一}
̲
'
x
p
.
……

"
Mめ

叩 叫

,

凶
,OOof/@N山 山

叩 刷
nEN川 町 } 吋
u 1剛 山 山 吋 1)".", 6
叩 ' > th
oroct̲/TY'附
<DATA
1YP
E
.
.
"
In&<川 1A
1YP
E
'

4陥
削除'"附,",

'
1
'
臥 UMN>
UMNn.m..'"叩 小
'PATH 'I'nt.,山'NR"'lll )OOMI11)StudvfI1川…… ~tom6,o"oDcflll伸一一 PATH ,
〈下 P
E><h.
P
め
<OATAlY陪吋,"山下,.,
<
lEN6TH>1
</WtUMN
叫

SASXMLMapperで雛形を作成してから
細部を整えると簡単に作れる占

,
,
"
"
'
/
T
Y
問問'",
,

ザ組.,

I持政府自問学は紅おステ均実証 ~:n.~~叫|
非標準変数の情報を抽出
filenames
x
l
e
l
i
b"(¥Temp
¥d
e
f
i
n
e,xml・
filenamesxlemap
libnames
x
l
e
l
i
bxmlv2xmlmap~ s
x
l
e
m
a
p
;

ヨ
QNAMfこ設定された

自

v
a
l
u
e

山 L is
t
情報の抽出 E 3
非標準変数

の10一覧を保持
QNAM

の抽出

自

E3dataset

V
a
l
u
eL
is
tの1
0を保持

自
OrderNumberでソート

6
1
2
‑

ー

vlm

623.

E3dataset EE 量量盟畿説欝盟 非標準変数の属性を復元 2 0 1 4 非標準変数の情報カ( I 二二よ糊されたデータセット欄< i j 組膜喬と取り出していく 非鮮変説雨情報を %doi = l% t o& d s n o b s . ; % I e tr e t = % s y s f u n c ( f e t c h o b s ( & d s i d,& i . ) ) ; 理 処 変⁝ 更 ⁝ % 性 一 ・3 属ぷ % I e tr e t = % s y s f u n c ( c l o s e ( & d s i d . ) ) ; r u n ; ‑ 6 1 3・

624.

1 医療政府郎大学問一 実行結果の例 • DM+SUPPDMの例 3 襲 Vatue 奇 襲 綴 l a b e l I T T l a g t I n t e n tt oT r e a tPopulat旧 nF e x tを容 200 SAFETY S a f e t yPopulationF l a g 200 義 塾 Type length 一 、 t e x t l a b e l !この 例では以下が復元してい 転置して生成された 非標準変数部分日 鉄 駅 山 鯨 Type Length る'‑占お 帥 受 さ 慎序 SAFETY S a f e t yPopulationF l a g t e x t 1 I T T I n t e n tt oT r e a tPopulationF l a g t e x t 1 以下の一連のプログラムをマクロ化すれば自動化できる。 SUPPQUAL を転置し、親ドメインと結合 イ deftne.xmlの緩み込み ゑ幾 :ふ議機Z 隣家豊臣の}標数豪復元 J 一九州川‑ │藍療、政府・自治体、大学による口システムの実証鉱山山総会 . V . " • ~n まとめ ‑今回の例から分かったこと ‑ SDTM利用者の視点で考えると • SDTMのデータセットのみでは:、利用時のすべての変数情報が揃っていない。 ValueL e v e lMetadatalこ関しては d e f i n e . x m lにしかない状態。 • d e f i n e . x m lをSASプログラムで読み込める事 l 立 、 SDTMを効率的に利用するための足 掛かりとなる 0 ・どんな場面で活用できるのか ‑ SDTMの親ドメインに SUPPQUAL を再結合するときの問題(今回の例) SDTMデータから直接レビューする人 l 立、毎回のように再結合する必要があるため、 自動化できると便利。 ADaMを作成する人は、特に SUPPQUALに多数の非標準変数があるときに便利。 ‑ Dataset‑XMLVl .Oの読み込み、書き込み • CDISCが作成している次世代のデータセット交換用ファイル形式。 ‑データ利用者は Dataset.XMLをSASデータセットに変換する必要がある。 ・Dataset.XMLはDefine.XMLが必須の仕様になっているため、相互変換プログラムに はdefine.xmlの読み込みが必須。(実際に SASプログラムを作って試してみました) ‑ 6 1 4 ‑

625.

ODSmarkupを使った ADaMd e f i n e ‑ x m lの作成 坂上拓 矢嶋友也 西本優美 株式会社中外臨床研究センターバイトメトリクス部 データサイエンスグループ C r e a t i o no fADaMd e f i n e ‑ x m lu s i n gSASODSmarkup TakuS a k a u e TomoyaY a j i m a YumiN i s h i m o t o B i o m e t r i c sDep t .DataS c i e n c eGroup, C h u g a iC l i n i c a lR e s e a r c hC e n t e r ., LTD 1.要旨 承認申請時の CDISC標準に準拠した臨床電子データの提出義務化を控え,これら臨床電子データ定義 書としての位置づけとなる d e f i n e ‑ x m lの作成は,解析業務プロセスの一つに組み込まれることが予想さ れる. ADaMや解析帳票を作成する解析プログラミング業務のプロセスを考えた場合, d e f i n e ‑ x m l を作成す るためのデータソースとして,プログラム開発者向けのプログラム仕様書を用いると, ADaMや解析帳 e f i n e引 n l 聞の整合性を保持する面で大きなメリットがある.しかしながら, 票のプログラム仕様と d d e f i n e ‑ x m l の要素や属性を考慮すると,プログラム仕様書には解析とは直接関係のない多大な情報を記 入する必要があり,これらを埋めるための時間を割くことは,解析を主として行う担当者にはストレス となる. 本発表は,当社で検討中の M i c r o s o f tE x c e lで作成されたプログラム仕様書をデータソースとした, SAS e f i n e ‑ x m l作成方法と, d e f i n e ‑ x m lの要素や属性に関する記入箇所を極力減らした ODSmarkupを使った d プログラム仕様書を紹介する. e f i n e ‑ x m l,プログラム仕様書, SASODSmarkup キーワード・ ADaMd 2 . ADaMd e f i n e ‑ x m l作成までの処理概要 当社での ADaMd e f i n e 叩 n l作成までの工程を以下に示す。 ADaMd e f i n e ‑ x m l 園田園. 国 一時哲三 国 一 SASprogram 同 p o r t ( E x c e l司 SASda出 e t l 図1 .ADaMd e f i n e ‑ x m l作成工程 ‑ 6 1 5 ‑

626.

3 . 1 プログラム仕様書 プログラム仕様書は E x c e l を使って作成しており, ADaM や解析帳票のプログラム仕様と共に, d e f i n e ‑ x m l を 作 成 す る た め に 必 要 な 情 報 も 記 載 さ れ る . プ ロ グ ラ ム 仕 様 書 の 構 成 を 表 l に示 D e s c r i p t i o n " 列には E x c e lへの記載ルールと共に, d e f i n e ‑ x m lへ展開するための仕様を記載しており, す." 図 lの中で示されているプログラム仕様書から SASd a t a s e tへインポートするプログラムと, SASd a t a s e t から d e f i n e ‑ x m lへエクスポートするプログラムのプログラム仕様に相当する内容となる. 表1.プログラム仕様書の構成 SruDYID STUDYNAME PROTOCOLNAME 湘 リ 四叶附 A I tl k計泊 町山助 日の K M ↑川山川 TLVA NAME ADaM 1 ‑ 1 ) . ltemGroupDef(OID) 2 ‑ 1 ) . I G .[NAME] 1 ‑ 2 ) . ItemGroupDef(SASDatasetName) AME] 2 ‑ 2 ) . [N 1 ・3 ) . ltemGroupDef(def:Commen t OI D ) 2 ‑ 3 ) . COM.[N AME] ト4 ) . l t e m G r o u p D e f ( d e f :Ar c h i v e Lo c a t i o n l D ) 2‑ 4 ) . LF . [ N AME] 1 ‑ 5 ) . ItcmGroupDe 訂' d e f : 1 e a 1 J d e f : t i t 1 e ( 羽 田 orNo) ‑ 6 1 6 ‑

627.

1 ) . def:CommentD e f / d e f : D o c u r n e n t R ef ! def:PDFPageRef( T y p e ) 2 ) . [参照方法] 参照先‑ 1 ‑ 1 ) . d e f : C o r n r n e n t D ef ! d e 正D ocurnentRef ! def:PDFPageRef( P a g e R e f s ) 2 ‑ 1 ) . [参照先] ト2 ) . def:CommentDe 町d e f :DocurnentRef ! d ef :PDFPageRef( F i目 tP a g e ) 2 ‑ 2 ) . [範囲指定(柑ー柑)をハイフンで分割した l番目の要素] 1 ‑ 3 ) . d e f : C o r n r n e n t D ef ! d e f : D o c u r n e n t R ef ! d e 正PDFPageRef( L a s tP a g e ) した 2 ( e . g .ADaM̲ADSL , ADaM̲ADAE) 同DaM仕 様 :ADaM V a r i a b l eM e t a d a t a ] ト1 ) . l t e r n G r o u p D cf i 1t e r n Re f( l t e r n Ol D ) 2 ‑ 1 ) . lD. " D a t 師団 N a r n e " . [ V ,組lABLE] 1 ‑ 2 ) . l t e r n Gr oupDef !l t e r n R ef(MethodOl D ) 2 ‑ 2 ) . M T . " D a t a s e tN a r n e " .[VA 則 ABLE] r n D e f(Ol D ) 1 ‑ 3 ) . l t e 2 ‑ 3 ) . l T . " D a t a s e tNarne".[VA 則 ABLE] ト4 ) . l t e r n De f(Na r n e ) 2 ‑ 4 ) . [VARIABLE] 1 ‑ 5 ) . I t e r n D e f( S A S F i e l d N a r n e ) 2 ‑ 5 ) . [VA 則 ABLE] KEY LABEL TYPE LENGTH DIGIT DISPF 孔1T CNTRLTERM o rP r o t o c o lo reDTo r DE RlVTYPE DER l VATION( JPN) REFDOC 記載方法. 文書単位のlD/参照方法 ( P h y s i c a l R e f/N a r n e d D e s t i n a t i o n )/参照先.) a )参照方法が P h y s i c a l R e fの場合は,ページ番号 o rベ ー ジ 範 囲 ( 範 囲 の 場 合 は 糊 榊 ハ イ フンで区切る). NamedDestinationの場合は,ファイノレ参照名 文書単位のlD 1 ) .M e t h o d D e f / d e f : D o c u r n e n t R e f( Ie af I D) ‑ 6 1 7‑

628.

dD e f ! d e f :D oc umentRe f ! def:PDFPageRef( T y p e ) 1 ) . Metho 2 ) . [参照方法] 参照先: ト り def:CommentDef ! d e f :Dn cumen tR e f ! def:PDFPageRef( p a g e R e f s ) ) . [参照先] 2・1 1 ,・2 ) . def:Commen tD e 訂d ef:Documen tR e f ! def:PDFPageRef( F i r s tP a g e ) 2・2 ) . [範囲指定(柑ー榊)をハイフンで分割した l番目の要素] 1 ・ 3 ) . def:Commen のef ! d e f :Dn cumentRef ! def:PDFPageRef( L a s tP a g e ) CODEDVALUE DECODEVALUE で'マ"が設定されている変数を有するデータセット} 1 ・1 ) . d e f : V a l u e L i s t D e f(OID) 2 ‑ 1 ) . VL.[ D ATASET]. [ I 勾RIABLEJ 1 ・ 2 ) . d e f : V a l u e L i s t D ef l I t 開1R e f( l temOID) D A T A S E T ] . [ V A R I A B L E ] .仰 MEJ 2 ‑ 2 ) 礼 [ 1 ‑ 3 ) . d e f : V a l u e L i s t D e fII回nR ef(MethodOID) 2・ 3 ) . MT.[DATASET].[ 陥R IABLEJ.[NAMEJ 1 ‑ 4 ) . d e f :V a l u e L i s t D e f l I t emR e f ! d e f :Wh e r eC l a u s e R e f(Wh e r 写C l a u s eOlD) 2‑ 4 ) . WC.[ D ATASET].[ 附R I A B L E J .[N AMEJ 1 ・5 ) . d e f :Wh e r eC l a u s e D e f ( Ol D) ‑ 6 1 8・

629.

CHECKVAR COMPARATOR CHECKVALUE REFDOC I参照文書 l 記載方法. P h y s i c a l R e fI Named De s t i n a t i o n )I参照先的 文書単位の IDI参照方法 ( a )参照方法が P h y s i c a 1 R e fの場合は,ページ番号 o rページ範囲(範囲の場合は糊ー柑ハイ プンで区切る). Name 泊D田 畑a t J . onの場合は,ファイノレ参照名 文書単位の ID 由 叫D e f l d e f : D 町 田 町n tR e f(l田町0) 1 ) . Me 2 ) .L F . [ 文書単位の I D ) 参照方法: 1 ) . MethodDefldef:DocumentRefldef:PDFPageRef( T y p e ) 2 ) . [参照方法] 参照先: De f l d e f :Do cumen tR e f l d e f : P D F P a g e R e f(PageRe 白) 1 ‑ 1 ) . def:Comment 2・ 1 ) . [参照先] t D e f l d e f :Doc umen tR e f l d e f : P D F P a g e R e f( F i 回 P a g e ) 1 ‑ 2 ) . def:Commen 2 ‑ 2 ) . [範囲指定(柑ー柑)をハイフンで分割した I番目の要素] 1 ・ 3 ) . def:Comm 四tDe f l d e f :Do cumen tR e 官' d e f : P D F P a g e R e f( L a s tP a g e ) DATASET 1 ) .d e f :Wh e r eC 1 a u s e D e f l R a nge Ch e c k l C h e c k V a 1 u e 2 ) . [CHECKVALUE) l R a n geC h e c kを発生 志向ーセル内に複数の値が存在する場合,該当変数分の d e f :Wh e r e C l a u s e D ef させる 圃 6 1 9 ‑

630.

1 ・ 1 ) . a n n :An a l y s i s R e s u l t D i s p l a y s / a n n : R e s u l t D i s p l a y(OID) ) . R D.[D1SPLAYIDENTIFIER] 2・1 1 ‑ 2 ) . a n n :An a l y s i s R e s u l t D i s p l a y s / a n n : R e s u l tDi s p l a y(N a r n e ) D 1SPLAYIDENTIFIER] 2 ‑ 2 ) . [ ト3 )ー 百 四 An a l y s i s R e s u l t D i s p l a y s / a n n : R e s u l t D i s p l a y / d e 印 o c u r n e n t R e f( Ie af I D) D1SPLAYIDENTIFIER] 2 ‑ 3 ) . L F . [ ‑ 4 ) . ann:An a l y s i s R e s u l t D i s p l a y s / a r m : R e s u l t D i s p l a y / a n n :An a l y s i s R e s u I t(OID) 1 2‑ 4 ) . AR.[D1SPLAYIDENTIFIER] ト5 ) 町町An a l y s i s R e s u l t D i s p l a y s / a n n : R e s u l t D i s p l a y / a r m :An a l y s i s R e s u lt J a n n :Ana l y s i s D a 刷出 ( d e f : C o r n r n e n t O I D ) 2 ‑ 5 ) . COM.[ D1SPLAYIDENTIF lER] ト6 ) . def:CommentDef(OID) ( e . g .ARM̲TABLE̲14‑3.01) [解析帳票の仕様 :A 田 l y s i s R e s u l tM e t a d a t a ] *シート名の [ D i s p l a yNam n n :加 a l 戸i s R e s u l t D 即 e ]は a l a y s / ann:Resul tDi s p l a y( 0 1 D)に設定 2・ 6 ) REFDOCID( D lSPLAY l E R) IDENTIF 記載方法。 文書単位の 10/参照方法 (PhysicalRef/NamedDestination)/参照先.) a ) 参照方法が P h y s i c a l R e fの場合は,ベージ番号 o rベージ範囲(範囲の場合は柑 イブンで区切る). Name dD e s t i n a t i o nの場合は,ファイノレ参照名 榊ハ 0: 文書単位の 1 1 ) .a r r n : A n a l y s i s R e s u l tDi s p l a y s / d e f :Do c u r n e n t R e f( l e af ID) 2 ) .L F . [ 文書単位の I D ] 参照方法: 1 ) .a r r n :An a l y s i s R e s u l t D i s p l a y s / d e f : D o c u r n e n tR efldef:PDFPageRef( T y p e ) 2 ) . [参照方法] 参照先・ 1 ・ 1 ) . a r r n :Ana l y s i s R e s u ltD i s p l a y s / d e f :Do curnentRefldef:PDFPageRef( P a g e R e f s ) 2 ‑ 1 ) . [参照先] ト2 ) . a r r nA n a l y s i s R e s u l t D i s p l a y s / def:DocumentRefldef:PDFPageRef( F i r s tP a g e ) 田 2 ‑ 2 ) . [範囲指定(柑ー岬)をハイフンで分割した l番目の要素] 1 ‑ 3 ) PURPOSE DATASET I解析に使用するデータセッ V成 IABLE]で指定した変数と指定順番の対応をとる) 1 ‑ 1 ) . a r r n :An a l y s i s R e s u l t D i s p l a y s / arm:Resu I t D i s p l a y / a r r n :An a l y s i s R e s u l t / a r r n :Ana l y s i s D a t a s e t s / a r r n :Ana l y s i s D a t a s e t( ItemGroupOIO) ) . IG.[DATASET] 2・1 1 ‑ 2 ) . ann: An alysisResultD~splays/ann:ResultDisplay/ann:AnalysisResu1出rm:AnalysisDatasetsJ a r m :An a l y s i s D a t a s e t l a r m : A n a l y s i s V a r i a b l e( I t e r n O I D ) 2・2 ) . IT.[DATASET].[ANALYSISVARIABL 勾 1 ‑ 3 ) . a r r n :An a l y s i s R e s u l t D j s p l a y s / ann:Resut IDisplay/arrn:AnalysisR田 u l t / , 叩n :An a l y s i s D a t a s e t s / a l y s i s D a t a s e t /a n n :An a l y s i s V a r i a b le / d e f :Whe r eCl a u s e R e f (Wh ereClauseOID) a r r n :An 2 ‑ 3 ) . WC.[DISPLAYIDENTIFIER}.[DATASET] 事斜体は同シ}トの別列の値 車問ーセノレ内に複数のデータセットが指定されている場合は,該当データセット分の 1 ) .a n n :An a l y s i s R e s u l t D i s p l a y s / a n n : R e s u l t D i s p l a y / a n n :An a l y s i s R e s u 1 山n n : D o c u r n e n t a t i o nID e s c r i p t i o n f f r a n s l a t e d T e x t 2 ) . [DOCUMENTATION] ‑ 6 2 0 ‑

631.

(DOCUMENTA T lON) I記載方法. 文書単位の ID/参照方法 ( P h y s i c a l R e f/N a r n e d D e s t i n a t i o n )/参照先.) a ) 参照方法が P h y s i c a l R c fの場合は,ベージ番号 o rページ範凶(範閣の場合は柑ー柑ハ イフンで区切る). NamedDestinationの場合は,ファイノレ参照名 文書単位の ID 1 ) .a ロn :An a l y s i s R e s u l t D i s p l a y s / a r m : R e s u l t D i s p l a y / a n n : A n a l y s i s R e s u l t l a r m : D o c u m e n t a t i o n l tR e f( l e a f 1D) d e f : D o c u r n e n 2 ) .L F . [ 文書単位の I D ] 参照方法. 1 ) .a r r n :An a l y s i s R e s uI t D i s p l a y s / a r m ・ R e s u l t D i s p l a y / a r m ・ A n a l y s i s R e s u lt J a r m : D o c u m e n t a t i o n l d e f : D o c u r n e n t R e! l def:PDFPageRef( T y p e ) 2 ) . [参照方法] 参照先 ト1 ) . a n n :An a l y s i s R e s u l t D i s p l a y s / a r m : R e s u l t D i s p l a y / a n n : A n a l y s i s R e s u l t l a r m : D o c u m e n t a t i o n l def:DocumentRe! l def:PDFPageRef( P a g e R e f s ) 2 ‑ 1 ) . [参照先] 1 ‑ 2 ) . a r m :An a l y s i s R e s uI t D i s p l a y s / a r m : R e s u l t D i s p l a y / a r m ・ A n a l y s i s R e s u l t l a n n : D o c u m e n t a t i o n l 町d e f : P D F P a g e R e f ( F i r s tP a g e ) d e正DocumentRe 2 ‑ 2 ) . [範囲指定(柑ー柑)をハイフンで分割した l番目の要素l ト3 ) . arm ・An a l y s i s R e s u l t D i s p l a y s / a r m : R e s u l t D i s p l a y / a r m 目 A n a l y s i s R e s u lt J ann:Documcntatio n J d e f : D o c u r n e n t R e ! l def:PDFPageRef(L回 t STATEMENTS) 記載方法. P h y s i c a l R e f/N a m e d D e s t i n a t i o n )/参照先.) 文書単位の ID/参照方法 ( a ) 参照方法が P h y s i c a l R c fの場合は,ベージ番号 o rベージ範囲(範囲の場合は榊ー柑ハ イフンで区切る). NamedDestinationの場合は,ファイル参照名 文書単位の ID: a l y s i s R e s u l t D i s p l a y s / a r m : R e s u l t D i s p l a y / a n n :An a l y s i s R e s u l t l a r m : P r o g r a m m i n g C o d e l 1 ) 町 m:An d e f : D o c u r n e n t R e f( l e a f 1D) 2 ) .L F . [文書単位の I D ] 参照方法・ 1 ) .a r m :An a l y s i s R e s u l t D i s p l a y s / a r m : R e s u l t D i s p l a y / a r m :An a l y s i s R e s u l t l a r m : P r o g r a m r n i n g C o d e l d e f : D o c u r n e n t R e f / d e f : P D F P a g e R e f( T y p e ) 2 ) . [参照方法l 参照先 } . } ) . a r m : A n a l y s i s R e s u l t D i s p l a y s / a n n :R e s u l t D i s p l a y / a r m :An a l y s i s R e s u l t l a r m : P r o g r a m m i n g C o d e /def:DocumentRef/def:PDFPageRef( P a g e R e f s ) 2 ‑ 1 ) . [参照先] } . 2 ) . a r m :An a l y s I s R e s u l t D i s p l a y s / a n n : R e s u l t D i s p l a y / a r m :An a l y s i s R e s u l t l a n n : P r o g r a m m i n g C o d e / d e f : D o c u r n e n t R e ! l def:PDFPageRef( F i r s tP a g e ) ー [範囲指定(榊ー榊)をノ、ィフンで分割した I番目の要素] 2 ‑ 2 ) 1 ‑ 3 ) . a r m :An a l y s i s R 削 l t D i s p l a y s / a r r n : R e s u l tD i s p l a y / a r m :An a l y s i s R e s u l t l a r m : P r o g r a m m i n g C o d e REFDOCID(PGM. STATEMENTS)2 REFDOCID(PGM STATEMENTS)3 プログラム仕様書で定義する d e f i n e ‑ x m l構成要素は出来る限り省略しており,定数値として定義(表 2 ) ができる要素や,プログラム仕様書で定義されている情報から自動的に生成できる要素(表 I の D e s c r i p t i o n列),プログラム仕様書の作成時に運用レベルで解決できるような要素は,プログラム仕様書 には入力箇所を設けていない. 表2 . 定数値として定義可能な項目 Element.; ODM A l t r i b u t e xmlns x m l n s : d e f x m l n s : x l i n k ODMVersIon ‑ 6 2 1 ‑

632.
[beta]
MetaDa
阻V
e
四i
o
n

T
四n
s
l
a
t
e
d
T
e
x
t

G
r
o
u
p
D
e
f
I
t
e
m
Ra
n
g
e
Ch
e
c
k
間 n
:P
r
o
g
r
四nnI
n
g
C
o
d
e
M
e
t
h
o
d
D
e
f

F
i
l
e
t
y
p
e
d
e
f
:Def
i
n
e
V
e
r
s
i
o
祖n
血r
d
N
副n
e
d
e
f
:
S

s
n
a
p
s
h
o
t
2
.
0
.
0
AD
aM
‑
I
G
1
.0
e
n
Ana
l
y
s
i
s
S
o
世

d
e
f
:
S
t
a
n
d
a
r
d
V
e
r
s
i
o
n
x
m
i
:
l
a
n
g
民 坤o
s
e

S
of
t
H
a
r
d
C
o
n
t
e
x
t
T
y
p
e

SASVc訂'Si
o
n
9
.
2
Co
mpu
阻t
i
o
n
(V
a
l
u
eL
e
v
e
lM
e
t
a
d
a
t
a定義の場合のみ)

今後の運用の中で,各試験でほとんど設定情報が無いような項目がある場合は,プログラム仕様書か
ら削除していく予定である.

3
.d
e
f
i
n
e
.
x
m
lの作成方法
3
.
1 SASODSmarkup
SASODSmarkupは
, X M Lや HTMLのようにタグに因われた文書の入出力に関連する機能を有してお

り,図 lの SASdatasetから define.xmlを作成するような場合に,あらかじめ準備していたタグセット(テ
ンプレート)と,

define.xml構成要素となるデータセットから, define.xmlを出力することができる.

ODSm
町k
u
申
pt
阻a
g
s
問e
守
ド
=
s
随a
m
p
l
e
.
d
e
f
i
田
n
e
田'
x
m
l
一
̲
v
叫2自
f
i
l
e
=
ODM*
吋/
p
r
o
cp
r
i
n
tda
阻=
WORK.odm;

/
戸
牟

r
u
n
;
'
*OD
M/
S
t
u
d
y
/
I
t
emGroupり
p
r
o
cp
r
i
n
tdata=WORK.itemgroup;

r
u
n
;

事
/ OD
M/
S
t
u
d
y
/
l
tem
Gr
oup
/
l
t
e
mR
e
fり

p
r
.
田 p
r
i
n
tdata=WORK.adsl;

r
u
n
;

ODSmarkupc
l
o
s
e
;

図2
.SASODSmarkup実行方法

3
.
2テンプレートの作成
図 2で示した実行方法からも分かるように, define.xmlを作成するための処理は,全てテンプレートの
)
.
定義に集約されている.以下に define.xmlを作成するためのテンプレートプログラムの例を示す(図 3
lementのみ作成する仕様になっている(図
このサンプルは,例示用に O D M,ltemGroupDef,ltemRefE
5
)
. 使用するデータソースは図 4に示す.
p
r
o
ct
e
m
p
l
a
t
e
;
d
e
f
i
n
et
a
g
s
e
ts
a
m
p
l
e
.
d
e
f
i
n
e
x
m
l
̲
v
2
;
i
n
d
e
n
t=2;
m叩='<>&'''";

・

mapsub='
/
&
I
t
;
/
&
g
t
;
/
&
a
m
p
;
/
&
q
u
o
t
;
/
&
a
p
o
s;
l
'
;
/
*s
t
o
r
ed
a
師 団t
namet
oDATANAME*
/
d
e
f
i
n
ee
v
e
n
tl
e
a
f
;
u
n
s
e
t$
d
a
t
a
n
a
m
e
;
, 聞n
e
s
;
u
n
s
e
t$
c
o
l
̲
s
e
t$da
阻n
amep
r
x
c
h
岨 g
e
(
'
s
/
^Da
阻 S
e
t¥
w+
¥
.
(
¥w+)$/$I
,
'
I1
,v
a
l
u
e
)
;
e
n
d
;
/
*s
t
o
r
ev
a
r
i
a
b
l
enamesc
o
n
t
a
i
n
i
n
gi
n
p
u
td
a
t
a
s
e
t打
d
e
f
i
n
ee
v
e
n
tc
o
l
s
p
e
c
̲e
n
t
r
y
;
町 田s
日NAME;
s
e
t$
c
o
l
̲
n
e
n
d
:

‑
6
2
2・

633.
[beta]
/材・ Rowl
e
v
e
lp
r
o
田 s
s
i
n
g*
/

d
e
f
i
n
ee
v
e
n
tr
o
w
;/
*<
‑
‑d
e
f
i
n
et
r
a
n
s
a
c
t
I
o
np
e
ro
n
er
e
c
o
r
dキ/
s
t
a
r
t
e
v
a
l $
i
d
x1
;
u
n
s
e
t$
c
o
l
̲
v
a
l
u
e
s
;
f
i
n
i
s
h
:
t
r
i
g
g
e
rODMattr /i
fc
r
r
】
p
(
u
p
c
a
s
e
(
$
d
a
t
a
n
a
m
e
),
'
O
D
M
'
)
;
t
r
i
g
g
e
rI
G
a
t
t
r /i
f
c
m
p
(
u
p
c
a
s
e
(
$
d
a
t
a
n
a
m
e
),
'ITEMGROUP');
t
r
i
g
g
e
rI
R
a
t
t
r
/i
fc
m
p
(
u
p
c
a
s
e
(
$
d
a
t
a
n
a
m
e
),
'
A
D
S
L
'
)
;
b
r
e
a
k
;
e
n
d
:
D
a
t
al
e
v
e
lp
r
o
c
e
s
s
i
n
g*
/
d
e
f
i
n
ee
v
e
n
td
a
t
a
;/
.<ー d
e
f
i
n
et
r
a
n
s
a
c
t
i
o
np
e
r1d
a
t
a(
o
n
ev
a
r
i
a
b
l
e
).
/
s
t
a
r
t
u
n
s
e
t$vname;
s
e
t$vname$
c
o
l
̲
n
a
m
e
s
[
$
i
d
x
]
;
s
e
t$
c
o
l
̲
v
a
l
u
e
s
[
$
v
n
a
m
e
)VALUE;
f
i
n
i
s
h
:
e
v
a
l$
i
d
x$
i
d
x
+1
;
b
r
e
a
k
;
e
n
d
;

/**
*
*
*
**
** * 帥 . * . 判 事 材 料 * 材 料 仲 * 件 事 . . 紳 判 事 . . 仲 村 . . 毒 事

/キ..事事*本端本判事**********

XMLv
e
r
s
i
o
nands
t
y
l
es
h
e
e
t

材料事
************機$噂...本欄$市*本市*本*本字率...場事事****事..ホ帥****ホ帥事*事事事*車場権事..事事*本/

d
e
日n
ee
v
e
n
tXMLversion;
s
t
a
r
t
p
u
t '
<
ワx
mlv
e
r
s
i
o
n
=
'・
1
.0
"encoding="UTF‑8"ヲプ NL;
l
‑
s
t
y
l
e
s
h
e
e
tt
y
p
e
=
"
t
e
x
t
/
x
s
l
"h
r
ef
=
".
.
/
s
t
y
l
e
s
h
e
e
t
s
/
d
e
古田2
‑
0
‑
0
.
x
sl
'
り>
'NL;
p
u
t 'くな m
f
i
n
i
s
h
:
b
r
e
a
k
;
e
n
d
;
/仲*****辛料ホ*仲*事判事*.判事*判事材料*.帥叫***材料*ホホ材*柿本材料率****材料帥*事

'ODM

件仲
キキ*キホ本ネキ本ホ.**噌*栴.**ホ.*ホ*********事事..帥料事..紳*材料..場事事****キキキ事*本材料../

d
e
f
i
n
ee
v
e
n
tODMmeta;
s
t
a
r
t
くO
DM';
p
u
t
'
f
i
n
i
s
h
p
u
t
'
>
'
N
L
;
e
n
d
:
甘
,
d
e
f
i
n
ee
v
e
n
tODMat
u
n
s
e
t$a
位,
s
e
t$
a
t
t
r$
c
o
l
̲
v
a
l
u
e
s
[
"
I
T
E
M
"
]
;

u
n
s
e
t$
v
a
l
;
s
e
t$
v
a
l $
c
o
l
̲
values["DESCRIPTION"];
do/i
f
$
a
t
t
r
;
put";
甘
・4
p
u
t$
a
t
do/i
fc
m
p
(
$
a
t
t
r
,
'
C
r
e
a
t
i
o
n
D
a
t
e
T
i
m
e
'
)
;
p
u
t"
"DATE'
T
'TIME"
";
e
l
s
e
;
p
u
t
q$
v
a
l
;
d
o
n
e
;
e
l
s
e
;
b
r
e
a
k
;
d
o
n
e
;
e
n
d
;
/***料****本件..キキキ材料キキ*掌キ材料市本特権*ホネホ市*場料*****輩格**本市帥*材料*****事本料

ODM/Study
lMe
t
a
d
a
t
a
V
e
r
s
i
o
n
l
l
t
e
m
G P

*材料
岡山
******事***********ホ*本傘..キキ..ホキ事.*キ$キホ*車掌車場事**ホホ**事事$事権$ホ*端本家キ*キ*キキ*牟**/

d
e
f
i
n
ee
v
e
n
t1
Gmeta;
S
祖r
t
n
d
e
n
t
;
n
d
e
n
t
;
n
d
e
n
t
;
旧t
'
<
l
t
e
m
G
r
o
u
p
D
e
f
;
P
f
i
n
i
s
h
<
/
It
emGroupDef
>
'NL;
p
u
t'
n
d
e
n
t
;
n
d
e
n
t
;
n
d
e
n
t
;
b
r
e
a
k
;
e
n
d
;
d
e
f
i
n
ee
v
e
n
t1
G
a
t
t
r
;
u
n
s
e
t$
n
a
m
e
;
u
n
s
e
t$
v
a
l
;
s
e
t$name$
c
o
l
̲
values["NAME"];
do/i
f$
n
a
m
e
;
s
R
e
f
e
r
e
n
c
e
D
a
t
a
=
"
N
o
"P
u
r
o
o
s
e
=
"
A
n
a
l
v
s
i
s
"
'
;
p
u
tII

‑
6
2
3
‑

634.
[beta]
"
I
G
.
'
$
n
a
m
e
'
・
‑
1
p
u
t
'OID=
p
u
t
'NAME='q
u
o
t
e
(
$
n
a
m
e
)
;
叫a
setName='q
u
o
t
e
(
$
n
a
m
e
)
;
put'SASD
p
u
t'
def:Commen
t
OID="COM.'$n
剖n
e
"
"
;
P
叫, d
e
f
:Arc
hiveL
田 副i
o
n
I
D
=
"
L
F
.
'
$
n
副n
e
"
・
1
e
l
s
e
;
b
r
e
a
k
;
d
o
n
e
;
s
e
t$
v
a
l$∞I
̲
values["REPEATING"];
do/i
f
$
v
a
l
;
g
=
'quote($val);
p
u
t
'R
e
p
e
a
t
i
n
d
o
n
e
;
田[
"CLASS"];
s
e
t$
v
a
l$
c
o
lv
a
l
u
d
o
/
i
f
$
v
a
l
;
p
u
td
e
f
:
C
l
a
田='q
u
o
t
e
(
$
v
a
l
)
;
d
o
n
e
;

・

s
e
t$
v
a
l$∞I
̲
v
a
l
u
田[
"STRUCTURE"];
do/i
f
$
v
a
l
;
p
u
t
'd
e
f
:
S
甘u
c
加問='q
u
o
t
e
峨v
a
l
)
;
d
o
n
e
;

>
'NL;/
.Clo
団 I
tem
Gr
oupDef• /
p
u
t'
u
n
s
e
t$
d
e
s
c
;
s
e
t$
d
e
s
c$∞I
̲
values["DESCRIPTION"];
do/i
f$
d
e
s
c
;
仕i
g
g
e
r
D
e
s
c
;
d
o
n
e
;
u
n
s
e
t$pa
ぬ;
s
e
t$
p
a
t
h$
c
o
l
̲
v
a
l
u
田 [
"
P
A
T
H
"
]
;
血;
do/i
f
$
p
a
凶g
g
e
rLEAF
̲TITLE;
d
o
n
e
;
e
n
d
;
/柿材料材料材料材料........材料......材料帥..帥材料柿柿・車材料帥....材料申

OD
Ml
S
t
u
d
y
lM
e
t
a
d
a
t
a
V
e
r
s
i
o
n
l
I
tem
Gro
up
l
I
陪mRef
e事事噂*事事.事..事事権布市.事噂事事惨事・ホ・事/

材料・
噂事噂事・事$車場事惨事申*事$・..事.奪事事....命取..・・事.事事事車場.事事

d
e
f
i
n
ee
v
e
n
tI
Rm
e
t
a
;
s
t
a
r
t:

n
d
e
n
t
;
f
i
n
i
s
h
:
x
d
e
n
t
;
t
r
i
g
g
e
rI
G
m
e
t
a
;
b
r
e
a
k
;
e
n
d
;
d
e
f
i
n
ee
v
e
n
tl
Ra
t
t
r
;
凶 器t
$v
叫
u
n
s
e
t$
v
a
l
;
田 [
"VARIABLE"];
s
e
t$
v
a
r$
c
o
l
̲
v
a
l
u
do/i
f
$
v
a
r
;
p
u
t'
<
I
t
e
mR
e
f
I
t
e
m
O
I
D
=
"
I
T
.
'$dataname'
.
'$
v
a
r"
"
;
e
l
s
e
;
b
r
e
a
k
;
d
o
n
e
;

s
e
t$
v
a
l$col̲values["ORDER"];
do/i
f
$
v
a
l
;
p
u
t'
Or
derNumbe
r
=
'quote($val);
d
o
n
e
;

・
'
]
;
s
e
t$
v
a
l$
c
o
l
̲
values["REQ
do/i
f
$
v
a
l
;
put'M
阻 d
a
t
o
r
y
=
'quote($val);
d
o
n
e
;
s
e
t$
v
a
l$
c
o
l
̲
v
a
l
u
e
s
[
"
K
E
Y
"
]
;
do/i
fs
t
r
i
p
(
$
v
a
l
)
;
p
u
t'
KeySequence='q
u
o
t
e
(
$
v
a
l
)
;
d
o
n
e
:
s
e
t$
v
a
l$
c
o
l
̲
values["METHTYPE"];
'COMPUTATIO
N
'
)
;
do/i
fc
m
p
(
u
p
c
a
s
e
(
$
v
a
l
),
p
u
t
'MethodOID="MT.'$dataname'
.
'$
v
a
r"
"
;
d
o
n
e
;
/
>
'NL;/
*Closel
t
e
mR
e
f吋
p
u
t・
e
n
d
;
/申噂車事事噌事.事*事**....事..・申・

e・車場市場・ホ..事.*.*.*.・・..・*事・*事申..申*噂市噂命車場権申.事事事申常事

ー6
2
4
‑

635.
[beta]
****キ

D
e
s
c
r
i
p
t
i
o
n
l
T
r
a
n
s
l
a
t
e
d
T
e
x
t

*ホ****ホキ平*キ本**平本*キキ宇キ本車**卒事***キ本***事キキ本キキ*.*キ*キ平本事事*キ宇キネ*ホキキ事*ホ**ホホホ

*
1

d
e
f
i
n
ee
v
e
n
tD
e
s
c
;
n
d
e
n
t
;
p
u
t'
<
D
e
s
c
r
i
p
t
i
o
n
プ N
L;
n
d
e
n
t
;
くT
r
a
n
s
l
a
t
e
d
T
e
x
txml:lang~"en">'$desピく TranslatedText>' NL;
p
u
t
'
x
d
e
n
t
;
くlDe
s
c
r
i
p
t
i
o
n
プ N
L;
p
u
t
'
x
d
e
n
t
;
e
n
d
;

1
*材 料 * * 材 料 帥 帥 ** ** * ホ ホ * * * 材 料 材 料 帥 . . * 材 材 料 . . 車 場 料 * 材 料 ** キ 傘 * 本 件 * 字
申*..事

d
e
f
:
l
e
a
f
/
d
e
f
:
t
i
t
l
e

*.*材料*ホ*キ..*今*キキホキ*キキ材料キ糾*辛料水牛本材料*材料亭材料**判事材料仲*材料事

'
1

d
e
f
i
n
ee
v
e
n
tLEAF
̲TITLE;
n
d
e
n
t
;
p
u
t'
<
d
e
正l
e
a
flD ~"LF.'$name川 xli此 href~' q
u
o
t
e
(
$
p
a
t
h
)・
>
' NL;
n
d
e
n
t
;
p
u
t
'
く:
p
ut
:t
i
t
l
e
>
'
$
n
a
m
e
'
.
x
p
t
<
/
d
e
正t
i
t
l
e
>
'
N
L
;
x
d
e
n
t
;
f
>
'NL;
p
u
t'
<
/
d
e
f
:
l
e
a
x
d
e
n
t
;
e
n
d
;

1
*DocumentLevel町
d
e
f
i
n
ee
v
e
n
td
o
c
;
s
t
a
r
t
t
r
i
g
g
e
rXMLversion;
日n
i
s
h
b
r
e
a
k
;
e
n
d
;
円 DocumentBodyL
e
v
e
l町

d
e
f
i
n
ee
v
e
n
tt
a
b
l
e
̲b
o
d
y
;
s
t
a
r
t
:
阻
1i
fc
m
p
(
u
p
c
a
s
e
(
$
d
a
t
a
n
a
m
e
)
・
,ODM'見 事 〈 ー inputd
a
t
a
s
e
tname;
t
r
i
g
g
e
rODMme
t
r
i
g
g
e
rIGmeta
1i
fc
m
p
(
u
p
c
a
s
e
(
$
d
a
t
a
n
a
m
e
),
'ITEMGROUP');・ι‑‑i
n
p
u
td
a
t
a
s
e
tname;
t
r
i
g
g
e
rIRmeta
1i
fc
m
p
(
u
p
c
a
s
e
(
$
d
a
t
a
n
a
m
e
),'
A
D
S
L
'
)
;. く ー i
n
p
u
td
a
t
a
s
e
tname;
b
r
e
a
k
;
f
i
n
i
s
h
:
fc
m
p
(
u
p
c
a
s
e
(
$
d
a
t
a
n
a
m
e
),'
O
D
M
'
)
;ホ<‑‑‑i
n
p
u
td
a
t
a
s
e
tname;
t
r
i
g
g
e
rODMmeta 1i
t
r
i
g
g
e
rIRmeta
1i
fc
m
p
(
u
p
c
a
s
e
(
$
d
a
t
a
n
a
m
e
),
'
A
D
S
L
'
)
;* く ー i
n
p
u
td
a
t
a
s
e
tname;
b
r
e
a
k
;
e
n
d
;
c
n
d
;1
キ e
ndofs
a
m
p
l
e
.
d
e
f
i
n
e
x
m
l
̲
v2ホ/
run

図3
. テンプレートサンプル

顎欄照明闘機欄頼朝駅務機数燃?棚橋鰍問符務務総議機簿熟練蘇縮減綴繍醐
r
宝M
DESCR
l
P
IDN
・:
川 n
s
h
t
tp
:
1
.
川
刷C
d
l
S
C
D
l
l
:
:
l
1 /odmん 13
窪、

r

悶

,川Ins:
d
e
f

日

3
4
5
(
5

1
8

httpj/wwwcdlsCDr~/1同 /d. ん2D謹

蓮

I
x
m
l
n
s
x
l時
h
1t戸川Yl'w,w3即 日 明 x
ll
'
lk
IODMVersω132
1
F
l
le
O
l
D
S~mple-SUGJ-2日 14
1
F
l
l
e
T
y
p
e
5
咽雲市ロ t
I
C
fe
a
llOnDa憎 T, 問
1
O"~lnator
Sa
耐 SUGJ‑
2
0
1
4

遺

1
"
事協

沼運
}還奪

叩
,
.

割譲

ADSL

No
No
N
o
N
o

t
e
x
l
t
e
x
t
l
e
x
l
t
e
x
t

ト
占
。

句"

ト
.
J
o

t
e
x
t
I
n
t
e
c
e
r
t
e
x
t

N口
No

N,州,,~

e
;
r
e
r
N口 』 円 t
I
n
l
e
l
e
r
N口
l
t
e
r
No 刊 e
刊句"
同 e
l
e
r
同時"

t
e
x
t

・

1
1
4
3
3

p
,同断2"σ
P
r
e
d
e
c
e
s
s
o
r
p,"蛇。.~

D
e
r
r
v
e
d

"
2
0
8

"
'

8
8d
a
t
e
9
8d
a
t
e
9
8
8
8
8
5

AR"
ARM
ARMN
ARM
ARMN

1
S
8
50
1

AGEGR1

A" 唱 ~d

A
S
S
l
l
l
l
n
e
d
A..町 外 国
D
e
r
r
v
e
d
Dedved
D
enved
D
e
r
i
v
e
d
D四H'l
v
e
d
p
,白色OlS
S
o
r
D
e
rlVe
d

図4
. データソース

制

Co ~tat ゅn

Fヤe偽~,~

F
ヤ回配e
s
s
o
r

6
2
5
・

1
0

Oom仰u
t
a
t回

ComputatlQl1
ComputatlOl1
.
汎u
t
.
.
.
t胞 "
00,

1
1
1
2
13
H
1
5

Ccm
夙
.
r
ta
t
lOl1

1
6
1
7

c
。叩 u
t
a
t
l
o

l
1

636.
[beta]
このデータソースは,表 lで示したプログラム仕様書の構成に従い定義したプログラム仕様の一部を
抽出し,

definexmlの属性として不足している情報を導出した後ものになっている.
拘

<?xml四 時 I
o
n
=
"1
.
0
"e
n∞ding="UTF
・8
"?>
く
つx
m
l
‑
s
t
y
l
e
s
h
e
e
tt
y
p
e
=
"
t
e
x
ぜx
s
ll1 h
問
f
=
".
.
/
s
t
y
l
e
s
h
e
e
t
s
/
d
e
f
i
n
e
2
‑
0
‑
0
.
x
s
l
"
?
>
ODMx
m
l
n
s
=
"
h
t
t
p
:
1
川 wv
日 d
i
s
c
.
o
r
g
l
n
s
/
o
命n/
vI
.3
"x
m
l
n
s
:
d
ef
="
h
甘p
・
I
l
w
w
w
.
c
d
i
s
c
.
o
r
吾n
s
/
d
e
f
l
v
2
.0
"
x
m
l
n
s
:
x
l
i
n
k
=
"
h
t
ゆ目/川wW.w3 g
l
l
9
9
9
/
x
l
i
n
k
"ODMVe
問団="1.3
.
2
"F
i
l
e
O
I
D
=
百 m
ple‑SUGJ
羽 1
4
"F
i
l
e
T
y
p
e
=
"
S
n
a
p
s
h
o
t
"
C問 a
t
i
o
n
D
a
t
e
T
i
m
e
=
"
2
01
4
‑
0
7
‑
01
T22・
1
0・
3
9
"O
r
i
g
i
n
a
t
氾
r
="Samplef
o
町S
UGJ‑2014">
冶S
DatasetName="ADSL"
<ItemGroupDefIsReferenceData="No"P
u
r
p
o
s
e
=
"
A
n
a
l
y
s
i
s
"OID="IG.ADSL"NAME="ADSL"S
def:CommentOID="COM.ADSL"d
e
f
:
A
r
c
h
i
v
e
L
o
c
a
t
i
o
n
l
D "LF.ADSL"R叩 e
a
t
i
n
g
=
"
N
o
"d
e
f
:
C
l
a
s
s
=
"
A
D
S
L
"d
e
f
:
S
t
r
u
c
t
u
r
e
=
"
O
n
er
e
c
o
r
d
p
e
rs
u
b
j
e
c
t"
>
<
D
e
s
c
r
i
p
t
i
o
n
>
<
T
r
a
n
s
l
a
t
e
d
T
e
x
tx
m
l
:
l
a
n
g
=
"
e
n
"
>
S
u
b
j
e
c
t
‑
L
e刊 1
A
n
a
l
y
s
i
s
<
l
T
r
a
n
s
l
a
t
e
d
T
e
xt>
くlDe
s
c
r
i
o
t
i
o
旧〉
<def:leafID="LF.ADSL"x
l
i
n
k
:
h
r
ef
=
川1
ADSL
.x
p
t
"
>
<
p
u
t
:
t
i
t
le>ADSL
.x
p
t
<
l
d
e
f
:
t
i
t
l
e
>
くI
d
e日e
a
f
‑
>
く
I
t
emRefltemOID="IT.ADSL
.STUDYID"OrderNumbe
r
=
"1
"Mandato
r
y
="No"KeySequence="1'
1
>
<ltemRefltemOID="IT.ADSL.USUBJID"OrderNumbe
r
=
"2
"Mandato
r
y
=
川No"KeySequence "
2
"
/
>
<ltemRefltemOID="IT.ADSL.SUBJID"Or
吐e
rNumbe
r
=
"3
"Mandato
r
y
=
"
N
o
"
/
>
<
l
t
emR
efltemOID="IT.ADSL
.SITEID"OrderNumbe
r
=
"4
"Mandato
r
y
="No"l>
くl
t
emR
e
f
!
陪mOID="IT.ADSL ITEGRI"OrderNumbe
r
=
"5
"Mandato
r
y
="No"MethodOID="MT.ADSL
.SITEGRI"
1
>
<
l
t
emR
efltemOID="IT.ADSL
.ARM"OrderN山 nber
=
"6
"Mandato
r
y
="No"l>
r
=
川7
"Mandato
r
y
="No"/>
<ltemRefItemOID="IT.ADSL.TRTO1
P
"OrderNumbe
<
I
t
e
mR
efltemOID="IT.ADSL
.TRT01PN"OrderNumbe
r
=
"8
"M叩 d
a
t
o
r
y
="No"l>
<
l
t
e
mR
e
fI
t
emOID="IT.ADSL.TRT01A"OrderNumbe
r
=
"9
川 M
andat
Ol
y="No"l>
く
:
J
t
emR
e
fI
t
emOID="IT.ADSL
.TRTOIAN"OrderNumbe
r
=
"1
0
"Mandatoη="No"/>
<
l
t
emR
e
fltemOID="IT.ADSL
.TRTSDT"OrderNumbe
r
=
"1
1"Mandatoη="No"MethodOID="MT.ADSL
.TRTSDT"I>
<
l
t
e
mR
efltemOID="IT.ADSL
.TRTEDT"OrderNumbe
r
=
"1
2
"Manda
加η
="No"MethodOID="MT.ADSL.TRTEDT"I>
くl
temRefltemOID="IT.ADSL
.TRTDUR"Or
吐e
rNumbe
r
=
"1
3
"Mandator
y
="No"MethodOID="MT.ADSL
.TRTDUR">1
くI
temRefItemOID="IT.ADSL
.AVGDD"OrderNumbe
r
=
"1
4
"Mandato
r
y
="No"MethodOID="MT.ADSL
.AVGDD"I>
<
l
t
e
mR
e
fItemOID="IT.ADSL
.CUMDOSE"OrderNumbe
r
=
"1
5
"Mandato
町 =
"No"MethodOID="MTADSL
.CUMDOSE"I>
<
I
te
mR
e
fI
t
e
m
Ol
D="IT.ADSL.AGE"0吋l
e
r
N
u
m
b
er
=
"1
6
"Mandato
r
y
="Noり〉
くI
temRefltemOID="IT.ADSL
.AGEGRI"OrderNumbe
r
=
"1
7
"Mandato
r
y
="No"MethodOlD="MT.ADSL
.
AGEGRI"
1
>
くI
ltemGrouoDef
‑
>

・

く

ニ

・

ニ

s
.

目

図5
.実行結果

テンプレートを使うことで,テープソレ・レコード・データ単位での開始と終了のタイミングで処理を
定義することができるため, XMLのタグを閉じたり,

define‑xmlの element を挿入したりといった処理

を定義しやすい.

4
. まとめ
昨今, define氾 nlを作成するツールは数多く提供されており,以前に比べ definx.xmlを作成するための
ハード、ルは低くなってきた.しかし,プログラム仕様書に定義された情報を define.xml のデータソース
とするような場合,運用上の問題や,プログラム仕様書の使いやすさ,

define
引 n
l のパージョンアップ

といったように, define.xmlを作成するためのソースが変わるような要因は数多くあり,それらを公開さ
れているツールで、カバーするには限界がある.そのため,どういう方法であれ,社内で define.xml を作
成するためのオプションは持っておく必要があると考えている.今後,より効率的なテンプレートの定
義方法や, define引 nlの複数パージョンへの対応できるような define.xmlの作成方法を検討していきたい.

参考文献
CDISCh
t
t
o
:
/
/www.cdisc.or
g/

幽

6
2
6
・

637.

!時一向i 説弱報誌… w l l 9 PROCMIANALYZEを用いた 多重代入法による結果の統合 石田和也・斎藤和宏 株式会社タクミインフォメーションテクノロジー Combinationo fR e s u l t sf o rM u l t i p l eI m p u t a t i o n UsingPROCMIANALYZE KazuyaI s h i d a,KazuhiroS a i t o TakumiI n f o r m a t i o nTechnologyI n c . 医療政府制点記ぷ俸i 要旨: 欠損値を含むデータの解析方法の 1つに多重補完法 ( M u l t i p l e I m p u t a t i o n )がある。 SASでは PROCMIで欠損値の補完をした後、 結果を統合するために PROCMIANALYZEを用いる。本発表では、 PROCMIANALYZEについて中心にご紹介する。 なお、 SASのバージョンは 9. 4(SAS/STAT1 2 . 3 )を使用した。 キーワード PROCMI,PROCMIANALYZE,M u l t i p l eI m p u t a t i o n,TYPE3T e s t, PROCSQL, ‑ 6 2 7‑

638.

陸横政府自問学問口システムの実証[.'f!1… W l J 9 本日の発表構成 1 多重代入法について 2 . 利用事例 3 . PROCMIによる欠損値補完 4 補完後データセットの解析 5 . PROCMIANALYZEによる結果の統合 6 . 統合後の結果に対する主効果の TYPE3検定について 医療政府間、贈山口シス弘の実証~汗蝕 1 .多重代入法について 興味のある解析 PROCGLM PROCGENMOD PROCPHREG e t c 解析結果 M ・~~ラメータ推定値 QM .QMの 分 散 防M ‑ 6 2 8・ 加9

639.

2 m 1 医療鵬帥大学によ紅抑制実証f;fjJ.~齢 1 .多重代入法について ‑補完後データによる解析の統合 ( R u b i n1 9 87) 古苧 M 1 》多重代入法によるパラメータ Qの推定値亘 Q= T ‑Q の分散T T=W+(l+土 ) B M) ~ ト . ; n¥.2 補完データセット間の分散 》ここで B =一一一 4 L ( Q i‑Q ) (推定問のばらつき) M-l~ \,.I:;.. 1 J : ; : . . " w=古P 1 》 M 補完データセット肉の分散 M が大きい(=補完データ セット数が多い) t‑多重代入 j 去によるパラメータ推定値の検定 (H o:Q=qO) →自由度 vが大きくなる 立主 、 IT • →検定統計量は漸近的に 刷 ベM ‑I)I I +r ~γ| ~ 正規分布にしたがう。 1 1 1 +ム I B I I ¥ MJ I 医療政府問、鳩山口システムの実証 f , f : J . . ~ 2 .利用事例 。低体重出生児に対するリスクの解析 T ‑1986年マサチューセッツ州、スプリングフィールドにある B a y s t a t eM e d i c a lC e n t e r において集められたデータの一部(データに欠損がない、完会デ一タ鈎) 戸 一 臼 掴 ‑ 一 一 一 一 一 ‑ 一 ‑ 置 戸 o 隠翠圃 LOW ち E d 幽生体重舟t 勺 2 . 5 k 匂 gを下回るか否か F 鈴ふ逗正山 E ト ( 2 . 5 k g を下闘った場合、低体重兇とする) H 思低体重児ではな L ' 目的変数 1 = 低体重児 AGE 母親の年齢(歳) LWT 最終月経期間における母観の体重(ポンド) RACE 母親の人種 SMOKE PTD HT 0 = な し ,1 =あり 0 = な し 1 =あり 高血圧症の肩凝吋政院吋刊吋何?す問"':1"""",:;‑1"1%,,,0 = なし有員長トん… 1=白人, 2=黒人 3=その他 妊娠期間の喫煙の有無 過去の皐産の有無 m 0 = な し 1 =あり FTV 妊娠後最初の3 か R間に医師の診断を受けた閲数 0 = 0殴 , 1 = 1回 , 2+=2回以上 出典 H o s m e r ,D .W.a n dL e m e s h o w ,S . ( 1 9 8 9 ) . A p p l i e dL o g i s t i cR e g r e s s i o n .W i l e yS e r i e si nP r o b a b i l i t ya n dS 也t i s t i c s U I 子宮炎症の有無 事 6 2 9 ‑

640.
[beta]
│医癒政府自治体大学問

2
.利用事例
‑ 完全データに対する PROCLOGISTICによる解析
procl
o
g
i
s
t
i
cdata=LBWI;
classr
a
c
e
(
r
e
f
=
"
w
h
i
t
e
"
)smoke(ref="No・
'
) ptd(ref="No")
h
t
(
r
e
f
=
"
N
o
"
)
u
i
(
r
e
f
=
"
N
o
"
)
f
t
v
(
r
e
f
=
"
O
"
)/param=ref
modellow(event=叶
")=ageI
w
tracesmokep
t
dh
tu
i
run;

!

‑ 完全データに対する PROCGENMODによる解析

I
procgenmoddata=LBWI descending;
ciassr
a
c
e
(
r
e
f
=
"
w
h
i
t
e
"
)smoke(ref="No") p凶 (
r
e
f
=
"
N
o
"
)
I
h
t
(陪 f="No
・
'
)
u
i
(
r
e
f
=
"
N
o
"
)
伽(
r
e
f
=
"
O
"
)/param=ref ;
modellow=ageI
w
tracesmokep
t
dh
tu
i /l
i
n
k=l
o
g
i
td=binomial ;I
ィun:

l 医療政府叫増!とよ却ミ~視の実証一一

~9

2
.利用事例
‑ 完全データに対する PROCLOGISTICによる解析結果
(PROCGENMODの結果は同じなので割愛)
最尤推定値の分析

W
a
l
d
パラメータ

I
n
t
e
r
c
e
p
t
a
g
e
I
w
t
b
l
a
c
k
r
a
c
e
r
a
c
e
o
t
h
e
r
s
m
o
k
e
Y
e
s
p
t
d
Y
e
s
Y
e
s
h
t
U
I
Y
e
s

自由度

推定値

標準誤差

カイ 2 乗

o
.6
3
6
9
0
.
0
3
7
7
0
.
0
1
4
9
1
.2
1
2
7
0
.
8
0
4
1
0
.
8
4
6
4
1
.
2218
1
.
8
3
8
7
0
.
7
1
1
1

1
.
2
3
0
3
0
.
0
3
7
8
0
.
0
0
7
0
4
o5
3
2
5
0
.
4
4
8
4
0
.
4
0
8
1
0
.
4
6
3
0
o
.7
0
3
3
0
.
4
6
3
1

0
.
2
6
8
0
O
.9
9
6
8
4
.
4
8
5
1
5
.
1
8
7
0
3
.
2
1
5
3
4
.
3
0
2
0
6
.
9
6
2
6
6
.8
3
5
9
2
.3
5
7
8

嗣

630・

P
r>
C
h
i
S
q
O
.6
0
4
7
o3
1
8
1
0
.
0
2
2
8
0
.
0
7
3
0
0
.
0
3
8
1
0
.
0
0
8
3
0
.
0
0
8
9
0
.
1
2
4
7

641.

│医制府自治体均とよるエコ以均 2 .利用事例 「 ‑ 欠損を発生させた際の PROCLOGISTICによる解析結果 1 パラメータ 推定値 Wald 標準誤差 附 カイ 2乗 P r >C h i S q 附 ! 1 n t e r c e p t 1 o .5 7 8 7 1 .2 9 8 3 O .1 9 8 7 O .6 5 5 8 叩 1 ‑ 0側 O O .7 附 O 0 O .0 0 3 9 2L 1 0 . 0 0 6 7 0 . 0 8 5 5 l │wt l 口一 二 i 雨 明 自由度 b l a口 c k し r~ r.問P. r a c e 口t 廿h e r ̲e̲ L 1 1 1 ‑ 0 . 0 1 4 5 1? 6 4 6 O .7 7 0 2 0 . 0 0 7 5 2 05 自 ? ? 0 . 4 5 7 9 3 .7 2 6 1 50 日0 日 2 .8 2 9 7 1 1 0 脱 1 .7 0 2 9 4 0 . 4 位2 0 ω 9 O . 4 9 9 2 3 4 .附 2 5 2 2 h t Y e s 12.0163 0 . 7 4 3 5 7 . 3 5 5 3 u i Y e s 1 O .8 3 5 0 04 8 5 7 2 .9 5 6 4 L U 》欠損を含むオブザベーシヨンが解析から除外されているため・.. 》完全データでは有意であった LWT(最終月経期間における母親の体重)、 SMOKE(喫煙有無)が有意ではない。 》全体的にパラメータの標準誤差が大きくなっている 》解析の精度が下がっていることが分かる 0 . 0 5 3 6 00?4511 0 . 0 9 2 5 ! 一 一 + [医芯甲府自治体、却による戸均坊主主ムー儲 . 3.PROCMIによる欠損値補完 • PROCMIを 用 い た 欠 損 値 補 完 の プ ロ グ ラ ム 例 p r両 副 LW seed=123456nimpute=20; I . . . . ̲ ‑Mの設定 i c l a s srace代vh t 一一一一一一一一一一 化 sd i s c r i m (悶 ce/c l a s s e f f e c t s = i n c l u d e )l o g i s t i c ( 伽) l o g i s t i c ( h t )陀 g ( l w t ) ; 瓦 幅 副 語 時 円 層 悪J 変数) ~SAS9.3 より追加された FCS ステートメントにより、 Fully C o n d i t i o n a lS p e c i f i c a t i o n による補完が可能になった。 ( SAS9.3は評価版) → RACEのような名義尺度についても PROCM Iによる多重補完が可能となった。 ‑ 6 3 1・ 1

642.

9 臨蜘叩;延長場務幹L仇 w l ] 4 .補完後データセットによる解析 PROCLOGISTICによる解析 • p r o cl o g i s t i cdata=LBWI一MIoutest=Lo9̲Paramcovout by̲imputation̲ ; c l a s sr a c e ( r e f = " w h i t e " )smoke(ref="No") p t d ( r e f = " N o " ) h t ( r e f = " N o " ) u i ( r e f = " N o " ) 批 判r e f = " Q " )/param=ref ; modellow(event="1")=ageI w tr a c esmokep t dh tu i I [ ̲ ' " l J ̲ t l ̲ ̲ ; 一一 • 叶南完デ タセットごとの解析 一一一一ーシパラメータとその分散共分散 行手J Iのデータセット化 一一一一 PROCGENMODによる解析 I odsoutputParameterEstimates=Gen̲Param COVB=Gen̲Cov …… P訂 arm 山 i 加 i r nfo=Gen 一 一 ‑ 川f o; I 仰 p r r ω o cgenmodd討 at a=LBWI̲MI descending; 一 ;.......11¥ .................I......I.........f̲IIII .I . . . . . I I ¥ . . . . . . . . . . 1I . . . . . . . ..f̲"! I .1 . . . . . " ¥ │by‑imputation c l a s sr a c e ( 令 r e f =whi 比 t e " )smoke(r 問e f = " N o " )p t ω d ( 令 r e f ゴ = " 判 N o " ) 刊 l modellow=a0 " )I 0 " ) g e w tr a c esmoke p t ω dh t山 u伽 i川 /i l 川 nk=l o g i は td=b i n o m i a l r u n ; ι 2mJ 時 ぷ 府 ・ 自 治 体I 延長場誠議!ぷ 倣 5.PROCMIANALYZEによる結果の統合 • PROCLOGISTICによる結果の統合 p r o cmianalyzedata= Log̲Param modeleffect I n t e r c e p tageI w t問 e b l a c kr a c e o t h e rsmokeYesptdYes : htYesu i Y e s; Ir u n; 即O 川 WUMωηω 川伽山山川郡山町別 加⁝⁝⁝制昨一市加回路一岬 吋困出吋吋吋回 hHMhu﹂ ﹂ 山 何 噌 剛 耐 州 内 冗仰向白 WH 附 vvJvvvvv V 同叩 ∞叩∞∞∞∞∞∞叫∞ 町一一附 川⁝詔叩川町町制町四四叩叩 γib 一一﹂﹁寸↓何 ‑uJE 棚一⁝⁝⁝一能川 uqJ 有 6 3 2 ‑ Ew 一 冊 一3一一 一7 一 十 一 日 一 H 一 η 12 46 6 別一一一一一一一一寸 げ︑肝心一のと他 乱むヱつれは 一勧使件な一敬一日の一日間 山﹂に訓一引が一日 川嘩引目︒一叫山町 メ 41 用m mる 一 行 口 指 協︒京町一部均 戸山一 U出 区をるプ一口調一ノ刀に 州 陣数吋一生げ時一位升川町村 忠変調不一日同一一セ九ジ 孔リ持 S羽 一 メ タ ザ 凡 シ 凹ゴで百一引は一ラ一夜ロ⁝ kyky O テ 形 Uき ど 一 パ デ 円 プ M 力 の O一 で な ﹁ IlllJ 島

643.
[beta]
1
1
怒
努
:
渋
行刈
v予7
汚
竺
I
さ J糸災守
ω
;
必ぷ怒絞撚:守
η?11いぞ.
医鴎癒、政蜘府.自治綿体、大学靴
I
巴
z
よ
拘
る
工
泊
2ジ奴ズ弘の糠翼証 訓側s
制
[
:
i
A
綿
斜
附
榔
s
吋白噌齢
Jぷ三滋?と
;勺:

完
史
宅
筏
:
一
メ
九

マ
汁
勺
守
叩
戸

刈

ν

イ

"
'
l
'
.
.
.

7
湘
目
l
u
r
i
l│
f

5.PROCMIANALYZEによる結果の統合
•

PROCMj_~blALYZE による出力結星

一一一一一一

P
a
r
a
m
e
t
e
rE
s
t
i
m
a
t
e
s

P
a
r
a
m
e
t
e
r

E
s
t
l
m
a
t
e

S
t
dE
r
r
o
r

9
5
首C
o
n
f
l
d
e
n
c
eL
l
m
l
t
s

0701462
‑
00
4
1
6
7
9
同γ一
一一一一七 014656
:
lc
p
.h
l肘 :
k
1?
4
7
f
i
O
R
1r
r
a
c
e
o
t
h
e
r
一
一
一
(s
m
O
K
e
l
e
s
Ip
t
d
Y
e
s
Ih
t
Y
e
s

1
.2
4
6
5
5
3
0
.
0
3
7
7
7
6
00
0
1
1
9
1
0~~n!H4

‑
17
4
1
9
8
.
.
01
1
5
7
2
00
2
8
7
5
01
9
4
?
R

I
n
t
e
r
c
e
p
t
│ 昭e

n

o

D
F

31
4
4
9
0 1
2
1
6
3
00
3
2
3
6 1
4
4
4
1
7
00
0
0
5
6 9
0
9
9
.1
?l
:
0
0
9
4 7
7
5
9
4

UiVe
γ

P
a
r
a
m
e
t
e
rE
s
ti
m
a
t
e
s
P
a
r
a
m
e
t
e
r

M
i
n
i
m
u
m

M
a
x
i
m
u
r
r

tf
o
rH
O
T
h
e
t
a
O P
a
r
a
m
e
t
e
r二 T
h
e
t
a
O P
r>I
tI

n
t
e
r
c
e
p
t

0
.
5
7
3
6

i医 領 、 蹴 ・ 自 … . . 手 編 …

~9

5.PROCMIANALYZEによる結果の統合
•

MODELEFFECTステートメントの自動化
SELECT
句で指定した変数を
マクロ変数化する。その際・・
procs
q
ln
o
p
r
i
n
t;
e
l
e
c
t NAME
・変数を績に並べる。
I i
n
t
o
:m
o
d
e
l
e
f
f
e
c
t separatedby
十一一一」 ‑変数の聞は SEPARATEDBYで
指定したデリミタで区切る
I fromL09̲Param
(左記は半角ブランクで区切る場合)
I where̲imputation̲=1and̲TYPE̲=COV":
I
q
u
i
t;
t
>
/~ラメータデータセットからマクロ変数を作成する

~SAS ログより

「
元
日tmodeleffect=&modeleffect;

modele
汗e
c
t=
I
n
t
e
r
c
e
p
tageI
w
tr
a
c
e
b
l
a
c
kr
a
c
e
o
t
h
e
r
smokeYesp
t
d
Y
e
sh
t
Y
e
su
i
Y
e
s
》マクロ変数を用いると・..

procmianalyzedata=L09̲Param
modeleffect &modeleffect
run;

‑
6
3
3
‑

644.
[beta]
│医憲政府関、大学問工コ滞ムゐ均一
5.PROCMIANALYZEによる結果の統合
•

…

PROCGENMODによる結果の統合

[山川而
一
i一
山
阿
山
山
…
…
…
…
吋
吋
s
吋
柿
{
い
c
l
ω
l
同
a

parmi
川
n
f
o=Gen
一川
I
n
f
o
;
c
l
a
s
sr
a
c
e
:
m
o
d
e
l
e
f
f
e
c
ti
n
t
e
r
c
e
p
tageI
w
tr
a
c
e smokep
t
dh
tu
i;
げ u
n:

舟叫叩組問叫崎一
川1
官 ..附→ [
'
'
'
'
'
'
1 a 悶!戸 i
'
^
"
l
'
,
適切なものを腿選択。(伊デフ万オル仙トは昨
F
印U
胤L
μ
L
υ
)弓
子
二1 :
r
「
F百 一 寸 I
r
認…:
;
『
rr
2
羽
E
rτ
羽
可
詑
::
;
;
;
"PROCGENMODの場合、パラメ一タ
一斗--i--~
:
:
:
エ
岬
困 :!!z l忠山; t
:
注 口1
月
山
川
!
引
出
:
U
u
デ一タセツトの力テゴリ水準の変数名の
JH ;
z
‑1
7 11
;
:;
:
11
1
:
:l
R
;

~CLASSVAR=オプシヨン

ω

》汗
F
刊ULL
,ほ
L
£印
V
ε し CL
凶AS
おSV
,胤
Aしの中から

0'白 i
帥

4
酔
問
蝉
帥
稼
開
叫
差
干

←

:
山
!
円
2
5

接頭辞がLEVEL
なので、 LEVELと指定。

一
寸‑
4
9

~CLASSステートメントでカテゴリ変数を

I

一
件
十
‑fj

指定するが、 2
水準のカテゴリ水準の
I
場 合 は 指 定 し な く て も よ い 。 ‑~"-1
1
(

l
f Z
; ::
;
::
;
:
t;
l
詑 2
1
;
;
ロ
い
!
J
2
1
1
!忠 1
1
2
;
l
思
;
z
;
;
;
:
:
;
Z
2
1
A
t
0
6
1
7
1

y~ ,

0
4
6
2
2

‑
0
2
8
S
9

1
5
2
3
0

一

2rac~

blackω58

0
5

一品白川棚

̲
̲
.
:
̲
:
:
: 即日加

&網棚観照棚網網"欄廟聞事踊

川 "

網開蜘州開."聯

!臨政府自治体胤ょ如何持ムー

~[1

6
.統合後の結果に対する主効果の TYPE3検定について
•

M
u
l
t
i
v
a
r
i
a
t
eI
n
f
e
r
e
n
c
e
(
R
u
b
i
n1
9
8
7,S
c
h
a
f
e
r1
9
97)

E多重代入法によるパラメータベ外ル Qの推定値 Q
Eゆ Q 人種を表すパラメーヲベクトル

Q

二

1

してテ

M

M

1
=
1 黒人と白人の平均の差 │

q,

L
q,
JL
その他と白人の平均の差 J

~Q の分散 T。

重

Q=~LÖ;

T=
W
+
(
l
+↓)
B
o

古お;‑Q)(Q; 吾) 補完データセット聞の分散共分散行列

》ここで B =

~

1

M

w=古
喜
吹

補完データセット肉の分散共分散行列

‑
6
3
4
‑

645.
[beta]
ι

│医療政府閥均一ぷ縦二一 加
6
.統合後の結果に対する主効果の TYPE3検定について
•

M
u
l
t
i
v
a
r
i
a
t
eI
n
f
e
r
e
n
c
e(
R
u
b
i
n1
9
8
7,S
c
h
a
f
e
r1
9
97)

>F統計量 Fo=(Qo‑Q
)
'
T
.
;
‑
I(Q。忌)/p ~ F(p,
v
) (Ho:Q=Qo)
》問題点
. ~補完データセット数が少ない (M が小さい)ときに、補完データセット聞の

E

分散共分散行 ~IJB が不安定となる。特に凡f 三 p のときには B がフルランクとならない。

》解決方法
│比例関係を仮定しな
》補完データセット問、補完データセット内の
│い場合はー‑
比例隣係にあることを仮定する。iT.=w+(
1
+̲
!
̲I
B
分散共分散行列カj
にの仮定の下では Qの分散 Tは T= W +r W=(
l+r
)W L
;
.
.
̲
̲
̲
̲
̲
̲
‑
L
‑
M

l

》この Tを用いて、 F統計量を構築しなおす。

>F統計量 F=(Q。語)'rl(Qo‑Q)/p ~ F(p,vl) (Ho:Q=Qo)
•

PROCM
I
A
N
A
L
Y
Z
Eでは
このロジックを採用している

I~(p+1{1+~)2 ifr~p(m-l)4
wnerev
[

l
医
療
、
政
府
自
治
体
点
同
己
点
本
毎
年
ム
ー
絡
会

~I]]n

6
.統合後の結果に対する主効果の TYPE3検定について
•

TYPE3
検定とは
》モデルにカテゴリ変数を用いた解析において、カテゴリ変数に含まれるいずれかの
水準の聞に有意な差があるかどうかを確認する検定。
I
L 係数行列(カテゴリ変数に対するダミー変数行列川
~ Ho:
Q=L3
J=0 i
jカテゴリ共変量のパラメータベクトル
│

I

~Type3検定の p値がO 目 05未満であれば、有意水準 5% で当該カテゴリ変数のいずれかの

水準の聞に有意な差があると主張することができる。

>PROCL
O
G
I
S
T
I
C、PROCGENMODなどの統計解析プロシジャでは、 CLASSステー
YPE3検定
トメントで指定された共変量がモデルに含まれている場合はデフォルトでT
の結果が出力されることが一般的であるが、 P
ROCM
I
A
N
A
L
Y
Z
Eではデフォルトでは
出力されない。

s

》係数行列 Lを理解した上で、自ら T
YPE3検定を行う(=プログラムを構築する)
必要がある。
>TYPE3検定は PROCM
I
A
N
A
L
Y
Z
EのTEST
ステートメントで行うことができる。

‑
6
3
5
646.

l 医穣政府自治体却による口均ム句会主制 ‑ a t . S. : l ‑ ' l f 0 1 9 6 .統合後の結果に対する主効果のTYPE3検定について 4 砂係数行夢I J Lの確認 》以下、カテゴ 1 )変数を R eferenceCodingで扱うこととする。 ~Reference C odingでは係数行列Lは(N‑ 1 )次の正方行列 (Nカテゴリ変数の水準数) 》今回の数値例において、人種(白人、黒人、その他の 3水準)の TYPE3 検定を考える。 》白人を Referenceとすると、係数行夢I J Lは以下のようになる。 10 L=1 1 1行目→「黒人」と「白人」の水準の差、 2行自→「その他」と「白人」の水準の差 一1 0 11をそれぞれ表す。 》人種のカテゴリ変数に対するパラメータ推定値を β 1( r黒人」と「白人」の水準の差)、 s 2 その他 J と「白人』の水準の差)とする。 c r 》人種のカテゴリについての TYPE3 検定は下記のようになる。 少 な く 一 一m m : ぺ 叶 ; ! 日l │ 二 水準との聞に有意な差がある i げYPE3 検定・分散分散的な検定) O , I vs ~I ß, = 0 and s=0 [医療政府臨縛による防ステムの詞 s 肌 + 齢 ~I]]9 6 .統合後の結果に対する主効果のTYPE3検定について • ー PHQCMIANALYZEのTE̲ST スT I ト メ . ; ̲ , . 上 i P gQC.LQGJSTJC の場合) p r o cm i a n a l y z ed a t ョ= Log̲Param modele 符e c tI n t e r c e p tageI w tr a c e b l a c kr a c e o t h e rsmokeYesptdYes h t Y e su i Y e s: t e s t raceblack=0 ,raceother=0Imult; run; 二二二~二主竺J J ・ 帰無仮説をカンマ区切りでコーディング │ 川南完デ ¥ 1ULT オプションで多変量に対する検定を実自包 1 5 士散行 PROCMIANALYZEによる出力結果 (TESl r , p v F A v gR e l a t i v e r 一 一 一 一 一 一 一 l n c r e a s e I Ff o rH O i nV a r i a n c e N u mD F D e nD F I P a r a m e t e r = T h e t a O O .0 4 6 6 9 6 2 1 5 4 1 2 I ‑636・ 3 .0 7 P r>F O .0 4 6 5

647.
[beta]
9

!医療、政府自治体¥末紘一以ぷ長年一一

W
l
J

6
.統合後の結果に対する主効果のTYPE3検定について
•

TEST
ステートメントの自動化
》パラメータデータセットからマクロ変数を作成する
d
a
t
aMakeType3;
s
e
tL09̲param;
where̲
i
m
p
u
t
a
t
i
o
n
̲=1and̲TYPE̲="COV" and i
n
d
e
x
しNAME ,"
r
a
c
e
"
)>0;
0
"
; %*TESTS
t
a
t
e
m
e
n
t
のパーツの作成;
Type3=t
r
i
mしNAME̲) 1 =
r
u
n
;
.
TESTS
t
a
t
e
m
e
n
tの構築には、
カンマ区切りのプログラムが必要。
p
r
o
cs
q
ln
o
p
r
i
n
t;
→SEPARATEDBYでぺ"と指定すればよい
s
e
l
e
c
tType3
i
n
t
o:
Type3s
e
p
a
r
a
t
e
dby,
""
由叩ー叫ム一時ム臨幽品一一一一由勾
│
f
r
o
mMakeType3;
q
u
i
t
;
"
""~両面" ,
示
一
而 山 花y
{
.
"
.
i
.
》マクロ変数を用いると・....

;
"
c
:
'!叫叫肺増設官 .
1
1
'
山町

中(選 g
i話集p
i
5
1
;
;
;
;
j
:
;

procmianalyzedata= Log̲Param
modele
仔e
c
t &modele
仔e
c
t
t
e
s
t&MakeType3Imult;
run;

7
起両誌品正一

…

医
療
、
政
府
・
自
治
体
、
大
学
!
と
よ
る
土
コ
シ
ス
均
三
‑
綿

6
.統合後の結果に対する主効果のTYPE3検定について
+̲̲PHQCMI
千
五N
ALYZEの1ES1
ステートメ":./ト L
PRQC.G.ENMQOの場合)一一
I
procmianalyzeparms(classvar=level)= Gen̲Param covb=Gen̲COV
parminfo=Gen̲info;
c
l
a
s
srace;
w
trace smokep
t
dh
tu
i;
modeleffecti
n
t
e
r
c
e
p
tageI
t
e
s
t race=0

•

SASログ
WARNING:TheTESTs
t
a
t
e
m
e
n
tcann
o
tbeusedwhenaCLASSs
t
a
t
e
m
e
n
ti
ss
p
e
c
i
f
i
e
d
.
~TESTステートメントと、 CLASSステートメントの併用ができない。

→パラメータデータセット (Gen Param)とパラメータ詳細 (
G
e
n
̲
i
n
f
o
)データセットの加工が必要

有印:::)五時幅
二
信

1
r

マ
̲:
c
:
:
;
;
:
:
コ

』↓寸

i

j
造;

一瞥..に宮司
二己
ゴ
…
.

同 時 川 川 駒 市

一#プ, ~...-

斗
斗

'
.

岨

.

‑士一品土庶弘之いお‑みa

‑
6
3
7
‑

;~!

町

f~

~~ I

議‑.̲.ゐ闘志

9

W
l
J

648.
[beta]
師、政府問、大学問ロシ均主主 s… ー 蝕

i

~9

6
.統合後の結果に対する主効果の TYPE3検定について
PROCMIANALYZEの TESTステートメント (PROCGENMODの場合)
》データセットの加工
i
d
a
t
aGen Param2;
IlengthParameter$128;
5
e
tGen Param;
i
fP
a
r
a
m
e
t
e
r="
r
a
c
e
"t
h
e
n f'_笠呈血ete_[~ trim(ParameterìJLl旦m住型旦Ll1;
r
u
n
本¥
'"カテゴリ変数とその水準を結合して、
d
a
t
aGen i
n
f
o
2
;
メユニークな変数値を作成する
l
e
n
g
t
hE
f
f
e
c
t$128;
/
5
e
tGen i
n
f
o
:
.
/
i
fr
a
c
怠^="then E宵ect=t
同mlE
宵'
e
c
t
l1trim(rQ~;
r
u
n
:

•

事コ

ι

ト

一 画 画

…W]9

I

│師、政府関、相よる工コ玖テ明

6
.統合後の結果に対する主効果の TYPE3検定について

。

修正後のゴ旦ってラ企 a
8
0
̲
CG
E
N
J
y
L
Q
口明場合)一

procmianalyzeparms= Gen̲Param2 covb=Gen̲COV
parminfo=Gen̲info2;
modeleffectraceblackraceother
t
e
5
traceblack=0,
raceother=0I
mult;
run:

!

。
│ …

I
干ROCMIANALY
互 bよる出力結果 (TESTステートメシト)
r
i
a
t
eI
n
f
e
r
e
n
c
e
A
s
s
u
m
i
n
gP
r
o
p
o
r
t
i
o
n
a
li
t
yo
fB
e
t
w
e
e
n
/
W
i
t
h
i
nC
o
v
a
r
i
a
n
c
eM
a
t
r
i
c
e
s
A
v
gR
e
l
a
t
i
v
e
Ff
o
rH
O
I
n
c
r
e
a
s
e
a
r
a
m
e
t
e
r
=
T
h
e
t
a
O
e
nD
F P
u
mD
F D
i
nV
a
ri
a
n
c
e N
0
.
0
4
6
6
9
6

2

1
5
4
1
2 I3.07

~PROC LOGISTIC
のときと閉じ結果が得られる

‑
6
3
8
‑

P
r >F
0
.
0
4
6
5

649.

m‑Es …‑髄 !医療政府間大…ロ ~9 まとめ 1 . 多重代入法について 解析の精度が下がることを防ぐため、欠損値を含んだデータに対しては、多重代人法により、 欠損値の補完を行った上で解析を行うことが有用である。 SASでは、 PROCMIで多重代入 法による欠損値補完を、 PROCMIANALYZE で結果の統合を行うことができる。 2 . PROCMIANALYZEによる結果の統合 PROCMIANALYZEIこ結果の統合を行うためには、補完データセットごとの解析結果のパラ メータデータセットと分散共分散行列のデータセットが必要となる。これらのデータセットの構 造は、統計解析プロシジャにより異なるので、 PROCMIANAL YZEの指定方法が、使用した 統計解析プロシジャにより異なる。 3 . 統合後の結果に対する主効果の TYPE3検定について モデルにカテゴリ変数を用いた解析では、カテゴリ変数に含まれるいずれかの水準の聞に 有意な差があるかどうかをTYPE3検定を用いることがある。 PROCMIANAL YZEでは、 TEST ステートメントにより、 TYPE3 検定を行うことができる。その際、補完データセット問、 補完データセット肉の分散失分散行列が比例関係にあることを仮定しているので、注意が 必要である。 イ . . . . . . fP 8 f i l 実証一触 ~9 :三川ツ?とふ然鈴いが ρ !医制附治ーとぬ 参考文献 +MIProcedureによる多重代入 SASver9.3における新機能の紹介 ( 2 0 1 3 )I多国圭佑 + M u l t i p l eI m p u t a t i o n法によるネステッドコントロール研究、ケースコホート研究の解析 (2012) /野間久史・田中司郎・田中佐智子・和泉志津恵 ・ロジスティック回帰分析 SAS を利用した統計解析の実際 ( 1 9 9 6 )I丹後俊郎・山岡和枝・ 高木春良著 +AppliedL o g i s t i cR e g r e s s i o n .WileyS e r i e si nP r o b a b i l i t yandS t a t i s t i c s(1989)IHosmer D.W.,LemeshowS +SASf o rL inearModels(1996)IRamonL i t t e l l, W a l t e rW.Stroup,RudolfFreund +Analysiso fI n c o m p l e t eM u l t i v a r i a t eData(1997)I J. L .Schafer 4U s e r ' sGuide +SAS/STAT9. 26 ‑ 6 3 9・

650.

l 医癒政府制大…一弘の実証 s … 金 P I I l l 9 ご清聴ありがとうございました 27 ‑ 6 4 0・

651.

. , . . 渋 々 . 医療、政府・自治体、大学によるエコシステムの実証 SASユーザー総会 ' t J1 1 1r l l HadoopとSASとの連携テクニック 小林泉 SASI n s t i t u t eJapan株式会社 ビジネス推進本部アナリティクスプラットフォーム推進 Techniquesi nSASonHadoop IzumiKobayashi AnalyticsPlatformPractice, SASI n s t i t u t eJapan │醗政府自治体大学問工コ妨ム尚一蹄 ~II~9 要旨: ビッグデータ分析の基盤としての Hadoopの活用が進んでいます。 SAS はこのような時代の流れを考慮し、 SASとHadoopを統合する製品を提供 しています。本講演では、ビッグデータを SASで取り扱う機能とテクニック について取り扱います。主 l こSASユーザーに向け、 Hado叩クラスター上 で動作する SASプログラミングテクニックをご紹介し、 SASから Hado叩 の 分散処理フレームワークをどのように活用できるかについて解説します。 キーワード:SAS,Hadoop,MapReduce,Hive,Impala,HDFS,機械学習, インメモリ,分散処理 ‑ 6 4 1・

652.

│ 一 一 • Hadoopとは • HadoopとSAS アジェンダ • SASデータセットを HDFSIこ保管する • Hadoopデータに対して SASから処理を実行する • SASプログラムを MapReduceとして分散処理する方法 • Hadoopクラスター上での分散インメモリ処理機能による高速 機械学習 医療政府間大…一弘の実証一綿 ~I]9 資料は下記サイトよりダウンロードしてください。 http://www.sascom.jp/campai g n /usergroupS2014/agenda.php ‑ 6 4 2 ‑

653.

SASを用いたコピュラに従う擬似乱数の生成 0矢 田 真 城 l 浜田知久馬 2 l 株式会社 ACRONET データサイエンス本部生物統計部 2 東京理科大学工学部経営工学科 G e n e r a t i n gpseudo‑randomnumbersfromc o p u l a sbyu s i n gSASs y s t e m S h i n j oYadal ChikumaHamada2 B i o s t a t i s t i c sDepartment, ACRONETC o r p o r a t i o n I 2 DepartmentofManagementS c i e n c e TokyoU n i v e r s i t yofS c i e n c e 角 要旨 コピュラ ( c o p u l a )とは,変数間の依存関係を表す接合関数のことであるー複数の変量についてモデル化した い場合,各変量の周辺分布とコピュラとを別々に設定することで,様々な多変量確率分布をあてはめること ができる 医薬品開発において,想定した試験デザインの動作特性を評価するためシミュレーションを行うが,その 際,コピュラに従う擬似データを生成しなければならないケースが考えられる そこで本稿では,代表的な コピュラの乱数生成法について整理し, SASを用いて ζ れらの擬似乱数を生成するための具体的な方法を紹 介する. キーワード:擬似乱数,コピュラ,マ シャルオルキン法, COPULAプロシジャ 1.はじめに 医薬品開発において,検討対象となる試験デザインの振舞いをうまく数式で表せない,あるいは数式で表 現できてもその解を解析的に求めることが極めて困難な場合,近似的な解を得るためにシミュレーションは 威力を発揮する そのようなシミュレ ションでは,大量の乱数を必要とすること,再現性が求められるこ とから,擬似乱数が用いられる川 擬似乱数が従う分布は,試験デザインの評価項目に依存し,コピュラによるモデリングが有効な場合があ る. SASでは,擬似乱数を生成させるために RAND関数が提供されている [2Jが,コピュラの場合, RAND関 o p u l a ),スチューデント 数で指定できない確率分布が必要とされる.そこで本稿では,正規コピュラ (Normalc tコピュラ ( S t u d e n t ' stc o p u l a ),クレイトンコピュラ ( C l a y t o nc o p u l a ) [ 3J,フランクコピュラ ( F r a n kc o p u l a ) [ 4J,ガン o p u l a j l 5J ベルコピュラ (Gumbelc を取りあげ,各コピュラに従う乱数を生成させる方法について述べる目そして, これら 5種類のコピュラに対し ,SASを用いて乱数を生成するための方法について具体的に説明する ‑ 6 4 3 ‑

654.

2 . コピュラについて ,…, m個の確率変数を XhX2 Xmとおき,これらの周辺分布関数を F I( x1), F2( X 2 ), …, Fm(xm),同時分布関数 , X 2 '…, Xm)と表すとき,スクラーの定理(S k l a 山 由e orem)として を F(X1 … F ( X I, X 2 ', Xm)=C(F1( X I ), F2( X 2 ), Fm(xm)) ( 2 . 1 ) 川 を満たす関数 Cが存在することが知られており, ζ の関数 Cがコピユラである[伊 か 6‑ 必 8 孔 元同時分布とその l次元周辺関数を結合する役割を担つていることを示している よつて , m個の確率変数 XhX 花 = ふ ,一 . …" X I( X I ), F2 ( X 2 ), …,Fm(xm)と,これら周辺分 mについてモデル化したい場合,個々の周辺分布関数 F Xm の同時分布関数を構 布関数の依存関係を表す関数 C,即ちコピュラとを別々に特定することで ,XhX2,…, 築することができる. ( 2.1)において,関数 Fが連続関数である場合には Cは一意に定まり,任意の Ui=Fi(Xi) (ここに i = 1 2, …, m で UiE[ 0, 1 ])に対し I ( u I ) 'F2 ‑ ( u ) , . . ,F n ‑1( C(U1, U 2, …, Um)=F( 1 ' i ‑I u ) m) 2 ( 2 . 2 ) と与えられる.このとき C は,各周辺分布が区間 [ 0, 1 ]の一様分布である同時分布関数となる. 変量聞の依存関係を行列で表現するコピュラとして,正規コピュラ,スチューデント tコピュラが挙げら れる.またそれ以外に,変量聞の依存関係を 1種類のパラメータで表現するコピュラがあり,その代表例が 1 chimedeanc o p u 1 a ) [ 6 ' 8 g e n e r a t o r ) アルキメディアンコピュラ(Ar である.アルキメディアンコピュラとは.生成素 ( と呼ばれる関数を用いて表現されるコピュラの総称であり,クレイトンコピュラ,フランクコピュラ,ガン ベルコピュラが該当する. 3 . 乱数の生成 3 .1.アルキメディアンコピュラに従う乱数の生成 区間 ( 0, 1 ]上で定義され, 0を含む正の実数値をとる単調減少凸関数ゆが ゆ ( 1 )= 0 を満たすとする ( 3 . 1 ) このとき U ( C( U l, u 2 )=O ‑1 砂( U )+砂( U 2 ) ) ここにい. I 2 )ε(o, l f 1 ( 3 . 2 ) として表現されるコピュラを, 2次元アルキメディアンコピュラと呼ぴ.併を Cの生成素という. 3次元以上 i m t →oO ( t )=∞を満たしゅ lが完全単調(c o m p l e t e l ymonotone) であるとき の場合, ( 3 . 1 )及び l C(U , U 2 " " ' U 1( 砂( U l ) +砂 ( U 2 )+ … + 妙( Um)),( U I, U 2 U O, l t m)=ψ m)ε( 1 川 ( 3み として定義される. アルキメディアンコピュラにおいて,よく用いられる乱数生成法の 1つがマーシャルオルキン法(M a r s h a l l 1 I 頃lの C ( ・ ) は andOl k i nm e t h o d ) [ 9 であり,マーシャルオルキン法を用いた乱数生成法は以下のようになる.手1 ラプラス変換である.乱数を生成させたいアルキメディアンコピュラに対し,生成素ゅの逆関数。 ‑1(・)に対応 するような確率分布 F ( η )を特定し,その確率分布に従う乱数を発生させる必要がある. ‑ 6 4 4 ‑

655.

手1 ) 慎 1 Cの生成素に対し,以下を満たす確率分布 F( η )に従う乱数 ηを生成させる. c ( t )=f e ‑ t' ld F ( η} = o ‑ 1 ( t ) 手1 ) 頂2 区間 [ 0,りの一様分布からの乱数 Xl, x 2, . . , x mを生成させる. ) 頂3 ui=C( 一η1l o g ( xi)) ( i = 1, 2, …, m) を算出する. 手1 3ユ正規コピュラに従う乱数の生成[JO] 平均ベクトル 0,分散が全て lとなる分散共分散行夢) 11:をもっ多変量正規分布が同時分布の場合,周辺分 …, Umを生成するための手順は以下の 布は標準正規分布となる.従って,正規コピュラから l組の乱数 U,J U2, ようになる. ) 慎 l 所与の相関係数から,分散全て lの分散共分散行列を作成する 手1 手1 ) 頂2 平均ベクトル 0,手1 ) 慎 lで作成した分散共分散行列の多変量正規分布に従う乱数 Z, J Z2 , …, Zmを生成さ せる. ) 慎3 手1 Uj=φ(Zj) ( i = 1, 2, … , m )を計算する.ここに φ(・)は標準正規分布の分布関数である. 3 . 3 . スチューデント tコピュラに従う乱数の生成[10] 自由度 V,相関行列1:( m x m )をもっ多変量 t分布が同時分布の場合,周辺分布は自由度 Vの t分布となる. . . , Umを生成するための手)1頂は以下のようになる. 従って.スチユーデント tコピュラから l組の乱数 U,JU2, 数 Xl, x 2, …みは,平均ベクトル 0,分散共分散行夢I]I:の なお,自由度 V ,相関行夢IJ1:の多変量 t分布に従う舌L 多変量正規分布に従う m個の乱数 Zlみ,ーんと,自由度 vのカイ二乗分布に従う乱数 sとを用いて導出できる. :( m x m )の多変量 t分布に従う乱数 XI, x 2 , . . . , x mを生成させる. 手順 l 自由度 V,相関行事IJ1 ) 頃2 ui= t v ( X j )( i 斗 ,2, …, m) を計算する.ここに 1 "( ・)は自由度 vの t分布の分布関数である. 手1 4 . SASによる擬似乱数の生成 コピュラを用いた例として, YuanandYin(2009)で用いられた 2変量生存時間データを参考にした以下のモ デルを考える. Tを毒性発現までの時聞を表す非負の確率変数とし .Tの生存関数としてパラメータんの指数分布 Sr( tr)=exp(λr1r) ( 4 . 1 ) を考える.効果発現までの時間 E についても,生存関数としてパラメータ λ Eの指数分布 tE)=e x p ( 一λE t E ) SE( ( 4 . 2 ) を仮定する.更に,毒性発現までの時間 Tと効果発現までの時間 Eとの相関構造として,クレイトンコピュ ラ( 4 . 3 ) を想定する ‑ 6 4 5・

656.
[beta]
0

,,‑1/0

S(
tr,
t
tr)‑"+SE(
tE)‑"‑W""
E)={Sr(

(
4
.
3
)

以上に示したモデルに従う生存時間 (
t
r
,
t
E
)の擬似データは,以下 2つのステップにより得ることができる.
くS
t
e
p
l
>

想定したコピュラからの擬似乱数を生成する

<Step2>S
t
e
p1で生成された擬似乱数を変換する
S
t
e
p
lにおいて,想定したコピュラから擬似乱数を生成するにあたり,まず DATAステップを用いた方法を説

明する.次に, V
e
r
.
9
.
3より SAS
厄 TSに搭載された COPULAプロシジャを用いた方法について紹介する.

4
.1
. DATAステップを用いた擬似乱数の生成
S
t
e
p
lでは,クレイトンコピュラ

o+ui
o‑1)ー1/0
C(
u
!,
u2)=(
u
i

(
4.
4
)

に従う擬似乱数(UhU2)を生成させる.クレイトンコピュラでは,生成素の逆関数はパラメータ θー1のガンマ分
4.4)で表されるク
布に従う確率変数のラプラス変換に一致することから,マーシャルオルキン法を用いて, (

レイトンコピュラに従う擬似乱数を l組生成させるためのアルゴリズムは,以下のようになる.

手1
I
頂1 パラメータ 1
1
θ のガンマ分布に従う擬似乱数 Zを 1つ生成する.
手1
I
頂21
I
頂lで生成した擬似乱数 Zと独立に,区間 [
01
]の一様分布に従う擬似乱数 X1,
X2を生成させる.
1
)3 U
;=(11n(X;)/Zr!/9 (
i
=
I,
2
) を算出する.
手頂

プログラム 4
.
1は,上記の手1
I
慎 lから手1
I
頂 3までを用いて 2次元クレイトンコピュラに従う挺似乱数を生
成させるための SASマクロプログラムである.マクロ引数 t
h
e
t
aにクレイトンコピュラのパラメータ 8(>1
)を
,
マクロ引数 ndrawsに生成する擬似乱数の個数を,マクロ引数 outuniformに生成した擬似乱数を保存するため
のデータセット名を,それぞれ指定する.

プログラム 4
.
1 DATAステップを用いたクレイトンコピュラの擬似乱数生成
%macrom
c
l
a
y
t
o
n
(
t
h
e
t
a,
ndraws,
o
u
t
u
n
i
f
o
r
m
)
;
d
a
t
a&
o
u
t
u
n
i
f
o
r
m
.
;
r
u
n
;
%dom i
=
1%to&ndraws.;
datam̲wrk;

.
;
l
e
n
g
t
hm̲r1m̲r2m̲u8
.
;formatm̲r1m̲r2m̲ubest
m̲r1=rand(
・
gamma',
1
/
&
t
h
e
t
a
.
);
domj=1t
o2
;
m
̲
r
2
=
r
a
n
d
(
'
u
n
i
f
o
r
m
'
);
m̲u=
(
1
‑
l
o
g
(
m
̲
r
2
)
/
m
̲
r
1
)
帥
(
(
・ 1)
/
&
t
h
e
匂
.
)
;
o
u
t
p
u
t
;
e
n
d
;
r
u
n
;

‑
6
4
6
657.

proctransposedata=m̲wrkout=m̲wrkp r e f i x = m ̲ u ; v a rm̲u;run; d a t am̲wrk; s e tm ̲ w r k ; i fn(m̲u1, m̲u2)=2t h e nSimNo=&m̲i.;run; d a t a& o u t u n i f o r m . ; s e t& o u t u n i f o r m .m̲wrk(keep=SimNom̲u1m̲u2); i fSimNo^=.; r u n ; procd a t a s e t sl i b r a r y = w o r knowarnn o l i s tn o d e t a i l s ;d e l e t em̲wrk;r u n ;q u i t ; %end; %mendm c l a y t o n ; S t e p 2では, S t e p lにおいて得られた擬似乱数 (UI oU2 Si1(U1), SE1(U2))と変換することにより,同時 ) を用いて ( 分布関数 ( 4 . 3 )に従う擬似乱数を算出する. ( 4 . 1 ), ( 4 . 2 )より t rコ Sil(ul )=‑lnullλ T ( 4 . 5 ) 1u )=‑lnu 1 t E 二 SE( 2 2 λE ( 4 . 6 ) であるから,プログラム 4 . 1により得られた擬似乱数 ( UI oU 2 )を( 4 . 5 ), ( 4 . 6 )へ代入することにより, ( 4 . 1 )から ( 4 . 3 ) に示したモデルに従う擬似乱数を得ることができるプログラム 4 . 2は ,( 4 . 1 ), ( 4 . 2 )においてパラメータを A r 1, 二 ゐ ニ lとしたときの SASプログラムである. SASデータセット randataに tl . t2という変数名でデータが入力 される.なお,プログラム 4 . 2では,各症例の観察期間 0 は区間 [ 0, ω]の一様分布に従うものとし, 番目の 1 イベント発現までの時間 ( T i, E ; )に対し Oi<T iなら打ち切りとする [12]ように組んでいる または OiくE i プログラム 4 . 2 生存時間の擬似乱数を算出する SASプログラム d a t ar a n d a t a ;s e tu n i f d a t a; l e n g t hlambda̲ Tlambda̲Et ̲ 1t ̲ 28目 ; f o r m a tlambda̲ Tlambda̲Et ̲ 1t ̲ 2best . ; lambda̲ T=1;lambda̲E=1; a r r a yu n i d a t a ( 2 )m̲u1m̲u2; a r r a ys t i m e ( 2 )t ̲ 1t ̲ 2 ; a r r a yparm(2)lambda̲ Tlambda̲E; doi = 1t o2 ;s t i m e ( i ) = r o u n d ( ( ‑ 1) * ( l o g ( 1 ‑ u n i d a t a ( i ) ) ) / p a r m ( i ), 1 e・1 2 ); e n d ; n H rHu d a t ar a n d a t a ;s e tr a n d a t a ; l e n g t hw 8 . ; f o r m a tw b e s t目 ;w =7; i fr a n d ( ' u n i f o r m ' ) * w < t ̲ 1I r a n d ( ' u n i f o r m ' ) * w < t ̲ 2thencensor=O;e l s ecensor=1; r u n ; ここでは, 2つの生存時間を表す確率変数 Tと Eの依存構造として,クレイトンコピュラ ( 4.4)を想定した が,フランクコピュラ,ガンベルコピュラは, ( 3 . 2 )を用いて統一的に表現でき,よってこれらのコピュラに ‑647‑

658.

従う擬似乱数は,クレイトンコピュラと同様の手I 1 債で生成することができる ただし以下に示すとおり,生 成アルゴリズムはやや複雑になる ‑フランクコピュラの擬似乱数生成 フランクコピュラ ぬ一り 却 一 Af 十 叶 一 l ︒ 一 mH C(UぃU2""'Um)=ゆl ( ゆ(Ul)+ゆ(U2)+…+ゆ(Um)) ( 4 . 7 ) において生成素の逆関数は,パラメータ β=I‑e‑oの対数級数分布に従う確率変数のラプラス変換に一致する. よってフランクコピュラの乱数を生成するためには,パラメータ s=I‑e‑oの対数級数分布に従う乱数が必要 となる しかし ,SASの RAND関数では対数級数分布に従う擬似乱数は生成させることができない.逆関数 0, 1 ]の一様分布に従う確率変数 Uとパラメ 法を用いて擬似乱数を生成させる方法もあるが,ここでは,区間 [ ータ lの指数分布に従う確率変数 Vが互いに独立であるとき, X = l 1 + 一1 v 打 I n( 1 ‑( 1 β) V )1 1 (ここにしj は置を超えない最大の整数値) ( 4 . 8 ) によって定義される確率変数 X が対数級数分布に従うことを用いた [13J この性質を用いれば,区間 [ 0, 1 ]の一 様乱数 Uとパラメータ lの指数分布に従う乱数 Vを互いに独立に生成させ, ( 4 . 8 )に代入することで,対数級 数分布に従う乱数を得ることができる目従って,マーシャルオルキン法を用いて, 2次元フランクコピュラ に従う擬似乱数を l組生成させるためのアルゴリズムは,以下のようになる. 手順 l 以下の手順にて対数級数分布に従う擬似乱数 Zを生成する 手I 1 頂1 ‑ 1 区間[ 0, 1 ]の一様乱数 Uとパラメータ lの指数分布に従う擬似乱数 Yとを Eいに独立に生成する. ‑ 2 手順 1 z = l ‑ ̲ Vn ; ; ‑ 1 + 1を算出する. 1l n ( 1一( e ) V )1 ーσ 手 ) 1 頃 2 手順 lで生成した擬似乱数 Zとは独立に,区間 [ 0, 1 ]の一様分布に従う擬似乱数 X1, x 2を生成させる. l o g { 1+e x p ( Zlln(X;))(e‑o‑l)}/B ( i1 , 2 ) を算出する. 手 ) 1 頂 3 U;=‑ 二 ← ‑ガンベルコピュラの擬似乱数生成 ガンベルコピュラ …)=ゆ 倒的)+ゆ )十…+ゆ C(Ul, U2 Um l (U2 (Um) ) = イ 一 色 ( 一 川 ( 4 . 9 ) において,生成素の逆関数は,特性指数 ( c h a r a c t e r i s t i ce x p o n e n t )が θ1 歪度パラメータが 1 ,尺度パラメータ ‑648 幽

659.

が[ C O S (Jr/2 θ) ] B,位置パラメータが 0の安定分布 S t (θ1, 1 ,[ c o s (Jr/2 θ) ] Bρ)に従う確率変数のラプラス変換に一 致する.従って,マーシャルオルキン法を用いて, 2次元ガンベルコピユラに従う擬似乱数を l組生成させ るためのアルゴリズムは,以下のようになる 手順 l 安定分布 S t (θ1, 1 , [ c o s (Jr/2 θ ) ]。刈に従う擬似乱数 Zを生成する 手順 2 手1 I 贋lで生成した擬似乱数 Zとは独立に,区間 [ 0, 1 ]の一様分布に従う擬似乱数 X1, x 2を生成させる. 手順 3 Uj =e x p ( ‑ ( 一ln(Xj) /Z) ' iB ) ( i = I, 2 ) を算出する これを SASで実装する場合,問題となるのは安定分布に従う擬似乱数の生成である. SASの RAND関数 では(一部の特殊な場合を除いて)安定分布に従う擬似乱数を生成することができない.そこで, Weron の アルゴリズム [141により標準安定分布 S t (α, β, 1 , 0 )に従う擬似乱数を生成させ,それを用いて任意のパラメータ に対応する擬似乱数を作り出すことにした S t e p l 区間 [ ‑ J r/ 2, J r/ 2 ]の一様乱数 Uを生成する. S t e p 2 一様乱数 U とは独立にパラメータ lの指数分布に従う擬似乱数 Vを生成する. S t e p 3 標準安定分布 S t (α, β,1,0 )に従う擬似乱数 X を算出する. 1 )α*1のとき X=SJ S i n ( α (U+B α ,. p )) ( ∞S(Uー α(U+B α ,, p )) ) α l l v │ ( ω( U ) 匹 ¥ y ν ( 1t a n( τ ) ) ーヤ +s2 2)α=1のとき ) ( β t a n ( 子 ) ) 2 r l l X~*%+βU} a n uベ 上記アルゴリズムにより得られた標準安定分布 S t (α , β, 1 刈に従う擬似乱数 x rこ対し X + μ ( α ' " 1 ) 1 O' X +2s O'l o g σ /J r+μ(α=1 ) IO' Y ニ~ ( 4 . 1 0 ) とすれば,特性指数 α(0< α 壬2 ),歪度パラメータ β(ー l壬β三 1),尺度パラメータ σ,位置パラメータ μの安 定分布 S t (α , s,a,μ)に従う擬似乱数となる [15] 付録 A に , DATAステップを用いて,クレイトンコピュラ,ガンベルコピュラ,フランクコピュラ,正規 コピュラ,スチューデント tコピュラの擬似乱数を生成するプログラムを示した.少し補足すると,正規コ ー6 4 9 ‑

660.

ピュラ及びスチューデント tコピュラの場合, 3 . 2節 , 3 . 3節に示したように,多変量正規分布の乱数が必要 となる.多変量正規分布に従う乱数の生成は,分散共分散行列を Cholesky分解することに基づいて行うこと ができる [5]ため,付録 A では MIXEDプロシジャを用いて C h o l e s k y分解を行い.多変量正規分布に従う擬似 乱数を生成させている [16] ユ COPULAプロシジャを用いた擬似乱数の生成 4 SASでは, V e r . 9 . 3より SAS 氾 TSに COPULAプロシジャが E x p e r i m e n t a lとして搭載され,正規コピュラ, スチユーデント tコピュラ,クレイトンコピュラ.フランクコピュラ,ガンベルコピュラに従う擬似乱数の 生成が可能となった [10] ( 4.4)で示されるクレイトンコピュラに従う擬似乱数を, COPULAプロシジャを用い て生成するための SASプログラムを以下に示す プログラム 4 . 3 COPULAプロシジャを用いたクレイトンコピュラの乱数生成 p r o cc o p u l a ; v a rU1・U2; d e f i n eCOPc l a y t o n( t h e t a = 8 ); s i m u l a t eCOPIndraws=1000seed=0724o u t u n i f o r m = u n i f d a t a ; r u n ; ユーザーが指定したコピュラに従う擬似乱数を生成することが目的であるので, PROCCOPULAステート メントにおいて, DATA=の指定は不要である.生成する擬似乱数の変数名は, VARステートメントに記載す る. DEFINEステートメントにおいて,クレイトンコピュラを表すキーワードである CLAYTONと指定し, で指定する.また, SIMULATEステートメントにて使用するた あわせてパラメータ値をオプション THETA= めに,このコピユラの名前を で行う. SIMULATEステートメントにおいて, DEFINEステートメントにおいて定義したコピュラの名前を 記述した後,オプション NDRAWS=で生成する擬似乱数の個数を,オプション SEED=で擬似乱数を生成する ためのシードを,それぞれ指定する.生成した擬似乱数を保存するための SASデータセット名は,オプショ ン OUTUNIFORM= で記述する. . 3より,クレイトンコピュラに従う様似乱数が生成されれば,あとは DATAステップでの生 プログラム 4 成と同様に,得られた擬似乱数 ( Ut .U 2 )を用いて ( S i l ( u ), SE¥U2))と変換することにより,同時分布関数 ( 4 . 3 )に l 従うデータを算出すればよい.なお, 2つの生存時聞を表す確率変数 Tと Eの依存構造として.正規コピュ ラ,スチューデント tコピュラ,ガンベルコピュラ,フランクコピュラを考えるのであれば,プログラム 4. 3 において, DEFINEステートメントの CLAYTONの代わりに各コピュラを表すキーワード及びパラメータを 指定する.ただし,正規コピュラ,スチューデント tコピュラにおいては,分散共分散行列の各成分をもっ SASデータセットを予め用意した上で, DEFINEステートメントのオプション CORR=(こて指定する必要があ . 8としたときの正規コピュラに従う擬似乱数を生成するための SAS る.プログラム 4.4に,ケンドールの rを 0 プログラムを示した. 2変量正規コピュラにおいて,ケンドールの fと相関係数 pとには ‑ 6 5 0・

661.

r=( 2! J r ) a r c s i n ρ ( 4 . 1 1) との関係が成り立つことを用い, DATAステップで対応する分散共分散行列を用意した上で, COPULAプロ シジャにより擬似乱数を生成している. プログラム 4. 4 COPULAプロシジャを用いた正規コピュラの擬似乱数生成 d a t ac o r r ; . ; l e n g t hU1U2r h op i8 . ;f o r m a tU1U2r h op ibest keepU1U2; p i = c o n s t a n t ( ' p i ' ) ;r h o = s i n ( 0 . 8 * p i / 2 ) ; U1= 1 ; U 2 = r h o ; o u t p u t ; U1=rho;U2=1;o u t p u t ; Hu n H r p r o cc o p u l a ; v a rU1・U2; d e f i n eCOPNORMAL(cor=corr); s i m u l a t eCOP/ndraws=1000seed=0724o u t u n i f o r m = u n i f d a t a ; r u n ; 5 . おわりに 本稿では, SASを用いてコピュラに従う乱数を生成させる方法について紹介した コピュラを取り扱うプ ロシジャとして, SASV e r . 9 . 3より SAS/ETSに COPULAプロシジャが搭載され,計 5種類のコピュラに従う 乱数を簡単に生成させることができる また,当該プロシジャを使用できない環境下で乱数を生成させる方 法として, DATAステップを用いたマクロプログラムを示した COPULAプロシジャでは,解析対象となるデータにコピュラをあてはめたときのパラメータを推定するこ x p e r i m e n t a lの扱いであるが,完全にサポートされれば更に利用価値が高まる とも可能である.現段階では E ものと期待される コピュラを用いたシミュレーション実験あるいはデータ解析を行う際に,本稿がその一 助になれば望外の喜びである 参考文献 [ 1 ] 岩崎学 ( 2 0 0 5 ) . 統計的データ解析のための数値計算法入門.朝倉書庖. [ 2 ] 魚住龍史,浜田知久馬 ( 2 0 1 3 ) .RAND関数による擬似乱数の生成 .SASユーザー総会論文集 2 0 1 3, 3 2 5・3 3 3 . [ 3 ]C 1 a y t o n, D .G .( 1 9 7 8 ) .Amodelf o ra s s o c i a t i o ni nb i v a r i a t el i f et a b l e sa n di t sa p p l i c a t i o ni ne p i d e m i o l o g i c a ls t u d i e s o f f a m i l i a lt e n d e n c yi nc h r o n i cd i s e a s ei n c i d e n c e .B i o m e t r i k a6 5,1 4 1 ‑ 1 5 1 [ 4 ]F r a 此 ,M . J .( 19 7 9 ) .Ont h es i m u l t a n e o u sa s s o c i a t i v i t yo fF ( x, y )a n dx + y ‑ F ( x, y ) .A e q u a t i o n e sM a t h e m a t i c a e1 9, ‑651‑

662.

1 94‑ 2 2 6 . [ 5 ]Hougaard, P .( 1 9 8 6 ) .Ac l a s so fm u 1 t i v a r i a t ef a i 1 u r et i m ed i s t r i b u t i o n s .B i o m e t r i k a73, 6 7 1 ‑ 6 7 8 . R . B .( 2 0 0 6 ) .AnI n t r o d u c t i o nt oC o p u 1 a s .NewY o r k :S p r i n g e r . [ 6 ]Ne1son, 2 0 1 2 ).r接合分布関数(コピュラ)の理論と応用」目北川源四郎,竹村彰通(編). 2 1世紀の統計科 [ 7 ] 塚原英敦 ( lI I I > 数理・計算の統計科学.東京大学出版会増補 HP版. 学 <Vo. h t t p : / / p a r k . i t c . u ‑ t o k y o. a c . jp l a t s t a t l js s75s h u n e nIV o1 3 .p d f ( 最終閲覧日 2014年 6月 l日 ) . [ 8 ] 戸坂凡展,吉羽要直 ( 2 0 0 5 ). f コピュラの金融実務での具体的な活用方法の解説 J . 日本銀行金融研究所. h t t p・ Ilwww i .m e s . b 句. o r . j p / j a p a n e s e ! k i n 戸 . J ! 2005! k k 24 ‑ b 2 ‑3 .p d f (最終閲覧日 2014年 6月 1日 ) . [ 9 ]M a r s h a l l, A .W.and0 l k i n, I .( 1 9 8 8 ) .F a m i l i e sofM u 1 t i v a r i a t eD i s t r i b u t i o n s .J o u r n a 1o ft h eAmericanS t a t i s t i c a 1 A s s o c i a t i o n8 3,8 34‑ 8 4 1 . ,NC:SASI n s t i t u t eI n c . [ 1 0 ]SASI n s t i t u t eI n c .( 2 0 1 1 ) .SAS/ETS9 . 3U s e r ' sG u i d e .TheCOPULAProcedure.C a ηr [ 1 1 ]Ying, G .andYuan, Y .( 2 0 0 9 ) .B a y e s i a nd o s ef i n d i n gbyj o i n t l ymodelingt o x i c i t yande f f i c a c ya st i m e ‑ t o ‑ e v e n t 7 1 9 ‑ 7 3 6 . o u t c o m e s .Jouma1o f t h eRoya1S t a t i s t i c a 1S o c i e t y5 8, , M., K a i d e r , A ., Wakounig, S .andH e i n z e, G . .( 2 0 1 3 ) .E s t i m a t i n gt h ec o r r e 1 a t i o no f b i v a r i a t ef a i 1 u r et i m e s [ 1 2 ]Schemper 4 7 8 1・4 7 9 0 . u n d e rc e n s o r i n g .S t a t i s t i c si nMedicine32, [ 1 3 ] 四辻哲章 ( 2 0 1 0 ) . 計算機シミュレーションのための確率分布乱数生成法.プレアデス出版ー [ 1 4 ]Weron, R .( 1 9 9 6 ) .Ont h eChambers‑Mallows‑Stuckmethodf o rs i m u 1 a t i n gskeweds t a b 1 erandomv a r i a b 1 e s . S t a t i s t i c sandP r o b a b i 1 i t yL e t t e r s28, 1 6 5 ‑ 1 7 1 . [ 1 5 ]C l i z e k, P ., H a r d 1 e, W . K .andWeron, R .( 2 0 0 5 ) .S t a t i s t i c a 1T o o 1 sf o rF i n a n c eandI n s u r a n c e .S p r i n g e r . [ 1 6 ]SASCUSTOMERSUPPORT/TECHNICALSUPPORT. 多次元正規分布に従う乱数列を生成する方法. h t t p : / / w w w . s a s . c o m l o f f i c e s / a s i a p a c i f i c / j a p a n l s e r v i c e / t e c h n i c a 1 / f a q / 1 i s t l b o d y / s t a t 0 3 4 . h t m 1 (最終閲覧日: 2013年 1 0 月1 9日 ) . 連絡先 E ‑ m a i 1 :s ヴa da@acronet . j p ‑652‑

663.

付録 A DATAス テ ッ プ に よ る コ ピ ュ ラ の 乱 数 生 成 プ ロ グ ラ ム /ホクレイトンコピュラに従う乱数生成マクロ d i m . . . . . .…….コピュラの次元 t h e t a . . . .… ・ コピュラのパラメータ s e e d . . . . . . . . . . . . .シード ndraws… ・ .生成したい乱数の個数 o u t u n i f o r m ..…出力用データセット*/ %macromclaycop(dim , t h e t a, s e e d, ndraws, o u t u n i f o r m ) ; d a t a& o u t u n i f o r m . ;k e e pm̲u:SimNo; 仕 切m i n i t (& s e e d . ) ; a r r a yc o l { & d i m . } ;a r r a ym̲u{&dim.};c a l ls doS imN o=1t o& n d r a w s . ; m̲ rl=rand('gamma', l I & t h e t a . ); domj=lt odim(m̲u); n d ( ' u n i f o r m ' ); col{mj}司 a m̲u{mj}=( 1‑ l o g ( c o l{mj}) / m ̲ rl )柿 ( ( ーl ) / & t h e t a . ) ; e n d ; o u t p u t ; e n d ; r u n ; %mendm c l a y c o p ; 作フランクコピュラに従う乱数生成マクロ d i m . . . . . . . . . . . . .コピュラの次元 t h e t a . . . .… . . . ・ ・‑コピュラのパラメータ H s e e d . . . . . . . . . . . .シード n d r a w s . . .・田…田…生成したい説数の個数 o u t u n i f o r m . . ...出力用データセット*/ %macromfrankcop(dim , t h e t a , s e e d , ndraws, o u t u n i f o r m ) ; d a t a& o u t u n i f o r m . ;k e e pm ̲ u : ; a 汀a ycol{&dim.};a 町a ym̲u{ & d i m . } ;c a l ls t r e a m i n i t (& s e e d . ) ; doS imN o=lt o& n d r a w s . : ms u 寸 a n d ( ' u n i f o r m ' ); v = r a n d ( ' e x p o n e n t i a l ' ); m̲ s m̲ rl=int((‑l)*m̲sv/(log( 1 ・( e x p ( ( ーl ) * & t h e t a . ) ) * * m ̲ s u ) ) ) +1 ; domj=lt od i m ( m ̲ u ) ; c o l{m j}= r a n d ( ' u n i f o r m ' ) ; 四 653‑

664.

m̲u{mj}ニ ( l o g (1 +e x p ( l o g ( c o l { m j } ) / m ̲ r1γ(exp((‑1け&theta.)ー1)))*((‑I)/&theta.); e n d ; o u t p u t ; e n d ; n m %mendm 企a n k c o p ; 1 *ガンベルコピュラに従う乱数生成マクロ d i m . . . . . .…….コピュラの次元 t h e t a .… . . . . ・ ・....コピュラのパラメータ H s e e d . . . . . . . . . ...シード n d r a w s . . . . . . . .・・‑生成したい乱数の個数 M ouωnifonn ・…出力用データセット * 1 %macromgumbelcop(dim , t h e t a, s e e d, n d r a w s, o u t u n i f o n n ) ; d a t a& o u t u n i f o n n . ;k e e pm ̲ u : ; a r r a yc o l { & d i m . } ;a r r a ym̲u{&dim.}; c a l ls t r e a m i n i t ( & s e e d . ) ; doS imN o=lt o& n d r a w s . ; l e n g t hm̲xum̲vp im̲xm̲sm̲bm̲ r18 . ;f o n n a tm̲xum̲vp im̲xm̲sm̲bm̲ rlbest . ; p i = c o n s t a n t ( ' p i ' ) ; o s( Pi / ( ア& t h e t a . ) ) ) * * & t h e t a . ;m̲alpha = r ound( l/ & t h e t a ., l e ‑ 1 2 ) ;m̲beta= 1 ; m̲gamma=(c 八= 1t h e nd o ; i f m̲alpha m̲xu = r a n d ( ' u n i f o n n γ p i ‑ p i / 2 ; l ' ) ; m̲ v= r a n d ( ' e x p o n e n t i a m̲b= a t a n ( m ̲ b e t a * t a n ( p i * m ̲ a l p ha/2 ) ) ; ( I+ ( m ̲ b e t a場' t a n ( p i*m ̲a l p h a / 2 ) )料 2 )料 ( 1/ ( 2ホm ̲ a l p h a ) ) ; m̲s= mxm ̲ s * ( s i n ( malpha*m̲xu+m ̲b ) / ( c o s ( m ̲ x u )仲 ( 11m ̲a l p h a ) ) ) 二 ← b ) / m ̲v ) * * ( ( I ‑ m ̲ a l p h a ) / m ̲a l p h a )) ; ホ (( c o s ( m ̲xu‑m ̲alpha*m ̲xu‑m̲ m̲ r l= r ound(m ̲gamma*m ̲x, 1 e ‑ 1 2 ) ; e n d ; e l s ei f m ̲ a l p h a = lt h e nd o ; m̲xu = r a n d ( ' u n i f o n n γ p i ‑ p i / 2 ; m v= r 阻d ( ' e x p o n e n t i al ' ) ; m̲x= ( 2 / p i ) * (( pi / 2 + m ̲ b e t a * m ̲ x u )本 t a n ( m ̲xu)‑m ̲ b e t a事 l o g ( ( ( p ν 2 )キm v 匂o s(m ̲x u ) ) / ( p i / 2 + m ̲beta*m ̲x u ) ) ) ; e t a*m ̲gamma本 l o g ( m ̲gamma), l e ‑ 1 2 ) ; m̲rl=round(m̲gamma*m̲x+(2/pi)ホm̲b e n d ; ‑ 6 5 4 ‑

665.
[beta]
domj=lt
od
i
m
(
m
̲
u
)
;
c
o
l
{
m
j
}
=
r
a
n
d
(
'
u
n
i
f
o
r
m
'
);
m̲u{mj}=exp(ー
(1
)
ペ
ーl
o
g
(
c
o
l{m
j})
/
m
̲
rl)**(
1/
&
t
h
e
t
a
.
))
;
e
n
d
o
u
t
p
u
t
;
e
n
d
;
r
u
n
;
%mendmgumbelcop;

/*正規コピュラに従う乱数生成マクロ

dim

….コピュラの次元

c
or....ーー…・…相関行亨I
j
(
S
A
Sデータセット名)変数名は c
olXでないとエラーになる‑
s
e
e
d
.
.
.
.一

一シド

n
d
r
a
w
s
.
.
.
.
.

生成したい乱数の個数

o
u
t
u
n
i
f
o
r
m…出力用データセット*/
%macromnormcop(dim,
c
o
r
,
s
e
e
d,
n
d
r
a
w
s,
ou
同n
i
f
o
r
m
)
;
d
a
t
am w
r
k
;
c
a
l
ls
t
r
e
a
m
i
n
i
t
(
&
s
e
e
d
.
)
;
汀a
yc
o
l{
&
d
i
m
.
}
;
̲TYPE ="SCORE";̲MODEL̲="col";mean=l;a

n
d
(
"
N
O
R
M
A
L
"
)
;
e
n
d
;
o
u
t
p
u
t
;
e
n
d
;
d
onum=lt
o&
n
d
r
a
w
s
.
;
d
oi
=
lt
od
i
m
(
c
o
l
)
;
c
o
l
{
i
}寸 a
d
r
o
pi
;
n
m

d
a
t
am̲cov;
s
e
t&co
.
r;
l
e
n
g
t
hmean8
.
;
f
o
r
m
a
tmeanb
e
st
.;
m
e
a
n
=
O
;
r
ow=
̲n
̲
;
r
u
n
;
o
d
sl
i
s
t
i
n
gc
1o
s
e
;
o
d
so
u
t
p
u
tCHOLG=m̲cholesky;
p
r
o
cmixeddata=m
̲c
o
v
;

c
1a
s
srowm
e
a
n
;parms/
n
o
i
t
e
r
;
m
o
d
e
lmean=;randomrow*mean/type=UNgdata=m
̲c
o
vGC;
n
m

o
d
sl
i
s
t
i
n
g
;
p
r
o
cs
c
o
r
ed
a
t
a
=
m
̲
c
h
o
l
e
s
k
yscore=m̲wrkout=m̲mnorm(keep=coln
u
m
)
;byn
u
m
;
v
a
rmeanc
o
l
:
;r
u
n
;
p
r
o
ct
r
a
n
s
p
o
s
edata=m
̲mnormOUT=m
̲mnorm(DROP=
̲NAME̲
)
;
b
yn
u
m
;
r
u
n
;
d
a
t
a&
o
u
t
u
n
i
f
o
r
m
.
;
s
e
tm̲mnorm;
aπaycol{&dim.};aηaym̲u{&dim.};
doi
=
lt
o&
d
i
m
.
;
d
oi
=
lt
od
i
m
(
m
̲
u
)
;
m
̲
u
{
i
}ニ CDF('NORMAL',
c
o
l{
i
})
;
e
n
d
;
e
n
d
;
d
r
o
pic
o
l
:
;
r
u
n
;

‑
6
5
5
‑

666.
[beta]
p
r
o
cd
a
t
耳s
e
t
sl
i
b
r
a
r
y
=
worknowamn
o
l
i
s
tn
o
d
e
t
a
i
l
s
;d
e
l
e
t
em̲wrkm̲c
h
o
l
e
s
k
ym̲covm̲mnorm;r
u
n
;q
u
i
t
;
%mendmnormcop;

/
*tコピュラに従う乱数生成マクロ
d
i
m
.
.
.
.ーー…….コピュラの次元
j
(
S
A
Sデータセット名)変数名は c
olXでないとエラーになる.
c
o
r
.
.
.
.
.
.
.
.
.
.・・‑相関行夢I
H

d
f
.
.…
…
.
.
.
・ ・
‑
…tコピュラの自由度
H

s
e
e
d
.
.
.
.
.
.
.
.
.
.
.
.
.
. シード
n
d
r
a
w
s
.…
.
.
.
・ ・‑生成したい乱数の個数
H

o
u
t
u
n
i
f
o
r
m
.
. 出力用データセット*/
%macrom
t
c
o
p
(dim
,
c
o
r
,
df
,
s
e
e
d,
n
d
r
a
w
s,
o
u
t
u
n
i
f
o
r
m
)
;
d
a
t
am w
r
k
;
c
a
l
ls
t
r
e
a
m
i
n
i
t
(&
s
e
e
d
.
)
;
汀a
yc
o
l{
&
d
i
m
.}
;
TYPE="SCORE"; MODEL=
"
c
o
l
"
;mean=l;a

=
r
a
n
d
(
"
N
O
R
M
A
L
"
)
;
e
n
d
;
o
u
t
p
u
t
;
e
n
d
;
donum=lt
o&
n
d
r
a
w
s
.
;
d
oi
=
lt
od
i
m
(
c
o
l
)
;
ω
1{
i}
d
r
o
pi
;
r
u
n
;

.
r;
l
e
n
g
t
hmean8
.
;
f
o
ロn
a
tmeanb
e
st
.;
m
e
a
n
=
O
;
r
o
w=n ;
r
u
n
;
d
a
t
am̲cov;
s
e
t&co
o
d
sl
i
s
t
i
n
gc
l
o
s
e
;o
d
so
u
t
p
u
tCHOLG=m
̲c
h
o
l
e
s
k
y
;
ニi
ll̲COV;
p
r
o
cmixedd
a
t
a

c
l
a
s
srowmean;parms/
n
o
i
t
e
r
;
m
o
d
e
lmean=;randomr
o
w
*
m
e
a
n
l
t
y
p
e UNgdata=m̲covGC;
二

r
u
n
;o
d
sl
i
s
t
i
n
g
;

=m
̲choleskyscore=m
̲wrko
u
t
咽
p
r
o
cs
c
o
r
ed
a
t
a

mnorm(keep=coln
u
m
)
;bynum;varmeanc
o
l
:
;r
u
n
;

s
p
o
s
edata=m
̲mnormOUT=m
̲mnorm(DROP=
̲NAME
̲)向 num;run;
p
r
o
c回 n
d
a
t
am̲wrk;
d
onum=lt
o&
n
d
r
a
w
s
.
;
o
u
t
p
u
t
;
e
n
d
;
r
u
n
;

.
;c
a
l
ls
t
r
e
a
m
i
n
i
t
(
&
s
e
e
d
九1Um
);m
̲s
=
r
a
n
d
(
'
c
h
i
s
q
u
a
r
e
',
&df)
;
r
u
n
;
d
a
t
am
̲
w
r
k
;
s
e
tm
̲
w
r
k
;
l
e
n
g
t
hm̲s8
.
;
f
o
r
m
a
tm̲sb
e
st
d
a
t
a&
o
u
t
u
n
i
f
o
r
m
.
;
mergem̲mnormm̲w
r
k
;
b
ynum;
汀a
ym̲u{&dim.};
a
r
r
a
yc
o
l
{
&
d
i
m
.
};a

'
,c
o
l
{
iけs
q
口(
&df
.
l
m̲s
,
)&
d
f
.)
;
e
n
d
;
e
n
d
;
doi
=
lt
o&
d
i
m
.
;
d
oi
=
lt
odim(m̲u);m̲u{i}=CDF('T

d
r
o
pic
o
l
:
;
r
u
n
;
p
r
o
cd
a
t
a
s
e
t
sl
i
b
r
a
r
y
=
worknowamn
o
l
i
s
tn
o
d
e
t
a
i
l
s
;d
e
l
e
t
em̲wrkm̲c
h
o
l
e
s
k
ym̲covm一r
n
n
o
r
m
;r
u
n
;q
u
i
t
;
%mendm
t
c
o
p
;

‑
6
5
6
‑

667.

EXCELで数独解答プロセスをリアルタイムで可視化する SASプログラム SASSudokuProgramt oV i s u a l i z ei t sS o l v i n gP r o c e s si nR e a lTimeUsingEXCEL 森岡 裕(ナイフィックス株式会社) FuadJ .F o t y( U . S .CensusB u r e a u ) 知 平 菜 美 子 ( 株 式 会 社 NSD金融事業本部) 周防節雄(兵庫県立大学・名誉教授) 要旨 2 0 1 1年に SASユーザー総会で、発表された「数独ノ fズ、/レを解く SASプログラム J(知平・周防2 0 1 1、周防・ 0 1 1 )で用いられた高度なデータハンドリング技法に森岡は影響を受け、その 2年後、森岡は SASユ 知平2 ーザー総会で、セルオートマトンというマス目状モデルを用いて行うシミュレーションを SASの環境で 行い、その結果を逐次EXCEL 画面上に表示することによって、リアルタイムで視覚的に理解できる技法 0 1 3 )を発表した。その論文発表後に、周防が森岡に、両者のプログラムを一つにし に関する論文(森岡 2 て、数独解法プログラムの解答フ。ロセスを EXCEL 画面上にリアルタイムで可視化したら、一層興味深 いSASプログラムになるのではなし、かと提案し、今回の共同研究が実現した。以前は解答プロセスを分 析するには、プログラム実行中に EXCELファイルに逐次保存しておいた途中結果を解答終了後に別途 解析することで、可能で、あったが、今回開発した可視化数独解法プログラム ( V i s u a l i z e d,SmartandS l i m SudokuS o l v i n gS y s t e m :略称はV i s u a lS 5 )には、プログラム実行中に数独を解いている様子が EXCEL画 面上に逐次表示される機能を追加した。空白のマス目に数字を埋めていくための補助情報が逐次更新さ れる一方で、マス自に数字が次々と埋められてし、く様子を、 SASのアウトプット画面や結果ビュー画面 ではなくて、カラフルな EXCEL 画面上で目の当たりにするのは壮観である。数独の解法アルゴ、リズム 画面上に可視化する技法と、データハン の解説は先行論文に譲り、本論文では、解答プロセスを EXCEL ドリングにおける SASの様々テクニックの紹介に重点をおいてVS5を紹介する。 1.序論 1 .1はじめに 2 0 1 3年の SASユーザー総会で、森岡はセルオートマトンというマス目状モデ、ルを用いて行うシミュ レーションを SASで行い、その結果を逐次 EXCEL画面上に表示することによって、リアルタイムで 0 1 3 )を発表した。この論文は、その 2年前に周防と知平 視覚的に理解できる技法に関する論文(森岡 2 ‑ 6 5 7‑

668.

が発表した「数独パズルを解く S ASプログラム J(知平・周防 2 0 1 1、周防・知平 2 0 1 1 )に出会ったのがき ASで解いているのを見て、セル状空間と SASデータセットという っかけで、マス目状のパズルを S 着想を得て、執筆したもので、あった。 昨年の森岡論文(森岡 2 0 1 3 )の発表後、数独プログラムの作成者の一人である周防が、数独解法 SAS プログラムに対して、 EXCEL画面上にリアルタイムで途中経過を可視化する機能の追加を提案し、共 同研究が始まった。 周防・知平の数独 S ASプログラム ( S u d o k uS o l v i n gS y s t e m:略称は SSS、「トリプル S J)は再帰的プ ログラミングを用い、高度なマクロを数多く組み合わせた複雑な構造であり、数独を解く途中経過は解 答処理の終了後、途中経過を保存した EXCELファイルを辿って解析するしか確認する術がなかった。 そのファイルの解析は S ASのパワーユーザーで、なければかなり困難であり、周防はその解法プロセス をもっと簡単に見えるようにしたいと常々考えていた。 一方、周防は 2 0 1 2年米国フロリダで開催された SASG l o b a lForum2 0 1 2で数独論文を招待論文と して発表し ( S u o h2 0 1 2 )、SASプログラム ( W i n d o w s版)の日本語版だけでなく英語版もネット上に一般 o t y(米国センサス局所属)は、その 3ヶ月後、マクロの 公開した。その時フロアで発表を聞いていた F 数を大幅に少なくして周防・知平のプログラムのスリム化、高速化を図ったプログラム ( L i n u x版 S A S ) を屑防に突然送ってきた。周防・知平の S ASプログラムはマクロが大変複雑で、その上再帰的手法を使 っているため、第三者がそれを解読して更に改良することは全く予想していなかったので周防は一瞬途 惑ったが、反面、その S ASプログラミングの力量に驚き、大いに感激した。周防と F o t yはこのニュー ノくージョンを S m a r ta n dS l i mS u d o k u ‑ S o l v i n gS y s t e m(:略称 S 5r Q u a d r u p l eS J と発音する)と命名 して S ASGlo b a lF o r u m 2 0 1 3に投稿する予定で、あったが、双方が多忙なため延期となり現在に至って し 、 る 。 その聞に、森岡のセルオートマトンを使った可視化機能追加の構想、が持ち上がった。森岡は、その時 5を W i n d o w s版に変換した後、数独解答処理中の途中結果の SASデータ 点の最新の数独プログラム S セットを逐次 EXCE画面上に表示させる機能を追加した S ASプログラムを完成した。このプログラム を本論文で解説する。今回パージョンアップしたシステムは、視覚化する部分を追加したので V i s u a l i z e d, S m a r ta n dS l i mS u d o k u ‑ S o l v i n gS y s t e m(略称 V i s u a lS 5 )と命名したが、 F o t yの S 5の数独 解法アルゴ、リズム自体には手を一切加えていない。今回の可視化作業に先立ち、森岡も S ASマクロの 更なる最適化が出来なし、かと検討してみたが、これ以上のコードの効率化は不可能な位複雑で、完成度 が高いことが判明し、解法アルゴリズム自体のこれ以上の改良は行えなかった。 本論文では、解答プロセスを可視化するために追加したプログラムの技術的な部分を説明することに 絞った。数独プログラムの開発・改良過程や解法アルゴ、リズムについては参考文献にあげる論文を年代 煩に読んでいただきたい。 1 2 .V i s u a lS 5で使用されている技法 2 .1L I B N A M EE X C E Lと E X C E L周辺知識について V i s u a lS 5について説明する前に、 EXCELファイルとの入出力処理に利用している LIBNAME EXCEL(EXCELファイルへのライブラリ参照)や、その他、いくつかの細かな技法について解説する。 ‑ 6 5 8 ‑

669.
[beta]
2
.1
.1セル範囲の名前の定義
EXCELには任意のセル範囲に名前を定義する機能がある。
R
6
:
C
2
J に表示する場合
例えば図 1の左図において、中央の 9個の数字を SUM関数で合計してセル i
=SUM(R2C2:R4C4)Jである。
の関数式は i
図 1の中央図)から参照範囲として iR2C2:R4C4J を選択後、
しかし、「数式タブ」→「名前の定義 J(
例えば「集計エリア Jというテキスト(図 1の右図)を入力して iOKJ すれば、セル範囲 iR2C2:R4C4J

I

邑J
帽附置圃圃圃圃圃圃圃圃・回!園

前園 h
v
名監靴工

昨}訟附

察メ威

河期 一明 側
酌樹
J

一
%
︑
/
山
川

立制罰的批

欄品側関

図1

4
4
F
/い
て
い Y画商

に名前が定義される。

種
1
1
:
工J
l
'
j
)•.

巴ι
一 一 一̲ ̲
1
劉

セル範囲の名前定義

百
口
一
一

その結果、関数式 i
=SUM(R2C2:R4C4)Jの代わりに、

i=SUM(
集計エリア)J(
図 2)に置き換えて記述することが
できるようになる。つまり、セルの「名前の定義」とは、直
接セル番地を指定せずに処理を可能とする機能である。

2
.1
.2 LIBNAMEEXCEL
品 目 丈 で EXCELファイルのフルパスを指定することによって、
LIBN

司 君 田 司 百1

EXCEL ファイルがライブラリになり、シートまたは名前の定義が SAS

自

データセットとして認識される。

定義すると、普通のシートの場合はシート名の末尾に事マークのついた

自
町

ドライブのルートに保存されている場合、 LIBN
泊四丈で以下のように

自
問

.x
l
s
xという名前で C
例えば、図 1で例示した EXCELシートが Book1

SASデータセット、名前を定義した範囲はそのままの名前で SASデータ
図3 ライブラリ EX

セットとして認識される(図 3)。

I
i
b
n
a
m
eE
X"
c半・Bookl.xlsx"header=noscantext=no;
図 3の SASデータセット「集計エリア」をダブルクリックすると、 3行 X3列の EXCEL表の名前の
定義が 3変数 3オブザベーションとなっていることが分かる(図 4)。

h
e
a
d
e
r
=
n
o
J オプションは 1行目を変数名とするかど
コード中の i

F2・・・と連番号で自
うかのオプションで、 noにすると変数名は Fl,
動的に付与される。
データセットの内容と EXCELファイルのセル範囲は同期してい
るので、どちらか一方の中身が変更されると、それがもう一方に反映

図4 SASデータセット
「集計エリア」

される仕組みになっている。
まず初めに、 SAS プログラムで EXCEL表の内容を変更する場合を取り上げる。そのためには

MODIFY文を使用する(プログラム 1)。ただし、既に存在する EXCELシートや名前の範囲の内容を SAS

‑
6
5
9
‑

670.

から更新する場合は、 LIBN 油 価 文 の 実 行 時 に│scantext= 干 1 0 │ オプ ションを指定しておく必要がある。続いて、①及び②の箇所のよう に、名前の定義をデータセットとして指定する際には、シングルコ ーテーションで囲み、 n を末尾に付して記述する必要がある。また、 名前の定義ではなく、シ d a t aE X .'集計エリア, n ;← ① m o d i f yE X . '集計エリア, n ;← ② 円= Fh2; ← ③ F 2 = F 2 + 1; F 3 = O ; r u n, トを対象とする場合であれば、①の部分 プログラム 1: M o d i f y文による EXCEL表の加工・出力 X . 'Sheet1 $ 'n;│のようにシート名の末尾に事を付す。② は│data E は、①の記述の dataを modifyに変えるだけでよい。③以降の記述は 普通の SASプログラミングの記述である。 実行後に名前の定義「集 計エリア」を SASと EXCEL の環境で見ると、それぞれ図 5、図 6のようになっている。 次に、 SAS データセット 1 4 図 6 EXCEL表 図5 SASデータセット DS1 ( 図 7)を加工して EXCELの'集計エリアに出力する場合を考える。 プログラム 2に示す様に、① modify 文の聞に挿入する 4 ことで実現できる。 3 LIBNAMEEXCELの使用 d a t aE X ..集計エリア.n ; s e tD S l; ← m o d i f vE X ..集計エリア.n ; F l = X ; F 2 = Y ; F 3 = Z ; m の SET 文 を data 文と SASデータセット DS1 上の注意点としては、使用する SASのパージョンと EXCELのパ ージョンの組み合わせ、またはその他の実行環境の違いによって実 ログラム 2 : M o d i f y文による SASデータ セットの加工と EXCEL出力 行時の動作が一貫しないことがある。また、対象とする EXCELファイルが閉じている状態と聞いてい る状態において、実行時に明らかな動作の差が存在する。現時点で確認できている注意点として重要と 思われるものを以下に列挙する。 1 ) 単一のセルに名前を定義した場合、 EXCEL ファイルを閉じている状態ではデータセットとして認 識されるが、聞いた状態では認識されない 2 ) 名前で定義されたセル範囲の値をリセットする場合の動作の違い(詳細は次節で説明) 2 .1 .3 EXCEL VBAの利用 名前の定義で指定されたセル範囲の値をリセット、つまり全て n u l l値にしたい場合は、対象の EXCELファイルが閉じていれば bnameEXcI ear;│を実行 プログラム 3を実行する。実行後、更に│Ii bname すればライブラリ指定の解除ができる。 EXCELを閉じて Ii 文を使用する場合は、解除せずに開こうとするとエラーが発生す るので注意が必要である。 EXCEL ファイルを開くと、セルは全 て空になっている(図 8) が、名前の定義「集計エリア」は依然と して存在している。 一方、 EXCELファイルを開いた状態で同じプログラム 3を実行 した場合、セル範囲の値がリセットされるところまでは同じであ ‑ 6 6 0 ‑ proc datasets Iib=EX n o li s t ; del e t e '集計エリア, n ; r u n ; quit; プログラム 3 : 名前の定義で指定の 1) セル範囲の値リセット (

671.
[beta]
るが、さらに名前の定義が EXCELファイルから消失する。実行す

d
a
t
aE
X
.'集計エリア, n
;
;
m
o
d
i
f
yE
X
.'集計エリア, n
c
a
l
lm
i
s
s
i
n
g(
o
fF
:
)
;
r
u
n
;

る度に消えた名前の定義を再度設定するのは面倒なので、 EXCELフ
ァイルを開いた状態で名前の範囲を削除させずに値をリセットした
い場合には、プログラム 4のように、指定した引数を文字型・数値型

プログラム4:
名前の定義で指定の
セル範囲の値リセット (
2
)

を問わずに欠損値に変えることが出来る c
a
l
lm
i
s
s
i
n
gルーチンを使
用する。
引数の指定を

r
o
fF
:Jとすることで r
F
J で始まる変数名が全て対象となり、文字型、数値型を問わ

ずに n
u
l
lとなる。
しかし、指定しているセル範囲が大きい場合、{直をクリアするた、けの単純な処理で、あっても実行時聞
がかなりかかってしまう場合がある。このように S
ASと EXCEL間での処理をプログラミングしてい
ると、原因不明の誤動作や、公式の説明にはない仕様の発見により、プログラミングに支障を来すこと
もある。こうした場合の有力な解決法のーっとして、 EXCELファイル側に EXCELVBAで行いたい処
理を実行するプログラムをあらかじめ作っておき、 S
ASの方から必要な場面で呼び出し・実行をする方
法がある。

EXCELVBAは EXCELを操作することに特化したプログラム言語なので、 EXCEL上の処理に関し
ては最も柔軟で細かな機能と高速性を有している。
例えば、セルの指定範囲「集計エリア」を全て空白化したいのであれば、 EXCELの「開発」タブか
ら r
V
i
s
u
a
lB
a
s
i
c
J を立ち上げ、

標準モジュールに以下の E
X
C
E
LVBAプログラム 1を記述する。

,
, ;,A f'!1I¥'fIIIl!IIIiiII911

t1"i
;
.
.M..'UJMitII:
Et
4,
‑
=
t
i
m

l
i
.
4

S
u
bcl
e
a
r0
l 4 フ?イ)1‑(
θ 織調印喰示(lI) 書
草刈p緩唱陸軍需ω
{ ヂtjl!l'l1(ω 震f
守
宅E
詰 ツ吋
i
E
M13
R
a
n
g
e("集計エリア "
)
.
C
l
e
a
r
C
o
n
t
e
n
t
s
i
l!a編・凶兵;... t!.企~ 劫 や . U l
謁
¥
t
ll塁言笠宮家主張物
E
n
dS
u
b
xl(General)
哲 明 書 摂

書

砦

I

ェ] ~

E
X
C
E
LVBAプログラム 1:

S
u
b cIe
a
r(
)
Range 集 計 エ リ ア " ).ClearContents
End Sub

セルの指定範囲「集計エリア』を全て空白化
フ7イ)~名{目)

この EXCELファイルを保存する際に拡張

坦竺旦り竺m

附軒目(J)辰吉翌骨密翌五1干m)

フ7イJ

r
x1s
m
J にしておかないと作成した VBAプロ

図9V
i
s
u
a
lB
a
s
i
cの保存画面

保存されないので注意を要する(図 9)。

ASから実行するプログラム 5を解説する。
次に、この EXCELVBAを S
まずファイルの拡張子名が変わ
ったので①でライブラリ名を定義
し直しているが、拡張子が x
l
s
xの
場合と同様の記述でよい。②で

IibnameEX"
c昭 o
o
k1
.x叫 . h
e
a
d
e
r
=
n
os
c
a
n
t
e
x
t
=
n
o
;← ①
1

1

Ifie
n
a
m
ec
m
d
sd
d
e'
E
X
C
E
LI
S
Y
S
T
E
M
'; ← ②
1

d
a
t
an
u11
fi
1ec
m
d
s
;
p
u
t
'[
R
U
N(
可l
e
a
r勺]'←③

EXCELの DDE(
D
y
a
n
a
m
i
cD
a
t
aI
r~~;
E
x
c
h
a
n
g
e
)と し 、 う 仕 組 み に
プログラム 5
:
E
X
C
E
LVBAを S
A
Sから実行するプログラム
FILENAME文で c
m
d
s
<
何で、もよ
し、)というファイル名を割り当てる。 DDEは異なるアプリケーション間でやりとりするための仕組みで、
l
e
a
rというマクロを実行させることができる。これによって、名前の定義
③の PUT文で EXCELに c
を消さずに、しかも高速にセルのクリアができる。

ASでは面倒な、或いは時聞がかかる場合は、 EXCEL上の操作や処理を活用して EXCEL
このように S

‑
6
6
1
‑

672.
[beta]
VBAに任せるのも有効な手段である。
VBAで記述する際に、 │
S
u
bA
u
t
o
̲
O
p
e
n0│とすれば、 EXCELファイルを開いた際に自動で実行され
る VBAとなるので、初期設定などの決まった動作であればこの仕組みを利用すると便利である。
なお、 EXCELの「マクロの記録」機能を使えば、ユーザーが手動で行った操作を自動で VBAコード
に変換してくれるので、 VBAの知識がないユーザーでも簡単に利用することができる。

2
.1
.4 条件付き書式の設定
SASと EXCELを組み合わせてシステムを作る際に、 EXCEL
側の機能で、便利なものをいくつか紹介する。

0の上の図では二つの 3X3のセル範囲に数字が
例えば、図 1
入力されている。今、左右の表で数字が異なるセルがある場合、
図 10の下の図のように、右側の表の当該セルの文字が自動的に
赤い太字になるよう設定したいとする。
「ホーム Jタブ、→「条件付き書式J→「新しいルール」→「数式
を使用して、書式設定するセルを決定」を選び、右側のセル範囲

=
R
C
[
‑
4
]<
>
R
C
Jを設定し(図 1
1
)、条件に合致し
を選択して、式 f
0の下の図のような結果を得る。
た場合の書式を選択すると、図 1

i
s
u
a
lS
5では、数独問題の初期局面で空白だ、っ
この方法は、 V
たマス目に新たに見つかった数字を赤色に着色する場合に利用

図1
0 左右で異なる数字を
太字の赤色にする

されている。

j
い!I崎績揖択して{相、@

・匂ゆ値;基づいて守1\(舵}~を書持続
.指定自j~を宮む切切悼式i 綻

砂上位または下簡に入る1
閥均書持活定
砂平均却上就位下司閥均書鵡定
.ー章治j~また:It重割引~l3tt書定綻
砂

5
賦を使用して、書掲旋す柏崎決定

勉~畠ア7 亜宇

新
1
.
I
.
¥
}
い
}
I
o
I
W
事 j卜J
刷 J
瑚
師

醤J
トJ
ゆ管理ω

図1
1 Excelの操作薗面

2
.1
.5 EXCELの画面分割

LIBNAMEEXCELで連続して、複数のシートに値を出力する場合、 EXCELファイルにある複数の
isualS5では数独解答中
シートを同時に画面表示すれば、一画面で確認することができて便利で、ある。 V
3
.
1節参照)の変化の様子を同時に可視化するために使用されている。一
の途中の局面と、フィルタ (
つの EXCELファイルにある複数のシートを同時に画面表示できることは EXCELのユーザーなら常識
であるが、確認の意味で簡単に解説する。

‑
6
6
2
‑

673.

園 「表示 j タブ 製賓J I →「新しいウイ 0並べて表示(I) ンドウを開く」 • I0ヨ王者,~主 R 亡裳_;T(設1 。上下に並べて表示【虫) ( 図 1 2左)を 。重ねて表示(阜) 口 作 業 中 。) ‑ : J内のウインドウを整列する(叫 コI . JI 図1 2E x c e lで複数画面表示の操作手順 仁三ζ クリックした h : " '1 Z 図 1 2右)をチェックして OKすると、 2つのシートの場合なら、 後、「整列」で「左右に並べて表示 J( 2つのウインドウに表示される。 3は、同ーの EXCELファイル内にある I S h e et 1J 図1 と I S h e e t 2 J を画面分割で表示している。 3 2つの E x c e lシートを画面分割表示 図1 2 .1 .6 ク リ ッ プ ボ ー ド を 経 由 し た デ ー タ の 出 力 LIBNAMEEXCELを使って SASデータセットを EXCELファイルに出力する際の留意点の 1つが、 品1:EEXCELによる出力だとかな 処理時間である。データが数千行や、数百列以上になる場合、 LIBN り時聞がかかってしまう。このような大容量のデータを出力する場合の対処法のーっとしては、 LIBNAMEEXCELではなく、 OSのクリップボードを経由させれば、かなり実行時間の短縮を図るこ とができる。この方法について解説する。 クリップボードとは、文字や画像をコピーした際に、その情報を一時的にストックしておくために OS が利用出来るバッファー領域のことである。ベーストする際はそこからデータが取り出される。 TESTJ という名前のデータセットを作成し プログラム 6では I た後、その中身をクリップボードにコピーしている。 ①の FILENEME丈でクリップボード ( C L I P B R D )に 1 c l i p J とい IdataTEST; IX = 'いろは r u n, f il e n a m ec li pC L I P B R D ;← ① う任意の名前を付ける。 ②で出力先に 1 c l i p J、つまりクリップボードを指定して、③で 出力する変数名を指定している。 このプログラムを実行すると、クリップボードに「し、ろは J を d a t a n u11 f il ec li p ;← ② s e tT E S T ; p u tX ;← ③ コピーしたことになる。従って、 EXCELや WORDはもとより、 p a s t e J アプリケーションを問わず、右クリックから「貼り付け」や 1 を選択すると、「し、ろは」とし、う文字列が貼り付けられる。クリッ プボードのデータを EXCELで指定したセルに張り付ける VBAは、簡 単なコードで記述できる。 B2セルにペーストする例を EXCELVSAプロ (こ示す。 EXCELVBAを作成した後、 1 2 .1 .3 EXCELVBAの利 グラム 2 用」で解説した方法を使い、クリップボードにデータを格納した直後に、 2 .1 .3節)に倣って SASから EXCELVBAを実行すれば、 プログラム 5( データセットの内容が EXCEL画面に表示される。 ‑ 6 6 3 ‑ プログラム 6 ク小: Jプボードに出力する SASプログラム S u bp a s t e0 R a n g e ( " B 2 " ) . S e l e c t A c t i v e S h e e t . p a s t e E n dS u b EXCELVSAプログラム 2 : クリップボードの情報を EXCELのセルに 貼り付ける

674.

2.2 SASデ ー タ セ ッ ト の 世 代 管 理 機 能 今回我々は数独解法に再帰的プログラミング技法を使用した。 2 011年時点のパージョン(略称 SSS)で include文を使って更に同じプロ は、数独を解く際に中心的な役割を果たす SASプログラムの中で、 % グラムが実行されていた。 S 5以降のパージョンではそのプログラムがマクロ化されて、そのマクロの中 に同じマクロが組み込まれている。 SSSでは、超難問の解答には実に 1248回の再帰が発生した(知平・ 0 1 2 )。 周防 2011、Suoh2 こうした特性から処理対象のデータセットは、実行中に同じデータセット名で繰り返し上書き・更新 されてし、く。そのような場合、実行後にデータセットがどのように変化していったのかを確認できる仕 組みは必要である。なぜならば、もし解けない数独問題が出た場合には、どこまで解答が進み、どの時 点で解答作業が行き詰まったかを解明して、システムのパージョンアップをしなければならない。その ために、途中のデータセットをすべて保存するように設計されている。ただし、このデータセットがい つの時点のものであるかは、保存したフォルダの名前を頼りに追跡する必要があり、システム開発者で なければ解析は容易ではない。そこで、今回は数独の解法過程がリアルタイムで画面上に見える様に 進捗状況を EXCEL画面にその都度表示できるように機能追加を図った。 今回我々が採用した方式には、 SASデータセットの「世代管理機能」を利用した。この機能は応用度 が高く、非常に便利であるが、日本では知名度が著しく低いので、丁寧に解説する。 4のプログラムを実行する 図1 ,&&&.聞圃園園E I.. L Ti T. ,d a t aT E S T : と、制のテンポラリーデータセ X = 2 : ツト保存用のライブラリ参腕 ..L.̲ 1 l " ' ,.蹴倒.組配出品凪!I!重量:.:m且正温 II~zm 1 1 1 1 歯 1r 肌 k‑J X 止 │ 2 WORKにデータセット iTESTJ が作成される。 続いて、図 15のプログラムを d a t aT E S T : 実行すると、データセットは当然 X = X * X : 上書き・更新される。この時点で、 r u n ; 盟国盟盟盟盟盟 b ‑ ‑ Jx 41 最初に X二 2で、あった iTESTJ の 情報はどこにも残っていなし、。も しも残したい場合は、データセット名を変えてから実行するしかない。 では、このデータセット' iTESTJ を一度削除して、 図 16 のプログラムを実行 d a t aT E S T ( g e n m a x = 3 ) : EVIEWTABLE:Wo ‑ r k .園 X = 2 ; 上斗 121‑ r u n ; してみる。また同じように 図 16 第一世代 SASデータセット iTESTJ が作成される。 7のプログラムを実行する。 続いて、図 1 図1 7 第二世代 SASデータセット 今度も、 X=4であるデータセット iTESTJ が作成されるのは当然だが、その他に、 i T E S τ予 ' t0 0 1 J とい ‑ 6 6 4 ‑

675.

う名前のデータセットが自動的に作成されていて、中身をみると X=2となっている。この I T E 8 τ甲t 0 0 1 J が「世代データセット」である。 genmaxオプションにより更新前のデータセットが自動的に保存され ている様子が分かる。 7のプログラムを実行すると、 I T E 8 τ ' # 0 0 2 J が作成され、 X 更にもう一度、図 1 の値は 8 になる。 genmaxオプションでは保持する世代の最大数を指定すること 6 )、もしも 4回目の更新が行 ができる。この例では 3に設定しているので(図 1 われた場合は、一番古い世代のデータセットが削除され、常に最新の 3つの世代 ① ↑ ︽ n H 1U ﹁ nU H TI .'Tl AA' 品E eaeoHU JHUVE aL ιe Ln ; 4 ‑ n 8 )。 のデータセットが保持された状態になる(図 1 地些' J l J ヨ ン テ シy lifes{ 自 T e 計初日 1 1 図1 8 第三世代 SASデータセット 世代データセットはプログラム 7の①のよ うに名前で直接指定することもできるが、通 常は②のように Igennum=J オプションを使って、何世代前かを指 data B ; 二 一 1 ) ;← ② set TEST(gennum run, 定して使用することが多い。よく使われる例としては、 compareプ プログラム7 : 世代データセットの名前指定を する SASプログラム (gennum=‑l)を比較して、どこが変更されたかを確認する活用法が ロシジャを使って現在のデータセットと一世代前のデータセット ある。 3 .V i s u a lS 5の解説と実行方法 3 .1数独の解法アルゴリズム Visual85の説明の前に、数独の説明と、今回のパージョンアップのベースとなっている 85がどのよ うな方法で数独を解いているのかについて、ごく簡単に解説する。 日 3 自 数独のルールは以下の 2つである。 9 7 ( 1 )空いているマス目に 1‑9のいずれかの数字を入れる。 行J )、縦列( I 列 J)及び、太線で固まれた 9個の 3X3 のボック 位)横列( I 箱 J)内に同じ数字が複数含まれてはいけない。 ス( I まず、人聞が図 1 9の数独問題を解こうとする際の思考プロセスを考えて みよう。一例を挙げると、同図の Oがついているセルに注目する。このセル 6 3 7 5 2 7 2 3 4 日 日 . 5 . 4 1 3 9 2 4 日 自 図1 9 数独問題例 , 6, 5, 9の数字が既に使われている。また「行 j を見ると左から が属する「列」を見ると、上から順に、 1 8, 4, 2が既に使われている。さらに「ボックス」を見ると左隅から時計四りで 4, 5, 9, 3が既に使わ 順に 3, れている。これら既に使われている数字をまとめて整理すると、 1から 9のうち未だ使われていないの は 7しか残っていない。従って、 Oのマス目の数字は 7に確定できる。 このように、人聞が数独を解く際に用いる最も普通の思考プロセスは、行・列・箱で既に使用されて いる数字を全て列挙して、 1~9 の数字と振るし、(フィルタ)にかけて、最後に残った数字を正解の候補と し、もしそれが一個ならその時点で確定できるというものである 1。マス目が新たに 1つでも確定でき れば、他のマス目のフィルタ情報に影響を与えることになり、フィルタ情報を更新することができる。 この作業を繰り返すことによって一つずつマス目が埋まっていくことになる。 1 我々の数独システムでは、全ての空白のマス目に対して、関係する「行・列・箱」に属する確定済みの数字を特定し 011) 。 て 9桁の数字にまとめた文字変数を「フィルタ J と読んでいる(知平・周防 2 ‑ 6 6 5 ‑

676.

85の興味深い点は、この人聞が採る論理的なプロセスと同様の方法を一番目の基本作戦としているこ とで、人工知能の分野で「ヒューリスティックス J( h e u r i s t i c s )と呼ばれる手法の一種である。 0では、図 1 9の 図2 日 数独問題例を再度取 り上げている。まず与 6 3 7 5 7 6 えられた初期局面か 2 れる 9桁の数字から 3 7 4 8 1 4 6 2 ら「フィルタ Jと呼ば 成る文字変数を作成 9 3 3 する。他のマス日で既 に使用されていて、使 日 ∞ ~ 、4 9 2 t s . 1 2 3 α】6 ゆ 7 8 0 2 3 α)5 7 C 自 0 2 3 。 コ6 7 日 ∞ 1∞ 1 7 8 0 1 句 αコ6 7a ∞ 7 8 0 同 基 1 ( 沼 1 ( 沼 以外の数字が入って ~ 4 5 0 3 1 2 3 4 7 8 0 1 2 3 α)5 a9 のフィルタの中身は 3 αl α)5 7日O 1 2 0 4 5 6 7 7 1 2 0 0 2 0 α)5 α)5 7 日 O 7 α 内3 泊 6 、 、 1 2 3 8 1 2 3 4 0 0 1 ( 羽 1 ( 沼 α ) ) 7 8 0 4 5 0 ③9 3 1 2 3 4 7 8 0 0 2 3 4 5 6 7 8 0 7 8 0 担3 4 5 6 7 但3 α)5 7 ∞ 2 0 2 3 4 0 0 780 ∞ 7 、¥ 月 五 J 4 5 B 6 O 4 8 4 5 0 但9 1a α)5 7 8 9 3 ∞ 1 ( 沼 ∞ α)) C 5 6 a9 1 伺 C 5 6 7 8 9 1 2 0 4 5 6 7 C 自 日 1 2 0 C 5 6 7 8 9 1 2 3 4 5 6 7 8 9 ~日9 1 ω 4 5 0 9 7 日9 1 田 α)) 回目 。 コ 日 1 ( 沼 白日 7 えない数字は既に O る 。 0で囲んだマス目 6 マ E 、∞ 2 いる状態となってい αコ6 7 8 0 qコ E 9 3 αl 4 5 0 7 ω 5 0 2 0 4 5 6 a日 位。 4 5 0 7 8 9 0 2 0 4 5 0 a9 4 1 2 3 4 5 0 a9 006 a9 3 3 αl 4 5 6 7 8 0 0 2 3 4 5 6 ao 0 2 3 4 5 0 7 8 0 0 2 3 4 5 0 ao 包3 4 ao 1 2 3 4 a9 位3 4 0 0 a9 0 2 3 4 7 8 9 ∞ ∞ 4 0 2 0 4 5 6 ao 8 0 2 0 4 5 0 ao ∞ 2 8 1 2 3 4 a9 ∞ フィルタ │ 1 2 3 4 5 6 0 8 9 │である 2。 図2 0 フィルタの更新 これは 7以 外 の 数 字 は既に使われていることを示している。従って、このマス目には 7とし、う数字が確定する。 今、取り上げたのは 85に実装されている 6つの解法アルゴリズム (r 作戦J)のうちの最初の作戦であ り、最も基本的な作戦3である。 3.2 V i s u a lS 5のシステム構成 V i s u a 1 85については、 8A8総会後に全プログラムをネット上に公開する。また、 8A8ユーザー総会 A8プログラム、及び作成され の資料ダウンロードページからでもダウンロードできる。実行方法と 8 z i p形式)を解凍すると、以下のファイルが保 る結果について解説する。ダウンロードした圧縮ファイル( 存されている。その他に、利用方法などのドキュメントも含まれている。 ① V S 5 .s a s・・・・メインとなる 8A8数独プログラム S U D O K U ̲ S H E E T . x l s m・・・・可視化するための出力テンプレート A T ̲ t o ̲ E X C E L .s a s . • .・テキストファイルに保存された数独問題を 8UDOKU ̲ 8 H E E T . x l s mに展 ③ D A8プログラム 開するための 8 ④ E X C E L̲ t o ̲ D A T .s a s・. ..SUDOKUS H E E T . x l s mで作成した問題をテキストファイルに変換して ASプログラム 保存するための S p r o bI e m J・・・・テキストファイル化された数独問題を保存するフォルダ ⑤フォルダ r 8A8プログラムの実行に先立ち、最初に r 8UDOKU ̲ 8 H E E T . x l s m Jを聞く。セキュリティの警告で 8 u bA u t o ̲ O p e n O J で定 マクロの許可を求められる場合は「有効Jにする。マクロが有効化されると r ② 2 図 20では見やすさから、 9桁の数字を 3段に分けて表示している。 ( 3 )、( 5 )で詳細に解説している。 3 作戦①』作戦⑥については、参考文献(1)、 ‑ 6 6 6 ‑

677.

義された EXCELVBAが自動的に実行され、画面が自動的に分割される。これによって複数のシート の内容を同時に見ることができる。聞くウインドウの数や大きさはユーザーの好みに応じて調整すれば よい。どのように画面を分割しでも LIBN 泊四の動作には影響を及ぼさない。 次に ISUDOKU̲SHEET.xlsmJ ( 図2 1 )の各シートの説明を行う。 問題名仁五日 1 日 3 6 2 6 3 日 5 3 9 2 4 日 2 3 4 5 2 7 4 9 7 6 2 3 4 5 3 7 3 7 1 日 6 9 7 6 6 7 自 4 5 自 9 4 日 日 2 日 一四川弘 一五すのそ 一町弘はあ ⁝河川述る分 n 一し山 m 後れや十 v 一 茂 J目 立 さ は ⁝州日日れ新れ 札‑M円 し 更 片 こシよ シに見 帖川一ト詳で寄 F ザ則一 ム分 o 百刷シるイに 正副(なタう トアる 一リえ U 一 柚 一川内 L rE 弘元札一け時 斗る中に !ii!jili‑‑1i!illl 二件件 さ行つ一て後シ甘さ実同 映実まシいたる引力ムが 反︑埋る解つれチ出ラト わされ N がグ一 がでがれを o 過面字さ﹂る終力持歴ロシ 2 経局数映面れき出石履プ 答期に反局さ解がオの;︑の 解初たが現新に歴 U 化情そ は新容﹁更全履ォ変 百側に内るに完の涜のなで 町左﹂のあ常が化る附タ一的の 面タにが独変す同ル岬な 期 o t け 初︒局ル﹂身数面述刑事イ ‑ m 中:局後いフてだ 一の口現イ 独恒﹁フ陥の幻のは耐の λ ト 数トの﹁タ品でく凶でに一 A一 ま ゴ シ 一側配トル血まし ‑ るよ 2 則シ右四一ィ n一 る 詳 r ・創のと L シフ・白至︒ h 至ゅの M ンる問︒で M にる日にいは J ﹁イす ﹁叫程﹁答な﹁答比四 o 2 過ト解こト事室ロー トメ始くト 一る開い一個る一︑い一角分日 シれをてシトいシに一シに咽明 ①②③④と 123 100 100 103 103 103 123 006 006 006 日 000 450 000 400 780 780 780 780 089 089 089 023 103 123 103 003 023 006 006 6 406 3 056 白 006 406 709 709 089 089 089 089 023 003 123 103 103 003 023 006 7 006 400 000 056 450 3 400 7日 日 709 目 700 7日O 780 780 7日 023 023 120 120 003 日 4 56 7 456 456 456 5 456 4 700 780 700 709 780 023 120 020 023 020 023 020 006 006 006 2 006 6 456 456 456 700 700 7日O 700 0日9 080 080 120 020 023 120 020 023 2 006 006 406 7 056 450 450 日 7日9 789 7日O 780 780 780 123 103 103 003 020 023 020 456 450 456 4 450 5 450 450 450 080 780 780 709 089 080 080 123 023 023 123 023 3 400 日 450 450 456 4 400 2 7日O 089 789 089 080 123 103 103 123 123 006 006 3 450 日 450 日 400 目 7日 089 789 089 089 現局面 3 . 3V i s u a lS 5の実行プロセス 3 . 3 . 1 数独問題の保存と呼び出し I S U D O K U ̲ S H E E T . x l s m J を聞いた状態で、 I E X C E L ̲ t o ̲ D A T .s a s J を実行すると EXCEL上の数独問題を 読み込んで、テキストファイルとして保存できる。 I E X C E L ̲ t o ̲ D A T . s a s J (プログラム 8 ) について簡単に解説する。 まず、①で S U D O K U ̲ N A M Eと指定すると、図 2 3の太線で、囲ったセル範囲を定義する名前になる。セル 結合されているため、問題名(この場合は I q l 1 1 J )が入力されているのは 4列目なので②は変数 F4を マクロ変数 Qに格納する。 R E A1と指定しているのは太線で、囲った範囲の名前になる。 9変数 9オブザベーションのデーセ ③で A ットと認識され、変数名 Fl~F9 で読み込む。 ‑ 6 6 7‑

678.
[beta]
⑤でn
u
l
l値を変換する c
o
a
l
e
s
c
e関数を使用して Oに置き換える。

a
t
s関数を使用して、空白を
⑥ で 指 定 し た 9変数を、 c

II*EXCELを指定*
1
含まない 9桁の数字から成る文字変数に変換して│
IIibnameSUDOKEX"./SUDOKU̲SHEET.xlsm"
いる。最後にその値を putして、②で取得した問題 I
h
e
a
d
e
r二 n
os
c
a
n
t
e
x
t
=
n
o
;
名のマクロ変数 Q をファイル名にしてテキストフ

1
*ファイル名(ファイル名)を取得*
1

4
)を作成している。このようにしてユー
ァイル(2

d
a
t
a NULL;
s
e
tS
U
D
O
K
E
X
.
S
U
D
O
K
U
̲
N
A
M
E
;← ①
c
a
lIs
y
m
p
u
t
x
(
'
Q
'F
4
)
;← ②
r
u
n
;

ザーは EXCEL上で作成した数独問題を外部ファ
イルに保存することができる。
11
1 1
1
!問題名 1g

労イ以θ 綴
集
(
.
E
) 義
市
:
l
/
)2

7

6

2

6
74

5

3

9

42
日

図 23

S
U
D
O
K
US
H
E
E
T
.
x
l
s
m

IH
弘偽

0
0
0
8
0
1
0
0
0
0
0
6
0
3
0
9
0
0
0
7
0
0
0
0
0
3
0
6
0
7
0
0
0
5
0
4
0
0
0
2
0
6
0
0
0
2
0
0
0
7
0
0
0
8
0
0
0
4
0
5
0
0
0
38
0
0
0
4
0
2
0
1
0
3
0
9
0
ω

4

5

7

2
3

口語凪

9

ヨ

日

図 24
作成された数独問題の
ファイル

次に IDAT̲to̲EXCEL.sasJ はそのようにして保存
された外部ファイルを EXCELに展開するプログラム
であるが、先の処理の逆をしているだけなので解説は
割愛する。

1
I
*
E
X
C
E
L上の問題を‑..e̲データセット化*

1
1
*空白はOに変えておく *

d
a
t
at
e
m
p
;k
e
e
px
;
s
e
tS
U
D
O
K
E
X
.
A
R
E
A1
;← ③
a
r
r
a
yf
{
9
}f
1
‑
f
9
;
a
r
r
a
ya
{
9
}a
1
‑
a
9
;
d
oi
=
lt
o9
;
e
s
c
e(
f{
i
,
}0
); ← ④
a{
i
} =c
o
aI
e
n
d
;
x
=
c
a
t
s(
o
f a{
*
}
); ← ⑤
r
u
n
;

1
*問題を datファイルとして保存*
1
f
il
e
n
a
m
eo
u
t
1"
.
/
p
r
o
b
l
e
m
l
品Q
..
d
a
t
"
;
d
a
t
a NULL;
eo
u
t
1
;
fiI
s
e
tt
e
m
p
;
p
u
tx
;
r
u
n
;
プログラム 8:E
X
C
E
L t
oD
A
T
.s
a
s

3
.
3
.
2数 独 解 法 プ ロ グ ラ ム の 実 行
I
SUDOKU̲SHEET
.x
l
s
m
J の IMainJ シート(21)の左側の EXCEL表に解きたい数独問題がセット
V
S
5
.s
a
s
J を開いて実行すれば、数独問題を解き始め、図 2
5が画面表示される。
されていれば、後は I
o
p
ti
o
n
si
c
o
n
Jの指定しており、これは実行中に SAS画面を最小化する効果があるの
プログラム中に l
で
、 EXCEL画面が見やすくなる。実行が開始されると画面の「現局面」の数字が順次更新され、新し
く埋められたマス目は条件付き書式設定の効果によって赤い太字に着色される。画面の右にはフィルタ

5の太線
情報を表示しているが、こちらもフィルタが刻々と更新される様子を見ることができる。図 2
VIEWとし、う名
で、囲った「現局面」のセルには AREA̲2とし、う名前、点、線で囲ったセルには FILTER̲
前がつけられている。

3
.3
.3実 行 完 了 と 結 果 の 確 認
SASプログラムの最終行に1dm'
p
o
s
t"終了しました川;│と記述している。 d
m文はポップアップウイ
ンドウで任意のメッセージを表示する命令である。この命令が実行されて「終了しました」というメッ

i
s
u
a
lS
5の処理が全て完了したことがわかる。 EXCEL画面を確認してみると、
セージが表示されると V

‑668‑

679.
[beta]
全ての数字が埋まり、フィルタの中も全て 1桁の数字になっていることがわかる(付録1)。

Main̲AUDITJや iFILTER̲AUDITJを確認すると、更新履歴が全て縦に連結され
また、シート i
て表示され、どのような順番で値が確定されていったかを追跡して確認することができる(付録 2)。

問
題
名
G
l
l
!
:
コ

現局面

日

3

6

9

3

7

6

5

7

2
2
3

4

6
日l

7

4

5

3

9

B

2I

4
B

図2
5 実行中の S
U
D
O
K
U
̲
S
H
E
E
T
.
x
l
s
m (シート M
ai
n
)

3
.
3
.
4VisualS5で追加した機能
Visua185は 85に視覚化機能を付加しただけであるが、追加し
た 8A8マクロは 4個ある。
一つ目の追加マクロは、解いている途中の局面を EXCEL画面
に反映する 8A8マクロ u
p
d
a
t
e
E
X
C
E
L
(プログラム 9)である。 85で
は再帰処理を行っているため、解答プロセス途中のデータセット
は何度も同名で上書き・更新される。これを可視化するには、デ
ータセットが上書きされる直前のタイミングで常に EXCELに出

I
*
E
X
C
E
Lファイルの更新マクロ *
1
%
m
a
c
r
oupdateEXCEL;
d
a
t
aS
U
D
O
K
E
X
.
A
R
E
A2
;← ①
s
e
to
ri
gi
n
aI; ← ②
a
r
r
a
ya
a
{
9
}a
1
‑
a
9
;
a
r
r
a
yf
f
{
9
}f
1
‑
f
9
;
m
o
d
i
f
yS
U
D
O
K
E
X
.
A
R
E
A
̲
2
;
d
oi
=
1t
o9
;
f
f{
i
}
=
a
a{
i
};
e
n
d
;
r
u
n
;
1
b
m
e
n
du
p
d
a
t
e
E
X
C
E
L
;

力する処理が働けばいいので、このマクロを、再帰処理が行われ

v
e(付録 3
)の中にある「確定した数字をはめ込
る 8A8マクロ 80I
む」処理の直後に埋め込んだ。

プログラム 9:

S
A
Sマクロ u
p
d
a
t
e
E
X
C
E
L

5によって更新されるデータセット名であり、データセットの内容
⑪ 'EXCEL上の出力範囲、②が 8

をそのままのイメージでエクセルに出力しているだけの単純な処理である。
二つ目の追加マクロは、フィルタの中身を EXCEL画 面 に 表 示 す る u
p
d
a
t
e円 L
T
E
R であるが、

u
p
d
a
t
e
E
X
C
E
Lとほぼ同じ記述なのでここでは解説を省略する。
三つ目の 8A8マクロ a
u
di
t
̲
m
a
k
e(プログラム 1
0
)は、エクセルシート M
a
i
n
̲
A
U
D
I
Tと F
I
L
T
E
RAUDnf
こ

‑
6
6
9
‑

680.

更新履歴を縦に連結して出力して いる。画面百オプシヨンを上限 値 1000に設定した上で、更新され るデータセットに追加した。作成 される世代データセットには末尾 に連番が付与されるため、その規 則性を利用して、縦方向に 1 つの データセットに連結している。 先頭①のloptionsnodsr 出r r ; │は 存在しないデータセットを指定し ootions n o d s n f e r r :← ① d a t日 nlJl l do i = l to9 9 9 : iI t e r olJt n ut : t t " .nut( i. 7 3) ." 'n"): o u t p u t : fiI ds=cats( ' "F s ( " ' o rI ! r i n a l # "nlJt ( i7 3 . ),"'n"):output; orids=c日t c a l ls v mOlJ t x ( c a t s ( ' f ' i )f i l d s ) : ),o ri d s ); c aIIsymputx( c a t s( '0',i 自n d : r u n : 私m acroalJd i tm a k巴 : data f iI t e ra u d i t : s e t 制。 i = l %to 9 9 9 ;← ② 品品f&i 弘e n d : r u n, で②や③のようにデータセットの data o r i g i n ̲ a u d i t : s e十 制。 i = l 批 o9 9 9 ;← ③ & & o & i 弘e n d : 存在確認をせずに最大数を網羅的 首menda uditm a k e : でも実行エラーとせずに完遂させ るオプションである。このおかげ nm. に set 文の対象にするような単純 な処理が可能となる。 プログラム 10:SASマクロ auditmake 4つ目の新規 SASマクロ output̲auditは、終了メッセージを出力するコードの直前に追加した。フ ィルタの更新履歴をクリップボード経由で行うので、高速でエクセルシート F I L T E R ̲ A U D I Tに出力する。 3 . 4 Visual S 5の今後の課題 探索過程における Visua185の更新履歴の確認画面(付録 2 ) は、現段階では、更新されたデータセッ トを作成順に単に縦に連結・表示しただけである。つまり、いわゆるゲーム木の構造を持っていないの で、これではプログラムがどのようにして数独を解し、ているかの経路を辿ることは難しい。このゲーム 木の生成状況は大変興味深いテーマである。 本稿の r 3 . 1数独の解法アルゴリズム」では、候補となる数字が 1つに絞れる場合にその数字を確定 する過程を説明した。しかし、我々の数独システムには、その方法で候補が 1つに絞りきれない場合に、 取り得る値の組み合わせから、正解が含まれる可能性がある候補局面を複数個生成し、その候補局面の それぞれについてゲーム木の探索を進めるとしづ作戦も複数個、実装されている。 我々は、このゲーム木の生成状況を EXCEL画面上に見やすく表示できることを追求しているが、開 発に時間がかかり、今回の報告時点までには実現に至っていない。ゲーム木における各更新局面の位置 情報は、既に、システム内に保持しており、その情報を基に見やすい可視化を目指して、現在のシステ ムを更に改良していきたい。 4 . おわりに 本論文の当初のメインテーマは、 8A8数独プログラムの実行内容をリアルタイムで EXCEL画面に可 視化することで、あった。これができれば、 8A8の出力用画面として、 8A8環境以外のツールが、リアル タイムで利用できることに繋がり、 8A8の利用環境が格段に拡大することになる。 Visua185は 85をベースとして、 8A8データセットとして作成される解答途中の数独局面が更新され ‑ 6 7 0 ‑

681.

る度に EXCEL画面に表示することにより可視化を実現できたが、解答を得るまでの実行時間の点では、 数独を解くことに関係のない処理をしている分だけマイナスになり、非合理的である。 では、何のために可視化をするのか。その理由は二つある。第一は、我々の数独プログラムを利用す るユーザーが見て素直に楽しめること。第二には、数独問題が解かれてし、く過程をリアルタイムで見え ることで、システムの動きが容易に確認できるので、システム評価が直感的にできることである。 周防は 2012年に米国フロリダで開催された SASGl o b a lForum2012で、数独を解く第一世代の SAS s s s Jを発表した。その発表準備期間中にニュージーランド人とカナダ人のグループから、 プログラム r M & 自分たちのグループも数独(SudokuP u z z l e )を解く SASプログラムを作成して発表する ( K a s t i n, Tabachneck, A2012)とのメールがあった。彼らのアプローチは新しいプロシジャ FCMPを使って数理 的に解く方法であった。解答にかかる実行時間は我々のシステムと比べると格段に早いものであった。 当時 p r o cFCMPを知らなかったユーザーとしては大変示唆に富んだ、研究報告だった。ただ、もし解答 時間の競争なら何もわざわざ SASでシステムを組む必要はなく、別の言語で組めばよかったのだが、 周防は数独の解答に極めて「不向きな JSASデータセットを使って解きたかったのが、この研究を始め たきっかけである。要するに、 SASの強力なデータハンドリング機能を試してみたかったのである。 SASには高度な解析技法が実装されており、それを用いることで極めて豊かな知見を得ることができ る。しかし先端の統計解析処理は、時として、各分野の先頭を走る一部のパワーユーザーの聞のみで、し かその魅力を共有できないとし、う側面がある。 一方で SASのもう一つの大きな柱である強力なデータハンドリング機能については、基礎的な部分 であるため、様々な応用ができ、分野を横断して多様なレベルのユーザー同士、共有発展がしやすい。 SASを長く使ってきた我々著者としては、次世代の SASユーザーを増やし、そのレベルを上げるため に、もっと魅せる SASプログラミングを意識する必要があると考えている。魅せる工夫としては、解析 結果のビジュアル化が最近の流行であるが、今回のようなデータステップの途中経過の処理を「可視化」 するのも一つの有効な手段ではなし、かと考える。 本論文では、こうした問題意識から、 SAS歴の浅いユーザーであっても興味を持って読みやすいよう に、数独解法のアルゴリズムの紹介は最小限にし、視覚化に用いている技法に焦点を当てて解説した。 今回、数独解法過程をある程度可視化できたことで、 SASによる魅せるデータハンドリングに一層興 味が湧いたので、今後もこうした研究姿勢を続けていくが、その結果、 SASプログラミングに更に興味 を持つユーザーの増大に繋がれば、著者としてこれほどの喜びはない。 参考文献 (1)知平菜美子・周防節雄 ( 2 0 1 1 ) 数独パズルを解く SASプログラム、 WSASユーザー総会 2011論 文集』、 p p . 3 5 3・ 363 。 ( 2 )周防節雄・知平菜美子( 2 0 1 1 ) SA Sマクロ言語を使った数独パズルを解くプログラムの構造と制 御方法、 WSASユーザー総会 2011論文集』、 p p . 3 6 5・ 378 。 ( 3 )Suoh, S e t s u o( 2 0 1 2 ),Sudoku‑SolvingSystembySAS , ⑧t h eD i g i t a lP r o c e e d i n g so fSASGl o b a l Forum2012,F l o r i d a,US A . ( ( h t t p : / / s u p p o r t . s a s . c om/r e s o u r c e s / p ap e r s / p r o c e e d i n g s1 2 / 2 2 5・2 0 1 2 . p d f ) ) ( 4 ) Kas t i n,M. & Tacachneck,A .S .( 2 0 1 2 )Y e tAn o t h e r Sudoku S o l v e r : PROC FCMP ,t h eD i g i t a l P r o c e e d i n g so fSASGlo b a lForum2012, F l o r i d a, US A . 2 / 4 3 3・2 012.pdU ( h t t p : / / s u p p o r t . s a s . c o m / r e s o u r c e s / p a p e r s / p r o c e e d i n g s1 ( 5 )周防節雄 ( 2 0 1 2 )SAS ⑧言語で解く数独パズル、『商経学叢』第 59巻第 2号、近畿大学商経学会、 2012年 、 p p . 1 3 1・167 1 2月 ω ( 森岡裕 (2013) ライブラリ参照と名前定義を利用して EXCELファイルへの柔軟な入出力を実現する方 法と応用例の提案一解析結果のレポーテイングからセルオートマトンまで一、 WSASユーザー総会 2013論 文集』、 p p . 3 7 7・ 389 。 0 ‑ 6 7 1 ‑

682.

付録 1 数独プログラム実行終了時の M A I Nシートとフィルタの EXCEL画面 E F IQ IH i 1 iJ 斜 配C I D I E I F よGI HI rLdK LI MIN I O IPjQI H L s l T J u BI .0 1D .I 5 9 3 日 6 自 2 6 7 3 4 7 日 2 4 4 9 5 5 2 日 3 6 9 日 5 2 4 3 7 9 白 自 7 2 問題名 Ig111 I 理局面 51 9 318 6 1 1 : 2 4 17 81 : 2 617 3 14 9 15 1 1 6 417 119 5 2 813 1 日 3 日 日 7 6 3 7 5 2 2 3 4 白 7 日 4 5 3 9 4 日 2 日 : 2 14 613 711 9 B 5 1 11 8 512 4 自 317 1 9 214 915 7 13 1 16 1 8 4 6 91 6 空 4 日 5 71 1 1 3 315 816 1 17 4 19 1 2 711 413 2 9 618 1 5 ~ シート Main 「現局面」は数字が全て埋まり、正解に辿り着いたこ とを示している。プログラムが解答した数字は EXCEL画面では赤色の太字で表示されている。 3 7 日 5 2 4 6 2 4 9 5 7 3 9 自 2 4 自 5 7 3 5 B 6 7 4 9 2 4 3 9 6 日 E 2 3 シートFlLTER 数独が完全に解けた場合、す べて 1桁の数字になる。この M a i n J の「現 数字はシート i 局面│と同じになる n 付 録 2 数独プログラム実行終了時の E XCEL画面 二つのエクセルシート iMAIN̲AUDITJ 、iFILTER̲AUDITJの中に、正解に向かっている局面とそ れに対応するフィルタ情報について、更新記録が逐一保存されている。付録 1の数独問題をここでも取 り上げて、次頁にある解答プロセスの初期段階のこの二つのエクセルシートの更新記録を辿ってみる。 次頁左にあるエクセルシート MAIN̲AUDITには初期局面から順次確定していったマス目が記録さ れていく。左端の枠外の数字① ⑤は局面 4の更新段階を示している。右側にあるエクセルシート FILTER̲AUDITは正解途中の各段階でのフィルタ情報を表示している。右端の枠外の数字①と③まフ ィルタ情報の更新段階を示しており、最初のフィルタ情報は①の 9x9のセル、次のステップのフィル タ 情 報 は ⑫ リ x9のセルである。 図の矢印 ( 1 )の先に新たに 7としづ数字が見つかっているが、これは本文中でも解説した通り対応す であることから確定できたことがわかる。この数字の確定は、作戦①にある るフィルタが │123456089│ 二通りの論理の内の一つ目の適用結果である。 4 図を見やすくするために、各段階の 8 1個のマス目は白地と黒地で交互に色分けしている。右側のフィル タ情報の表示も同様に色分けしている。 ‑ 6 7 2 ‑

683.

一 058 一 369 100 一 一 一 一 309 369 QdEqιnuQU一 つ ιnuRU ‑140 0 4 0 ‑309 3 6 9 008 8 ‑ 0 0 8一 000 ‑ 1 0 0一 1 qunuQu 園一 国 国一 圃 7‑058 9 一 ‑140 6 一 3 ‑qununu OQM nd ハ 一 5‑008 7・0 7 一 園一 ‑一 一 一 4‑8 208 140 一 ・ 060 3‑008 6 マ ' 一 .寸Enu 圃 国 マ'一司﹄円 U ゥ︐ 一 一 060 369 2 008 OOO 叶Enu ワιnu 自u一司ι n u n U nunu づ ︐ 1Enu 一 360 369 41nFι ‑ 6 7 3 ‑ 023 マ ' 一 ll シート M A I N ̲ A U D I T 0031123I103I 1031003 023 ②

684.

矢印 ( 2 )の先にも新たに 2とし、う数字が見つかっているが、これもこのフィルタ情報から確定でき た。対応するフィルタ情報は│003456780│なので候補ナンバーは 1,2,9の 3個あるが、このマス目 の「行J を見ると、ほかの空いたマス目のフィルタには全て 2 が入っているので、それらのマス目に は 2が使えないことが分かる。従って、この行で 2を使うことができるのは矢印 ( 2 )の先にあるマス目 だけということになり、 2が確定する。これは作戦①の二つ自の論理の適用である。矢印 ( 3 )の先のマ ス目も同じ論理で 8を確定している。 このようにしてシート iMAIN̲AUDITJのステップ③までで、 3つの数字を確定できたが、ステッ プ④でデータセットが更新されているのにも関わらず、新たに発見された数字はない。これは、この 時点まで使用していたフィルタ (iFILTER̲AUDIT Jステップ①の情報)の内容からはこれ以上新た に数字を特定できなくなったことを意味する。その時は、この新たに確定した 3つの数字を追加して フィルタ情報の更新が行われ、 iFILTER̲AUDIT Jのステップ②となり、次の新しい数字の発見に進 んでし、く。その結果 iMAIN̲AUDITJのステップ⑤で新たに三つのマス日に 7, 8, 8が確定してい る。これは作戦③ ⑥を適宜適用することによって、ゲーム木を探索した結果である。 付 録 3 新規追加した SASマ クロ ω m. ︐のけ 川出回し叫 ﹄命︑ 卜・ 'O +LJU aunH r 0u un nM u1 a1 u‑‑ り 卯 f *mMon 一定 n 弘一 t=d 確e VAOU こ ︐ or1u t o dF b ' .. E E 4 1 ' Z 1 ︐ ・d & p h・ nHnvρu''twT ︑ 目 一 窃 nhr13x E X 一 + L e l ' * 削 刊 nu'tE ψ y s t ' a u u y ふ a L huO 唱 tlsnvne ・ fI 自 一 C lBPSIt‑‑LRqyl ・ E ﹁ t I ‑ E E l ‑︐ . ︐ ヨ σ5 一 ft ︑ 41nudIn ooeMNf t w・ lLnow L vA cn ﹁ み ・ 'r=aerc+Le 一一 ︐ a+LOU+LAU 一a n o + L n E ﹁ w w J G n s ・' n ‑ J 1 C 4 l a M OO‑‑GOLD‑‑Hus‑auyuzea=21 rJU 芋L u = o a a a E m ‑ ‑ ‑ l ・ ' L i f ' n o s v z l・ ' ・ n n v r r r J 口 4 u ﹁ ー ahwtlvar4lJu‑‑EBrreUFOn a ト'geaamhuAue A u e vlice=Fan ・ ite‑ ElenvZl ︐ ︐ u自・I L K ‑ n v 九川 o c eL ふ l n u m ' v i n eoauaurTanunH μ E n U H U akside‑ ︐γr s 協 同 O+LnH1a eJq VEnaHu.4 CJur.a w百n ・ u e a a u 伽 ﹄ ﹃﹄ J円 ﹄ 存; 侭け 晶 F ' a E I 字削 幽 皿 山 町 一 一 n u u . ︒ ︐伽 これまでのぜの中に、今回 新規に追加した S A Sマクロは 合 計 4個である ( 3 . 3 . 4節 ) 。 左の S A Sマクロ s o l v e は数 独解法エンジンとして本シス テムの心臓部に相当し、この マクロの中でこのマクロ自身 が再帰的に呼び出される。左 のコードの中で「新たに確定 した数字の保存」をした直後 A Sマクロ u p d a t e E X C E lを にS 新規に追加した。 なお、フィルタ情報をエク セルシート F I L T E Rに表示する SASマクロ u p d a t e F l l T E Rは 、 行・列・箱のフィルタ情報を統 合する S A Sマクロ a l l ̲ f iI t e r の内部に新規に追加した。 S A S プログラムの全コード は付録 4の URLからダウンロ ードできる。 付 録4 数独プログラム VisualS5のシステムファイルのダウンロード 本論文で解説した SASの数独プログラム一式、利用方法、及び関連ドキュメントは、以下の URL からダウンロード出来る。ユーザー登録やパスワードの設定は不要。 h t t p : / / m i g h t y . g k .uh y o g o . a c . j p / c o n f i d e n t i a lN isuaLSudoku.zip ・ ‑ 6 7 4 幽

685.

.吋自治体大学によるーテムの実証…一総会 ~llJ9 Le t 'sMakeF o r e s tP l o tbySAS S h i n i c h iH o t t a f i z e rJapanI n c . DevelopmentOperations,P I ….m 9 z コ ジ ス デ ム ら おs 憲政府自治体大学による A b s t r a c t : Thet i p st oc r e a t et h ef o r e s tp l o t se a s i l yw i t h a s i cf u n c t i o n sa r ei n t r o d u c e d . SAS/GRAPH'sb Keywords: SASGRAPH,GPLOTProcedure,PLOTStatement, BUBBLEStatement,AnnotateF a c i l i t y ‑ 6 7 5・

686.

加9 │再開.子学問工コシ杭の実証…会 Whati sF o r e s tP l o t " ? F o r e s tP l o t "i s ・ Someg r o u p s 'e s t i m a t e sandt h e i ri n t e r v a l sasag r a p h .( A n y t h i n gi sOK) ・ Usedf o rMeta‑analyses. │Exampleo fT y p i c a lF o r e s tP l o tI 5 t u d y OddsR a t i o Thes i z e so f e s t i m a t e ' s symbolsareo f t e n weightedbyt h e samples i z e s . . 5 ) 5 t u d yA 0 . 6( 0 . 1,1 5 t u d yB 0 . 9( 0. 4 , 1 . 4 ) . 8 ) 5 t u d yC 1 . 5( 1 . 3,1 r e s u l ti s sometimes d i s p l a y e da tt h e sametime. O v e r a l l 1 . 2( 1 . 1,1 . 3 ) 。 。 0 . 5 1 . 0 OddsR a t i o 1 . 5 2 . 0 ~9 │臨政府開大学問エコ以弘の実証…ー絡会 Howt omaket h ef o r e s tp l o tbySAS8.2 ・ SASd o e s n ' thavethegraphf u n c t i o nf o rt h ef o r e s tp l o . t 'Theo v e r l a yo fL inep l o tandBubblep l o tenablesyout omaket h ef o r e s tp l o . t i Age 同 坦hGroup A g e ‑ ‑ ‑ i ‑ + ー ー ー ー ‑ m岨 n=123 I H ‑ M i d d l e G 問叩 !そも I H ‑ A 訓 出d 旭G ̲ ‑‑t;‑ ・ モ ← m an=88.67 L 側 面o up mean=闘 刊 30 ‑ 6 7 6・ 1開

687.

│ 町 府 ・ 自j 錦 、 大 学 品 崎 製 品 . . . . . .2 0 1 4 Theb a s i cd a t as t r u c t u r ef o rt h ef o r e s tp l o t 、 口 • Thes t r u c t u r e0fthei n p u tdataseti srelevantt othef o r e s tplo . t Th宇v a r i a b l et c a l l yp l o tl e f t ve同i ml 胤 h avet h e v a l u e sf o rt h e ((4)Attheobsemtionshr1f(3)ThevanablebhorizontBlly 1p l o tmusthavet h e四 l u e sf o rt h e 1 1t h ee s t i m a t emu討 beb l a n k . ~ 1e s t i m a t e sandt h e i ri n t e r v a l s 1 1 ìh~ i n t e刊 a . lt h ev a r i a b l ef o r 1 ( 5 )A tt h eo b s e r v a t i o nf o rt h e e s t i m a t e,t h ev a r i a b l ef o rt h e i n t e r v a l smustbeb l a n k 可 I ジ : ー ヨ ヨ e 吋hG u p 悶 r H l g hG r o u p _,~: しM i d d l eG r o u p L ‑ M l d d l eG r o u p 1 1 2 5 1 5 0 5 1 2 3 9 3 8 4 3 9 8 3 8 8 . 6 6 6 6 6 6 6 6 7 7 5 0 . 5 7 1 2 8 ‑ i 争政禅譲日I ← I 問[9 │ 医 療 政 均 Thef o r e s tp l o tbySAS9.2 ・ BySAS9.2orl a t e rversion,BFILLニ optioni nGPLOTprocedure'sBUBBLE statementenablesyout of i l lthebubblesw i t hthec o l o r s . •Thislooksprobablymorei d e a lasthef o r e s tp l o . t Age ~一一→ H l g hG r o u p , ̲ . , H ‑ M i d d l eG r o u p mean=1 0 1 . 8 8 → ‑ しM i d d l eG r o u p mean= 1 2 3 . 9 0 mean=8 8 . 6 7 LowG r o u p mean=8 6 . 7 9 3 0 6 0 9 0 1 2 0 1 5 0 Avg/RangeofBW(lb) ‑ 6 7 7‑

688.

闘政府間大…工均ムの実証… 儲 m D Themoree x p l o r a t o r ytechniques ・ I n s t e a do fBUBBLEStatement,u s i n gAnnotateF a c i l i t yw i l lexpandt h ev a r i e t yo f t h ef o r e s tp l o t s . Theshapesf o rt h ee s t i m a t e s ' symbolscanbechangedasneeded. Age 一二三‑一一ーー← ー ‑ ‑ ‑ t H i g h G r o u p mean=1 2 3 . 9 0 H ‑ M i d d l eG r o u p‑ 打 L ‑ M i d d l eG r o u p 、 打e a n =8 8 . 6 7 L o w G r o u p 一 l e a n =1 0 1 . 8 8 mean=8 6 . 7 9 mean=1 0 0 . 0 3 3 0 6 0 9 0 1 2 0 1 5 0 W(lb) Avg/RangeofB l 医療政府自治体大…~弘の実証…一儲 ~IlIJ9 Theexpandedb a s i cdatas t r u c t u r e ・ Theb a s i cd a t as t r u c t u r ef o rt h ef o r e s tp l o tcanbeexpandedanda p p l i e di n t ot h e d a t a s e tf o rAnnotateF a c i l i t y . Thev 百r i a b l e si nt h ed a t a s e tw i t ht h eb a s i cd a t a s t r u c t u r ea r er e n a m e df o rA n n o t a t eF a c i l i t v . o v 駅南H H . M i 掛 e G r o u p 同ghG r o 咽 L抽出1 0白t>UP ‑ 6 7 8・

689.

l r n三 え 弘 I 一 二 十 7日í~l ーー・ 一一 ト関門町蝕 医療、政府・自治体、大学は げーな ペ Theh i g h l i g h t so fsampleSASprograms │Samplef o rSAS8.2 I procg p l o tdata=byage2; p l o tr o w i dも p l o t = r o w i d / v a x i s = a x i s 2h a x i s = a x i s 1n o l e g e n d ; b u b b l e 2r o w i d 2 * b p l o t = n ̲ s u b j / v a x i s = a x i s 3b s i z e = 9b c o l o r = b l a c k ; r u n ; │Samplef o rSAS9.2orl a t e rve附 n I procg p l o tdata=byage2; p l o tr o w i d * b p l o t = r o w i d / v a x i s = a x i s 2h a x i s = a x i s 1n o l e g e n d ; = a x i s 3b s i z e = 9bcolor=blackb f i l l = s o l i d ; b u b b l e 2r o w i d 2 * b p l o t = n ̲ s u b j / v a刻 s r u n ; │Samplef o rANNOTATEF a c i l i t y I fyouneedthef u l lsample programs,pleasecontact shinichi.hotla@pfizer m ∞ I procg p l o tdata=anno̲ageannotat 港= anno̲age; p l o tr o w i d * x = r o w i d / v a x i s = a x i s 2h a x i s = a x i s 1n o l e g e n d ; p l o t 2y c * x = y c / v a x i s = a x i s 3n o l e g e n d ; r u n ; ‑ 6 7 9 ‑

690.
[beta]
r
JF J
UC:A8910fi168Le¥;e;14けf
j
j
'
:
"
}(
;
ぺ
品

1心l記・己\l l~I i':'下、

r
ぺ
:
:
:
‑
̲
;
れ
ぺ
:,~')(';' ,!:
t('J~~

,(':己ー笹山川、,

円 、J

'
.
l
lf
;

戸 厄

"
円

~乙/'-._r

dt
.
:
?

1
;
'
h
'

,

ι トー‘。、けマ 1;:ι~. m
iqt
!')(11
"

'
;
.
:

.\~吋ぷ~.

.'
{ :,~

nu
唱

ι
'"'
F
.
'
描b
.
"
一

町
円

" ‑'¥.

.
!
:
$
Qs
"
d
''e','' )'̲ ';̲{ ,".
'
1
ぃ つ 日 刊
3

ー

,.
,'"崎
九

J
f

"
"
'
.
,

.
.
;
"
)
/
'r
'
I'
WC',,‑ ;
.
(
'
t
)r
事1
0"1出 j

V

、 ,¥'>1' 、
.
'

司1
AHIJ¥
I
‑
1A10i!'!:qrn~ ,;

考も ξ

、:.i,..,,,~援..えa 吋,;l':~:

争 Z 吐畠£ゐげ...,,-:

E

i:l官id=', c!"き♂勺'3~h:.. !
~: ~r.,、ー

︿

︐

t

J

~~',:;,対yll"

日!
ρフ
, ,
普I
X
ι
ζ
(
:
:
;
)
(
f 号、

~ !

I~_] i・

司 ' 目

;
.
;
,
.
,

c

I

,ハー汁"!.~~;.~雌組織難色;ぶずが与え ,'.)<:i.句?ふ r 制~_;~検出泊場

693.

SASハツ、ンュオブジェクトを利用して 医薬品開発に使用するプログラムを効率化する 一有害事象と併用薬、臨床検査値と途中変更のある施設基準値 のマッチングから SASプログラムコードの分析まで 森岡裕 神田悟志 ナイフィックス株式会社バイオメトリクスグループ UsingSASHashO b j e c t st ol m p r o v eProgram ー 合omM atching‑MergeC l i n i c a ld a t at oA n a l y z i n gyo 町 S ASCode Y u t a k aMorioka S a t o s h iKanda B i o m e t r i c sGroup, N i p h i xKK 要旨 SAS9.1よりデータステップ内でハッシュオブ、ジェクトが利用可能となった。 SASにおけるハッシュオ K e y )とデータ ( D a t a )から構成され、メモリ上において展開されるルックアップテー ブ、ジェクトは、キー ( プ、ル構造である。 アクセス時間が高速であるメモリを参照することから、主に金融・マーケティング分野のピックデー タ関連で効率化のテクニックとして紹介されることが多いようである。 しかし、医薬品開発の分野でも、例えば大規模或いは長期間追跡の臨床試験では臨床検査値データや 有害事象の報告数が数百万オプザべーションやそれ以上となることがある。またモンテカルロシミュレ ーション等では膨大なデータを発生させてから処理を行うケースも多くみられる。 そのような場合、データステップやプロシジャの lステップ lステップが無視できない処理時間を必 要とすることが多く、通常のサイズのデータセットに対する処理と同じ感覚でプログラムを書くと、長 大な実行時間やデ、イスク容量オーバーなどが原因となり、処理に支障をきたすことがある。 本稿ではそういった問題に対してハッシュオブ ジェク卜の利用を提案する。単純化した例として有害 事象データと併用薬データおよび、臨床検査値と施設基準値を効率よくマッチングする方法を紹介する。 また解析業務に使用された SASのプログラムコードをテキストとして読み込み、 P e r l正規表現とハッ シュ反復子オブジェクトを使い、どのような処理が行われたかをレビューする方法を紹介し、テキスト 処理におけるハッシュオブジェクトの特徴と利用メリットを明らかにしたい。 キーワード:ハッシュオブ、ジェクト ハッシュ反復子オブジェクト ‑ 6 8 3 ‑ P e r l正規表現

694.

1.有害事象と併用薬のマッチング (1)ハッシュオブジェクト ハッシュとは連想配列とも訳され、キーとデータから構成される構造を指す。 SASにおいて配列という言 葉は ARRAYステートメントによる配列を示すことが多いが、ハッシュとは大きく性質が異なる。 ARRAYで作成される配列は要素番号によってデータが格納され、要素番号を指定してアクセスされる。そ れに対して、ハッシュオブジェクトではキーで指定された値をもってデータが格納され、メソッドという特 定のコマンドによってのみデータにアクセスされる。 (2) MERGEステートメント、 SQLプロシジャとの文法の比較 SASではある変数の値をキーとして複数のデータセットを結合する場合には、いくつかの方法がある。 本稿では有害事象と、それに対して使用された併用薬剤のマッチングを MERGEステートメントおよび SQL プロシジャで行う例を挙げ、同様の処理をハッシュオブ、ジェクトで行う場合について紹介する。 有害事象のデータセット rAEJ と併用薬のデータセット rCMJ があり、 AE.CMIDと CM.CMIDを症例ご とに一致させることによって、各々の有害事象に対して使用された薬剤(し、わゆる併用薬)の薬剤名を取得 する。 l code 1 :MERGE I p r o cs o r tdata=AEo u t ヱAE̲1; byUSUBJIDCMID; r u n ; p r o cs o r tdata=CMout=CM 1 ; byUSUBJIDCMID; run, d a t aMERGE̲AE; mergeA E ̲ 1 ( i n = i n a ) CM 1 ; i fi n a ; run, lcode̲2:SQL p r o cs q ln o p r i n t ; c r e a t et a b l eSQL̲AEa s AEID, AETERM, AE.CMID, CMTERM s e l e c tAE.USUBJID, 叩 AEl e f to u t e rj o i nCM f r o .CMID=CM.CMID; onAE.USUBJID=CM.USUBJIDandAE q u i t ; USU8JIDI 1 2 3 4 5 6 7 8 1 T ‑ 0 0 1 I T ‑ 0 0 1 I T ‑ 0 0 1 IT 一 目 。1 I T ‑ 0 0 2 I T ‑ 0 0 2 1 T ‑ 0 0 2 1 T ‑ 0 0 2 A E I D 1 AETERMI 1不眠 2~自痛 3発 熱 4 胃挺 1厩炎 2怒菅 3骨折 4頭痛 CMID 1CMTERM 1唾眼導入義 2解熱鎮痛剤 2解熱鎮痛剤 3 胃腸襲 1胃腸薬 2感冒藁 3解熱錨痛剤 3解熱鵠痛剤 MERGEステートメント、 SQLプロシジャ共に、全く同じ結果のデータセットを作成することが可能である。 ただし、 MERGEステートメントの場合、事前に結合するためのキ一変数で、データセットがソートされて いることが実行の条件となる。 2 開 6 8 4 ‑

695.

続いて、ハッシュオブジェクトを使用して、同様の処理を行うコードを提示する。 │code 3 :HASH(リターンコードなし) まず①では、コードの先頭において s e tステート dataHASHAE; メントでデータセット iCMJを指定しているが、 ① =0thens e tCM; i f̲N̲ if̲N 一=1thend o ; N =0の条件を付けているため、オブザベーシ ② ョンは発生しない。これは、変数の定義情報の ③ d e c l a r ehashh c m ( d a t a s e t : ' C M ' ) ; hcm.definekey('USUBJIDγCMID'); hcm.definedata('CMTERM'); hcm.definedoneO; 読み込みを先に済ませておくための処理である。 ④ つまり、続けてハッシュオブ、ジェクトに iCMJ ー⑤ のデータを格納し、そこからキーで検索して、 ⑥ 目的のデータを取り出す処理を行うのだが、ハ e n d ; setAE; ッシュオブrジェクトはデータステップの処理 ー⑦ hcm.findO; (PDV:プログラムデータベクトル)と独立してい ③ るため、先に何らかの方法で変数の初期化を済 run, ませておかないと、データステップの途中で突 如、読み込んでいない変数が指定されることに よりエラーが発生してしまう。 ②について、ハッシュオブジェクトの作成は lステップで l度のみ行えばよいため、 N= 1の条件をつけ ている。この条件がないとデータセット i A E J のオブザベーションを読み込むたびに、ハッシュオブ、ジェク トを無駄に再作成してしまい、処理時間が遅くなる。 e c l a r eステートメントの後に h a s hと続け、さらに続けて ③はハッシュオブ、ジェクトの宣言部分である。 d 作成するハッシュにつける任意の名前を指定する。ここでは i h c m J という名前でハッシュオブ、ジェクトを 定義する。ハッシュオブジェクト名の後の括弧で、格納する変数の抽出先のデータセットを指定できる。デ ータセット名や変数名は全てシングルコーテーションで括る等、通常の SASデータステップと記述法が異な ることに注意が必要である。 ④から⑥にかけてはメソッドと呼ばれる処理を記述している。ハッシュオブ、ジェクトは通常の SASの処理 とは完全に区別されているため、 SASの通常のステートメントでは一切干渉することができない。数種類の メソッドという決められたコマンド以外では、作成することも、そこからデータを取り出すこともできない。 メソッドに共通の書き方として、まずハッシュオブジェクト名にピリオドを加えて記載して、どのオブジ ェクトに対してのメソッドであるかを明らかにする。その後にメソッド名を続け、さらに括弧内に引数とな る値を記載する。 lメソッドの終わりはセミコロンで表現される。 ④は d e f i n e k e yメソッドで、ハッシュオブPジェクトのキーを指定する。ハッシュオブジェクトは必ず、キー とデータという構造で定義されるため必須で、ある。なお、後にキーが重複している場合の処理も紹介するが、 e f i n e k e yメソッドはエラーとなる。 何も特別な指定をしていない限り、キーが重複していると d 例では AEの USUBJIDと CMIDを使って、 CM内の同ーの USUBJID、CMIDを探して取得したいため、キ ーは USUBJIDと CMIDになる。 ⑤は d e f i n e d a t aメソッドで、ハッシュオブ、ジェクトのデータを指定する。キーに紐づく内容の部分で、今回 は薬剤名を取得したいため、 CMTERMを指定している。 e i f i n e d o n eメソッドで、これによってハッシュオブジェクトの作成が完了する。 ⑥は d ⑦は通常のデータステップで、 s e tステートメントで AEのデータの読み込みが開始される。 3 ‑ 6 8 5 ‑

696.

③は白 ndメソッドで、これによってハッシュオブジェクトでに設定されたキー (USUBJID、 CMID)と、現在 の PDV上の同変数をマッチングして、一致した場合はデータ (CMTERM) に設定されている変数が付与さ れる。 先 に C Mの変数定義情報(ディスクリプタ部)が N =0で読み込みされているため、変数の格納順序が 異なるが、結果は MERGEや SQLのものと同一である。 注目点としては、 SQLと同様に事前のソートを必要 としていない点である。 u S U 8 J I DI C M I D I CMTERM T ‑ O O1 2解 熱 錨 痛 剤 T ‑ O O l 3胃腸藁 T ‑ 0 0 2 2感冒襲 T ‑ 0 0 2 3解熱鎮痛剤 (3) リターンコード 先述のコード ( c o d e3 )でハッシュオブ、ジェクトを使ってマッチング を完了できたが、それは C Mに白ndメソッドで検索される USUBJID と CMIDが 全て存在していたからである。例えば CMから CMID=1のデータを削除し、 C Mというデータ セットを作成し、それを用いて再度同じコードを実行する。 旧T E :デー 3セット明O R K . ̲ C Mから 4オゴザ.ページョン喧読み込みました。 R R O R :K e yn o tf o u n d . R R O R :K e yn o tf o u n d . 日T E : 工う」が発生したため、このステッブの処理在中止しました。 T E :デー卓也ッ卜 W O 叫. A Eから 8オブザベーションを読み込みました。 A R N I N G :テ"‑3セ 7 卜W O R K .附 HA EI ま来完戚です。このステッ=材、 自オブザベ}ション、 5変数で停止しました。 T E :D A T Aステ}卜メント処理てム計処王両閉): 日 処理時間 0 . 3 2秒 C P U縄 問 自. 0 4秒 。 ログに fERROR:keyn o lf o u n d . J というメッセージが現れ、データセットの作成が失敗している。これは AEの T ‑ 0 0 1の CMID=1 と T・002の CMID=1について、自ndメソッドでハッシュオブ ジェクトからデータを F 取得しようとしたところ、該当するキー情報のデータが存在せず、メソッドが失敗したためである。 このようにたとえキーを見つけられず、メソッドが失敗した場合でも、実行を最後まで完了したい場合は メソッドの先頭に f r c ニ」というコードをつける。民は r e t u r n c o d eの省略形である。 │∞出̲ 4 :臥 SH(リターンコードあり) I d a t aHASHAE; I ['JQI~: タ、 セ ッ 明 K .C M から 4 オ 計 オ 8 処 ブ オ l 理 ワ ザ ブ ベ 時 ベ ザ 間 」 ベ } シ ) : シ } ョ シ ョ ン ン ョ を を ン 読 読 、 み み 込 8 込 み 変 み 散 ま ま で し し た すた 。 。 T E : プーせ ' )ト ~ 日 W O R . A E から i f一 N‑=0 42 与h i f N =1t h e nd o ; I f ' j O T E :D A T Aステートメン卜処理(ロ d e c l a r ehashhcm(datase t : ' ̲CM')・ 処理時罰 0 . 0 1秒 1 1 C P U時間 0 . 0 1秒 hcm.definekey('USUBJID', 'CMID・ ) ; hcm.definedata('CMTERM');USUBJIDI C附 D CMTEmnMID I A正T E R M I r c 1 6 0 0 3 8 h e x y l ‑ d e f i n e d o n e O ; T ‑ m 1 1 1不自民 l e n d ; setAE; rc=hcm且n d U ; r u n ; 下目。 1 2解熱錦繍剤 2頭 痛 0 0 1 1 1 4 I T ‑ 0 0 1 下0 0 2 0 0 2 1l ‑ ̲ . g ̲ . E ‑ T ‑ 0 0 2 T ‑ 0 0 2 2解熱i l i 痛剤 3胃腸藁 1胃腸襲 2感雪藁 3解熱鑓痛剤 3解熱錦繍胃l1) 3発 熱 4胃炎 1腸炎 2感冒 2骨折 4頭痛 下 日 日 0 1 6 0 0 3 8 リターンコードをつけたことで、実行しでもログにエラーがでないまま完了することができる。作成された データセットをみると、自ndメソッドが失敗する箇所の r cの値が 0以外の数字になっているのが確認できる。 cに数値コードとして受け取り、実行を完 このようにメソッドにリターンコードをつけることで、エラーを r 了することができる。エラーの内容によって r cに格納される値は変わる。 応する値である。エラーが発生しなければ戻り値は必ず0になる。 4 ‑ 6 8 6 ‑ r 1 6 0 0 3 8 Jは f k e yn o tf o u n d . J に対 o 。 0

697.

そして 5オブザベーション目をみると、 r cは0以外の値でCMTERMIこは意図していない値が格納されている。 直前の成功した f i n dメソッドの値を保持して、キーが見つからなかった際に、引き延ばしたいような場合はこ のままでよいが、今回の例では誤りとなってしまうので、リターンコードの値を利用してエラ一発生の際の 処理を付け足す。自ndメソッドとリターンコードによる処理は、 SCL関数を用いた処理、またはインデックス のついた変数と s e tステートメント +ke y=オプションでマッチングをする際の IORC を利用した処理に構造 が類似している。 Icode̲5:HASH(リ タ ー ン コ ー ド あ り エ ラ 一 時 処 理 あ り ) d a t aHASHAE; i f N =0t h e ns e t CM; i f N =1thend o ; M ' ) ; d e c l a r ehashh c m ( d a t a s e tア C hcm.definekey('USUBJID', ' C M I D ' ) ; hcm.definedata('CMTERM'); h c m . d e f i n e d o n e O ; e n d ; setAE; rc=hcm.findO; ifrc^=OthenCMTRM= " ; run, U S U 8 J I DI C M I D I CMTERM I A E I D I A E T E R MI T ‑ O O I 自R 1不 2解熱誠痛膏,] T ‑ O O I 2~~痛 3発 軌 T ‑ O O I 2解熟語痛買'] T ‑ 0 0 1 3胃腸藁 4 胃炎 T ‑ 0 0 2 1腕炎 ‑ 0 0 2 2感官襲 2怒菅 ー一一了一 トT 丁 目0 2 日 骨折 3解熱j富痛膏'] T ‑ 0 0 2 3解熱3 直痛宵'] 4 頭痛 r c 1 6 0 0 3 8 。 。 1 6 0 0 3 8 。 。 (4) addメソッド ハッシュオブジェクトにデータを格納する際にデータセットから読み込みだけでなく、メソッドで追加する ことも可能である。 Icode6:addメ ソ ッ ド 伊jとして、ある特定の事象名に該当するレコードにフラグ をたてる処理を考える。今回は「頭痛J または「骨折j と いう事象名を対象とする。 前述のc o d e3 ‑ 5ではノ¥ツ、ンュオブジェクトに格納するデー タがデータセットとして存在していたため、定義情報のセ ット・変数の初期化の処理を N =0の際に実行される s e tス テートメントにより行ったが、今回はデータセットから読 み込まないため、①で長さを定義し、④で初期化を行うこ とで同様の処理を実現している。 ②でp a i nという名前のハッシュオブrジェクトを作成してい る 。 何のオプションもつけずに作成する場合は空括弧となる。 │ dataHASH PAIN; lengthAETERM$ 4 .FLAG$1.:ー① i f N =1thend o ; d e c l a r ehashpainO; ② rc=pain.definekey('AETERM'); rc=pain.definedata('FLAG'); rc=pain.definedoneO; r c = p a i n . a d d ( k e y : '頭痛',d a t a : ' Y ' ) ; ③ r c = p a i n . a d d ( k e y : '骨折', d a t a : ' Y ' ) ; FLAG); ④ c a l lmissing(AETERM, e n d ; setAE; r c = p a i n . f i n d O ; i fr c八 =0thenFLAG='N'; dropr c ; run, 以下、 d e f i n e . d o n eまでは前述のコードと同様である。 ③及び次の行で、 d e f i n e . d o n eで作成が完了したハッシュ オブジェクト p a i n lこ対して、データを格納している。 addメソッドは、括弧内にkeyの場合はk e y : '値 d a t aの 場合はd a t a : '値'と記述する。 k旬 、 d a t a共に複数ある場合は、続けて記述する。 5 687‑ ー A E I D C M I D 日 日

698.

2 .ハッシュオプ、ジェクトの実行時間 (1)背景 ハッシュオブrジェクトを利用する最大のメリットは、プログラム実行時間の短縮である。 データセット同士を結合するために Mergeステートメントを利用する場合には、両データセットからデータ を読み込む際に、ハードディスクからメモリにオブザベーションを lオブザベーションずつ移動して処理し ていくため、読み込む量が多い(オブザベーション数が多い、全変数の合計サイズが大きし、)とそれだけ処 理の完了まで時間がかかる。 それに対してハッシュオブPジェクトを利用すると、ステップ実行中はメモリ上にデータを常駐させて処理を 行うため、読み込みの時間が著しく速い。ただし、メモリはハードディスクに比べて圧倒的に容量が小さい ため、巨大なデータをハツ、ンュオブジェクトとしてメモリに展開するには注意が必要で5あり、不可能な場合 もある。 一般的に、ハッシュオブジェクトが、実行時間短縮に対して効果的だとされているのは、巨大なデータセッ トに対して小さなデータセットを、共通するキーの値でマッチングするケースである。 本稿では、 Mergeステートメント及び SQL、ハツ、ンュオブジェクトによる実行時間を処理対象となるデータ セットのサイズを変更しながら比較した。ただし、以降の結果は使用するコンピュータのスペックや実行環 境に大きく依存するため、絶対的なものではなく、参考の範聞である。 ( 2 ) 使用するデータとプログラムについて │c 叫 ー7 :大きいデータセットを作るコード II c o d e ̲ 8 村 % l e t8 i z e = 1 0 ; d a t aBIG; doID=1t o& 8 i z e ; doRID=lt o1 0 0 ; a r r a ydummy(5)$ 1 0 0 . ; o u t p u t ; e n d ; e n d ; run, d a t aSMALL; doRID=100t o1by. 1 ; a r r a ydummy(5)$ 1 0 0 . ; FLAG='Y'; o u t p u t ; e n d ; run, c o d e 7で作成されるデータセット fBIGJ と code8で作成される fSMALLJ を RIDとしづ共通の変数で 結合させる。 code 7の先頭で、 % l e tにより値を与えているマクロ変数 S l z eの値を増やしていくことで、 BIG のオブザベーション数を増やすことができる。また配列で文字変数を作成しているのはデータセットのサイ : i 一 一 一 ‑A H QU A H ‑唱 l m 札 附QL I 一 p r o c8 0 r tdata=BIG out=BIG 1 ; byRID; run, p r o c8 0 r tdata=SMALL out=SMALL 1 ; byRID; run, d a t aMERGEDS; mergeBIG̲l( in = i n a ) SMALL 1 ; byRID; i f i n a ; run, ‑‑ρo iu l c 尚 一 側 目g e I ‑ ‑e d ズを増やすためである。上記のデータセットを以下の 3種類の方法でそれぞれ結合する。 p r o c8 q ln o p r i n t ; d a t aHASH DS; c r e a t et a b l eSQL̲DSa 8 i f N =0then8 e tSMALL; i f N =1thend o ; FLAG 8 e l e c tBIGぺ fromBIGl e f to u t e rj o i nSMALL d e c l a r eha8hH S ( d a t a 8 e t : ' S 乱(ALL'); onBIG.RID=SMALL.RID; r c = H S . d e f i n e k e y ( ' R I D ' ) ; ; qU1t r c = H S . d e f i n e d a t a ( ' F L A G ' ) ; r c ニH S . d e f i n e d o n e O ; e n d ; 8 e tBIG; r c = H S . f i n d O ; i frc^=OthenFLAG="; run, 6 ‑ 6 8 8・

699.

時間の計測については code9・1 1の先頭と末尾で d a t e t i m e関数をつかって、日時データをマクロ変数に格納 し 2時点で格納した値の差をもって処理時間(秒)とした。 code̲9の Mergeについてはソートが処理に必ず必 o r tプロ、ンジャの実行も含めて lつの処理とみなした。 要になることから、 s ( 3 ) 検証結果 匂 ,, ,", ,", O o o JO o o oJ J J a s 今回の設定においては、 l万オブザベーションあたりまでは 3つの処理とも差はほとんどないが、 1 0万で SQLの処理速度がやや劣った。その後 1 0 0万から 500万まで計測したところ、 Mergeと SQLの処理時間の増 加率に比べて、ハッシュオブジェクトが明らかに低いことがみてとれた。 500万オブザベーションにおいて、最も遅い SQLとハッシュの差は 400秒近くになった。 このことから、ある程度大きいと思われるサイズのデータセットに対して処理を行う場合は、あらかじめ ダミーデータで処理時間の目安をだしてから、実行時間とコードの可読性等から使用する方法を決定すべき であり、また一定のサイズを超えた場合ハッシュオブジェクトの処理効率がかなり良いことが示唆された。 3 . 臨床検査値と途中変更のある検査基準値のマッチング (1) 背景 多施設共同臨床試験で、各施設において臨床検査値の測定を行っている場合、取得された値を評価するため には、その施設の被験者の性別に対応した基準値を適用する必要がある。また試験期間中に基準値が改定さ れる場合もあるため、検査日と基準値の適応開始日を比較して、各検査日に対応した基準値を取得しなけれ ばならない。 マッチング処理のプログラミングとしての難易度はそれほど高くないが、臨床検査値のデータは大規模試験 或いは長期間にわたって追跡を行う試験の場合、数百万から場合によってはそれを遥かに超えるオブザベー ション数になりえる。データセットのサイズが大きくなると、データステップ、プロシジャステップの lつ lつにかかる時間が現実的に支障をきたすレベノレになる。 ハードを高性能なものにしたり、分散処理を行ったり、オプション等を工夫することで対応できる面もある が、最も簡単なのは、処理するステップ数を最小限にすることである。 7 ‑ 6 8 9・

700.

また、各被験者の臨床検査値データは巨大なものになるが、施設基準値のデータセットは如何に多施設共同 試験で頻繁に改定されたとしても、比較すれば極小といってよいサイズであるため、ハッシュオブジェクト を利用する上で非常に好条件である。 (2)使用するデータとプログラムについて 本稿で例とするデータセット r LBSSJ と r L B J を右に 示す。 LBSSは施設ごと、項目ごと、また適用開始日ごと にオブザベーションが発生する、例えば SITE rA施設」 の PARAM rRBCJ は 2 0 1 3 / 1 1 1から 2 0 1 3 / 0 1 / 3 1まで LOW( 基準値下限) r 3 7 0 J、H I (基準値上限) r 4 8 0 J であり、 20日/ 0 2 / 0 1からは LOW r 3 7 5 J、HI r 4 8 5 J となる。 例えば、ハッシュを使用せずにマッチングを行う場合 LBSSを SITE、p ,ばA M 、を byステートメントに指定して STDT、UNI、LOW、HIそれぞれを t r a n s p o s eプロシジャで 転置し、それを元データとマージして、配列で LBDTと ‑D N 一一 色 斑 一m 訂 E 盟師団 A 印刷 mm ぽ 一 出一山口 sπE I USUBJIDI LBDT I PARAMI AVAL A施設 T ‑ 0 0 1 2 0 1 3 / 日1 1 1 5 RBC 3 8 0 ‑ 0 0 1 2 0 1 3 /日1 1 1 5 WBC A施設 T 4 . 2 ‑ 0 0 1 2 0 1 3 / 0 2 / 1 5 RBC A施 設 T 3 7 2 A施設 T ‑ 0 0 1 2 0 1 3 / 0 2 / 1 5 WBC 3 4 5 0 能設 T ‑目 日1 2 0 1 3 / 0 3 / 1 5 RBC A 3 7 3 A J i I ! 誤 T ‑ 0 0 1 2 0 1 3 / 閃1 1 5 WBC 3 4 5 0 B ) 車設 T ‑ 0 0 2 2 0 1 3 / 日1 1 1 5 RBC 5 0 0 漉該 T ‑ 0 0 2 2 0 1 3 / 0 1 1 1 5 WBC B ‑ 0 0 2 2 0 1 3 / 日2 / 1 5 RBC B施設 T ‑ 0 0 2 2 0 1 3 / 日2 / 1 5WBC E施設 T B施 設 丁 目 0 2 2 0 1 3 / 0 3 / 1 5 RBC B胞 E 貴 T ‑ 0 0 2 2 0 1 3 / 0 3 ν 1 5 WBC 20218 3 柏崎4 幻 1 d a t aHASHPATTERN 1 (rename=(STDT̲ =STDTUNI ー= UNIHI 一=HILOW̲=LOW)); LB( 各被験者の検査値データ) I d e c l a r ehashh l b s s ( o r d e r e d :' Y ' ) ;←① h l b s s . d e f i n e k e y ( ' S I T E ', 'PARAM', 'COUNTER'); ー② h l b s s . d e f i n e d a t a ( ' S T D T ', 'UN , ' l'LOWγHl');ー③ h l b s s . d e f i n e d o n e Q ; code̲13:HASH ̲P ATTERN2 procs o r tdata=LBSS; bySITEPARAMdescendingSTDT; run, d ou n t i I (ENDLBSS); ④ s e tLBSSend=ENDLBSS; ⑤ bySITEP 組 AMSTDT; ⑥ i ffirst.PARAMt h e nCOUNTER=O; ー⑦ COUNTER+l; ー⑧ r c = h l b s s . a d d Q ;ー⑨ e n d ; dataHASHPATTERN2 ; i f N =0t h e nd o ; s e tLBSS; e n d ; i f N =1t h e nd o ; m u l t i d a t a :' Y ' ) ;ー ① d e c l a r ehashh ̲ l b s s ( d a t a s e t : ' L B S S ', ' P A R A M ' ) ; ② h ̲ l b s s . d e f i n e k e y ( ' S I T E ', h ̲ l b s s . d e f i n e d a t a ( ' S T D T ', 'UN , ' l'LOW', ' Hl ' ) ; h ̲ l b s s . d e f i n e d o n e Q ; e n d ; (ENDLB); ⑩ d ou n t iI s e tLBend=ENDLB; COUNTER=l; ⑪ r c = h l b s s . f i n d Q ;一⑫ d ow h i l e ( r c = O ) ; ⑬ i fLBDT>=STDTt h e nd o ; STDT̲ =STDT; ー⑬ UNI=UNI; LOW=LOW; HI= H I ; e n d ; +l;⑬ COUNTER r c = h l b s s . f i n d Q ; ⑫ e n d ; o u t p u t ; ー⑬ e n d ; d ou n t i l ( E N D L B ) ; s e tLBend=日NDLB; , UNI, LOW , HI ) ; c a l lmissing(STDT r c = h ̲ l b s s . f i n d Q ; ⑬ d r o pSTDTUNILOWHICOUNTER; f o r m a tSTDT̲yymmddslO.; run, d owhi I e(STDT>LBDT); ③ r c = h ̲ l b s s . f i n d ̲ n e x t Q ; ④ e n d ; o u t p u t ; e n d ; f o r m a tSTDTyymmddslO.; run, 8 ‑ 6 9 0・

701.
[beta]
STDT を JI慎番に比較して、 LBDT~STDT{i} の場合に UNI 、 LOW、 HI を書き換えていくような処理が想定さ

れる。その場合、 LBSSと LBの結合が必要なため、 LBSSだけでなく LBに対してのソート処理が必須とな
る
。
それに対して、ハッシュオブジェクトを利用したコードがどのようになるかを 2種類のパターン
(code̲12:HASH̲PATTERN1、c
o
d
e
̲13:HASH
̲PATTERN2)で提示したので以下に詳細を解説する。
h
1
b
s
s
J を定義して
まず code12:HASHPATTERN1 の処理について説明する。①でハッシュオブジェクト r
o
r
d
e
r
e
d
:'
Y
'
)とすることで、作成されるハッシュオブジェクト内部のデータがキーでソートされた状態
いるが (

で格納される。②で SITEPARAMCOUNTERと 3つのキーを定義しているので、この 3つの値によって③で
指定されている変数が昇順にソートされて格納される。ここで COUNTERという LBSSにない変数を指定し
ている点については後述する。
e
tステートメントの end=
で指定されている変数 rENDLBSSJ は LBSSの最終オブ
④、⑤の部分について s

ザベーションの読み込みで値が rlJとなる。それを dou
n
t
i
1で指定することで LBSSの全オブザベーション
が処理されるまでループが発生する。
⑥、⑦、⑧の部分で基準値の改定のあった検査項目については、改定の回数分、変数 COUNTERが+1され
る。一度も改定されていない検査項目については COUNTERの値は lとなる。
そして、⑨で元の LBSSに基準値改定 IDとなる COUNTERが追加されたオブザベーションが、 addメソッ
ドによりハッシュオブジェクト r
h
1
b
s
s
J に追加されていく。
以降⑩から始まる dou
n
t
i
1ループは LBをセットし、それに対して対応する基準値をマッチングしていく部
分になる。⑪でまず COUNTERに初期値 lを与えて⑫の白 ndメソッドで SITEと P
品 A Mと COUNTERをキ
ーとしてマッチングを行う。今回は、コードの簡素化のため、検査データがあるのに対応する施設基準値が
まだ 1つも登録されていないというケースは除外して想定しているので、ここで必ず初回の施設基準値が取

4
専できる。
h
i
l
eループは r
c
=Oの間繰り返される。 r
c
=
Oとはメソッドが成功している状態である。それは今回
⑬の dow

のコードでは f
i
n
dメソッドにかかっており、つまり SITEと P
組 A Mと COUNTERでマッチングが成功して
いる限りループするということである。⑪で COUNTERに lずつ加えているので、基準値が改定している数
i
n
dメソッドを実行
まで漏れなくループが実行されるということである。最終的には+1により l回分過剰に f

しているので最終のメソッドは必ずエラーになるが、その場合正常に f
i
n
dされた値が保持され、引き延ばし
が起きるため、問題とならない。
⑬で、無事マッチングできた場合に、それを適応するかどうかについて検査日と施設基準値の適応開始臼に
ついて比較し、検査日>=適応開始日であれば、以下ハッシュオブジェクトのデータ部分を割り当てステート
メントで採用する。もし、採用された適応開始日よりもさらに新しい日付で、かっ検査日>=適応開始日を満
たすものがあれば、⑫で COUNTERに+1 した後、再度⑬で f
i
n
dメソッドをかけているので、そこで更新され
u
t
p
u
tされ、処理が完了となる。
る。⑬でマッチングが完了した全オブザベーションが o

次に c
o
d
e 13:HASHPATTERN2の処理について説明する。前提条件として、このコードが正常に実行される
h
a
s
e
2以降の環境が必要とする。
ためには SAS9.2P

叩 A Md
e
s
c
e
n
d
i
n
gSTDTでソートし、各施設各項目の適用開始日が新ししサl
慣にデータが
まず LBSSを SITEPl
くるようにしている。
①でハッシュオブジェクト h
̲
l
b
鉛を作成し d
a
凶 e
t
;で LBSSを指定している。②の部分を先にみると d
e
f
i
n
e
k
e
y
で指定されているのは SITEとあ叩A Mだけとなっており、適用開始日が含まれていないため一意にならない

96
9
1
702.

組み合わせとなっている。そこで①で m u l t i d a t a : ' Y 'としている。本来ノ、ッシュオブジェクト内のキーは一意 にならなければならないが m u l t i d a t a : 'Y,とすることで重複を許したハッシュオブジェクトを作成することが できる。 SAS9 . 3 言語リファレンス:解説編の第 22章 rDATAステップコンポーネントオブ、ジェクトの使用 JP 4 5 3 .非 一意キーとデータのぺア注釈では、 r SAS9 . 2P h a s e2 以降では、複数データ項目リスト内の項目は、ユーザー が各項目を挿入した順番で維持されます。」と記載されているため、本コードにおいては直前のソート順にデ ータが格納されているはずである。 以下は c o d e1 2から COUNTER変数の処理を抜いたような形になっているが④で白 n dn e x tメソッドを使用 しているのが特徴で、これはハッシュオブジェクト内の次の値を参照するメソッドである③のループ条件と 合わせることにより、 c o d e1 2 とは逆に、最新の適用開始日から遡って値を更新する処理となっている。 c o d e1 2、c o d e1 3の結果は、変数の並びI I 頂については制御するステートメントを入れていないため並びが違 うが、内容は同じとなる。 RBC WBC RBC WBC RBC WBC │国U目 ! Q ̲ J 1 6 0 0 3 8T ‑日0 1 1 6 0 0 3 8T ‑ O O l 1 & 0 0 3 BT ‑ O O l 1 6 0 0 3 BT ‑日 1 1 6 0 0 3 8T ‑ O O I 1 6 0 0 3自 T ‑ O O l 1 6 0 0 3 8T ‑日0 2 1 6 0 0 3 8T ‑ Q u 2 1 6 0 0 3 8T ‑ 0 0 2 1 6 0 0 3 8T ‑ 0 0 2 1 6 0 0 3 8T ‑ 0 0 2 1 6 0 0 3 8T ‑ 0 0 2 ! E D RBC WBC RBC WBC RBC WBC 果 LBDT 2 0 1 3 / 01/1 5 2 0 1 3 / 01/1 5 2 0 1 3 1 日2 / 1 5 2 0 1 3 / 0 2 / 1 5 2 0 1 3 / 0 3 / 1 5 2 0 1 3 / 0 3 / 1 5 2 0 1 3 / 01/1 5 2 0 1 3 1 01/1 5 2 0 1 3 / 0 2 / 1 5 2 0 1 3 1 0 2 / 1 5 2 0 1 3 / 0 3 / 1 5 2 0 1 3 / 0 3 / 1 5 AVAL 3 8 0 4 2 3 7 2 3 4 5 0 3 7 3 3 4 5 0 5 0 0 3 . 2 3 8 0 42 3 7 1 1 . 8 STDT U N I 2 0 1 3 /日1 / 0 1 x1 0 " 3 1μL 2 0 1 3 / 0 1 / 0 1 x10~3/μL 2 0 1 3 / 0 2 / 0 1 x10~3/μL 2 0 1 3 / 0 2 / 0 1 xjμt 2 0 1 3 / 0 2 1 0 1 x1 0 ‑ 3 /μL 2 0 1 3 / 0 3 / 0 1 x/μL 2 0 1 3 / 01/0 1 x1 0 " " 3 /μL 2 0 1 3 / 0 1 / 自1x1 0 " ' 3 1μL 2 0 1 3 / 日1 / 0 1 x1 03/μL 2 0 1 3 / 0 1 / 0 1 xW3/μL 2 0 1 3 / 日1 / 0 1 x1 0"3/μL 2 0 1 3 / 0 1 / 0 1 XW3/I 'L LOW H I 3 7 0 3 . 5 3 7 5 3 5 0 0 3 7 5 3 4 0 0 3 6 0 3 . 6 3 6 0 3 . 6 3 6 0 3 . 6 四 4 8 4 8 5 1 9 0 0 4 8 A N I ~ x10"'31U μL STDT 2 日1 3 / 日1/0 1 RBC 2 0 1 3 / 0 1 / 0 1 W8 C 2 0 1 3 / 0 2 / 0 1 RBC 2 0 1 3 / 0 2 / 0 1¥ l l f B C 2 自1 3 / 0 2 / 0 1 RBC 2 0 1 3 1 回/ 0 1 柚旭C 2 0 1 3 / 0 1 1 日1R BC 2 1 1 1 3 1 日1 / 0 1 WBC 2 0 1 3 / 01/0 1 R8C 目1 3 /自1 1日1WBC 2 0 1 3 /日1 / 0 1 RBC 2 0 1 3 /目1 / 0 1 W8C x1 0 ' " ' 3 1μL 0 " ' 3 1μL x1 x/μL 0 " ' 3 1μL x1 x/μL 3/μL x1 0 " x10~31μL 03 1μL x1 x1O~31μL x1 03/μL ‑ a /μL x1 0 A A LOW H I 3 7 0 3 . 5 3 7 5 3 5日 3 7 5 3 4 0 0 3 6 0 3 . 6 3 6 0 3 . 6 3 6 0 3 6 │国 UBJID 4 8 0T ‑ O O l 9T ‑ O O l 4 8 5T ‑ O O l 9 0 0 0T ‑ O O l 4 8 5T ‑ O O l 9 1 5 0 0T ‑ O O l 4 8 5T ‑ 0 0 2 9 . 2T ‑ 0 0 2 4 8 5T ‑ 0 0 2 9 . 2T ‑ 0 0 2 4 8 5T ‑ 0 0 2 日2T ‑ 0 0 2 I l8DT 2 日1 3 / 0 1 1 1 5 2 0 1 3 / 0 1 / 1 5 2 0 1 3 / 0 2 / 1 5 2 0 1 3 / 0 2 / 1 5 2 0 1 3 /凹 / 1 5 2 0 1 3 / 0 3 / 1 5 2 0 1 3 / 0 1 / 1 5 2 0 1 3 1日1 / 1 5 2 0 1 3 / 0 2 / 1 5 2 0 1 3 1 日2 1 1 5 2 0 1 3 / 0 3 / 1 5 2 0 1 3 / 凹/ 1 5 AVAL 3 8 0 42 3 7 2 3 4 5 0 3 7 3 3 4 5 0 5 0 0 3 . ' 3 8 0 4 . 2 3 7 1 1 . 8 4 .ハッシュ反復子オブジェクトでコードをテキストマイニングする (1)背景 巨大なデータセットと小さいデータセットをマッチングするのに効率がいいハッシュの性質は、長大なテキ ストデータから、特定のパターンを抽出して何らかの解析を行うような、いわゆるテキストマイニング処理 に適しているため、利用されることが多い。 臨床試験の統計解析結果は通常、 lつの解析出力結果ごとに、それを作成する 1つの SASプログラムがあり、 その仕様は解析プログラム仕様書等のドキュメントで規定されている。 1つ lつの SASプログラムファイルの中でどういったプロシジャが使われ、どういった関数が使用されてい るかを抽出し、それがプログラム仕様に準じているかを簡単にチェックすることができるとすれば、解析プ ログラムの品質をチェックする上で有用だといえる。 そこで今回は特定のフォルダの中にある複数の SASプログラムファイルから、プロシジャまたは SAS関数 が使用されている箇所を抜き出し、集計するプログラムについて紹介する。 1 0 ‑ 6 9 2 ‑

703.
[beta]
(2)使用するデータとプログラムについて
右図のように一つのフォルダにまとまって解析に仕様される SASプ
ログラムファイルが保存されているとする。

│

均一描踊描踊山畑出向

MMM

旺 1‑ap&‑ALE‑LL

間四四国明班

盟国国国国立一立

mmm

ヘ
"

u‑T‑ ほ 正 ほ 印

,

明一

・
=

刷一間前閉山瑚

%
I
e
tp
l
a
c
e=c:¥解析 Program;
f
i
l
e
n
a
m
eFOLDERp
i
p
e"
d
i
r1
b&
p
l
a
c
e
.
"
; ー①
d
a
t
aFlLELIST;
l
e
n
g
t
hFNAME$200FPATH$
1
0
0
0
;
i
n
f
i
l
eFOLDERdlm 0
9
'
x
;
岨t
FNAME;
i
n
p
"
.
s
a
s
"
)>α
ifindex(FNAME,
FPATH=t
r
i
m
(
!
e
f
t
(
"
&
p
l
a
c
e
.勺)II IIt
r
i
m{
l
e
仇(
FNAME));
run
f
i
l
e
n
a
m
eINPdummy; ②

団団団唱団閣団自由四四国

フォルダ rc
;,¥解析ProgramJ の中身
一一団一団団団自圃圃圃団

∞ 札1
4
:テキスト読み込み部分

データセット rCODEJ の一部分

ル名とパスを取得して、③以降で取得した全てのファイルにつ

一即断府間一山町一山町一山町一山町一山師団一山町一山町一山一円

d
a
t
aCODE;
l
e
n
g
t
hLINE$
1
0
0
0
.
;
s
e
tFILELIST;
i
n
f
I
l
elNP
filevar=FPATHend=FLGd
l
m
=
'
0
9
'
Xm
i
s
s
o
v
e
rI
r
e
c
l=1
0
0
0
;
I
(
F
L
G
)
;
d
ou
n
t
i
i
n
p
u
tLINE$
;
o
u
t
p
u
t
;
e
n
d
;
run,
①から②までで指定のフォルダ内の拡張子が r
.
s
a
s
J のファイ

一岬蝿抽楢崎町醐間四醐蝿醐血醐血糊四蝿蝿踊醐

町

③

いて 1行を 1オブザベーションとし
て読み込んでいる。結果は右上の
データセットのようになる。
そこで抽出されたデータセットから関

c
o
d
e
:
.
.
.
1
5
:
ハッシュ反復子オプヅ耳クトと正規表現による抽出
p
r
o
c8
0
凶 d
ata=SASHELP.VFUNCー①
out=FUNC̲DIC(keep=FNCNAME)n
o
d
u
p
k
e
y
; ‑②
whereFNCNAME^=";byFNCNAME;
r
u
n
; ③

数とプロシジャが使用されている部分を
5のプログラム
抽出するのが右の code 1

となる。
まず関数をどのように抽出するかにつ
いて考える。①から③の部分でディクシ
ョナリテーブルビューのうち fVFUNCJ
を指定して、関数名を取得している。
VFUNCにはその SAS環境で使用可能

な関数の情報が全て格納されている。
あとは取得した関数リストとデータ
をどうやって照合するかである。
本稿ではパターンマッチングの方法と
e
r
l正規表
して関数、プロシジャともに P

現を使用している。(⑩⑪@⑭⑮)
P
e
r
l正規表現はテキストのパターンを規

則に従って記号化し、それを SASの正規
表現用の関数に与えてテキストの検索や

d
a
t
aFUNCTION(keep=FNCNAMELINEFNAME)
PROCEDUR(keep=PRONAMELINEFNAME);
i
f̲N̲
=0t
h
e
nd
o
;
s
e
tFUNC̲DIC;
e
n
d
;
FUNC̲DIC',
o
r
d
e
r
e
d
:
ヤ);ー④
d
e
c
l
a
r
ehashFHUSH(data8et:・
d
e
c
l
a
r
eh
i
t
e
rFHITER(
・
FHUSH'); ー⑤
FHUSH.definekey('FNCNAME'); ー⑥
FHUSH.definedata('FNCNAME'); ー⑦
FHUSH.definedoneO;
d
ou
n
t
i
l
(
E
N
D
L
I
N
E
)
;
s
e
tCODEend=ENDLINE;
町=
FHITER
.f
i
r
s
t
O
; ー⑧
d
ou
n
t
i
l
(
四);ー⑨
p
r
x
l=co
m
p
r
e
s
s
(
'm
1
¥W IIlowcase(FNCNAME)II
事例; ー⑩
i
fp
r
x
m
a
t
c
h
(
p
r
x
l,
l
o
w
c
a
s
e
仏I
NE))>Othen0
岨t
p
u
tFUNCTION;⑪
r
c
=FHITER.nextO; ー⑫
e
n
d
;
佐
p
r
却
x
p町
a
r
問s
舘e
(
"
"
s
/
/
p
r
o
c(
庁
月
?
)
(1
;
)
.
匂
*
/
事ν
1
1
"
引
p
r
x
2=戸
pos=prxmat
旬c
h
(
句
p
r
宜
x
2,
l
o
w
c
a
s
e
(
L
I
N
E
)
)
; 一⑭
i
fP
O
S
>
Ot
h
e
nd
o
;
PRONAME=prxposn(prx2,
1
,
l
o
w
c
a
s
e
(
L
I
N
E
)
)
; 一⑬
o
u
t
p
u
tPROCEDUR;
e
n
d
;
e
n
d
;
8
t
O
p
;
r
u
n
;
可

、

11

‑
6
9
3・

E

704.
[beta]
置換を行うものである。
SASにおける P
e
r
l正規表現利用の詳細については SASのヘルプ等を参照していただきたい。ただし、 l点

正規表現で大文字小文字どちらでも検索にかける /
iを使用せずに l
o
w
c
a
s
e関数を使用しているのは、速度の問
iパターンよりも相当に処理が速いためである。
題として /

さて、関数情報のみを④でハッシュオブジェクト FHUSHに格納し、プロシジャ情報についてはハッシュオ
ブジェクトを作成していないのは、関数は入れ子構造をとることができ、 l つの行に複数回出現する可能性
があるため、 1行ごとに全関数リストとマッチングする必要があるが、プロシジャは入れ子構造をとらず、
一般的なコーディング規則において l行に複数回出現することはないからである。
そのためプロシジャはハッシュオブジェクトとは関係せずに通常のループの中で⑬の正規表現で、 procの後
に出現するワードとして抽出してデータセット rpROCEDURJ に出力している。
ハッシュオブ、ジェクト FHUSH に格納されている関数リストとデータをマッチングする上で、通常の Find
メソッドは使用することができない。マッチングするキー情報以外の文字が混合しているためである。その
ためハッシュオブ、ジェクトのままでは今回の処理にはうまく適用できない。
そこでハッシュオブ、ジェクトをさらにハッシュ反復子オブジェクトという構造の中に格納する。それが⑤の
部分である。 d
e
c
l
a
r
eh
i
t
e
rハッシュ反復子オブ ジェクト名( ハッシュオブ、ジェクト名');で作成することができ
e
y
‑
d
a
t
aに依存し
る。ハッシュ反復子オブジェクトは、ハッシュオブジェクトを内包した構造体で、通常の k

ない処理を行うことができる。
具体的には⑧の自 r
s
tメソッドと⑫の n
e
x
tメソッドがあげられる。これはキーマッチングではなく、単純に
ハッシュ反復子オブジェクト内の先頭をみる処理と、その次をみていく処理である。ここでのリターンコー
ドは単純にオブ、ジェクト内に参照データが存在するかどうかであるため、⑨のループ終了条件は、オブジェ
クト内の全てのデータを参照することと同義になる。すなわち、あたかも ARRAY配列を横に順次参照する
処理を縦に置き換えたような状態になる。
そして⑩でハッシュ反復子内のデー夕、すなわち関数リストに括弧ヤを加えた正規表現パターンでマッチし
たら OUTPUTするとしたことによって、関数がどれだけ入れ子になっていても全てデータとして起こすこと
が可能となる。
{抽出された関数名と使用コ}ド行

│抽出されたプロシ、ジヤ名と使用コード行
FNAME

,
.
.
旬"

F
ねU
R
E
̲
l
s
a
s
F
I
G
U
R
E¥
副S
F
ぬU
REI
S
I
I
S
F
ねU
R
E
̲
'
SdS
F
沿U
REl
.
;
a
$
FDUREI
SdS

附 e
r
eSL白 J
I
DゴRCC‑ZIGOfand

OOl̲11n
o
t
nt2Ol1106/04
'
.'
2
01
1
/
0山 内
i
fIRGDTC
=
"t
h凹

t
田 t

C0L
̲
11
=
田 町 時 田 〈 ∞u
l
l
r
(
'!
U
R
s

t
・
州
司p
l
a
t
e

L

四

,
U'
・泊町

、
割

I
r
l
e
i
e
s
t

sas
L
I
S
T2.
l
I
S
T
̲
2品 S

V
l
S
πNO̲=kscan(
p
ut
(
V
I
S
汀N
O.GNV. L
I
S
T
̲
3
s
a
s
S
J
I
KI
̲
=
kscM
l
(
p
ut(SJIKtGNM).2:,
'
)
: l
l
Sτ3sas
ks日 n(put(KOUHAN.GN ll
ST̲
3sas
KOUHAN=
f
iDγz仲Ien
l
l
ST3sas
D
T
̲
=
凹 t
(
r
o
u
nd
(DT
,
O,
O
,8
)
1.
2
)
:
c
d
l
l$)1叩u
t
x
(
'
o
b
s
',
̲
N
)
;
lIST).
sas
V
I
S汀NO=
k
s
c
a
n恥t{
VJSITNO.GNV l
I
ST̲4
sas
脹絡会"'"齢(凹そ(lNG
,
GNF,)2
:
.
'
)
l
l
SThdS
回目 的 m凹 t
x
(
'
o
b
s
',
̲
N
)
:
L
l
ST̲4sdS
sas
SEX̲=ksca
n
(p
u
t
(
S
E
X
H
S
E
X
)
.
2
.
'
'
}
.
UST̲4.
V
I
S
π附 ̲
=
k
s
c
副'"制帽汀NO.GNV L
1
ST̲5sdS
c
a
l
lsym
似 吋 出s
'
.
̲
N
)
.
L
l
ST̲5sdS
1
* 1ii
n
(12
.
5
)t
h
e
n
L
l
ST6sas

銅l

劇

F陪 U田 " 邸

F
ねU
R
E
̲
2
sdS
由 U旺 2創 S

F
J
陥U
RE2
s
a
s
UST_1.sð~

制副削

L
I
S
Tl
SdS
l
l
STls~s
L
I
S
T
̲
2
s筋

L
l
ST̲2sdS
UST2
:
sdS

c
a
l
l町叫丸山(,o
b
s
',
̲
N
)
.
L5T̲2sas
J
I
KI
=kscan(put(VJSITNO.GN
V
)
.2
.
'.
1L
1
ST
̲2SdS
陥x(PARAM噛査目下>Ot
h
劇
団T
̲
'開

⁝
叫
削

F
沿U
RE2
剖 S
F
むU
RE2
SdS

UNπ'=kscd
r
l
(PARAM
,
2
:
0
'
)
:
PARAM=ksC
d
l
l
(PARA
,
M1:0

剛岬剛

FねU町 l .sa~

P
冊 NAME

抽出終了後は、たとえばプロシジャ名や関数名で集計することで、どういったものを多く使用しているかな
どの分析も可能となる。

1
2

胆

694‑

705.

5 . おわりに 本稿ではハッシュオブFジェクトの基本的な文法と、応用法を紹介することで今後、医薬品開発の分野でハッ シュオブジェク卜の利用が進むことを目的とした。今後、グローパルな開発による大規模臨床試験の実施数 増加や個別化医療のためにシミュレーションベースの探索的解析の普及、または副作用データベース等を活 用したリスク検出などを背景として、医薬品分野で扱うデータの量が劇的に増加していくことが考えられる。 そういった中で、 SASをどのように使っていくのかについて、選択できる方法をより多く知っていることは 大きなメリットをもたらすと思われる。 ハッシュオブ、ジェクトの文法、処理のアルゴリズムは SASと大きく異なる。しかし、異なるが故に組み合 わせることで、従来では考えられなかった柔軟、或いは高速な処理が可能となる。 今後もハッシュオブジェクトの利用について継続的に研究していきたい。 6 . 文献 1 )ArtC a r p e n t e r ( 2 01 2 ) .C a r p e n t e r ' sG u i d et oI n n o v a t i v eSAST e c h n i q u e s,SASI n s t i t u t e 2 )SAS9 . 3言語リファレンス:解説編 3 )SAS9 . 3 コンポーネントオブ ジェクト:リファレンス P 1 3 ‑ 6 9 5 ‑

706.
[beta]
守い

リ
ー

て
ィ

》‘"‘~r

"

,,

也 、

ト

喝晶

(
j'
i

、

(

ず

、'"

,柑 1

ι む~ :
]
1

¥
.~

1

ヂ
タ

,

認可,~品r.

士清明暗性(:'

、L

唱
"

縄手 J
ι之
品 '1'̲ ム

̲U

~:; ,町、 tv'11t'd貴 煎
.'.雫浄,~:' .
.

,
!.
.~ I¥ :

1
'

~. f,( :
:f~_'i ,-~,: '
.
.
.
>
1 ,作(: Yi!]f''̲'

,‑

! 1
"
", , " " 引 1

;
,
'
.

,
"
,

一
、
,

J

709.

SASユーザー総会論文集の無料一般公開のインパクト 高橋 行雄 BioStat 研究所(株) Impact of Open to the Public for Free of SAS User General Meeting Collected Papers Yukio Takahashi BioStat Research Co.,Ltd. 要旨 多くの学会紙に掲載された論文が,独立行政法人科学技術振興機構 (JST)が提供する「科学 技術情報発信・流通総合システム」(J-STAGE)を通じて無料でダウンローできるようになりつつある.SAS ユーザー総会の論文集には査読付きではないが多くの貴重な論文が掲載されている.これらの論文を引 用したいと思っても論文集の現物が手元にない限り困難である. SAS プレミアムラウンジから発表時のス ライドなどが,ダウンロードできるようになってはいるが断片的である.そこで,2013 年の SAS ユーザー会の 世話人会で論文集の電子的な公開を提案したところ,J-STAGE 活用したらどうかとの提言もあったが,利 用資格の条件に該当しないこともあり,自前で対応することが了承された.SAS ユーザー総会は 1982 年に 始まり 2013 年で 32 回目であり,現物の収集については,世話人会のメンバーにお願いすることになった. 公開に際し,作業量を勘案して論文ごとの対応ではなく 1 冊の論文集まるごとの対応とした.試験的に 1982 年~1989 年までの 8 年分を SAS ユーザー会のトップページに Excel 化した著者索引とともに掲載し たところ,外部検索エンジンから検索でき,該当する論文集の PDF もダウンロードできることも確認できた. さらに,PDF の品質を向上しつつ容量を削減するための試行を 2000 年から 2003 年の 4 年分について行 った.これらの経験を踏まえ, OCR による自動テキストの付与も加えても PDF に最適化を施すことにより, 2013 年の 567 ページの論文集で 16M バイト,1 ページ当たり 30K バイトに圧縮が実現できた.公開された Excel の目次および著者索引を元に,様々な SAS 論文集の活用法を紹介する. キーワード: SAS ユーザー総会,一般公開,SAS 論文集 1. はじめに 昨年 2013 年のSASユーザー総会のプログラム編成が 2013 年 6 月 18 日 WEB 公開された後,世話人 会にSASユーザー総会論文集の電子公開を提案した.これは,ユーザー会事務局との次のような対話が あったことによる. Q1. 高橋: SAS 関連の高橋これまでの論文(PDF)はどこからダウンロードできな いがどうなっているのかるのか.外部検索エンジンでも全く検索できない. A1. 事務局: プレミアムラウンジからダウンロードできると,担当が言っていました. 高橋のアクション: 2012 年「SAS プレミアム」で検索するとプレゼン PPT にたどり着くことができた. 2010 年のもようやく別途検索をし,当日の PPT にようやくたどり着けた.ところで,論文はどこだ! 発見できない. ‐699‐

710.

2009 年のも発見できない.もちろん以前のも.SASユーザー総会のホームページに,有料の複写サービス で論文を手に入れることが可能とのアナウンスが次のように掲示されている. SAS ユーザー総会 論文集の在庫販売は終了いたしました。 1997 年以降の論文については、こちらより有償にて入手する事が可能です。 独立行政法人 科学技術振興機構 TEL 0120-004-381 情報資料館 複写センター FAX 03-3979-2210 http://pr.jst.go.jp/outline/location.html なお、新刊につきましては、毎年のユーザー総会開催の際に購入申し込みを受け付け ます。申込み数のみの印刷となりますので、ご了承ください。 そこで,JST の WEB 上で「SASユーザ」で検査すると 996 件の文献が登録されていることか確認された. 著者名による絞込みも 図 1 に示すようにできるようになっていることが確認された.ただし,内容を確認す ることは WEB 上ではできないので,1 論文あたり約 1,000 円の複写サービスで現物を入手する必要がある. 筆者の文献数は,31 件となっていて,11 件分足りないが網羅的に収集され複写サービスが受けられるよう になっている. 図 1 (独)科学技術振興機構のWEB上にある「SASユーザ」関連文献 特定のテーマで文献を網羅的に収集しなければならなければ,有料の複写サービスであっても利 用できるようになっていることはうれしいことではある.しかしながら,多くの学術雑誌の文献が 無料で即時ダウンロードできるようになりつつある時代にあって,昔ながらの複写サービスとは, さみしい限りである.J-STAGE に収録されている多くの学会の論文は,WEB の検索エンジンで検索可 能となっているが,JST に登録されている SAS 関連の文献タイトルは,WEB の検索エンジンでは 参照されないことも不満足である. 2. 論文集の電子化と公開 SASユーザー総会論文の電子化は,すべて「自炊」によって行った.筆者の手元に 32 年分のうち 22 年 分があった.残りの 11 年分は世話人会のメンバー,筆者の知人などの協力をえて総て収集することができ た.そのうち 2007 年度は,論文集としてではなく,個別の論文が電子的 PDF で提供されたので,論文集と しての体裁がなかったので,「論文集」としての体裁に整えることにした.電子化に際し,ドキュメントの品質 とサイズのトレードオフを考慮し,事前に最適化をはかる必要があったが,ともかく試行することにした. ‐700‐

711.

最初の試行結果は,図 2 に示すようにSASユーザー総会のトップページに掲載され,Excel化した論 文のタイトル・著者名・年度・掲載ページから論文の検索ができるようになった. 図 2 SAS ユーザー会のWEBのトップページのダウンロード画面 掲載後の外部の検索エンジンによって著者名順のExcelのリストが検索され,それをダウンロードして, Excel の検索機能を使って年とページを入手できるようになった.ただし,品質は不十分であり,サイズも 1988 年以後はページ数も多く 100Mバイト近くなり不満足な結果であった.品質上の問題は「かぶり」であ った.WEB上の 1982 年論文集をダウンロードし 1-2 ページの「日本 SAS ユーザー会会則」拡大してみる と,文字の周りに多くの点状のかぶりが見いだされる.このかぶりは,大きな文字の場合には印刷すると気 になくなるが,SAS コード,結果の出力など小さな文字の場合には,判読不能となってしまう. 図 3 読み取り設定(グレイ,200 dpi)でのかぶり 1982 年の論文集は 84 ページで 11Mバイトなので,1 ページあたり 130 k バイトとなっている.ページ数 がこの程度ならば「良し」としたかったのであるが,1989 年の論文集は 50 ページ,全体で 99Mバイトとなり ダウンロードに躊躇するサイズとなってしまう.これは,スキャナー(Scan Snap S1500)での読み取り設定 を,グレーで 200 dpi としていたためであった. 図 4 読み取り設定を(白黒,600 dpi)でサイズの縮小 そこで白黒の 600 dpi とすることにより品質の向上とサイズの削減が図られことになり,SAS ユーザー総会 のトップページに図 4 に示すようなダウンロードページに示すようにサイズを 3 分の 1 にしつつ,品質 の向上が図られた. ‐701‐

712.

図 5 かぶりの消去(2003 年の目次のトップの拡大,白黒 600dpi)の確認 さらなる PDF のサイズの縮小を図るために Adobe Acrobat で最適化を実施すると 2003 年の論文 集で 37 M バイトであったのを 9 M バイトと 4 分の 1 に縮小しつつ 図 6 に示すように拡大すると 文字の輪郭にギザギザが生じているが,印刷した時にはほとんど判別がつかないことが確認された. また,印刷物では,文字が小さくて判読できにくいい場合でも,PFD を拡大して画面上で読み取れ ることも確認した. 図 6 最適化後の品質 Adobe Acrobat によりイメージの文字を認識する OCR 機能を使い 32 年分の論文集の一括処理を 行った.OCR による自動読み取りの結果を図 7 に示すが,そこそこの品質であり,2003 年の論文 集で 5 M バイトの増え全体で 14 M バイトとなった. 臨床試験の早期中止の検 ベイズ流予測確率と条件付き i 界仰也(イーピー工ス株 菅波秀規(興和株式会社 図 7 OCR による文字認識の結果(堺信也が i 界仰也と文字化け) ‐702‐

713.

3. 32 年分の論文集の目次の作成 年度ごとの論文集の目次について QCR 専用のソフト e.Typist を用いて文字化し,表 1 に示すよ うに Excel に統合整理した.共著者がある場合には,所属が同じならばカンマ区切で入力し,所属 が異なる場合には論文番号 11-12 で示すように新たな行とした.全体で 1,707 行,1,377 文献となっ た. 表 1 年次別タイトル一覧 論文 番号 1 2 3 4 5 6 7 8 年度 1982 1982 1982 1982 1982 1982 1982 1982 年度 タイトル 名前 番号 1 日本SASユーザー会(SUGI-J)会則 日本SASユーザー会 2 SAS導入の諸問題 高島邦彰 3 SASの教育利用 雄山真弓 4 SAS/GR,APHと地図情報77 高橋均,河津隆昭 5 駿台電算専門学校でのSASの利用について 穂積和子,須藤恵子 6 SAS/GRAPHのXYプロッター,日本本語ラインブリ 福田正一 ンター等への出力について 7 SASと人口研究 小川真宏 8 日立ソフトウェアエンジニアリング㈱におけるSAS 辻勝久 の導入 9 SASの導入背景と利用について 北原精二 開始 終 リンク 日本SASユーザー会 いすゞ自動車㈱ 関西学院大学情報処理センター 国際航業㈱ 駿台電算専門学校 名古屋大学大型計算機センター 所属 1 3 7 11 15 19 2 6 10 14 18 30 SUGJ1982.pdf SUGJ1982.pdf SUGJ1982.pdf SUGJ1982.pdf SUGJ1982.pdf SUGJ1982.pdf 日本大学人口研究所 日立ソフトウェアエンジニアリング ㈱ ㈱富士銀行コンピューターサービ スー 三菱化成工業㈱ 理化学研究所 岡山大学 31 39 38 42 SUGJ1982.pdf SUGJ1982.pdf 9 1982 10 11 12 1982 1982 10 SAS導入とその利用 11 SASによる大麦データベースの試作 12 1703 2013 1704 1705 1706 1707 2013 2013 75 ミクロデータ分析,教育用擬似ミクロデータを用い 冨里遼太,土生敏明,米倉孝俊 大鵬薬品工業株式会社 た収入・消費傾向の考察 76 ミクロデータ分析,シニア世代の消費特徴分析 中島貴之 株式会社データフォーシーズ 77 JMPCIinicalにおけるCDISCデータの解析について 大津洋 東京大学大学院特任研究員 78 山口拓洋 - 79 索引2013 索引 索引 長田博一 菅原秀明 小西猛朗 43 44 SUGJ1982.pdf 45 49 48 49 SUGJ1982.pdf SUGJ1982.pdf SUGJ1982.pdf 545 548 SUGJ2013.pdf 549 555 554 SUGJ2013.pdf 560 SUGJ2013.pdf SUGJ2013.pdf 566 SUGJ2013.pdf : 2013 561 著者名別の文献リスト作成のために,カンマ区切りの名前を別々の変数として切り出し,行ごと の転置機能により 1 人ごとのファイルを作成し,表 2 に示すように名前順の 2,454 人分のリストを 作成した.さらに,名前順の文献リストと,名前の頻度順のリストを併合し,名前の頻度順の文献 リストも作成し,検索の便宜を図ることにした. 表 2 論文 番号 170 170 1479 年度 筆頭or 名前 所属 番号 共著 23 A.C.B.Richardson 2 米国環境保護庁 23 A.Wolbarst 2 米国環境保護庁 35 ARMAN BIDARB A 1 東京国際大学 名前順の文献リスト タイトル 年 開始 米国職業被曝解析 米国職業被曝解析 Poverty Mapping: Case Study of Iran 1988 1988 2009 91 91 289 終 94 SUGJ1988.pdf 94 SUGJ1988.pdf 298 SUGJ2009.pdf リンク : 1403 993 1401 1327 1208 567 36 マヘシュ クマル ス 36 ラーマチャンドラン 34 ラクソノ アナン 22 ロ羽文 25 阿部いくみ 42 阿部まさ子 1 1 1 1 1 1 東京国際大学/ネパール中 ミクロ統計特別セッション、ネパールにおける貧困と不平等 2007 サティヤムコンピュータサービウェブマイニング-競合優位性への道- 2001 東京国際大学/インドネシアミクロ統計特別セッション、貧困対策のための非貨幣的指 2007 東京大学/日本臨床腫瘍研究nestedケース・コントロールデザインにおける擬似尤度に 2006 三菱ウェルファーマ株式会社前臨床実験データの統計解析をいかに検証するのか,前 2004 マリオン・メレル・ダウ株式会 Windows版SASのPCネットワークへの導入経験 1994 330 277 304 171 157 359 333 SUGJ2007.pdf 286 SUGJ2001.pdf 317 SUGJ2007.pdf 180 SUGJ2006.pdf 158 SUGJ2004.pdf 360 SUGJ1994.pdf 53 繆青 14 齊藤博 51 翟国方 1 1 1 兵庫県立大学 ヘキストジャパン㈱ ダイナボット株式会社 425 75 407 438 SUGJ2005.pdf 80 SUGJ1987.pdf 416 SUGJ2001.pdf : 1303 113 1008 JMPを活用した住民意識調査データに基づく行政課題の 2005 HP3000によるホスト・システムの利用形態 1987 データマイニング技法による生活習慣病のリスクファクター 2001 1982 年から 2013 年の 32 年間について論文集の頻度を 図 8 に示す.1986 年から 2006 年にかけ て,論文数は 40 件以上であったが,2007 年から 2012 年にかけて文献数の落ち込みがあり,SAS ユーザー総会の活動が縮小傾向となっていた.2013 年には 50 件と盛り返したことが読み取れる. ‐703‐

714.

80 73 70 67 61 62 60 56 57 51 50 46 54 51 49 44 40 40 42 46 47 50 46 40 34 30 26 20 10 62 58 11 12 10 16 30 33 33 25 25 20 0 図 8 論文集の年度別頻度表 論文集には,1,332 人の発表者がおり,複数回の発表を含めると延べ 2,454 人であった.発表頻度の 多い人もいれば,1 回のみの人たちもいる.共著も含めて 10 回以上,5 回以上,3 回以上,2 回,1 回の人数,論文総数,その割合などを 表 3 に示す.発表件数が 1 人で 54 回ものモンスター浜田 知久馬氏もいれば,1 回しか発表していない人も多数いることがわかる.発表件数が 10 回以上は 21 人おり,論文件数では 365 報,14.9%であるが,1 回のみの人が 895 人で 36.5%と多くを占めて いた. 表 3 発表回数 54回~10回 9回~5回 4回~3回 2回 1回 計 発表者に関する統計 人数 21 52 133 221 895 1322 論文数 365 307 445 442 895 2454 比率% 14.9 12.5 18.1 18.0 36.5 100.0 4. 文献検索の事例 表 1 に示した文献リストから所属が異なる共著者の行を削除して,SAS のプロシジャで“GLM” が含まれる文献リストを 表 4, “MIXED”が含まれる文献リストを 表 5 に示す.ある興味を持つ SAS のプロシジャについて調べたいときに,過去の SAS ユーザー総会の該当論文の検索が容易に 行える. 浜田知久馬氏が筆頭著者である文献を 表 2 に示した発表者順のリストから検索した結果を 表 6 に示す.1992 年から 2013 年まで毎年欠かさずに筆頭著者として論文集に登場していることが見 出される. ‐704‐

715.

表 4 論文番号 44 85 131 162 292 362 363 733 742 882 1215 1349 1485 1586 年度 タイトル 名前 1985 COX回帰プロシジャPHGLM使用経験上のある問題点について 森川敏彦 1986b SASのGLMによる実験テークの解析 高橋行雄 1987 GLMの臨床試験データ解折への応用 高橋行雄,藤丸清志 1988 GLMによる実験データ解析入門 高橋行雄 1990 Cox比例ハザードモデル(PHGLM)で求めた癌相対リスクと生荏期間の検 大槻成章,山縣清壮, 証 岡田頴一 1990 PROCGLMを用いた繰り返し測定データの解析 折笠秀樹 1991 Multiple Slopes Model(PROC GLM)による共分散分析の解釈 澤淳悟 1997 耐糖能障害・糖尿病改善に及ぼす要因の解析 -- GLMによる三元配置分 青野裕士,小澤秀樹, 散分析-斉藤功,池辺淑子 1997 各種の実験デザインにおける PROC GLM,PROC MIXED の利用 角元慶二 1999 PROC GLM及びPROC IMLを用いた3期3剤クロスオーバーデザイン(直交 石川靖 ラテン方格)の解析 2004 SAS/STAT GLMプロシジャの平方和計算の基礎 柴山忠雄 2006 SAS/STATGLMプロシジャの演習-Excel 表示応答分解- 柴山忠雄 2010 臨床試験データへの GLMSELECT procedureの適用 横溝孝明 2012 GLM と MIXED による2剤2期クロスオーバーデザインの解析一再考 斎藤和宏 表 5 論文番号 469 546 669 742 751 874 900 1045 1098 1137 1165 1298 1330 1398 1586 1629 1630 “GLM”が含まれる文献リスト 表 6 年度 1992 1993 1994 1995 1996 1997 1998 1999 1999 2000 2001 2002 2003 2004 2005 2006 1398 2007 1434 1480 1492 1524 1576 1628 2008 2009 2010 2011 2012 2013 終 40 52 170 62 22 503 1 117 504 8 128 137 415 142 428 227 321 63 137 234 328 74 150 開始 35 183 179 137 183 349 終 42 202 198 142 188 360 103 110 149 485 141 361 381 158 496 150 368 390 191 262 202 283 137 73 83 150 82 96 開始 357 337 527 241 331 17 375 3 383 13 165 111 73 165 127 81 終 370 340 540 254 346 34 394 18 390 38 188 138 98 194 152 106 “MIXED”が含まれる文献リスト 年度 タイトル 名前 1993 An Introductionto Mixed Model with the SAS/STAT MIXED Prccedure Russell Wolfinger 1994 各種分割実験モデルに対するMIXEDプロシジャの活用 高橋行雄 1996 PROC MIXED入門 岸本淳司 1997 各種の実験デザインにおける PROC GLM,PROC MIXED の利用 角元慶二 1997 SAS MIXEDモデルを用いた成長曲線分析とその応用 李聖煕,大竹正徳 1999 マルチレベル分析による生活満足度の分析 ― SAS PROC MIXEDを用い 中田知生 て― 2000 V8のODSによる総括報告書の電子化-関西プロジェクト-,その 伊藤要二 5.Model-based解析結果の要約(MIXEDプロシジャを例として) 2002 MIXEDプロシジャを用いた反復測定データの解析 菅波秀規 2002 NLMIXED プロシジャを用いた項目反応理論モデルのパラメータ推定 伊藤陽一 2003 MIXEDプロシジャを用いた線形混合効果モデルの交互作用の指定方法 寒水孝司 2003 NLMIXEDプロシジャーを用いたItem Response Modelのシミュレーション 板東説也 2005 MIXEDプロシジャを用いたメタ回帰 長谷川千尋,渡部恵, 浜田知久馬 2006 NLMIXEDプロシジャによるbreakpoint指数分布のあてはめ 浅野淳一,浜田知久馬 2007 メタアナリシスの功罪 -MIXED プロシジャによるメタアナリシスと公表バイ 浜田知久馬 アスへの対応 2012 GLM と MIXED による2剤2期クロスオーバーデザインの解析一再考 斎藤和宏 2013 NLMIXED プロシジャを用いた生存時間解析 伊藤要二 2013 NLMIXED プロシジャ紹介 PK 解析及び生存時間解析への応用 小林聡晃 論文番号 460 503 587 613 687 724 837 838 876 891 982 1043 1129 1211 1266 1317 開始 37 35 163 61 15 浜田知久馬氏の SAS ユーザー総会における貢献 所属 武田薬品工業㈱ 東京大学 東京大学 東京大学 東京大学 東京大学 東京大学医学部 東京大学医学部 東京大学医学部 京都大学 京都大学 東京理科大学 東京理科大学 東京理科大学 東京理科大学 東京理科大学 タイトル MULTTESTプロシジャの紹介 SASによる生存時間解析 SASによる条件付きロジスティック回帰 SASによるメタアナリシス SASによる用量相関性の解析 SASによる正確 (exact) な検定 SASによる信頼区間の計算 MULTTEST Q&A Separate-ranking型ノンパラ多重比較 V8におけるLOGISTIGの機能拡張 SAS V.8 における正確な推測とシミュレーションによる近似法 V.8 における生存時間解析関連プロシジャの機能拡張 生存時間解析における症例数設計 SASV9のTPHREGを用いたメタアナリシス POWERプロシジャによる症例数設計 ロジスティック回帰による推測(V.9LOG!STICプロシジャの機能拡張) メタアナリシスの功罪 -MIXED プロシジャによるメタアナリシスと公表バイ 東京理科大学 アスへの対応 東京理科大学 SAS によるコクラン・アミテージ(Cochran-Armitage)検定 東京理科大学大学院 SASによる共分散分析 東京理科大学大学院 SASによる中間解析のデザインと解析 東京理科大学大学院教授) 生存時間解析入門「生存時間解析のミステリーをひも解く」 東京理科大学大学院教授 SASによる2値データの解析「ここまでできるFREQプロシジャV.9.3 東京理科大学大学院教授 SAS 生存時問解析プロシジャの最新の機能拡張 ‐705‐ 262 283 165 301 111 3 3 3 202 337 182 46 58 72

716.

2014 年の SAS ユーザー総会では,企画セッションで「大学と企業における統計教育と SAS」が開催され る.そこで,タイトルに“教育”が含まれる文献リストを作成してみた.第 1 回目,1982 年の雄山真弓氏による 「SAS の教育利用」から始まり,その後も綿々と続いていることがわかる. 表 7 論文 番号 3 52 74 76 96 104 108 110 177 178 179 180 182 327 328 330 331 332 366 382 522 523 524 525 625 878 885 1009 1031 1035 1052 1140 1171 1183 1254 1345 1346 1620 1642 1682 1703 年度 “教育”が含まれる文献リスト タイトル 名前 1982 SASの教育利用 1985 第3WG(エンドユーザー教育研究グループ) 1986a 情報処理教育におけるSASの利用 -文科系大学における一般教育課目での展開- 1986a 統計学教育とSAS 1986b SASにおける教育システムの開発 1987 国際金融教育シミュレーションとSAS事例 1987 ユーザー教育の手段としてのSAS/CBT 1987 国際的機構におけるSASユーザー教育 1988 大学教育でのSASの実践例 1988 情報処理教育のあり方について 1988 SAS教育と認知カウンセリング 1988 社会科学教育とSAS 1988 文科系学生に対するSAS利用教育 1990 アイオワ州立大学統計学科におけるSAS教育およびSASの利用 1990 社会科学専門教育と情報処理カリキュラム 1990 教育心理学専攻学生に対するSAS教育 1990 PC-SASを利用した社会調査に関する大学教育 1990 理工系大学におけるSASによる統計教育の試み 1991 バージニア州立大学医学部生物統計学科における統計学教育とSASの利用 1991 SAS/AFを利用した統計教育システム 1993 PC版SASによる情報処理教育 1993 UNIX版SASシステムによる経済系情報処理教育(大阪大学経済学部での実施例) 1993 歯科保健情繍生教育におけるUNIX版SASシステムの利用事列 1993 SASを使った統計教育 知的ツールとしてのパッケージ統計学 1995 利用者自身によるデータ活用のためのSAS教育の展開 1999 臨床疫学教育におけるSASの役割 1999 企業における教育研修の評価と改善 2001 神戸商科大学におけるSASシステムを利用した統計・情報処理教育の現状と展望 医薬特別セッション:JMPによる副作用データマイニング,JMP4Jによるロジスティック回 2002 帰モデルの教育-併用薬剤の種類,有害事象の種類別の探索的解析- 医薬特別セッション:JMPによる副作用データマイニング,JMP4Jを使用した有害事象の 2002 生存時間解析の教育 2002 実験計画法の学部内一般教育 2003 CROにおけるSASプログラマの育成教育 2003 看護系大学における疫学・生物統計学教育の実態調査 2003 SAS/GRAPH入門 ~ 社内における教育研修事例 ~ 臨床開発のためのSASプログラミング教育カリキュラムの開発と実践 ~統計解析業務 2005 を題材に~ 2006 SASを使った数値計算・統計処理教育プログラム 2006 テユートリアル教育(情報科学演習)における学習行動の類似性に関する定量分析 2012 統計教育と統計ソフトの共生 2013 (財)日本科学技術連盟における「臨床試験セミナー統計手法専門コース」と SAS 教育 2013 SASを用いた医薬品開発の統計解析担当者に対する CDISC の社内教育 2013 ミクロデータ分析,教育用擬似ミクロデータを用いた収入・消費傾向の考察 開始 終 雄山真弓 エンドユーザー教育研 三浦協一 市川伸一 佐藤栄里 川崎章弘 白石典義 グラトン ミサコ 武藤宣道,神田範昭, 二宮正司 市川伸一 竹中治 金井浩,静谷啓樹,川 布能英一郎 竹中治 森際孝司 川上和久東 山本英二 大槻成章 東勲,能川賢一 長野祐弘 田中克明 松久保隆,大川由一, 高橋伸夫 八木章,高橋和子 縣俊彦,清水英佑,田 陶山博太,伊藤洋子, 川向肇,有馬昌宏,古 7 71 109 119 101 25 43 59 125 133 139 143 151 233 251 265 275 277 17 107 453 455 459 465 317 391 461 417 10 71 114 120 106 28 48 64 132 138 142 146 158 250 256 274 276 280 24 110 454 458 464 474 326 394 470 424 澤田克彦 81 90 西山智 91 98 柴山忠雄 竹田眞,佐藤智美 田中司朗 林行和, 185 161 391 477 192 166 400 488 山口孝一,林行和,平 13 22 作花一志,南野公彦 安田晃,平野章二,阿 新村秀一 池田敏広 浅見由美子,小山暢之 冨里遼太,土生敏明, 297 309 339 175 423 545 308 320 348 182 438 548 5. まとめ SAS ユーザー総会の 32 年間にわたる活動の青果物である論文集をすべて電子化し,無料公開を 目標に関係各位の協力のもとに実現した.SAS を活用し新たなチャレンジをしようとしている人た ちが,これまでの熱狂的かつギルド集団的な活動の成果を踏まえ,さらなる SAS ユーザー総会の 発展に積極的な関与をお願いしたい.また,無料公開することにより,多くの人たちが SAS のパ ワーを認識し,新たな SAS ユーザーとして活躍されんことを期待している. ‐706‐

718.

4 ん 正

719.

与信モデノレ構築 小野潔 株式会社インテック 松津一徳 金融ソリューションサービス事業本部 CreditModelofDevelopmenntforDataMining K i y o s h iOno, KazunoriMatsuzawa u s i n e s sS o l u t i o n sDevelopmenntD i v i s i o n INTECI n c . B 要旨 最近、貸金業法の総量規制の施行により、金融機関の与信モデルを見直す動きが始まって J I C C )に加盟でき いる。銀行等の金融機関が、従来、加盟で、きなかった個人信用'情報センター ( るようになったためで、ある。消費者金融会社の無担保ローン・モデルは、従来モデルよりも高精度 であり、かっ安定的で、ある O さらに金融庁が住宅ローンの収益性について言及しており、与信モ デルの融資判定にも収益性の考慮が必要になりつつある。 K n o w l e d g eD i s c o v e r y 金融機関の与信モデルの構築プロセスは一般モデルと同様に KDD( i nD a t a b a s e s )プロセスである。しかし与信モデ、ルには 個人信用情報"、 精度を高める組合せモ デ、/レ"、 モデ、/レ格付"、 判定マトリックス"、 AVR領域"、 個別審査ルーノレ"などの特徴がある O 本報告では、与信モデルの見直しの背景と、 S A S / E n t e r p r i s e M i n e rを用いた与信モデ、ルの構 築法と特徴を報告する。また外部環境からの与信モデルの SASプログラムの起動法や SASマク ロの代入法を解説する。 キーワード:与信モデル個人信用情報センターデータマイニング、 マイニング・ツール S A S / E n t e r p r i s eM i n e r ハイブリッド・モデルアンサンブル・モデル モデル格付判定マトリックス AVR領 域 1 . はじめに 与信モデ、ルは、住宅ローン、キャッシング、クレジット、マイカーローン等の融資を統計学に基づ、いて 判定する。一方、審査システムは、申込の受付、保証会社や外部の個人信用情報機関とのデータ通信、 決裁に至るまでの裏議/回覧、営業匝からの照会などの審査工程を自動化し、審査担当者を補助するシ ステムである。自動審査システムは審査システムに与信モデルを組み込み、融資判定を自動化したもの である。自動審査システムの導入メリットは、①判定の均一化(審査担当者による判定結果のばらつき防 止)、②審査の業務時間の低縮、③リスクコントロールがある。 金融機関の与信モデルの特徴は、会社の保有するデータだけでなく①外部の情報ベンダーのデー タも利用すること、②審査担当者が理解しやすい分析手法を採用すること、③倒産した場合の損失額は 大きいので、より精度を高める組合せモデ ルを採用すること、④倒産率(ミスコア値)からモデ、ノレ格付を確 定し、判定マトリックスから AVR領域iを決定する点があげられる。 l A領域:モデ、ルにより自動的に承認する領域、 V 領域:審査担当者により判定する領域、 R領域:モデルにより自動的に 謝絶する領域 7 1 5 ‑ ー

720.

与信モデルは、初期与信モデ、ルと途上与信モデルがあるが、本報告では、 S AS ! E n t e r p r i s e M i n e r V e r l 2 . 0を利用して初期与信与信モデ、ルの構築を報告する。また自動審査システムは通常、 Java等のプ ASシステムを起動し、 ログラミング言語で開発されため、本報告では実務上の観点にたち、外部環境から S かつマクロ変数による引数渡しを説明する。 2 . 背景 与信モデ、ルの構築は、都市銀行で 2 000年頃から、地方銀行で 2006年頃から導入が始まった。現在、 与信モデ、ルはメガパンク、大部分の地方銀行に多数導入されている。最近、貸金業法の総量規制の施行 により、金融機関の与信モデ、ルを見直す動きが始まった。理由の一つは、貸金業法の総量規制実施の影 響で、銀行等の金融機関が従来、加盟で、きなかった個人信用情報センター(株式会社日本信用情報機 J I C C )に加盟できることになったためである。 J I C Cは全国の消費者金融会社が加盟しており、加盟会 構: 社はリアルの無担保ローンに関する個人信用情報を入手できるO 消費者金融会社の無担保ローン・モデ、 0 1 2 年から情報を入手 ルは、従来モデ、ルよりも高精度で、あり、かつ安定的である。銀行等の金融機関も 2 ができるようになり、現在、個人信用情報を利用した無担保ローン・モデルが期待される。 もう一つの理由は、近年、金融庁や日本銀行が住宅ローンの与信判断に収益性を求めている点であ る。従来の住宅ローンの融資判定でも収益を加味されていたが、残高、金利、事務経費から算出する単 純な収益で、あった。しかし近年の住宅ローンの競争激化に伴う金利低下により、金融庁は金融機関に対 して、中途解約や経年解約や金利変更に伴う収益を考慮するように指導を始めた。そのため、住宅ロー ン・モデ、ルに収益性を含めて融資判定させる動きが発生している。ただ金融庁・日本銀行が求めている住 宅ローンの収益は、個人の生涯収益であり、理論が未だに完全に確立されていなし、。 3 . (参考)個人信用情報センター 日本の個人信用情報センターは、①銀行および子会社が加盟する全国銀行個人信用情報センター (略称:KSC) 、~信販会社(~クレジット会社)が加盟する株式会社シー・アシ・シー(略称 :CIC) 、③消費 者金融会社が加盟する株式会社日本信用情報機構(略称 : J I C C )がある。従来は各情報センターは、異 業種の加盟を認めなカミった。 006年 1 2月に成立、システム対応の準備期聞が必要のため、 2010年 6月に総量規制 貸金業法は 2 を含むすべての規定が施行された。その結果、新たな貸付けの申込みを受けた場合、貸金業者は指定 信用情報機関が保有する個人信用情報を使用し、他の貸金業者からの借入残高を調査することが法令 で定められた。 総量規制の実施に伴い、個人の借入総額が必要になり、指定信用情報機関制度が導入された。 J I C CとC I Cは 2012年に貸金業法に基づく「指定信用機閉止して内閣総理大臣より指定を受けた。それ I C Cへの加盟が認めれ、借入額 に伴い銀行などの金融機関も、消費者金融などの貸金業者と同じように J 2銀行(室尉子の 65%、表 l参照)が刀CCに加盟し、ノ や件数などを開示請求できるようになった。今では 8 ンバンク、消費者金融など、の個人の借入情報を見ることが可能になった。 1 3までに制限する。対象は「個人向け 貸金業法の総量規制は個人の借入総額が、原則、年収等の 1 であり、個人の金の借入れである。ただ個人が事業用資金として借入れる場合は、総量規制の対 貸付けJ 象にならず、クレジットカードを使った商品購入は貸金業法の対象外で、ある。また総量規制は貸金業者か ‑ 7 1 6 帽

721.
[beta]
らの貸入れを対象としており、銀行からの借入を対象外である。
20ま41多131
省1>甘デ傘辰干子

f寓曹毛窪贋ヰ「子

1
也メア車艮干子
貰奪三ニ f
泊ヌテ車戻守子

:毛;み泌自ら

1

。

‑
t
!
i
"
官
十

l

・ 「 そ 町 他 畠 良 行 J る ま 、 新 主 主 銀 ・ ジ ャ yマ ン ネ ッ ト 領 ・ セ ブ レ 銀 ・
章 夫 銀 ・ 新 銀 行 東 京 ・ あ お ぞ ら 傾 ・ レ テ ィ バ ン ク 銀 ・ 住f
言
SBIネ ッ ト 銀 ・ イ オ ユ ノ 銀 ー フ 民 和 ネ ク ス ト 銀 ‑SBJ銀
‑i
言言王圭良守子るま皇IH
子子会本土寄与を院予を〈軍司日韓 f
言言モ銀守子に R
県主E
‑th丘呈=エニ...:;0::3宇乙/

表 1 日本の針子数
信用情報センター

(
n
c
c
)の個人信用情報の登録内容を表 2に示す。
登録期間

内容
本人特定情報

1
:

義克主主主主、

f
2
i
J
5
2

与雲君主雲寺主主先、

登録会員名、契約町種要望、契約目、貸付目、

契約内容

契 約 継 続 中 及 び 完 済 日 か 品5年 を 超 え な い 期 間

喜さ帯百孟草署員、主苦やT
妥誌客員、{!展言iE喜男等夢

1

1
‑ ~_

̲~___

│契約内容に関する情報帯が登録されている期間

1
契 約 紬 続 中 及 び 完 済 目 か ら5年 を 超 え な い 期 間
~~__.

~,.__

_~,_~

I
(た だ し 、 延 滞 情 報 に つ い て は 延 滞 継 続 中 、 延 滞 解 消 時 事

返済状況

l
入金目、入童予定日、残高孟額、完済目、延滞帯
I./.... .>.u.'-'~ ./....~ ~ ^"'-......~ ".-., _J..............?<~ /....T ....,........~

取引情報

憤権回収、債務整理、保寵履行、強制解約、
破産申立、債権譲渡等

申込み情報

本人を特定する情報(氏名、生年月目、電話番号及
│ び 運 転 免 許 註 等 の 記 号 番 号 帯 〉 、 並 び に 申 込 白 及 び │ 申 込 田 か 品6ヵ 月 を 超 え な い 期 間
j申 込 商 品 種 別 等

J'C: l'P""'‑

l
実 に 係 る 情 報 に つ い て は 当 該 事 実 町 発 生 日 か ち 1年 を 超 え
な ν 期間〉
当童書事実の発生日ヵ、ら5年 を 超 え な い 期 間
〈ただし、債権譲渡司事実に係る情特については当額事実
町発生日ヵ、 '
;
1年 を 超 え な い 期 間 〉

一
表 2 信用情報の登録内容

4
. 無担保ローンの与信モデルの特徴
無担保ローンの与信モデルでは、「個人信用情報を利用したモデルjと「利用しないモデル」では、
予測精度とモデ、ノレ安定性に大きな差が存在する。与信モデルの決定木分析(後述)では、倒産に相関が
}
慣にデータ項目のツリーが作成される。図 lは両者のモデルを比較した概略ツリー図で、ある o r
左図
強いI

図 1 個人信用情報を含むモデソレ(左)と含まないモデ〉レ〈右)のツリー図比較

‑
7
1
7‑

722.
[beta]
なお銀行は個人信用情報センターの KSCから個人信用情報を入手できたが、無担保ローンに関し
てはマーケティング、範囲も狭く、リアル性も少ないため、与信モデルの否認基準等に利用されてきた。

5
. マイニングツール
l
E
n
t
e
中 出e
MinerIBMlM
o
d
u
l
a
r等)を利用する。マイニ
与信モデ、/レの構築はマイニング、ツール (SAS
owledgeD
i
s
c
o
v
e
r
yi
nD
a
t
a
b
a
s
e
s、データベースからの知識発見)を実装し
ング、ツールは KDDプロセス(Kn

たものであり、プロセスを繰り返すことで、精度の高い知識が得られる。 KDD プロセスは、①選択
(
s
e
l
e
c
t
i
o
n
)、②前処理 (
p
r
e
p
r
o
c
e
s
s
i
n
g)、③変形 (
t
r
a
n
s
f
o
r
m
a
t
i
o
n
)、④データマイニング、 (
d
a
t
am
i
n
i
n
g)、⑤解
i
n
t
e
r
p
r
e
t
a
t
i
o
n/e
v
a
l
u
a
t
i
o
n
)、⑥ノレール生成 (
r
u
l
e
)から成り立つ。 KDDプロセスは分析だけはなく、
釈・評価 (

マイニングの知識発見の一連作業を指す。マイニング・ツールは、 KDD プロセスを実装し、モデルのスク
ラッフ。&ヒ、、ルドをプログ、ラムレスで実現した。現状ではツールなしで、のモデ、ノレ構築は考えられない。

6
. 分析手法
本項では与信モデルによく使われる決定木分析を解説する。決定木分析は、データから専門家の知
I
F
‑
耳f
f
i
Nノレール)を抽出するための人工知能学の技法である。信頼区間や安定性に関する数値は算
識(

出しないが、ため、分析結果の IF‑THENルールが人間にとってわかりやすい。
決定木分析は、データ属性を使ってグループ分類でき、分析結果は樹形(ツリー)図で表現される。
決定木分析では、ツリーの分岐の属性順序や関値を自動的に算出するので、分析者の恋意は排除され
し
、
う IF‑THENルールを導出で、きる。決定木分析のメリット
る。ツリーの構造から「もし・・・ならば である jと
は IF‑THENルールに直すことで、審査担当者の理解を得られやすくなる。デ、メリットは精度を向上させる
‑
‑
‑
7 階層に達すると、 E・耳f
f
i
Nルールが細かくなりすぎて、
には、ツリーの階層を増やすことになるが、 5

専門家でも全体像をつかめなくなる点で、ある。
決定木分析の優秀な点は、属性の分割基準値に基づいて、分割属性の優先順位が決まることにあ
る。分割基準値は、ルールが目的属性値の分布与える影響度合いを数値化したものである。基準値が小
さいほど影響力が大きく、ツリーの最初の分割属性になる。
決定木分析分割基準には、「情報エントロピー値j、fGINI基準値J、「カイ 2乗値」とし、う代表的な分
、 j個のカテゴリー値をもっ目標属性が存在し、集合 S内にi
個番目の値を
割基準がある。データ集合 Sに

i
(
S
)
個(i
=
I,..,j
)あると仮定する。ルール Rで S
IとS
22分割し、部分集合
もっデータがそれぞれ X
S
I内のi
番目の値の分布比率を P
i
(
S
i
)
=
X
i
(
S1
)
/
I
S1とすると、各分割基準を表 3のように定義できる。
決定木司種類

うす害Ij基準 f
直

CS̲O.C4̲S

情報エントロビー値

正 義 式

En
t(
R)= Ent(x(
S,
)
)

=

CART

GINIi
直

"(
.
<
"
.
.
.
.
.
.
.
.
.
.
.
‑
:
t'
~p

:
t

i
:
;
i

.(g"¥̲r̲L
主 JKP,(S,)logp,(S,)‑庄 斗 危
~同 p ,
(S
,)logp ,
(S
,
)
)

g Pl(S)-(-'I~I'
,
(S)lo
r>

=
G
z
O
n
f
f
R
同
〉
E
k
;=p
,
〈G
a
S
n
〉
z
〈
2〉
x
ZS
一
│
1
l〉
‑
e
S
〉
L
│
lO‑EMk;pt〈
SJ
、ヴー一
│
i
S
一
S‑
2
i
lO‑EM
k
:PE〈SJ2〉
‑・・・・・・・目』・・・・・・目』・・・

・
・
目
』
・
・
・

目
』
・
目
』
・

目』・・

・
』
目

目』目』目』目』目』町砂田目』ーー・・・

目 』 目 』 ・ ・ 目 ・ 64
・ ・ 6・

べ

C h R)=
c,如(x(
S,
)
)
CHAID

力 イ 2乗 f
直

= b土
・
1! s z l M q〉 ps町 内 IS,I(p
,
民 〉 ー p β,
)
)
'
P.(
S)

表 3 分割基準の定義式

‑
7
1
8
帽

・・町・ 44

723.

関 事 ー で ; 山 骨岡山畑山相│ 豆諸 図 2 決定木の選択法佐)と対話モードへの移行(右) S A S A n t e r p r i s e M i n e rの分割基準の変更を図 2左に示す。与信モデ、ルの決定木分析で、は、一度ツリ ーの生成に成功したら、次にマニュアル操作に移行し、審査担当者のヒアリング結果に合わせて、ツリー を作りなおす。図 2右図に対話モードへの移行法を示す。対話モードではデータ項目の優先順位変更や 数値の分岐を恋意的にで、きるつくるが、一度、完成したモデルの精度にあまり影響しない。 7 . 分析結果 外部の個人信用情報を 利用したモデル"と 利用しないモデ、ル"を ROC図(図 4 )と累積リフト(図 5 ) に表示する。 4図と 5図から、 個人信用情報を利用したモデル"は、優れた精度を有していることがわか る 。 」 一 場司令叫 44 ωヰ斗脳卒ふ 財ヰふ輔らふもどさヒふ粗 豆急 図 3 SAS l En t e r p r i s e M i n e rのワークスペース上のモデ、ル作成 ‑ 7 1 9 ‑ 一 臨 fLr 幽一物 翻瞬間

724.

値 > s 包囲 図 4 個人信用情有/無モデ、ルの ROC図 ツリ 百〉銅斗言蚕言レ ヨY リ ← ‑ (4) ‑ 5 3 3二記念寝5 1 量寝室ヒ 一 志'リ一一 図 5 個人信用情有/無モデルの累積リフト図 8 . 与信モデルの分析手法とモデル 日本の金融機関の与信モデルで、は、わかりやすい分析手法として、決定木、ロジスック回帰が採用さ れるケースが圧倒的に多し、 (MBRを採用されたケースも有り)。ニューラルネットはパラメーターチューニ ングに成功すれば、他の手法と比べても精度が高いため、米国の金融機関で、はニューラノレネットワークが 採用されるケースも見受けられる。しかしニューラルネットワークは判定理由を明確に示すことがで、きない ため、審査担当者から理解を得ることがむずかしし、。 与信モデ、ルの構築で、は、倒産した場合の損失が大きいため、オーバーフィッチングしない限界まで モデルの精度をあげる必要がある そのため単独分析手法ではなく、複数の分析手法を組み合わせて使 O 用する(本稿では分析手法の組合せ方をモデ、ルと称する)。日本の与信モデルで、採用され、実績のある モデ ルは、 ハイブリッド、モデノレ"、 アンサンブルモデル"、 カテゴリーフラグモデル"である。 Hybrid Model 8 .1 . ハイブリッドモデ〉レ ( 2 段F 皆一直列型モデ、/レ) 向 田 T;S τE P このモデ、ルは 2つの手法を直列に組み合わ せる方法である。第 1段階の分析手法で得られた 倒産率を説明変数に追加する点がミソである。第 2段階の分析では第 l段階で得られた倒産率の寄 ‑ 7 2 0 ‑ /ケ SECOND $TEP 決 定 木 (n偲 説 明 変 数 〉 (p/(1‑p))=a, x セグメント毎の確信康 … 口ジスティック泊帰 4・S n X n寸‑an+1X n+1 ‑ tC

725.

与度(説明力)が高いため、第 2段階の分析手法は精度の微調整を行い、更に精度を高めてし、く。あたか も衛星ロケットが第 1段ロケットで大気圏まで上昇し、第 2段ロケットで、衛星軌道の乗るために微調整の起 動修正を行うようなものである。 なお分析手法は多数存在するので、組合せ方は無数になるが、与信モデ、ノレで、は最初に決定木分析 を行い、次にロジスティック回帰分析を適用する。理由は決定木分析から得られる E・THENルールが、現 場の審査担当者にわかりやすいためである。しかも第 2段階にロジスティック回帰分析を用いるため、最 終推定モデルが一つの式で、表すことでき、運用上の取り扱いが容易になる。 E n s e m b l eModel 8 . 2 . アンサンプルモデル(多数決ー並列型モデル) アンサンブルモデルは あまり精度が高めない 分析(弱い分類器)"を複数回行い、多数決で判定 する方法である。複数の分析は「異なった分析手法」 でも「ランダムサンプリングにしたデータに基づく閉じ 分析手法」を適用してもよい。つまりモデルを 5個 ↓ 1 0 0個程度作成し、各分析結果の倒産率の平均値、 Ba a a i n a. B o o s t i n a 中央値等を倒産率の代表値とする。精度が高める分 析、例えば前述のハイブリッドモデ、ルを複数個作成しても、倒産率の差があまりないため、精度の改善が 望めない。例えるならば、経験が浅い 1 0人の審査担当者が同じ案件を審査し、多数決で判定するようなも のである。もし全員がベテラン(ハイブ、リッドモデ、ノレ)ならば、同一判定となり多数決にならない。 8 ふ C a t e g o r yF l a g Model カテゴリーフラグモデル(離散型モデル) 金融機関のデータにはカテゴリデータ(例:職 │織機縦厳密 持をぬ')S子科 業、住居形態)と数値データ(例:給料、勤務年数)か ら成り立つ。このモデルは、すべてのデータをカテゴ リーデータ(離散化)にすることで、分類器の判別力 を高める方法である。ただ数値データの離散化は情 報量の劣化を招きかねない。そのため、情報量の劣 化を最小限にする闇値を選択する方法として、分割 = { 0, 1 } )を説明変数とす 基準値を利用する。闘値が決まれば、カテゴリー範囲をオンオフするダミーフラグ( るカテゴリー変数を追加する。この作業をすべての連続数値に繰り返し、最後にロジスティック回帰分析を 適用する。 9 . 個別ルールの制定 与信モデ、ルは与信に関わるすべて事象をモデル化できない。与信モデルを簡単に言えば、データ 項目の優先順位に重みをつけて、何らかの演算を行って倒産率を算出することであるo つまり与信モデ、ル の欠点は大数の法則にしたがうため、発生ケースが少ない特異な案件に対しては、有効性がない点にあ る 。 この点を補完するために審査の個別ルールを作成する。個別ルールの発見方法は、①審査担当者 ‑ 7 2 1・

726.

へのインタビューから経験則や知見を掘り起こす方法と、②自動的に作成した多数ルールの中から有効 ノレールの選別する方法がある O 本報告では S A S A n t e r p r i s eM i n e rを利用した②自動的にルールを作成する方法を説明する。この分 析にはアソシエーション分析を利用する。アソシエーション分析は多量データからアイテムにこではデー タ項目)の関連性について自動的に抽出する方法である。 アソシエーション分析を利用すると、倒産事象に関連するイベント(データ項目)の組合せを抽出でき A Sデータセットにあつめ、カテゴリー毎に 1ま る。具体的には目標変数の倒産に該当するデータのみを S AS l E n t e 中r i s eM i n e rのアソシエーションノード、を適用する O ただ、アソシエーショ たは 0のフラグを作成し、 S ン分析から抽出される大量のアソシエーションルールのほとんどは意味がなく、その中から意味のある個 AS 厄n t e r p r i s eM i n e rで、は大量データを処理するため、 IBMが開発したアプリオリとしづ 別ノレールを探す。 S アルゴ、リズ、ムを採用して短時間で処理する。 個別ルールを否認条件に含めるか、それとも独立した個別ルール・システムに含めるかは、得られた る内容による。個別ルールの取扱いは面倒なケースが多いため、可能ならばメインの分析、例えばツリー の枝葉に吸収できなし、かを考える。 1 0 .モデル格付 使宜上、本稿では与信モデ、ルから算出する値を倒産率と述べていたが、与信モデ、ルから算出される 値はスコア値とし、う。融資商品のデ、フォルト率は数%程度のため、倒産の件数が少ない。このデータ比率 でモデル開発すると、倒産の特徴を読み取れなくなる恐れがある。そのため、モデル開発では、倒産件数 l a c k:Wh i t e = l :1のサンプリングを行う。その結果、与信モデ、ルから算出されるスコア値の を最大値とした、 B 平均値は 50%になる。このスコア値を倒産率へ変換するには、①実際のデータから、あるいは②ベイズ 統計学を利用する方法がある。 0分割する方法と、②スコア分布の構成比の 1 0分位を モデ、ル格付の設定は、①スコア値で均等に 1 0分位を設定する方法がある。 とる方法と、③スコア値を倒産率に変換し倒産率の基づ、き 1 1 1.判定マトリックス 与信モデ、ルは倒産率や格付を算出するが、融資判定には別ロジックが必要である 融資判定には、 O 倒産率だけでなく、倒産した場合の損失額(言回収額)あるいは外部個人信用情報を考慮する。そこで融 L T V : L o a n T o V a l u e )が望ましし、)あるいは専業件数(もしくは総額) 資判定は、モデル格付けと回収金額(( 参照)を利用する。判定マトリックスは AVR 領域に分割されている。 等を軸とした判定マトリックス(次頁、図 6 AVR領域は倒産率から導いた格付と回収金額による与信判断の意思決定マトリックスで、表現する。要は AVR領域の判定は、審査担当者が審査するグレー領域を特定することである。 最近、住宅ローンでは日銀・金融庁の指導により、収益を加味する要望が高い。そのため、判定マト リックスに収益性も含めた 3次元として捉えるようになってきた。ただ金融庁・日本銀行の住宅ローンの収 益は、単純に金利と残高と事務経費から求めるだけでなく、中途解約、経年解約、金利変動リスクも考慮し、 他の金融商品の収益をふくめた生涯収益を理想としている。しかし、住宅ローンの収益モデ、ルは理論的 に未完成の部分があり、しかも長期わたる住宅ローンのすべて実務データが揃ってし、る銀行はいない。 実務では、収益計算の一部簡略化して計算せざるを得ないのが実情である。 ‑ 7 2 2 ‑

727.

底資額/限度額 AVJl'楊緩 飽 A( ACCEPT)t唖調書 与f 冒宅ヂ)1,.によ曹自動的に事事定を*砲守る繍犠 vわゆるW除 e 穣緩 明 V侭 EVJE ¥ ' I I ) 傾 壕 響査担当暑によ唖響董@~鴎・繍揚唱E判定する積書E ν制酔る@胃申置緩 R侭 日ECη領 媛 、 与 、 相 信 ゆ 宅 る デB J L h c K l < よ 機 智 織 自動的に勝治唱E 輔定する錦織 同誇護者曙定 図 6 AVR領域 1 2 . 自動審査システムのフロー 自動審査システムは与信サーバーに構築される。 自動審査システムのフローを左図に示す。まず案件は 否認基準(行内のコンブライアン情報や延滞情報)で チェックする。次に個人信用情報センターへお客さま の個人信用情報の登録と問合せを行う。借入総件数 や借入総額が否認基準に抵触していなし、かどうかを照 合する。否認基準をパスした融資案件は次に行内の取 引情報、勤め先の情報、その他情報を集められ、 SAS 与 量 雫 1 ' ) 1 . ( 5 . ¥ 由 の与信モデ、ルが起動する。与信モデ、ルで、はスコア値 (倒産率)を算出し、モデ、ル格付を確定させる。判定マ トリックスで AVR領域を判定し、自動審査システムへ出 力する。自動審査システムでは A流 領 域 に 合 わ せ て 融資判定を行う o AIR領域ならば自動判定で、 V 領 域 j自由魁同予ム ならば審査担当者が融資の判定を行う。 1 3 .外部プログラムから SASプログラムの実行方法 審査システムは J a v aや Cなどのプログラミング言語で開発されるため、 SASプログ、ラムの与信モデ、ル は外部プログラムから起動する。本項では外部プログ、ラムから SASプログラムを実行する方法と、外部プ ログ、ラムからの SASマクロ変数の代入法を示すo atファイルからの実効 ① Windows B コマンドライン ( b a tプログラム)を実行することで、開発 SASコードを Windowから起動できる。 [ s y n t a x】 c : ¥ ¥ . . S A Sインストー/レパス..浮s a s . e x e 骨 s i nc : 町実行する SASプログラムのパス.汗m y p g m . s a s ‑ c o n f i g c : 笥..インストールした SASの c o n f i gファイルのパス.持s a s v9. c f g ‑ 7 2 3 ‑

728.

[example) パラメータ等 引数の意味 、 晶 c : ¥ p c o g r 皿 1f i l e S ¥ S a s9 . 1冶 a s . 位 e SASシ ス テ ム 実 行 i 二sy混ぜ下L ご実行する 田 プ ロ グ ラ ム の 場 開 記 載 匂 血 C加 問 駒 山 畑 抑 伊 ー 描 S ‑sysparmTokyo..と書〈ととでマクロ変数 &sy sparmに文字データ・'T ok : y o "を代入 ‑ s y 甲 車mTok 卯 f佃 f i gc : ¥ p c o g r a mf i l e s ¥ 盟 s ¥ s a s9 . 1 ¥ 日 町 宮. c f g I ‑ 四nfig以 下 に 語5の ωnfigフ7 イ)J.,を記載 ② powershellから batファイルを呼び出す方法 a tのみのパッチ開発は難しいため、 p o w e r s h e l l等から前述のコマンド、を記 実務では、 windowsb 載した b a tファイルを呼び出す方法を採用する。 [ s y n t a x ) cmd!C" c a l lc:~. .sAS 実行用の bat ファイルパスを指定.J 1 4 . おわりに モデル構築には SAS /E n t e p r i s e M i n e r等の優秀なマイニングツールが不可欠で、ある。ただ与信モデ ルの構築は、単に精度のよいモデ、ルを開発するだけでなく、現状の金融事情を把握し、例えば金融庁・ 日本銀行の方針に合わせたモデルを構築する必要がある。また審査担当者の理解で、きるようなモデルを 作ることも重要である。本報告で、は一般的な与信モデルの構築法を述べたが、実際の開発にはデータク リーニング、恋意的データの混入、倒産データの不足、未完成な理論などの様々な壁が存在する。 以前は、所属する金融業界(銀行、信販会社、消費者金融会社等)により、与信モデ、ルは相違してい たが、今回のように同じ個人信用情報が使えるようになると、優れた与信モデ、ルへ収束してし、くことになろ う。現状はその過渡期にある。ただ、銀行が消費者金融会社型のモデルを運用しても、不良債権の回収率 が違うため、本報告で、説明した収益を含めた判定マトリックが違うものとなり、運用面は同じにならない。与 信モデ、ルは、今後も所属する金融業界に合わせて、構築する必要があろう。 1 5 .参考文献 •F a y y a d ,U . M ., P i a e t s k y ‑ S h a p i r o,G .a n dS m y t h,P . :F r o mD a t aM i n i n gt oK n o w l e d eD i s c o v e r y : AnO verview ,A d v a n c e si nK n o w l e g eD i s c o v e r ya n dD a t aM i n i n g,p p . 1 ‑ 3 4,A A A I! MITPress,1996. ・J o s e p hP .B i g u s, D a t aM i n i n gw it hN e u r a lN e t w o r k s " ,T h eM c G r a w ‑ H i l lC o m p a n i e s,1 9 9 6 . ・コアブ・フロインド,ロパート・シャピリ,訳:阿倍直樹, ブースティング入門'¥人工知能学会, v ol .1 4 N o . 5, p p 7 7 1 ‑ 7 8 0,1 9 9 9 . .小野潔, デ一タマイニングを利用した融資モデデ、ルの現状と課題 S 訂I G ‑ J ‑ A ω 0 0 ω 4 , p 凶 p 4 十 9 一5 臼4 , 却 2 0 0 引 1 . . ・小野潔, ハイブリッド・コンポーネントの構築'¥第 2 0回日本 S A Sユーザ会研究発表論文集, p p 2 6 9 ‑ 3 2 7, S A S , 2 0 0 1 . I n s t i t u t eJ a p a n ・河野浩之, データベースからの知識発見の現状と動向"、人工知能学会, v ol .1 2No.4, p p .4 9 7 ‑ 5 0 4,1 9 9 7 . ・寺野隆雄、 問Dツールの動向と課題"、人工知能学会, v o l .1 2N o . 4, p p . 5 2 1 ‑ 5 2 1,1 9 9 7 . ‑丸岡章,滝本英二, オンライン予測",人工知能学会, v o l .1 4N o . 5, p p 7 6 3 一7 7 0,1 9 9 9 . ・小野潔, マイニング・ツール選択のポイント"日経情報ストラテジー, v ol .7 ,p p .5 6 ‑ 5 9, 日経 BP也 2 0 0 0 . ・小野潔, データマイニングを利用した融資モデルの現状と課題"人工知能学会研究会資料 S I G ‑ J ‑ A 0 0 4,pp 2 0 01 . 4 9 ‑ 5 4, •J .R .キンラン、 A Iによるデータ解析"、 トッパン、 1 9 9 5 . ‑724‑

729.

‑丹後俊郎、山岡和枝、高木晴良、 ロジスティク回帰分析ぺ朝倉書底、 l 的6 . ・大橋靖雄、浜田知タJ 馬、 生存時間解析"、東京大学出版、 1 9 9 5 . ・鈴木義一郎、 情報量基準による統計解析入門"、講談札 1 9 9 5 . ・エリザベス・メイズ、 クレジットスコアリング'、シグマベイスキャピタル、 2 0 01 . ・大久保豊、尾藤剛、 ゼロからはじめる信用リスク管理"、きんざい、 2 0 11 . ・本田義一郎、三森仁、 住定ローンのマネジメントを高める"、きんざい、 2 0 0 4 . ∞ ・日本銀行金融機構局、 住宅ローンのリスク管理"、 2 7 . h t t p : / / w w w . b o j ̲ . o r .j ̲ p / r e s e a r c h / b r p / r o n ̲ 2 0 0 7 / d a t a / r o n 0 7 0 3 c . p d f ・日本樹子金融機構局、 住宅ローンのリスク・収益管理の一層の強化に向けて"、 2 0 11 . h t t p s : / / w w w . b o j . o r . j p / r e s e a r c h / b r p / r o n ̲ 2 0 1 1 / r o n l l l 1 2 4 b . h t m / ・小島俊郎、 金融宇検査結果事例にみる住宅ローンビジネスの現状"、野令指本市場クオータリー2 0 1 2 S p r i n g . m / n i c m r / r e o o r t / r e p o / 加1 2 / 2 0 1 2 s p r l O . p d f h t t p : / / w w w . n i c m r . c o ‑ 7 2 5・

730.

‑ 7 2 6 ‑ ・ 品 ‑ * 令 8 J色 、 J

733.

統計分析における 「第三の変数 jの功罪 成践大学理工学部情報科学科 教授岩崎学 iwasaki@s . tseikei.ac.jp INTERNATIONALYEAROF S T A T I S T I C S P A J I↑I C t P A T l NGORGA刈 l A T l ON 自己紹介 1952年 12月 14日静岡県浜松市生まれ ‑学会など • SASユーザー会名誉会員 ・統計関連学会連合:副理事長 2期) ・日本統計学会:代議員,前理事長 ( .臼本計量生物学会:評議員 ・日本行動計量学会:理事,編集委員 .応用統計学会:評議員 期 ‑合計'理事 28期,評議員(代議員 )34 .政府機関など ・消費者庁消費者委員会:専門委員 ‑医薬品医療機器総合機構.専門委員 ・文部科学省,総務省,厚生労働省などの各種委員 7 2 9 ‑ ー

734.

要旨 ・統計的データ解析では因果関係の確立が大きなテーマ ・ビッグデータ解析でも,将来に対する方略・戦略の立案で は,何をすればどうなるかの正しい知識が必要 ・因果関係では,文字通り「原因変数』と「結果変数」がある が,それに加え「第三の変数J が重要な役割を果たすこと が多い ・これらは,無視したり使い方を誤ったりすると結果に偏りを もたらす ・本講演では,それら「第三の変数 J の正しい使い方につい て,分かりゃすく解説 TheSexyJob •H a lV a r i a nonHowt h eWebChallengesManagers( 2 0 0 9 ) • Google'sc h i e feconomist • Ikeeps a y i n gt h esexyj o bi nt h en e x tt e nyearsw i l lbe s t a t i s t i c i a n s . • Thea b i l i t yt ot a k edata‑tobea b l et ounderstandi t, t o t oe x t r a c tv a l u efromi t, t ov i s u a l i z ei t, t o processi t, t 'sg o i n gt obeahugelyimpo巾 n ts k i l l communicatei t ‑ t h a o to n l ya tt h ep r o f e s s i o n a ll e v e lb u t i nt h en e x tdecades,n f o r evena tt h ee d u c a t i o n a ll e v e lf o relementarys c h o o lk i d s, f o rc o l l e g ek i d s . h i g hs c h o o lk i d s, 7 3 0 ‑ ー

735.

さまざまなマスコミで、 ( 2 0 1 3 ) 1 の統 学計 関学 最強の武器 、 U日でが 統計学! 診 き 暴 自 !事 NHKでも .2013年 7月3日(水)クローズ、アップ現代 ‑数字の力ラクリ・データの真実 統計学ブームのヒミツ .視聴率 :10.7%(関東地区) I~I ‑ 7 3 1 ‑ :糧費

736.

現代思E J 2 ! ? 4 P i 現代思想 (2014年6月号) 特集ポスト・ビッグデーヲと統計学の時代 【イントロダクション】 ピックデヲと統計学/竹内啓 Z 続ト 1 も考; 議 】 品 ( デ‑11)は人を自由にするか/西垣通+ドミニクチエン ぷ ! ? i j L :短 【イン I~クト】 統計学にとって情報とは何か/竹村彰通 ビッグデーヲブームを考える/水田正弘 ビッグデ 告は科学嵯変えたか? / 出 口 康 夫 【イン9ビュー】 統計学は科学の文法である水俣から福島まで、なぜ公害は繰り返されるのか/津田敏秀 【統計学の現在】 統計的因果推論の考え方/岩崎学 議計学確率論の有効性とその限界/小島守之 計・実証主義・社会学的想像力/太郎丸 事 【データという問題】 ビッグデ一世の社会哲学的位相ぺ大黒~彦 「非有機的身体』の捕獲膨脹すゐ所与(7'‑11)と新たな利潤(レント)源泉/長原豊 工学的心身問題/西川アサキ+森脇紀彦 【ポスト・ビッグデータ社会のために】 生かさない〈生 政治〉の誕生ビッグデ一世と「生存資源」の分配問題/柴田邦臣 『ネオ精神医学」を生み出した「トロイの木馬 J:DSM アメリカにおける父殺しと科学への倒錯/樫村 愛子 ビッグデー告とビッグソサエティ/和田伸一郎 日経産業新聞 ( 2 0 1 4 .6 . 1 0 ) .統計解析最前線 ‑ビジネスの場で生かす統 計解析 事欧米で当たり前の統計解析 がなぜ日本企業で遅れてい るのか ‑統計解析を企業利益につな げる人材の登用・育成がカ ギ a 四 Minitab・17 世立..'一一ゾ7""~7' 袋詰壁土主主 7 l L? 1 I 雪空塑塾主目竺̲j データが「集まる」時代こそ より質の高い統計解析を Z 謀 ""詩話巴一 i l 翠慈雲宣護翠議官己 l l . . . , . 三 塁 塁 ヱLJJ12 型 空J I ‑ 7 3 2 ‑

737.

統計的データ解析の流れ 10年以上前のスライドだが ‑研究目的の設定 ・データ収集法の立案:実験,観察研究,調査 ・データの収集(モニタリング) ‑データの電子化 ・データのチェック(クリーニング),マージ ・データの集計とグラフ化(予備的検討):記述統計 .統計的推測ないしは予測:推測統計 ・分析結果のプレゼ、ンテーション:文書化,口頭発表 ・意思決定(終了もしくは最初に戻る) PPDACサイクル • P:Problem • P:P l a n ・D:Data • A: A n a l y s i s • C :C o n c l u s i o n • CensusAtSchool c 08t8 o.tlt.拘糊樋~ P ' f " C I f : 相 鵬崎町恥甲・ 7 3 3 ‑ ー ̲ 噛 吋 戸 時 間

738.

研究の種類 ‑実験研究 ( e x p e r i m e n t a ls t u d y ) ・処置効果の評価を意図.実験条件の設定(無作為化など)が研究者自 らの手でできる ・観察研究 ( o b s e r v a t i o n a ls t u d y ) ‑処置効果の評価を意図.観察条件の設定(無作為化など)が研究者自 らの手でできない ・調査 ( s u r v e y ) ‑必ずしも処置効果の評価を意図しない. ‑前向き研究 ( p r o s p e c t i v es t u d y ) ‑条件を設定し時聞を追って観現1 ] .コホート研究 .後ろ向き研究 ( r e t r o s p e c t i v es t u d y ) ・現在の状態から過去にさかのぼって調査.ケース・コントロール研究 因果関係の確立 •E f f e c to fCauseo rCauseo fE f f e c t ‑統計学で主に扱うのは E f f e c to fCause ‑ある処置 ( t r e a t m e n t )に効果 ( e f f e c t )があるか,あるとしたら どの程度か. ‑新規開発医薬品, ICTを使った新しい教育方法,新規の販売促進戦略, ある種の公共政策 ・一方で, Causeo fE f f e c tの探索も,実用上重要 ・ある病気の原因は何か.どうやれば製品が売れるか.どうすれば学生 の学力は上がるか. c to fCauseの評価 ‑原因候補が特定できても,その次の段階として E仔e が必要 ‑ 7 3 4 ‑

739.

因果推論での登場物 ‑目的:ある処置 (treatment)Tの効果を,対照 ( c o n t r o l )C と の比較において評価 ・「比較」は絶対に必要 ・「薬を飲んだら病気が治った J .fWEBのデザインを変えたらページ ビューが増えた」だけでは不足 ・第一の変数:処置の割り付け変数:Z=1( T ),=0( C ) ・第二の変数:結果変数 :Y= 1( 成功), = 0 (失敗),あるいは 連続量 ・第三の変数:(観測される)共変量 : X(個体を特徴づけるもろ もろの値で観測されるもの,通常は多数) ・第四の変数:(観測されない)共変量:U (観測されないあらゆ る要因) 回帰モデル ‑単回帰モデル : y=a+bx+e • y= ax+b+eではない • y=my+b ( x‑mx )+e •y :目的変数.x :説明変数.e :誤差項 • a:定数項(通常は意味なし).b:回帰係数 • my:yの平均.mx :xの平均 ・仮定 : eは xとは独立に N (O,ポ)に従う = ・重回帰モデル:y bo+b1x1+・・・+bpxp+e • y= my+b1(X1‑ m1)+・・・+b p ( xp‑mp)+e • y= bo+b1x+b2x2.・・+b p xP+e • y:目的変数, X1, . . . , xp:説明変数, e:誤差項 • bo:定数項, b1,• ..,bp:(偏)回帰係数 ・仮定 : eは x1'..., xpとは独立に N ( O,ポ)に従う ‑ 7 3 5 嗣

740.

単回帰式 ( y= a+b x )の性質 ‑回帰直線は楕円の長軸ではない •E [ yI x ]=a+b x: xを与えたときの yの条件付き期待値 ♂ 〆 / • xを定めたとき,対応する yは ( a+b x )を 中心にばらつく .a 定数項(通常は意味なし) .b:xを1 単位増加させたときの yの(平均的な)増分 .bの 推 定 値 =C o v [ x,y ]I V [ x ] •V [ x ]=V [ y ]のときは b=P( =R[x,y ],相関係数) ・yから xへの回帰式:X =C +dy = = •V [ x ] V [ y ]のときは b 1 / p • xが2値 ( 0or1 )のときは bは各群の平均値の差 重回帰式 ( y= bO+b1x 1+b 2)の性質 2x •E [ yI x x x 1, 2]=b o+b 1 1+b 2x 2:x 1'x 2 を与えたときの yの条 件付き期待値 • b1の解釈 1 :x x 単位増加させたと 2 の値を固定した上で, 1を1 きの yの(平均的な)増分 • b1の解釈 2 :x2によって yのばらつきの説明をした残りの部 分 (yと x2との単回帰式の残差)に対し,x1を1単位増加させ たときの yの(平均的な)増分 ・【重要】 b R [ x1,x 0であれば x 2と無関係に 1の解釈は , 2]= できるが ,R [ x1,x ‑0のときは, x 2 に依存する 2]* R[x1,x2]=0であれば,単回帰式 y=a+bxと重回帰式 y=bo+b1x1 = +b x2において ,b b1となる 2 ・b1は x 2 に依存するので,x 2として何をとるかが重要であり, hの解釈をむやみに拡大してはならない ‑ 7 3 6 ‑

741.

回帰係数の値の推移 = = ̲ ̲ ̲ ̲ / 、 一 一 回帰係数の推移 = = •r [x1,Y ] 0.5, 1 R r [x2,Y ] 0 . 2 2 R と固定し, r=R[x1, x2]を 変化させたときの,偏回 帰係数 b1,b2の動き 閉まお・の寺内 r 一ー‑b!一一回 = 回帰係数の推移 = •r [x1,Y ] 0.5, 1 R ら =R[x2,Y ]= 0 と固定し, r R[x1, x2]を ~ トー一一 5145 = 綴 変化させたときの,偏回 帰係数料, b2の動き 説明案徴用¢相1II, 欄欄帽恥 b l 鴫 蜘 同 制 bl 回帰係数の計算式 •( x1, x2'Y )の相関行夢J I X1 X2 Y 、 ( 1 r れ} X1 X21 r 1 乃│ y ¥.'I乃 1) • b1,b2の計算式(各分散は 1に基準化) 2‑ r b ,一 丘二竺L ι̲ ' i 一一 r 2 11‑r2' つ 1‑r ‑説明変数聞の相関 rが大きいと分母が小さくなって回帰係数 が大きくなる ・相関 rが大きいと,r 1>0で、あっても,分子が負になることが ある ‑ 7 3 7 ‑

742.

τ‑1 三 . 主 : 百 三 三I ι 添加物と走行距離の例 ‑1 ‑自動車のオイルにある添加物を入れること により自動車の燃費(ガソリン 1 リットルあ たりの走行距離)に差が出るかどうかを 添加物無では 5台,添加物有では6台の自 動車について,各走行距離を計測した 10 2 3 4 5 6 ‑この添加物を加えることにより燃費が異な るかどうかを有意水準5%で両側検定せよ. .原因(処置):添加物の有無 ( Z= 0,1 ) 添加物無 添加物有 y ( O ) ) y(1 17. 4 1 8 . 2 1 5 . 7 1 4 . 2 1 3 . 9 1 0 . 3 1 6 . 2 1 6 . 4 1 4 . 0 .6 11 1 0 . 6 添加物の有無 x走行距離 .00 HC. 1 , (0 • ド ・結果(効果):走行距離 ( γ ) o• 10u • ・検定結果 ( 2標本 t検定): t =ー 0.117(P= 0 . 9 0 9 ) ' " 。 添加物と走行距離の例 ‑2 ‑原因(処置):添加物の有無 ( Z= 0,1 ) I D ・結果(効果):走行距離 ( Y ) ・共変量:自動車の総排気量(リットル)( X ) 2 3 4 5 6 平均 │標準偏差 添加物無 X ( O ) Y ( O ) 1 . 3 174 1 .5 1 5 . 7 1 . 5 1 4 . 2 18 1 3 . 9 2 . 0 1 0 . 3 1 . 6 2 0 1 4 . 3 0 0 0 . 2 7 7 2633 添加物有 y (1 ) X ( 1 ) 1 8 . 2 1 .5 1 6 . 2 1 .5 1 6 . 4 1 .8 1 4 . 0 1 .8 11 .6 2 . 0 1 0 . 6 2 . 2 4 . 5 0 0 1 .800 1 . 9 6 9 0 . 2 7 6 2 総排気震と走行距離 2 0 1 9 1 8 γ ( 1 ) l < 1d Eヲι 3 " " " " 2ちの . . 込U 1 7 " " " " 14 1 1 10 10 ‑ 7 3 8 ‑ 1 . 2 1 ̲ 4 1 . 6 18 • 22 2'

743.

添加物と走行距離の例 ‑3 ‑共分散分析 (ANCOVA) ・モデル式 :γ=α+δ Z+yX+ε =1.901(P=0.032) ・効果量(のの推定値:d 国盛範量 童相関 R 重決定R2 補 正 R2 0 . 9 2 5 0 . 8 5 6 0 . 8 1 9 1 . 140 1 1 標準誤差 観測l 数 盆盤盆盆塞 自由虚 2 8 1 0 回帰 残差 盆 主 土 塞動 盆盤 盆盤比 61 .519 1 0 . 3 9 0 7 1 . 9 0 9 3 0 . 7 5 9 1 . 2 9 9 2 3 . 6 8 4 u 査 0 . 0 0 0 添加物と走行距離の例 ‑4 ‑共変量(x)の値でマッチング : Xの値が閉じもののみをピック アップ ・共変量の偏りを排除:比較可能性を高める ・データ数が減少しているので統計的な有意性はないが,平均 値の差に偏りはない I D 2 3 4 5 6 平均 標準備差 添加物無 Y ( O ) X ( O ) 1 .3 1 7. 4 1 .5 1 5 . 7 1 4 . 2 1 .5 1 3 . 9 1 .8 1 0 . 3 2 . 0 1 .6 2 0 . 2 7 7 1 4 . 3 0 2 . 6 3 3 添加物有 X ( 1 ) Y ( 1 ) 1 .5 1 8 . 2 1 6 . 2 1 .5 1 . 8 1 6. 4 1 .8 1 4 . 0 2 . 0 11 .6 2 . 2 1 0 . 6 1 .80 1 4 . 5 0 0 . 2 7 6 2 . 9 6 9 l 平均 I 1.7 │標準偏差 I 0 . 2 4 5 ‑ 7 3 9・ I13.525 I 1.7 I15.600 I I 2.290 I 0.245 I 2.814 I

744.

米国 SATスコアの例 ‑1 ‑米国の SATスコアは 1 9 8 0年に底を打ち,その後上昇に転じた とされる ‑下の表は,人種別に見た平均 S ATスコアの推移 5点 • Whiteの平均は8点増加し, Non‑Whiteの平均の増加は 1 であるが,全体での平均の増加は7点 平均スコア 人種 1980 1984 差 W h i t e 8 924 932 N o n ‑ W h i t e 802 817 15 全体 890 897 7 c f .Wainer( 1 9 8 6 ) 米国 SATスコアの例 ‑2 • Whiteの平均が 8点増加, Non‑Whiteの平均が 1 5点増加 .全体の平均の増加は 7点 ・足りない情報:受験者比率 9 2 4x0 . 7 2 2+8 0 2x0 . 2 7 8= 8 9 0 . 6 9 5+8 1 7x0 . 3 0 5= 8 9 7 9 3 2x0 ‑第三の変数「受験者比率」の情報がないと解釈を誤る可能性 740・ ー

745.

‑喫煙習慣と死亡率につ いてカナダ,英国,米 国の 3 つの調査研究が 行われ,各喫煙習慣ご との死亡率 (1000人 年)が報告された ・調査時の平均年齢(第 三の変数)を考慮しな いと結論を誤る. ‑調整は,年齢階級ごと に求めた死亡率を融合 c f .Cochran( 1 9 6 8 ) さらに簡単な数値例 ‑単回帰式: 1 . 6+0.5429x y= ・ダミー変数 dを入れた回帰式: y=4+6d‑x X*Y ‑ダミー変数 dの導入により,各 群での xとyとの関係が正しく 判断される y=O.5429 ・ 翼1.6 4 ・添加物の例では, Xの導入により d とyとの関係が明らかになった 1 7 7 4 1 ー ・ I

746.

5つのべからず集 ‑第三の変数を用いた調整法にはいくつかのものがある ・マッチング,層別,共分散分析 ・どうすればいいのか,に対する確固たる解答はないが,しては いけないことはある. 1 .モデルを想定せず,やみくもに調整してはいけない 2 処置に影響された変数を用いて調整してはいけない l' • • 3 .モデルのチェックなしに外挿してはいけない 4 .調査対象とは異なる対象に関する変数で調整してはいけない 5 .調整したからといってその結果が常に妥当であると考えては いけない c f .W a i n e r( 1 9 8 9 ),Rosenbaum( 1 9 8 4 ) クロスオーバ一試験における層別 ‑対照食品摂取後の値の高低(高群,低群)で2群に層別し {効果量 J=r被験食品での結果 J一「対照食品での結果 J を計算 ‑その結果,高群での効果量に有意な差を認めた •r 2 .処置に影響された変数を用いて調整してはいけなしリに 抵触 第 1期 ‑742‑ j 第 2期

747.

出生時体重と成人での血圧 ‑出生時体重 (BW)が低いほど成人血圧 (BP)が高い ( Barker 仮説): BP=c onst+b1B Wにおいて b1<0 • BPだけでなく,コレステロール値,心血管系イベントの発生率など .成人での BMIを説明変数に加える BP=const+b1B W+b2BMI • b1の絶対値が大きくなる 回帰係数の推移 ・r1=R[BW,BP]=‑0.05 ・r ,BMI]=0.15 2=R[BW ・ O壬 r=R[BMI,BP]<1 ./ ~: ~~~ : 0 r 2 .処置に影響された変数を Z 用いて調整してはいけない J 0 . 8 肘 l こ抵触 c f .Tan,e ta. l(2005) ー 白 ー ‑ . , 時自問‑b> 性差別 ?‑1 ‑男性 (M)と女性 ( F )で,賃金格差があるか ・共変量 x=jobpeげormance : 二く!と ー7 4 3 ‑

748.

性差別 ?‑2 ‑閉じ xOobperformance) で見ると(実線), M のほ うが Fよりも大きい ・同じ成果で、あったとき,男性 のほうが給料が高い ・女性に不利な差別 .同じ y( s a l a r y )で見ると (破線), M のほうが Fよ りも大きい ‑閉じ給料をもらっている人で 比較すると,男性のほうが 成果が大きい ・男性に不利な差別 , c f .ConwayandRoberts(1983) 最後に:統計家はこう考える ‑因果関係の確立には実験研究が goldstanda吋 .実験研究が必ずしも可能とは限らない ‑観察研究による因果推論では,実験研究に近づける努力 .後ろ向き研究しかできないことも多い ・稀な事象の場合には,ほとんど唯一の方法論 .現在そこにあるデータについては ・データの素性を明確に ‑データ取得の 5W1H • Who, What, When, Where, Why+How ‑統計では特に Howが重要 • Whomと HowMuchを加えて 6W2H( W i k i p e d i aより) ‑744‑

749.

. 1 統計検定 統計検定 (2014) 臨制一一二ご .2014年 11月30日(日)実施 2 級 • 1級 2級 3級 4級 │公謝問題集 2011‑2013年 @専門統計調査士,統計調査士 ・2級 , 3級 , 4級は年 2回実施 " ' ' ' ̲ ' 1 1 . ̲ ' 幽 ー 酬 ‑学習マテリアルと問題集 醐 IIIi聞鯉 一一一一 I ! 智 仁‑ 2 2 統計検定 3 級 ・4 級 公式隙題集 gngL ねm r J 4 ……… 一 帆 紛 肩関開 参考文献(和書) ‑甘利俊一・狩野裕・佐藤俊哉・松山裕・竹内啓・石黒真木 夫( 2 0 0 2 )多変量解析の展開隠れた構造と因果を推理する. 岩波書庖. •P e a r l,J .(著)黒木学(訳)(2009)統計的因果推論モデル・ 推論・推測.共立出版圃 ・星野崇宏 ( 2 0 0 9 )調査観察データの統計科学因果推論・選択 バイアス・データ融合.岩波書庖. ・宮川雅己 ( 2 0 0 4 )統計的因果推論一回帰分析の新しい枠組 みー.朝倉書庖. ‑ 7 4 5 ・

750.

参考文献(洋書 ‑1) •B e r z u i n i,C .,Dawid,P .andB e r n a r d i n e l l i,L .( e d s . )( 2 0 1 2 ) C a u s a l i t y .StatisticalPerspectivesandApplications.John Wiley&Sons. •F a r i e s,D .E .,Leon,A .C .,Haro,J .M.andObenchain,R. し( E d s . )( 2 0 1 0 )A n a l y s i so fO b s e r v a t i o n a lH e a l t hCare DataUsingSAS@.SASI n s t i t u t e . • Morgan,S .L .( e d )( 2 0 1 3 )HandbookofCausalA n a l y s i s f o rS o c i a lResearch.S p r i n g e r . • Morgan,S .L .andWinship,C .( 2 0 0 7 )C o u n t e r f a c t u a l s andCausa"nference.MethodsandP r i n c i p l e sf o rS o c i a l Research.CambridgeU n i v e r s i t yP r e s s . 参考文献(洋書 ‑2) • Rosenbaum,P .R.( 2 0 0 2 )O b s e r v a t i o n a lS t u d i e s ,Second E d i t i o n .S p r i n g e r . • Rosenbaum,P .R.( 2 0 1 0 )DesignofO b s e r v a t i o n a lS t u d i e s . S p r i n g e r . • Rothman,K .J .,Greenland,S .andLash,T .(2008)Modern Epidemiolog μT h i r dE d i t i o n .W o l t e r sK l u w e r . • Rubin,D .B .( 2 0 0 6 )MatchedSamplingf o rCausalE庁e c t s . CambridgeU n i v e r s i t yP r e s s . • Shadish,W.R . , Cook,T .D .andCampbell,D .T .( 2 0 0 2 ) ExperimentalandQuasi‑Experimentaldesignsf o r GeneralizedC a u s a l l n f e r e n c e .HoughtonM i f f l i nCompany. ando t h e r s , ‑ 7 4 6 帽

751.

参考文献(学術論文) • Cochran, W.G.(1968)Thee f f e c t i v e n e s so }adjustmentbys u b c l a s s i f i c a t i o n i o m e t r i c s,24,295‑313. i nremovingb i a s i no b s e r v a t i o n a ls t u d i e s .B • Conway ,D .A .andRoberts, H .V .( 1 9 . 8 3 JReverser~gression , f a i r n e s s, and t a t i s t i c s, 1, employmentd i s c r i m i n a t i o n .JournalofBusiness&EconomicS 75 ・8 5 . Rosenbaum,P .R .(1984)Theconseq~ences o fadjustmentf o ra concoI T li t a n tv a r i a t l et h a tl ! asbeenaf!ect~d byt h etreatmen . tJournalofthe RoyalS t a t i s t i c a lS o c i e t , y SeriesA,147,656・666. • Tu, Y . ‑ K ., West, R . ,E l l i s o n, G.T .H .andG i l t h o r p e, M.S .( 2 0 0 5 )Why evidencef o rt h ef e t a lo r i g i n so fa d u l tdiseasem i g h tbeas t a t i s t i c a la r t i f a c : t t h e" r e v e r s a lparadox"f o ‑ rt h er e l a t i o nbetweenb i l 巾 w e i g h tandb l o o d r ̲ ei nl a t e rl i f e( w i t hd i s c u s s i o n ) .AmericanJ o u r n a lofEpidemiology , pressu 161,27 ・3 2 . ,H .(1986)M i n o r i t yc o n t r i b u t i o n st ot b eSATs c o r et u r n a r o u n d :an • Wainer o u r n a lofE d u c a t i o n a lS t a t i s t i c s,1 1,239 ・ exampleofSimpson'sp a r a d o x .J 2 4 4 . • Wa!! ' te r ,H .(1.98~U::~lw?r~~ , ~ullet.hole.s , andG~r~~dine ,F~~ra~.o: so~e problemsw i t hs t a t i s t i c a ladjustmentandsomes o l u t i o n s( w i t hd i s c u s s i o n ) . J o u r n a lofE d u c a t i o n a lS t a t i s t i c s,14,1 2 1・1 9 9 . andmanyo t h e r s 場 今後の活動予定 講演予定 ・統計関連学会連合大会 (2014.9.13 ・1 6 ) ・於:東京大学(本郷キャンパス) ・9月 13日午後チュートリアル講演「マッチングと統計解析 J(3時間) .日本計算機統計学会シンポジウム (2014.11.14 ・1 5 ) ・於:沖縄科学技術大学院大学 • KyotoI n t e r n a t i o n a lConferenceonModernS t a t i s t i c s ( 2 0 1 4 . 1 1 . 1 7 ・1 8 ) .於:京都国際会館 出版予定 ・岩崎学 (2014o r1 5 )統計的因果推論の基礎(仮題).朝 倉書庖 ‑747‑

752.

電︐た .盤置し 俗間開 z gE︐をの ス大 穐岨シ拡 HM エス 向日イネ 偏﹃タピ i u サラ ・ ・ デ i A n a l y s i s 合同会社 代表・最高解析責任者倉橋一 z 担些坐 設立経緯とビラヨシ 医療分野で培った最新の 分析ノウハウをあらゆる場面に展開 i A n a l y s i s 最高解析責任者 (CAO) が東京大学医学部と医 療系コンサル会社で得たノウハウをもとに 2 0 1 1年に設立 し、業務のシステム化、人々の行動変容、意思決定の手 助け、社会貢献、人材教育などへさまざまな場面に展開 しています。 "データイノベーションセンター H 「データは世界を変える Jをビツョンとし、クライアント 様の データイノベーシヨシセンター"となることを目指 しています。 H CO附 r 祖 : h ti A n a l v s l s比C A U r i a h t s聞 eN 同 ‑ 7 4 8 ‑

753.

aAna 凶 s 2011年サービス開始から 2014 年 の 3年の問、 主 株式会社 NTTドコモ 株式会社ペネッセコーポレーション i A n a l y s i s 株式会社リクルートキャリア 株式会社インターネットイニシアティブジャパン 日本経済団体連合会 l ま 力 、 ! ; : : ! ま 大手自動車会社 エーザイ株式会社 大手携帯キャ 1 )ア 大鵬薬品工業株式会社 大手製造会社 旭化成フアーマ株式会社 大手航空宇宙製造会社 株式会社gumi Web 広告ベンチャー 株式会社日経 B P 情報セキュリティベンチャーなど 株式会社ミクシィ 東京大学医学部付属病院 など23業種、 44 社ヘサービス提供 (うち東証 1部 上 場 企 業 :36%) C o p y r i g h ti A n a l y S i sl l CA I Ir i g h t sr e s e r v e d 3 i A n a l v s i s 設立者:最高解析寅任者 (CAO) 倉橋一成(Is s e iKurahashi ) [経歴] 東京大学医学部博士課程卒 ( 2 0 1 1 ) 統計家、コンサルタン卜、データサイエンテイスト、健康学博士 S t a t i s t i c i a n, Consultant,DataS c i巴n t i s t,Ph.D 【専門/スキル] 統計解析、コンサルテイング、データサイ工ンス、医療データ分析 R,SAS, SPSS,Python 【パックグラウンド] .2005:NPO日本臨床研究支援ユニット、解析担当 ・2 007、2009:スタットコム株式会社、統計解析者 ・ 2009~2010 :帝京大学、医師への統計コンサルタント .2010:キャピタルメディ力株式会社、プロジェクトメンバー ‑2011:iAnalvsis 合同会社歯立 .2011~2012 :東大病院特任助教(兼務) ・ 2013~ ・ 2013~ 東大病院特任研究員 ・経団連 医療ビッグデータ研究会委員 ブログ閲覧数 100 万田町 h仕 p : / f d . h a t e 旧 n e . j p f i s s e i n g 3 3 3 f 国際論文 10 本以上 http://isseing.jimdo.com/%E7%B5%8C%E6%AD%B4/ 2 0 1 4 / 3 / 2 7読 売 新 聞 朝 刊 , 刊 C o p y r i g h ti A n a l y s i sL l C州 I r i g h t sr e s e d 7 4 9 ー ・

754.

i An l l l y s l s i A n a l y s i s のサービス ビジネスセクター向け 1 . ビジネス拡大のための データ活用支援サービス アカデ ミックセクター向け 2 . 論文レビューサービス ホームページ:i a n a l y s i s . j p 問い合わせ先:c o n t a c t @ i a n a l y s i s . j p お電話:03 ・ 6868 ・ 3490 また、ご要望に応じてセミナーや講演も行います. 詳しくは別途資料にてご案内致します. Co岡 市 川 ti A n a l慣 I s L L C A I I叫酌 t s r e s e 阿国 i A n l l l v s i s 事業拡大のためのデータ活用支援ザーピス 口 鏑続短信娘婿 (IT) Z 時e r n e t官民h n o l 。由V + … 雪 印 ヱ 〉 ス + ~ BusineoI n 担l l i g e n c e ~ 線計解析 量踊t i s t i c a lDa 回An . l y o o ; . 訴しいアイディア Inn 側 副veId 岨 I 弊社的扇面ぶト示融筋 l 一 ‑ しι . I 弊社はデータ活用のノウハウによって、様々なアイディアを生み出します。 1 捕時間 ことで、ビジネス価値を何倍!こち拡大します。 分析 新たな経営指楊の開発により 億円の売上糟加を発見 年間約 120 力車 ×新日側 アイディア 東証 1 部上場大手自動車メー力一 J A J : 品 レセプトデータの集計分析によって 年間 1値円の売上噌加を発見 病床数200 床地方中核総合病院 栄サービス料金等、内容の詳細は別途資料にてご案内致します. ~世lt i An a l y s i sL L CA I Ir i g h t sr e s e r v e d ‑ 7 5 0 ・

755.

iAnalysis 論文レビューザーピス これまで汗ンパクトファクタ J 機 ( IF ) の高い 国際雑誌に多数投稿してきたノウハウを活かし、 統計解析方法のじビューやアドバイスを行います。 [これまでの投稿実績] JBone阿i n e rMetab(2.2), C l i nExpN e p h r o l (1 .2 ), KidneyI n t ( 7 . 9 ), AmJHypertens(3.8), D i a b e t e sC a r e ( 8 . 1 ), I n s e c tS c i e n c e (1 .7 ), NephrolD i a lT r a n s p l a n t ( 3 . 3 ), C l i n i c a lCancerR e s ( 7 . 8 ), インパクトファクターとは 論文の号|用数を指標化したちので、一般的に 2~ 3くらいから国際論文として認められています. c i e n c e 科学誌で最高峰と言われる Natu陀が36、S が31です. PLOSONE(4.0) [これまでのサービス提供実績] 東京大学医学部付属病院、東京大学工学部、 大鵬薬品工業株式会社、近畿大学、福島医科大学 I F が2以上の雑誌は無制限にレビュー 。メールにてやりとりを行う F が2 未満の雑誌への投稿は、年間 3報まで 。圏内論文やI 。最初の 1報は無料 弊社担当者を共著または謝辞に入れてちらう 年間契約で 30 万円(税抜)、研究室単位での契約 C o p v r i g h ti A n a l y s i sL L CA I Ir i g h t sr e s e r v e d データサイエンスとは 議 : A n a l y s I s ‑ 7 5 1・

756.

身近なサービスで行われている 分析・データサイエンス e G o o g l e ヨ弘~OO' 阻 a m a z o n 圃 、 J 楽@天 品 & ノ& 品 DeNA Waln 可a r t二.. paypal' 町 一 eGREE : A n a l y s i s Copyrighti A n a l y s i sLlCA I Ir 惚htsrese刊 ,d 具体的にどんな f 分析Jが行われているか ,ネットフリックス 問 ' . ‑ ・ E n l l l ' ndetrl81 1d d r e関 岡 酬 阿 川 町l 開 町 叩 . . 叫 胸 i 回 開 始 脚 1 9 9 7 " ‑ '、 DVDのオンラインレンタルビジネス ,全国展開していた「ブロックパスター Jを破綻に追いや るほど成長 罰 7 5 2 ‑

757.

レコメシドエシラシ:!シネマッチ ,顧客の好みを分析して映画をレコメンド(推奨)する 。アマゾンのレコメンドが有名 配送方法:スロットリンク ( t h r o t t l i n g ) ‑たまにしか借りない、利益率の高い顧客に優先して D VDを届けたいが、頻繁に 借りる会員が「不公平だJ と感じてしまう(→訴訟も) •r 利益の最適化 jと「公平な配送J のバランスを計算するアルゴリズムを開発 頒布(はんぷ)権の購入金額 ,新しい映画の頒布権を購入するとき、過去に借りられた「似ているジャンルの映 画J と同じくらいレンタルされるだろう A/B テスト ,新しいサービスを作るとき、それが本当に効果があるかどうか、 A/s テス卜によって 常にチ工ツクする : A n a l y s i s 1 1 , 刊 C o p y r i g h ti A n a l y s i sL l CAl Inghtsr e s e d 分析の活用事例 : A n a l y s i s 7 5 3 ‑ ー 1 2

758.

分析事例 「分析力のある企業 j の成功事例 • GOOGLE: リステイング広告 • Amazon:商品のレコメンデーション • p a y p a l :不正検知 ,キャピタルワン:クレジツトカードのパーソナライス ‑ネットフソックス:ビデオのレコメンデーシヨン 般事例 .夕、イレクトマーケテインク、の効果アップ ‑ユーザーの離反防止 ‑株式投資自動化 i A n a l y s i s 事例 砂経営企画の仮説検証、論文研究のための仮説検証 • Web訪問者の属性予測、広告効果の高いユーザーセグメントの発見 ,婚活サイトのユーザ分析 b 化粧品会社の顧客分析 ,新しいレコメンデーションシステム企画立案のための調査データ分析 ,情報の不正流出検知アルゴリズムの開発 :Analysis 1 3 Copyrighti A n a l y s i sL L 仁A I Ir i g h t sreserved 鉄鋼製造会社 (RockyMountain5 t e e lM i l l s ) 背最 2005年に価格競争のためシームレス鋼管製造を打ち切ったが、原油価 格が高騰したために原油採掘会社からの需要が高まった。 課題 鋼管製造の再聞を検討。 しかし意思決定のためのコスト分析の信頼性が低いと感じていた。 分析 プロフィッ卜・インサイトという分析ソフトを導入し、工場を再穣働 させるべきかどうか分析結果をみながら毎月検討。 12 月に損益分岐点を超え、さらに予測モデルによってその後ち価格上 昇が見込まれる状況になって初めて、製造の再聞を行った。 成果 早期に生産再開した場合の損失4300 万ドルを回避 :AnalysIs Copyrighti A n a l y s i sLlCA I Ir i g h t sreserved ‑ 7 5 4 ‑ 14

759.

クレラット会社(キャピタル・ワン) 背景 1 9 9 0年代、 「情報ペース戦略」を打ち立てる。 「まだ顔を見たことない2 億の人達について2情報を集め、集めた情報を基にし て、長期的な作戦を練る」 分析 データベースの整備、分析などを精織に行うことで、 「高額の商品を あっさりクレラットで買い、長期にわたってゆっくり返済する客 Jが 最ち優良顧客であることが判明。 成果 業界で初めて「リボルピンク 機能 Jをカードに搭載し、新商品開発に つながった。 事 現 在 で は 旧 に 300 回のマーケテインク調査。 譲渡性預金の利息、ロールオーバーのための優遇措置、最低必要残高などと、 顧客定着率との間にはっきりとした関係があることが判明。 →定着率の87%アップ、新声購買客開拓コストの83%ダウン : A n a l y s i s 1 5 Copv ri且L旦旦~己主型己刷 ts r eserved 事例:インターネットザーピス関連企業 Web訪問履歴を利用したリバースブロファイリシグ インコロット データサイエシス 邑 離 日ヒストグラム 分析 散布図 箱ひげ図 集計表 Web訪問履歴 アワトプット 活用 重回帰 ロヲスティクス回帰 重み愚適化 ラシダムフォレスト クラスタリシグ 距離計寅 コワイン類晶L 度 相関係数 検索履歴 GB 阿 ナイーブベイズ ! SV同 一率嶋一 一解町一 一正約一 語 ー nーグラム AUC 比較 決定木 プロジェクトメンバー;データサイエンテイス卜 x2 (弊社) マネージャー、 DB エンジニア(クライアント) プロジェクト期間: 3ヶ月(他の分析ち並行) アーキテクチャ ~ ~0 p y t h o n 隔 地 型 亀 山 必 鞠 盛 時B ‑ 7 5 5 ‑ 1 6

760.

事例:業界トツフセキュリティ関連企業 社内 PC か5の情報漏洩防止アルゴリズムの開発 インプット アウトプット データサイエンス 活用 自 菌 プロジェクトメンバー:データサイエンテイスト x2 (弊社) マネージャー、エンジニア(クライアント) プロジェク卜期間: 1 .5ヶ月 アーキテクチャ @丙 p仰 n 園 CopvriRhti A n a l y s i sLLC創 Ir i g h t sreserved 事例:大手自動車メーカー本社企画部 経営企画のための新しい切り口の経営指標を開発 イシプット アウトプット データサイエシス データ分析 データ加工 ;ヒストクラム 散布図 変数削除 指標の計算 出箱ひげ図 外れ値除去 の一タ 国ラ一 全一デ 本イよ 日デ売 集計表 シユ八一卜 管理図 インフォグラフ ‑ ゆ 指標の開発 相関分析 重回帰 データ集約 売上と関連 のある経営指標 1ポイント上がると 年間 120 億円 の売上泊加 プロジェクトメンバー・データサイエンテイスト x2 (弊社) 企画部課長、技術者 プロジェク卜期間: 3ヶ月 アーキテクチャ @鰐 , 内d Copyrighti A n a l y s i sLLC削 r j g h t srese 756‑ ー 活用 J

761.

そもそち分析の用途・目的は? 砂①仮説検証、現状分グ析 =今マーケァィン系 。市場データの分析、広告効果の分析 サイトの分析 。EC ,②仮説発見 。自然言語の共起ネットワーク 。企業間の取引ネットワーク y恒u、 予 測 モ デ ル 参③最適化、異常検知ヲ =今シスァム、研開発系 。レコメンド 。在庫、仕入れ、配送の最適化 。不正アクセス解析 。リステイング広告最適化 コ癌の予後予測 。入院回数予測 : An a l y s i s 1 9 Copy!i ̲ g h ti A ̲ n a l y s i sLlCA I Ir i g h t sreserved 部署ごとでの効果的な分析手法 立 口 ⁝画︑ JJd ω 経 企舎 一営 tie 経営状況の K P I分析 企業業績管理 (CPM) マーケット分析 ブランド分析 プライシンク、分析 tu ﹃ データ可視化 デ知 モ化検 測適常 予最異 特許分析一 モデリング L i円l 法務部 仮説発見 け 人事配置の最適化 離職率の要因分析 仮説検証 析肝肝 人事部 ゆ剣山川 UM 資賀 川投経 営業部 顧客分析 (CRM) 会員離脱分析 広告効果分析 : An a l y s i s 20 。 問 Copy 忠弘込2出弘正と rightsrese 伊 757‑

762.

データが溜まるスピードに分析が追いつかない 単位(ゼタバイト) 90 一一一 山 10年間で 44 信? 一 一 一 ‑ . ‑ 80 ‑ 1 米国では 2 018 年までに、高度なアナリティクス・スキルを持つ人材 4 " " 1 9万人不足し、大規模なデータ (データサイエンティスト)が 1 セッ卜のアナリティクスを活用し意思決定のできるマネージャーやアナリ 5 0万人不足する ( b yマッキシゼ、ー) ストが1 30 20 , 現在 ,,JF , 送 ! . 5 d ̲ 土2皇盆 キロバイト メガバイト ギガパイト テラバイト 10 。 T一 一 一 一 十 会~上 2017 2019 2021 工クサバイト 立笠広:iJ三 ヨタ)i イト : An a l 事 ,i 5 21 Copyrlghti A n a l v s i sl l CA I Ir J i t h t sr e s e r v e d 社内でデータを活用する際の課題 ,データ活用の目的が明確ですか? │何のため(」?│ ー目的に合った分析ツールやシスァムを │何を使て 適切に選べていますか? っ ーこれまでデータ分析を活用してきた社 員が何人いますか? ーこれまでの勘や経験だけで 経営判断しまぜんか? : An a l y s i 5 C o p y r i g h ti A n a l y s i sL L CA I Ir l g h t sr e s e r v e d 7 5 8 ‑ ー ? i │誰が?│ │活用の土壌は?J 22

763.

ヂ品夢活用の自的が明確ですがJ ビジネスt 広大のため 分析円の進め方 実 哨舗能 : A n a l y s i s ビジネス拡大のための分析 P lの進め方 ゴール スタート る 要 れ さ と 必 分 力 析 主 口 ‑ • 7 5 9 ‑ ー 24

764.

i A n a l y s i s 関係者外秘 データ分析の流れ 。 。 。 。 デ ータチェック データインポート デタクレンジング グラフチ工ツク 集計表 アドホック分析 モデリング 仮説検証 デタフィルタ デタ作成 クロス分析 効果検証 予測モテル セグメンテション 施策結果の計算 予測の検証 施策検討 レポート作成・共有 ミーテイング ‑ C o p y r i g h ti A旧 I v s i sl l CAt Ir i l h t sr e s e r v e d 25 Phase1 データチェック ,データの収集や加工 ERP 自 CRM 副 . . . ETじYール バッチ処理 ‑抽出 圃圃砂 ‑変換 ‑ロード DWH データマー卜 .集約 ・絞り込み 販売 生産 在庫 : 加al,滅s ‑ 7 6 0 ‑ 2 6

765.

データクレシシシグの課題 ※ 分 析 の 中 で デ ー タ ク レ ン ジ ン グ に 費 や す 時 間 の 割 合 は7 0 . . . . . . . . 9 0 %※ 全国の健診テ、ータを分析するプロジェクト ,概要 。目的:特定健診データを収集しクレアチ二ン測定の意義を分析する 。全国数十の市町村からデータ収集 。約 6 0万人 。 5年間は追跡目標 ,データクレンランク が最大のネック s vファイルの仕様が微妙に違う 。国保によって c 尿蛋白などが 1~6 になっていたりー, + ‑ , " ' , +++になっていたり 。入力ミス、エラー値がある 翠題 ,巨大データをどうやってクレンランクするか? 。データを全て可視化することができない 。ロジックを組んだからといってコンビュータに任せっきりは危険 。 「データが分かる人」が逐次モニターする必要がある :An a l y s i s 仁o p y r i g h ti A n a l y s i sl L CA I Ir i l h t sr e s e刊 e d Phase1 1 アドホック分析 /全性 園調 園田園周 ‑E E‑EEE霊皿 櫨滋 男性が95% 女性が5% ‑EEE 鷹 電 邑四回脂血 ・ 2k 縄師 .3 1 40~45歳が最頻帯 a g e 2 a .0 ・以上 織 30 ・以上 圃".以上 園 75・以上 9 男性 必 日 以よ 園 35 ・以よ 蝿 以上 機関・以上 5 . a 鵬 日 以よ 鵬 40. 以上 醐同齢は 綴 20 ・以よ 層田・以上 雄日・以よ 園田忠以よ 轍 50.以よ 圃刊・以上 利用時間は 12~14時がピーク 18~20 時はあまり無い 量1欄 28 C o p y r i g h ti A n a ) y s i sL l CA I Ir i 医h t sr e s e r v e d ー7 6 1 司

766.
[beta]
Phase1
1
1 モデリシグ
ーデータに様々な「モデルj を当てはめて、情報を探索す

る

匝盃ヨ

yx
29

A
/
B
テスト)
PhaseIV 効果検証 (

a
a
a
a
a
a
a
a
a
a
,
.
.
10001000人

司F

, ,

咽
.
.
圃
世
,
a
な
圃
惚
ず
.
,v‑ .の持つ嵐昧とIt守
""..~眠、-守"'1刊."・

.
.

.
.

酬""~~ ~~r" ・尚v一"一<~目fI.'t:"洲~ ..;
J
o

.~一惨劇一
暗命

剛
̲
.
ョ
・
峨
,
岨
叫
剛
‑
ト
‑
噛帽
‑
日
岨華・"割帽
岬
.
"
鬼
剖
:
栢
' !'-~
A

…・ ・

M

F

A
唱
!
I
'
!
・
ゆ
・
』
・
国
・
,
.
・
叫
・
‑
噛

司

岨
剛

m s

・
‑伽
・ w
剛
6

一 軒崎切 梓

一
.
句

山

齢

一

年

問 時則

、 時 由 列 過.

哨凶

司V
コンパージョン、直帰率、サイト滞在率、リピート率などを比較

:
加a惨
事b
…山旦"日'![

7
6
2
‑

ー

m

767.

目的(と合うた分析ツ ‑Jレやシステムを 段以適切に選べていますか? シ イ7 ラの整備えで目的に合った ツhj:レタシステム導入 さ守三手三誌主 : A n a l y s i s 様々な分析サービス インフラ・ DB ソフトウェア BAツール ETL"DWH ORACLE PENTAHO SAS R Hadoop Neteeza Lavastorm Greenplum MySQL 巴SQL Postogr AmazonRedShift SPSS JMP Mathmatica S t a t i s t i c a S t a t a ヱクセル : Aaiysis 刻 Copvrighti A n a l v s i sLlCA I Ir i g h t sreserved ‑ 7 6 3 ‑ ソリューション B Iツール S a l e s f o r c e GoogleAnaI y t i c s GoogleAdwords CRMサービス ERPサービス 32

768.

ビッグデータのデータベース ,様々なところに記録されているデータを統合する 。社内の部署連携 。データベース工ンラ二ア、インフラエンジニア ,大規模データを扱う必要 。数 100GB'"数 10TB 。Facebookは1日に約 100TB のデータが発生 億 (?)のサイト力、ら検索を行っている(約 。Googleは約 200 400TB?) 。Amazonは数千万アイテムの中力、らリコメンド(推奨)している ー 「分散処理」によって高速に処理を行う J¥ドワープ) 。Hadoop ( .G o o g l e の基盤技術である MapReduce をJ a v aでオープンソース実装し た分散処理のフレームワーク : An a l y s i s 3 3 C o p y r i g h ti A n a l y s I sl L CA I Ir i g h t sr e s e同 吋 データマイニシグとデータサイヱシスの違い ,データマイニング (大量の)データから有益な情報を掘り起こす(マイニング)こと 。分析対象のデータは「排気データ j なことが多い 。技術的な視点が強い ,データサイエンス 。データを適切に分析することで、正しい意思決定を行う 。目的、仮説を持って意識的にデータを溜めて分析しよう 。技術を何のためにどう活かすかという視点が強い ~ Google: r 次の 10年で熱い職業は統計学」 。あらゆるデータが記録される時代 。データをどのように有効活用するか! h t t o : // w w w . o u b l i c k e γ1 .i o / b l o a / 1 0 / 1 03 .h t m l ~ Facebook: データサイエンテイスト Jを 公 募 r : A n a l y s i s ~~_iA!!aJy引 sllCAllrightsreserved ‑ 7 6 4 ‑ 34

769.

分析+ビジネス業務Web サービスを開発申 ーデータチェック力、ら効果検証をワンストップで ー分析内容を手軽にレポーァイング ービジネス業務機能を便利に使えて、データち溜めれる ~ R e d S h i f tに接*‑売してピック データち扱える ,豊富なアンプレートにより高度な分析もワンクリックで : A n a 刷s 臼 鱒議襲議製品 3 S " " " o h 'lA、a柄 isllCAII崎Ihtsreserved 構雛襲警 ダ踏襲撃 これまでデータ分析を活用してきた 何人いますか? 車 庫 錫 人材確保、人材育成 事 F : A n a l y s i s ‑ 7 6 5 ‑

770.

データサイエシテイストってどんな人? ①鐘計学を駆使して②データ分析することで ③ビジネスインパク卜のある結果を産み出す人 ,それぞれの企業内で活躍している人 。G o o g l e :広告効果を分析 o A mazon:レコメンドエンジンの効果を分析 。D eNA:マーケテイング分析 。リクルート:多種サービスの分析 ー外力、ら企業に入って活躍している人 。富士通、 N EC、日立:様々な企業のデータ分析 。ァクセンチユア、野村総研:様々な企業ヘコンサルテイング 。i A n a l y s i s :様々な企業ヘコンサルテイング : A n a l y ぬ 37 ~i~n咽些_!.L~r哩ht~re~_!!何回 データサイヱシテイストのスキルセット・人物像 & & ①統計学 ・ 品 、6 s Copyrighti A n a l y s i sLLCAI lr i g h t sreserved ‑ 7 6 6 ‑ 盤主査 鐘註塞 38

771.

データ分析は統計学 < S t a t i s t i c s ) が基盤 ,統計学: r 経験的に得られたデータを分析し法則性を見出す学問 j ,政治・ギャンブルなどの二一ズから生まれた hp @@@趣' @@@@ @織@品' 金砂@︒ サンプリング調査 webアクセス・広告 @巴顧問 平成2 2年 1 OJ ! l1B : An a l y s i s 39 CODvr収htiAnalys凶LlC刈 I r i g h t sreserved 回帰系:利用する場面とモデル、手法の全体像 置~玄与幸治r一一一一一一一一 組I;~も皿・・・| 2値 連続値 ,蜘 3つ以上のカテゴ リー 連続 2 値 線形単回帰、線形重回帰 カテゴリ一、連続 共分散分析 カテゴリー 分割表、ロラスティック回 帰 連続 漁 民J 李総) ぷ品ぷぷムぷ孟ヰぷ 3つ以上のカテゴリー カテゴリー、連続: 名義口三:;ステヅク回帰 ︑ ︐ ︑ 続円続 連一連鋭 カテゴリー、連続 順序ロジステック回帰 りカテゴリこ‑吋ケるい:ぷ対数線形モデル 川 J叩 けJ ポオ守マτ 分割表 一 アZ J 総 t カテゴリー コ 一 コ 生存時間 汚 カテゴリー、連続口三Jス子ツク回婦長 力向力 カウント億りが ロジステツク回帰など 相関のある値、グループ値カテゴリ一、連続 ポアソン回帰 Cox回帰 混合効果モデル じO P V r l j 日h tlAnalyslsLLじA I Inghtsreserved ‑ 7 6 7‑ 40

772.

分析手法マップ [ l │ ‑ : I [Ë]~* I 構造方程式モデリング ( SEM) 形 混 釘 ル( G川 ‑i H ヒ線形モデ ル ( Gl1M) │ 機械学習系 │ ) 確率 過程モデル ディリヲレ過程混合モデル 中豪レストラン過 程 │一般級形モデル ( GLM ) 分微分析 T I 鉱芭事変量回帰数量化傾 ロジステイフヲモデル 割即時N Ii放量f t , 峨 ポアソンモデル 巨ff:Ðitr.,~ffi' 一 般 化 加 法 モ デル ( GAM ) I 、 正員1 ) 化注 スブライ: 人 ω間 制 時 制um j 凶s s o凶 師、リツジ回帰 言力 自 民 玉 ︑ 一心 値 一州 市 叩 異 一粉 枇 柑 予 因 一 圭 直 晴1 成数 測 司l グラフイカルモデル系 情這方程式モデリング ( S E I ゆ ベイジアンヰフトワーヲ 隠れマルコフモデル 41 回帰モデルのイメージ ー結果変数yが連続値の場合 Y1 . 差; 誤〆 r • y= a+b x a: 切片 b :傾き • X : A n a l yI s 冨 Co P V r i g hti A nal y s i sl l CA I Ir ight sr es e r ved ‑ 7 68‑ 42

773.

機械学習 静サポートベクターマシン (SupportVectorMachine; SVM) ,ニューラルネットワーク ( N e u r a lNetwork;NN) ; ; 川 、 ・ u ぇ‑二子守 畢 E a l y s i s An 43 A n a l y s i sLlCA I Ir i g h t sreserved Copyrighti 手法ごとの主な用途 線形回帰 (重回 1 席、ロジスデイツ !ク回帰、ポアソン回帰、 Cox回帰等) 一一ペ ⁝ 四 心7 一 日 一 山 Hズ ⁝ 郎 一 ‑7f アレ⁝曙 一 剛 一 昨 一一一樹 決定木 要因分析、予測・記述モデル 要因分析、予測・記述モデル、要因の可視化、ルル抽出 時系列プロットの可視化、スム ジング クラスター効果の調整して正確な効果を確認 LASSO ? 教師付き機械学習 (SV問、ランダムフォレ! スト、 GBM等) 非教師付き機械学習 (クラスタリング、 SOM' 等) l 要因分析、要因の可視化 群問差が統計的に有意力、どうか確認 : A n a l y s i s 44 , 刊d Copyrighti A n a l y s i slLCA I Ir i g h t sr e s e ‑ 7 6 9 ‑

774.

分析のためのエンジニアリングスキル E窒Iæ里~ヨ・ . , python~' Q L i t e 欝 MyS& 域 C++ d 3 . j @ 躍 動 UNIX E データベース系 │む蛤 可視化、レポーティング系 基本は抑えておき、 必要となったらその場で 調べて利用するという スクリプト、分析系 C o p y r i g h tI A n a l y s i sl l C刈 I r i g h t sr e s e刊 . d スタンス データザイエシテイストを目指すな 6知つ ておきたい Rパッケージ 10 個 +0 ,randomForest:超強力な汎用予測モデル ,RPostgreSQL,RMYSQL,RMongo,RODBC,RSQLite:各種データベースへの接続 ,plyr:デ タ 集 約 ,reshape2:データ加工 f o r e c a s t :時系列予測 ( s t r i n g r:文字列操作) ( I u b r i d a t 巴:日付操作) 砂 ( s q l d f :SQL ライクなデータ操作) ,(ggplot2:締騒なプロットを描く) ,qcc:品質管理 砂 ・ 砂 ,party:決定木が締麗に描ける ,gbm:randomForestより汎用性の高い超強力な予測モデル ,survival:生存分析 ,caTools,Epi:予測モテルの性能評価に必要な ROC曲線が指ける、 AUCを計算できる ,XLConn ct:工クセルのデータを読み込める、 Rオフ ジエクトを工クセルに保存できる 巴 : A n a l 同s 46 凹 ,'ilht協 同tvsisllCAII噌 htsrese .d c 刊 770‑ ー

775.

TokyoR ー @ yokkuns が主催 回のペース、現在 2 5回開催 ,月 1 ~ Rを中心にして、さまざまな分析トピックスを発表 ""10人 ,発表者は毎回 5 ー参加者は各社の分析屋+学生 ー参加人数は4 0""80人 ー参加方法:T w i t t e r や Googlegroup で告知されるので ATNDで登録 httos:// 口r ouos.口ooole.com/ 口rouo/r‑studv‑tokvo? h l=ia&oli=1 ,会場:N i f t y 社のセミナーjレーム(北新宿) p 資料置き場: h社。// I a b .s a k a u e .i n f o/ w i k i. c a i/ JaoanR201O?oaae=%CA 悦 D9%B6%AF%B2%Fl%C8%AF%C9% 日D拍 C6 %E2%CD%C6%BO%EC%CD%F7 :An誠y訴 事 4 7 C o p y r i o h ti A n a l y s i sL l CA . 1 tr i g h t sr e s e r v e d フォローすべき分析系Twitter アカワシト i s s e i n g 3 3 3 gepuro 砂 作 計l i o n s什l 1 i e • teramor 、 a g i 砂 yokkuns • teikaw • h o r i h i r o • d i c h i k a wdkz • hamadakoichi • d o r y a k u j i n • sas20yen • bob3bob3 • mikedewar T kan̲yukiko ‑ 吋n dai87 a ̲ b i c k y • mihiog • kos59125 • ~ ー • • • • S打l l y i a k i y a 、 円a i A n a l y s i s L L C hoxo m AntiBayes 臨 圏 サ 面 1 1 1) 1 ~[I • hiroue harada • mikado h i t o • Hiro macchan • wakuteka • phosphor ̲m • Rbloggers • triadsou ー Rbloggers • kohta • fuzzysphere • Door intoSummer • langstat • aad34210 強 直 通 現 • tyatsuta A ~悶 協ぬポ刊誌 + • sfchaos • s h i 、 円a • sakaue • yanaoki • NPHard • StatsGuild shima :a'sP55Japan C o p y r i g h ti A n a l y s i sl l CA I Ir i g h t sr e s e r v e d ‑ 7 7 1 ‑ 司 官 畠 会 盟 揺 霊 空 ヲ ィ.~ ,. 伊 脳 級 鴫 司 包 置 48

776.

web上の情報 分析関連ブロクI'~ • Radventcalenderで書かれた 25ブ ログ 。 htto://atnd.oro/eγents/22039 • Rに関する情報まとめ 。 Rを使えるようになるための10 のこと +0 h 社。/ / d . h a t e n a . n e .i o / i s s e i n o 3 3 3 / 2 0 1 1 0 9 1 7 / 1 3 1 6 2 3 1 0 8 2 • Facebook ページ 。 iAnalysis:! J t t o・ / / w w w . f a c e b o o k . c o m /旧 旧 I v s i s 。 StatsGuild:h吐ロ :llwww.facebook.com/StatsGuild.iD 0 デタマイニング: httos://www.facebook.com/oaaes/%E3%83%87%E3%83%BC%E3%82%BF~屯 E3%83%9E% 日 明A2%A4%E3 悦 8 3%8B悦 E3q も8 3 羽 田 弘E 30j七日 20七日 0/148756641848693 , 。 WebMining:! J 出 ・I / w w w . f a c e b o o k印 刷W e b M i n i n a S t u d i e s ,ポータルザイ卜 o KDnuggets:! J 性D : / l w w w . k d n u o a e 包 凹m / • Data ScienceCentral: h性白田 //WWWd a t a s c i e n c e c e円t r a. lcom/ 目 : An alysis 49 A I Ii r l !h t sr e s e r v e d ~型並区 iAna 情 is l l C KAGGLE(_bW:/川w.k~ie-com/) ,データサイエンスハッカソン@ロンドン 。 2012年 7 月 21日 ー医療データによる入院日数予測 。 1位には 2.4億円 (2013年4 月3日締め切り) ー信用スコアの改善 ーレコメンデーションシスァム ,サッ力一ワールドカップ優勝国の予測 ー高速道路の渋滞予測 、 . . . p現在 48イベント 。 httD‑//www.kaqQle.com/comDetitions :Analysis o p y r i g h ti A n a ! y s i slLCA I Ir l g h t sr e s e r v e d 仁 ‑ 7 7 2 ‑ 50

777.

i A n a l y s i s セミナー ¥ 学問 / エンジニアリング ; Cツケージを使った応用 つrτ21 私理問 灘 長 FH : An a l y s i 5 C o p y r i g h ti A nョl y s i s L l C刈 I r i g h t sr e s e r v e d 分析系で読んでおくべき本 ,統計学 。統計学入門 。自然科学の統計学 。多変量解析入門 o Elementalo fS t a t i s t i c a lL e a r n i n g (修士以上レベル) 。D ataM i n i n gf o rD e c i s i o nMaking p エンジニアリング o R によるやさしい統計学 を用いた入門書 。統計学 :R によるデータサイ工ンス 。R 。データサイエンテイスト養成読本 p ビジネス、事例 。分析力を武器とする企業 。分析力を駆使する企業 : An a l y 事1 5 C o p y r i g h ti A n 旦I y s i sLlCA I Ir I R : h t s: r e s e r v e d ̲ ‑ 7 7 3 ‑ 52

778.

これまでの勘や経験だけ 経営判断しませんか? 企業内の分析文化 : A n a l y s i s なぜデータ分析が重要か? ,勘や経験や度胸 vsデータ ,製品やサービスの価格を決めるとき、過去に類似の商品 が類似の状況でいくらなら売れたのかというデータを無 視して勘で決めたら? ー人材を採用するとき、そのポストではどんなスキルや適 性が高業績につながるか、過去のデータを分析せずに採 用担当者の直感で決めたら? ,在庫水準をデータに基づく最適水準に維持ぜず、 「この くらいがちょうどいい Jという漠然とした経験で決めた ら? ‑ E ‑ 7 7 4 ‑ ¥

779.

企業の分析力の発患の五段階 ‑分析力の活用が限定的な企業 ‑分析力の組織的な強化に取り ‑分析力はあるが決定打に至らない企業 : A n a l y s l s J 55 ; A ialy富山 llCAI lr 園 、t s r e s e r v e d C o p y r i l h t, 56 7 7 5 ー ・

780.
[beta]
人

経嘗障のコミツイ
トメント

4

A

!

掛 占 ル

ι
"
"
"
'.
,
.
.
̲
,.
.

開
力
は
;
今f
i
i
i
i
J
ト
ー
ム
:
「5
己
記
長
ト
…
二
.
.
.
<
=
1
:
:
>
,
‑
.
.
.
.
.
.
.
.
.
‑
1
:
.
.
.
.
甚
i
三
う
乞三さ!フオ

d!)'@IJ'
i
;

i

去
聾
竺
杢
」
吾
士 :まだ水準に違し

ムを構築

;苧f三うE宮.V~
どと f企:と:ご!害杢是空云ミ5
杢
き

?
5虐
葬
手
葬
話 E
詰
詰
鋭
2
鮎
忌
説
占
高
号
誌
E;
…τ日…山ぺ1雀主室宮

言
守
壬
宇
芸
引 与み叫和点雪雪器鋲喜匙た巴

H

十」;ιi
日長孟~孟-手平長山i一叩…川 山町叩叩十

度なスキルををt 1

¥

~,
i ~. .
.
.
.
.
八
"
'
ム
備己主、意欲のあ
柄
7
1
る専門家がそ
5 分析力を ii
宍去三雲云云~
f
iCEOを筆頭ζ
l経
,た事実を導き :定着し、高度
。,守
i
::z-~.:;:=:;~7~
武器とす iE
字I 器会まぞ i
[ろっている.盟 営陣力積極的に
‑ 四 ー 』 弔 問

る企業

::7 Z

i
出す.
に│に統合化され
i 貼~'~'~I.:;~
'._~~~'-H

!
i
デ タ や シ ス テ j ている・

市叫軸~-~白

i~::::~~S'f.=,":~

j
1
事実に基づい
;意思決定を下
!
i実験し学習す
1

辺業務立アウト!取り組んでいる姿勢が浸透し

;'
空
五
宣
け
L立
λ量
主丘
主.
k̲
¥山

j

~v._o
三
ムの改善を図る。~半比】

… 一 … 町 一 与

いる.

一一

…

‑‑N
=回目

圃包

F

Eh
・
開

E
E
‑
‑
s
‑
t
r

'
E
︐
白
川

問

︒
c

則
一
明

i"
!
a
一
関
畑
一
一
山
.
掴
=
一
唱

57

o‑‑O

効率良く分析を進めるための組織編成
集中管理モデル

経宮チーム

分析
グループ

部門A

ム

部門A

部門 B

部門 B

分析
グループ
分散配置モデル(非推奨)

経営チーム

×

部門A

部門 B

分析

分析

グループグループ

:
An
a
l
y
s
i
s
白町並区主出恒己正 AIIrightsreserved

7
7
6

ー

・

58

781.

データサイエンス業界の課題を解決するには |何のため(~? ーデータ活用の目的が明確ですか? I =今目的を持って効果的に進める、アウトソーシンク、ち活用 ,目的に合った分析ツールやシスァムを │何を使 ? │ 適切に選べていますか? って =今多種多様のツールがある中で適切に選択する ーこれまでデータ分析を活用してきた社 員が何人いますか? │誰が?│ =キセミナー・研盤による教育、専明家のコンサルテイングを活用 ,これまでの勘や経験だけで 経営判断しませんか? │活用の土壌は?│ =今勘だけじゃなくて数字ち見るようにする : An a l y s i s 59 Copyrighti A n a l y s i slLCA I Ir i g h t sreserved 分析が漉さない状況は? ,時聞がないとき 。瞬時に決定する必要がある ,前例がないとき 。小規模なA /s テスト ,過去の事例が当てにならないとき 。株価 。地震 ー意思決定者がきわめて経験豊富なとき 。データ収集と分析プロセスを頭の中で行なってしまう ,変数が計測できないとき : An a l y s i s Copyrighti A n a l y s i sLLCA I Ir i g h t s何 回 向 坦d ‑ 7 7 7‑ 60

782.

分析力で競合他社と差をつける :An剖! y s i s 61 C o p y r i g h ti A n a l y s i sl l CA I Ir i g h t sr e s e r v e d "データイノベーションセンター" 「データは世界を変える」をビジョンとし、 クライアント様の データイノベーションセンター" となることを目指しています。 : A n a l y s i s ‑ 7 7 8 ‑ 62

785.

l F政府自治体、大学によるロシステム尚一一細 1m LOGISTICプロシジャに よる解析と最新の機能拡張 映画「タイタニック」のロマンティック回帰 膚' 浜田知久馬 東京理科大学 A n a l y s i so fSASLOGISTICprocedureandnew f u n c t i o n s . ChikumaHamada TokyoU n i v e r s i t yo fScience 要旨: 生存・死亡のような 2値データの多変量解 析を行う LOGISTICプロシジャについて,モデ ル構築の方法のチュートリアルを行う また LOGISTICプロシジャの V.9.3まで、の 機能拡張について紹介する. キーワード:LOGISTICROC曲線多重性調整オッズ、比, F i r t h ' sP e n a l i z e dL ikelihood 7 8 1・ ー

786.

1 )オッズ比,予測確率のプロット等,グラフ表示の ODS GRAPHICSの機能の充実 2 )CONTRAST,ESTIMATE,LSMEANS,LSMESTIMATE ,ODDSRATIOO文を利用することで 共変量と多重性の双方を同時に調整した解析 3)ROC曲線を, ROC文で作成し, ROCCONTRAST文 で複数のモデル聞でAUCの比較 4)MODEL文の FIRTHオプションで、 F i r t h ' sP e n a l i z e d L ikelihoodに基づいた推測 ジャックローズ 書 嘩 轍 司 侮 運命査変える恋がある 温 ロジスティック回帰で、 ロマンティック回帰 ジャックとローズの ラブロマンスが かなう確率を分析 ‑782・

787.

!一自治ふ弱時務範μ ~[9 SASによるロジスティック回帰 LOGISTICプロシジャ CATMODプロシジャ生存司衿 死亡 GENMODプロシジャ INSIGHT プロシジャ PROBIT プロシジャ GL lMMIXプロシジャ何が影響をあたえるか ly 間以鞠欝勝弘&ill 9 ロジスティックモデル ある現象の発生する確率(割合 ) p ( x ) を その現象の生起を説明するために観測さ Xr) れた変数群 X = (Xl'X2 , " , で説明するモデルを考える, r 個の変数群 x の下で現象が生起するという条件付き確 率を p ( X ) で表しこれを p ( x )=P r { 生起 IXl, X2' , "Xr}=F(x "Xr) 1, という分布関数Fを用いてモデル化 , ‑ 7 8 3 ‑

788.
[beta]
p (x) = P
r
{ 生起

Ix1,
X 2, ,
Xr}F(X1,
X2 ,
.
.
, Xr )

e
x
p
( β。+βlX1+ β2X 2+ ・
・
・
+βrX r )
1+ exp(β 。+βlX1 +β 2X 2 +・・ +β rXr)

ロジスティック関数:
Z=β。
+βlXl+β2X2+・
・+
βrXr

2
.
7
1
8Z
exp(Z)
F(Z)=
=一一一
1+exp(Z) 1+e
x
p
(‑Z) 1+2.718

Z

p

P
r
o
b
a
b
i
l
i
t
y
確率p

'W

p(Z)=

,0
.9

0.8

0.7
'0.6

,

0.
5
0.4

c
x
p
( Z)
1+ e
x
p
(Z

,
.
'
1
‑
t

2.718
ノ
角 / / 。
==0.5!l
1+ 2
‑
"
:7
18 u
1十 1
'
1
:
7
1父
p()/二一~
1
2.71ちー

p(O)=

7

0.3

l
; ‑‑‑p(‑ウ=0
4

一∞

z ̲ーーーーー与ー
‑
7
8
4
‑

ート∞

789.

イベント発現確率 p p=exp(Z) l + e x p ( Z ) fLl‑pl ι ‑ 況ーと金 odds=‑ P l 1‑P l 1‑p P 2 1 2 桔) = z 1 0 + 叩 E.ißlffif.I3~ßf*.盟冨盟冨醤冨盟国匝圃 p(x)= 。 。 e x p ( β +β内 +β2X2+…+β'rXr) 1+e x p ( β +βlXl+β2X2+…+βrXr) 。 1+e x p ( ‑ β ‑ β戸1‑β2X2‑‑‑‑‑βλ) ここから,式変形を行うと p ( x ) =β。+均 X1+β2X2+…+βrXr 1‑p(x) 上記左辺を p(x)のロジット(対数オッズ)という 1 0 ‑ 7 8 5・

790.

医痕政府間大学中 オッズ (odds):0/{1‑0) p ( x ) = β。 + β1'(X1+1 )+ β2X2+…+βλ 1‑p(x) I V p(x)=exp(β0+β1'( X 1 )+ βめ + … +βλ) 1+ 1‑p(x) = e x p ( β。 +s1X1+ βめ+・ +βλ) イ exp(β~) I 上記左辺を p(x)のト p(x)に対するオッズという e x p ( β ):他の変数固定で, x を 1単位変化 させたときのオッズ比 1 1 説明変数が 1つの場合 めト 1 4 占) = s o +βlX ̲ e x p ( β。 +βl'X) d=OR‑mJ‑1+叫 収。 +βlX) x = O : d r u g ‑ x = l : d r u g + 1 2 ‑ 7 8 6・

791.

l i k e l i h o o d(尤度) L) =モデ、ルの下でデータが得られ る確率 L= =p ̲ 5X( 1 ‑p ̲ ) 9 5Xp + 1 0X( 1 ‑p + ) 9 0 P-=~xp(β。) ~ ̲ exp(β0+βJ 1+e x p ( β。 ) ' Y+ 1+e x p ( β。 +β1) 's 最尤法:s 1の値を動かしてしが最も大き o くなるようにする方法 I I Lニ p f×(l‑zz) P‑10 尤度 l 尤度曲面 1 . 但 E‑23 1 . 21E‑23 6 . 0 7 E ‑ 2 4 . 1 30 ‑ 7 8 7‑

792.

l o g L=5 1 o g p ̲+951og~-りpologP++90logo-A) 対執る度 ‑ 5 2 . お ‑ 5 5 . 0 5 四 5 7 . 7 3 1 . 3 0 ∞ ‑ 3 . 2 0 . 2 0 織盤爆撃パラメ→タが多いと破綻 尤度 1 , 1 . 82E 231‑ 山 1 . 2笹 ー23 ‑ 3 . 2 0 00 . 2 0 ‑ 7 8 8・

793.

対数尤度 l o g l ‑ 5 2 . 3 6 ‑ 5 5 . 0 4 ‑ 5 7 . 7 1 ' { , J‑ ‑ t ‑ ‑ (|LM48♂5~+j-rr111111lll"""" 一3.33 ~~ 同 ∞ ~1 .5 0 . 5 4 . 0 . 0 対数尤度とスコア関数 L=p ̲ ax( l ‑p ‑ txp/x( l ‑p Jd l ogL= a l o g p ̲+bloga‑pJ+clogp'++dloga‑pJ ̲ , I C I d l o g L̲ i̲ J¥ U(sJ=一誠一=ぺ+似二 O吋=ーっ│ (¥, u u l c+a I d l of ! . L ̲ ̲ ̲ ̲I a I 叫 ) = ォ ー ‑ ( 川) p ̲‑ (c+の 日 ヰ p ー │ i a+bI 1 8 789‑ ー

794.

。 l o g72‑=β +βlX P 1‑ 広司 j o log.p / ( α +b) ‑fog子│ =log o U 1 ‑ p l ‑ α / ( α +b ) [ ιム 」 ハニ r ̲ー 1‑p+ c / ( c+d) ~l-c/(c +d) j1=logl L 一同 p̲ =hog(b c .1 。 β +βl=log‑ 1 一 一 二 '‑'l‑p+ ー '‑'l‑p̲ ' ‑d I ' ‑ ' "ad) 1 1) Example5 3 . 2L o g i s t i cModelingwithC a t e g o r i c a lP r e d i c t o r s 高齢者の Neuralgia(神経痛)に対する 鎮痛薬の試験 反応変数:Pain(痛みの有無:Yes,No)の消失率 群変数:Treatment(治療 :p(プラセボ), A,B ) 共変量 : S e x (性別:F ,M) Age(治療開始時の年齢:連続量) Duration(履病期間:連続量(月)) ‑ 7 9 0 ‑

795.

︐ 白U F D 7 f n b マ JRU7F ﹃ f a u a u 氏U 畑﹁﹁ E ' F 4 M剛 M川 M m E a M m M川 M m M m M m M附 EE 守 jaunb つL q υ A守 ハbquEuodnbRUEUEJM ﹃/﹃/白u ιEJU1E 1 唱 4 1 1 噌 1 11 ︽ nu u V I M刊 V P M N M刊 削 N V I M閃 VlvlvtVIVa‑N川 MN 21 ・ 川u 川 川 川 内匂︽ 川 刊川町川 ・ N 川 M 川 V I v v‑一 VIv‑ ・ 内 噌 ﹄ 66725 0 1 0 1 1 1 6 7ワ7 511 ι ? 11 斗 ηζqun49ι 円 tssssss ηαnunu U ハ UnunununuAU o n u UAUnu N H V I M N M N M N V ' V E M N V v ‑ N H V T N門 川 刊 NMPAAPPABABBAPPPB E‑‑‑ fvlN a a a ︐4 vHU ・ ﹃ . 'n t ︐ ﹁ uMHMHMFIE‑uM ﹁ ﹁ EIHM ﹁ r ﹃ 凋斗 7' ・ ttηζη 乙 凋 斗 qOQunU / n u η L Q U F b 4 7' ﹃/﹃/ P 0 7 r n b n o 7 ' 7 J 守f n U マf ハ 町 内 0 7 J L1e1lt14lA 幽 gb 4v. A u n ‑E . E x F vBUMF‑HMHMr づ a'ecυ 回命事 ︐ 噌︐ 一︐︐ ﹄ ︑ ︐ + 1 ‑ nHnbqucuqu ハ @ A V Q U ロU A N A H A n A m D l D B 口u B U D I D ‑ D ' A H A a+L . . ・ 一. ︐ ununuoununununuounuaununununuou F司 圃E F mρN NYNNNNYNYNNNNY 十圃 一圃 一圃 ︽ ‑Ea F 1 B n d 凋斗 nunungnU マf Q u n D n u n O f n u o 00 守 ' ' ハb n O づF 守f c O I C O P 0 7 f 守f n b︐ ‑ a ﹃o n D l‑ 1 川 1 n H ︐ ﹃ FF a E ' F ' E E E I H 附 M 川 E 1 M川 M m F 4 M m E I M m F ト M附 ・帽 小 品 マ ︑ ︒ζ q u 凋斗 kund‑11111 7'1111QU つι ﹃﹃d ' n u ︐ ︐ 命脚 v q O 1 Bワ﹄n L 凋斗 4 l n L n t 1 1 1 B l n t nt rEO ‑ 'nbnbcdqucucdnU ‑ 1 ﹃4 000e800000eeeee 3 't M M N N Vav‑N N upBAABABAAPBAPAA ︐ ︐‑2・ ‑ E‑EH ートトl a u alu‑‑nO il河 内 ノ F H L 6 0 8 7 9 1 0 2 5司4 1670 3 u 1 E 9﹄ ワ ι 四回 . ︐ ︐ ︐s ' a u n u o usncuunsusnsucauusnsu a u o u o u a u a u •• ‑ 一 内 vtl dv ‑ lQunvqζ 凋斗 nu‑‑ 白d 凋 件 ︒4nwuT17JnJι1・ 一 ‑ 4 0 b e S 唱 1 唱 ー のζ 1 t η L 4 1 ;圃 1tηζηζ lireη 唱 2uTE'nH ﹄ 〆 ri 口 7' 広Jvn 口 FU7'FhdnU 内/﹄ u + L l i n D 7 ' n o n U 凋斗 nuun h u ヴJ 7 ' euanDP 口 7'no7 ・ rD7'7'nhv7'nbnhu ハ H V u m川 n nHqG ︐ ふ alAU E ﹄ E l E I FE ﹁ E S E E M附 Et ト M m H川 E I M附 E1Mm ﹁ & E ‑ ‑ a u 同 nkunvEnkunvEnv'A品川 n HunHunvt nHunvtnHuunHunHURμlenu 7 9 1 ‑ ー 掴 NQ 臨 Y闘 Pain p B ‑ ‑ A ~ │ 医 療 、 附 閥 均I ゐ訴訟員二… ~9 医癒政府自治体大…口シスー一一 デ、ータセット Neural :痛みの消失率 20 15 富市 Treatment 2 2

796.

l‑ 師、大学悶コザ拘…会 W l J 9 LOGISTICの基本プログラム o d sg r a p h i c s0 n ; PしO T S二 ( O D D S R A TI 0E F F E C T ) I proc l o g i s t i cI d a t a二 n e u r a l g i a ; c l a s st r e a t m e n ts e x / p a r a m 二g l m ; m o d e lp a i n =t r e a t m e n t ; │ o d d s r a t i ot r e a t m e n t ; r u n : o d sg r a p h i c so f f ; I 2 3 標準誤差 I W a l d 力イ 2乗 I P r >ChiSq ‑ 1 . 0 9 8 60 . 5 1 6 4 4 . 5 2 6 1 0 . 0 3 3 4 2 . 1 9 7 2 0 . 7 3 0 3 9 . 0 5 2 1 0 . 0 0 2 6 2 . 1 9 7 2 0 . 7 3 0 3 9 . 0 5 2 1 0 . 0 0 2 6 。 7 9 2 ー 叩

797.

デフォル卜は d i f f二a l l オッズ比の 95%Wald信 頼 煩 界 ‑ ' . "+ =ORs 1 5・5 5・1 5 A =一 一 = 1 , ̲ 句 " ・ntA vsP T 1 5・1 5 ORm=O R D n=一5一5 一= 9 中 ・ ,匂 明 ・ ntB T a ¥1$ 山 ・ P 。 。, 一一一一一 ー一一 柑 。 2 回 : : t " ; . r ズ 比 25 一 a │臨政問均一一る印ス弘の実千s P L O T S = ( E F F E C T ) 予測信事 Pain=No '00 。 " 皇制 15/20=75% 15/20=75% 一一 7 9 3 ‑ ー 26

798.
[beta]
基準群との比較
デフォルトは d
i
f
f二 a1
オッズ比の 95'"Wald信 頼 限 界

一
一
一
一
一
一
→

T
'l
Ia
同 制 A'
15P

h
l
l
i
l肺!!In
tB '1$ P

トー

.
,

"
'

2
0

オッズ比

40

│闘、政府間均一一弘みんー

27

~9

P
L
O
T
S二(
O
D
D
S
R
A
T1
0a
L
O
G
B
A
S
E二日)
オ
ッ
;
;
(
"
J
:
t
の 95%Wald 信 組 i
眼界

了,.,匂明曹のtA"
"B

し

2
.
1
5

9
.
0
0

3
7
.
6
6

T
"
"
'>ltme耽 A V~ P

4
.
1
8倍 4
.
1
8倍
Treil旬
、
内
.
骨
量 B、
'
'
'
'p

1
/
2
.
7
1
8

1

f
.
冗
皆

2
.
7
1
82

2
.
7
1
83

) Wald型で、は左右対称
自然対数(等比スケール,
‑
7
9
4
‑

フ8

799.

点推定値が最小 オッズ比由 9日 W副 d信績額界 最小 1 T,岨伽鴨舵 A 四 8 T, ・ . I m 併 時 A叫 P I ー ト { 一 一 一 一 一 T得・旬、e喰 B" ' ρ ぃ一一一一一一 一 一一一一一一ー一一一一一一一一一一一……一‑‑"‑1・ 一 一 一 十 一一一一一一一一・一 8 最大:9 オッズ比 2 0 1 長与の実証 S AS ‑tf‑o l 医癒、政府・自治体、大学によるZコ 三 むズ:~llÆ~m SAS~Hf-ø* . l . 29 ~.J UI 会 PLOTS=(ODDSRATIO~RANGE=(O , 3 0 ) 1 ) ) オッズ比の範囲を指定 オッズ比の 9511W.ld信頼限界 T開・旬、.械 A ¥1$ B ト ・ 一 一 一 一 → Tn 期 制 A 凶 PI ト ・ 十 目 一 一 一 一 一 一 ー 日 T地 拍 帽 悦 B ,/5 P J 30 ‑ 7 9 5 ‑

800.
[beta]
垂直に信頼区間をプロット
オッズ比の 95"Wald慣 鰻 担 界

"
'
J
O

0
2

4
幼 khL町

1
0

・,

T .tmw
曾 A ~~ B

,

Tr
制 刷 僻l
tA". P

T
櫓油引I$flt B".~ P

31

一
一
一
一
一
一
千
竺
竺
勾1
9
P
L
O
T
S(
O
D
D
S
R
A
TI
0~TYPE=HORIZONTALSTAl1) )
O
Rの数値をグラフにプロット
二

1・
て‑
:
,
J
;
;
て
.
t
t
;
<
1
> 95% W..ld f
冨車置田豊里事

・・

了r .
t
r
n!otA vs B

T
・
,8刷・枇 A vs P

T
'
‑
"
i
l句 "

武

B ¥o'S P

1{02394184011

ト一一一・一

1ト ー

・…一

。 をo

20

30

オッズ比

7
9
6

ー

・

一
一
一
→

9 位 向 曲 目 659)

‑
→

9 {21日)937659)

40

801.
[beta]
尤度比検定に基づく信
ラベル
TfI'Hl町 .ntA 

サー→

B

Tre

.
t
I
旬T
u
t
n
tA vs P

TreatmentAv
sB

0
.
2
3
3

4
.
3
0
1

TreatmentAv
sP

2
.
3
0
6

4
1
.
7
4
5

Tr
e
a
t
m
e
n
tBv
sP

2
.
3
0
6

4
1
.
7
4
5



 

Tn
!
la
  官tB '0'$ P!

一一・一一一一一一一 
 




 一一一一一一一一一一一一一一一一一一一一一十

f 





o







10





20





30

40

B

 γズ比

ェー同議機構;~S~-~-.*

2
0
1
(
1

オッズ比の多重比較
I
s
m
e
a
n
st
r
e
a
t
m
e
n
t
l
a
d
j
=
t
u
k
e
y
Ic
le
x
p;
Treatmentの最小 2乗平均の差

多重比較の調整:Tukey
TreatmLTreat I
調整済│アル
ent
Iment I
P
ファ

未調整オツズ比

指数

多重性調整オツズ上

IExponelExponel
調整済│調整済
n
t
i
a
t
e
dI
n
t
i
a
t
e
d

オッズ比 i



多│重性調整 b


B P
 P



﹂A 
B

Lower IUpper 1下限
Exp

│上限
I
E
x
p

1
110.05 1

0239 1
4
.
1
8
4 1
0
.
1
8
1 1
5
.
5
3
8

9
0007 10.05 1

2151 1
3
7
.
6
6 1
1
.
6
2
5 1
4
9
.
8
4

口功亡雪五舌日汀、ョて傘本一ー 1+n.j..;"
'
1、

‑797‑

34

802.

smeanst r e a t m e n t / a d j = t u k e y0 1e x p ; PSln の 比 厳 τrea t .rnent . P‑A P‑B の比較 。 ‑2 ‑2 一 A ヲ ー ' ー 「1 o 」 「 2 、 3 I s m e a n st r e a t m e nt/凶 j = d u n n e t t Id i f f = c o n t r o l (P " )c le x p; P 群との比較 ‑ 7 9 8 帽

803.

o d sg r a p h i c so n ; p r o cl o g i s t i cd a t a二 N e u r a l g i a P L O T S = ( O D D S R A T I O ( T Y P E二 H O R I Z O N T A L S T A T ) ); c l a s st r e a t m e n ts e x /p a r a m = g l m ; m o d e lp a i n二 t r e a t m e n tI s e xa 巨ed u r a t i o n l o d d s r a t i ot r e a t m e n t : r u n : │医療政府開、大学問問がみ‑‑紬 D W l J 交絡を調整したオッズ、比 各変数の検定結果 効果に対する Type3分析 Wald 効果 自由度 力イ 2乗 Treatment 2 1 2 . 5 3 1 0 Sex 5 . 2 9 4 6 Age 7 . 2 9 7 7 D u r a t i o n 0 . 0 3 1 5 Pr>ChiSq 0 . 0 0 1 9 * * 0 . 0 2 1 4 * 0 . 0 0 6 9 * * 0 . 8 5 9 1 3 8 7 9 9 ‑ ー

804.

最尤推定値の分析 パラメータ 自由度 推定値 標 準 誤 Wald Pr>ChiS 差 力イ 2乗 q I n t e r c e p t . 5 9 1 55 1 5 . 5 7 4 46 . 5 8 2 8 0 . 0 1 8 1 Treatment A 3 . 1 8 1 7 1 . 0 1 6 19 . 8 0 4 9 0.0017**I 3 . 7 0 8 5 1 . 1 4 0 71 0 . 5 7 0 0 0.0011** Treatment B Treatment P Sex F Sex Age M 。 。 。 。 1 . 8 3 2 2 0 . 7 9 6 35 . 2 9 4 6 0 . 0 2 1 4 * ‑ 0 . 2 6 2 10 . 0 9 7 07 . 2 9 7 7 0.0069** 0 . 0 0 5 8 60 . 0 3 3 00 . 0 3 1 5 0 . 8 5 9 1 D u r a t i o n 臨政問…!こゐ1 1 尚 美m;~S~-4f-.a 2 0 1 9 交絡のみを調整したオッズ比 オッズ比の 95%Wald慣 絹 想 界 一寸 Tf 1 ! ll lb'可同@打tA '~S B 05開 5(0郎 副 37053) T . . . . .駒 市 崎 AvsP 24081(3287fi 17648) 一 一 一 → ・ , T a刷ent.B ¥/1; P I ト-~_.一一一一一一一一 100 3 0 0 200 40194(436時 四 日 日 400 オッズ比 40 ‑800 司

805.

│閥、ーらみi 持移譲ぽ.総会 ~II~n 多重性と交絡を調整したオッズ、比 o d s graphics o n ; proc l o g i s t i cd a t a二 Neuralgia P L O T S二 ( O D D S R A T I O ( T Y P E二 H O R I Z O N T A L S T A T ) ); c l a s st r e a t m e n ts e x /p a r a m = g l m ; m o d e lp a i n二 treatmentlsexa g ed u r a t i o n l I s m e a n st r e a t m e n t A a d j = t u k e y I c le x p ; r u n : H Treatmentの最小 2乗 平 均 の 差 多 重 比 較 の 調 整 :Tukey‑Kramer(調整後) 上J 多重性調整 p j 直 多重性調整オッズ Treatme Treatm Pr>I z l 調整済 指数 n t e n t P ExponenExponen調 整 済 調 整 済 │ 上限 t i a t e d t i a t e d 下限 Exp Lower Upper Exp A B 0 . 5 7 4 0 0 . 8 4 0 2 0 . 5 9 0 5 0 . 0 9 4 0 93 . 7 0 5 3 0 . 0 6 5 6 75 . 3 0 8 8 A P 0 . 0 0 1 7 0 . 0 0 5 0 2 4 . 0 8 7 43 . 2 8 7 6 1 7 6 . 4 8 2 . 2 2 6 1 2 6 0 . 6 4 I B P . 3 6 1 6 381 .55 2 . 8 1 5 4 5 9 1 . 0 9 0 . 0 0 1 1 0 . 0 0 3 3 4 0 . 7 9 4 24 オッズ、比推定と Waldによる信頼区間(参考未調整) フベル 推定値 95%信頼限界 TreatmentAvsB 1000 0 . 2 3 9 4 . 1 8 4 TreatmentAvsP 9 . 0 0 0 2 . 1 5 1 3 7 . 6 5 9 TreatmentBvsP 9 . 0 0 0 2 . 1 5 1 3 7 . 6 5 9 ‑801‑

806.

W J [ 1 医樟政府自治体大学によるエコシステムの実証一蝕 予測確率のプロット o d sg r a p h i c so n ; proc l o g i s t i cd a t a = N e u r a l g i a P L O T S二 ( E F F E C T ) t c l a s st r e a t m e n ts e x /p a r a m = g l m ; m o d e lp a i n =t r e a t m e n ts e xa g ed u r a t i o n ; o d d s r a t i oT r e a t m e n t : r u n : 43 lF‑ mJ … 一 実 証 純 一 消失率の予測確率のプロット BF 015 一一‑r‑ーーー 60 ー ー ー ー ー ー ー ‑ y ‑ ‑ ‑ 吊 F 伊 問 問 問 団 ー ー 70 60 A& e T. , eatment.Sex 一一一一‑A F ‑一一一‑ A M ‑ ‑ ‑ B F ‑ 一一一一‑ B M 一一一一一 P F ーP M 44 ‑ 8 0 2 ‑

807.

…11記録謀議!長一 ー ム 白1 等高線プロット ~9 o d sg r a p h i c so n ; p r o cl o g i s t i cd a t a = N e u r a l g i a ; m o d e lp a i n =a g ed u r a t i o n ; │ e f f e c t p l o tcontour~ r u n ; o d sg r a p h i c so f f ; 恒竺竺竺空竺雪三士~日| 等高線プロット平面 m o d e lD a i n =a g ed u r a t i o n ; 羅病期間 低年齢な人の .:No 消失 .:Yes 痛み有 消失率が高い モデルの適合度統計量 z e a 基準 │切片のみ│切片と共 AIC 1 8 3 . 5 0 3 sC 1 8 5 . 5 9 8 1 8 4 . 7 5 5 81 .5 0 3 2LogL 1 1 7 2 .4 72 変量 60 ,. 7. 80 1 7 8 . 4 7 2 予測確率を 等高線で結ぶ 4 ( ‑ 8 0 3 ‑

808.

ロット 年齢の 2次の項追加 o d sg r a p h i c so n ; p r o cl o g i s t i cd a t a = N e u r a l g i a ; m o d e lp a i n = agelage*age~uration; e f f e c t p l o tc o n t o u r ; r u n ; o d sg r a p h i c so f f ; 47 ロット曲面 m o d e lp a i n =a g eage*aged u r a t i o n ; ・ :No 消失 = Noの 予 測 確 事 .:Yes 痛み有 75 BO 48 司 8 0 4 ‑

809.

交互作用項の追加 o d sg r a p h i c so n ; p r o cl o g i s t i cd a t a = N e u r a l g i a ; m o d e lp a i n =a g el a g e * a g e~uration d u r a t i o n * d u r a t i o n l p g e * d u r a t i o n e f f e c t p l o tc o n t o u r ; r u n ; o d sg r a p h i c so f f ; 49 ロ ッ m o d e lp a i n =a g ea g e * a g ed u r a t i o n o na e:e*du 'l ~Won;消失 duT55112凶 i .:Yes 痛み有 モデルの適合度統計量 岨 基準 切片の み 切片と共 変量 AIC 8 3 . 5 0 3 7 6 . 2 3 5 SC 8 5 . 5 9 8 8 8 . 8 0 1 ‑2LogL 81 .5 0 3 6 4 . 2 3 5 。 曲 同 50 ‑805 幽

810.

d u r a t i o n ( 2 ) a g e ( 2 ) a g ed u r a t i o n ( 3 ) 護 d u r a t i o nd u r a t i o n * d u r a t i o na g e ( 4 ) d u r a t i o na g ea g e * a g e ( 4 ) d u r a t i o nd u r a t i o n * d u r a t i o na g e a g e * a g e ( 5 ) d u r a t i o nd u r a t i o n * d u r a t i o na g e a g e * a g ea g e * d u r a t i o 0 ( 6 ) ReceiverOperatingC h a r a c t e r i s t i c i nNegativeCases 健常群 偽陽性 TrueP o s i t i v e / 真陰性 真陽性 感度 Threshold(闇値) を下げると 陽性率 疾患(感度) 健常 ( 1ー特異度) ‑ 8 0 6 ‑

811.

100~ら p ( T r u eP o s i t i v e sa r ef o u n d ) o r S e n s i t i v i t y 真陽性 感度 。p(FalsePositivesarefound) 100% o r 1 ‑ S p e c i f i c i t y 風一;土手i334 識し… 疾患なし寧 疾患あり 本 * 牢 * ~9 牢 data w o r k : i n p u t group t i m ec e n s o r @@; c a r d s : 141161181 251271291 proc l o g i s t i cP L O T S二 R O Cd e s c e n d i n g ; m o d e l group二 ti m e ; r u n ; ‑807‑

812.

│医醸一体規Iq‑‑Ls ュ チ 総 会 疾患なし* 疾患あり 闇値 * 牢 * w l l 9 * 1一特異度疾患なしで鴎値以上 *感度疾患ありで闇値以上 ↑ ↑ ↑j に よR O c t↑ 線 AUC=6j9 075 輩。日 ROC曲線 025 。 025 050 075 零 00 1一 時 興 産 │医療政府自治体均一士?三好ムープー ~9 AUCが1 に近い方が予測力が高い ( O J 1 )感 度 = 1,特異度 = 1 感度 1‑特異度 ‑ 8 0 8 ‑ 5 6

813.

「疾患あり」集団が「疾患なし J 集団より 予測確率が高くなる割合 の集団から 1人 , r 疾患なし」の集団 「疾患あり J 疾 から 1人,それぞれランダムに選んだとき, r 患あり」の人の予測確率が「疾患なし」の人の 検査値よ1 も大きくなる確率 どちらの予測確率 が高いか り 」 「疾患 巨額政府自治体大学によ拡散ステムの知一触 っ 7 ~II]9 Mann‑WhitneyのAUC N1:疾患あり群のサンフ。ルサイズ N1X N2人の N2 :疾患なし群のサンフ。ルサイズ 予測確率の比較 P l i :疾患あり群の個体 i の予測確率 P2j:疾患なし群の個体 jの予測確率 " 1 N. N 今 AUC=一二一‑)~ )~Uii(PI i' P2i) N1xN2 7 : tj 三 fv H ゐ J ( 1 PIi >P2j P 2 j )=1 .5 P戸 P2jN. , 人 U i j ( P l i, LOPIE>P2j‑ 圃 8 0 9 ‑

814.

疾患群 6 /9 勝 率 (AUC): 0 . 6 7 疾患あり 1 1 ‑ 3 1 1 ‑ 2 1 1 ‑ 1 疾患なし ゅ. 3 7ゅ. 5 5 ) │ 9ゅ. 7 1 ) 1 5 刊 ー 65 3) 9 24 、 、 ー " ' " 3 一 向 タ ,/ 、 ¥ / 。 Yμ t 2 │医療政府自綿大学による工均ムゐ実証一齢 疾患なし牢 疾患あり 本 、 勝! ~llJ9 本 寧 3 ホ ホ 2 1 毛 デ ル に 対 す る R O C 盛凶匝 8 回 E同 E叫 aEJ 3 令 の大 しド 持低 A 噌 疾・ よ ︐ は人︐ 唱A nU n u ζu ︐ 守nu X 3 2一 一 一 l一 3 + 1一 3 × 3 2一 3 l一 05 ・+ 73一 3 3 × 一 一 d 一 ‑ c u 醐輔下蘭梱 ~O 蝿肝 肘 ( O . 3 3, 0 . 6 7 ) I ~人はよ疾り患値ながし大 の 器。田; ( 0 . 0 0 . 0 . 3 3 ) 面積は = 6 / 9 : 1は疾患なしの 3みより値が大 0.00 0. 25 050 1 一 宇 , " ' . 圃E ‑ 8 1 0・ 。 75 1(回 60

815.

AUC=l 感度 =1 1・特異度 =1 疾患なし 疾患あり AUC=O.8 感度> 1 AUC=O.5 感度= 1 ・特異度 予測値の分布 ROC曲線 AUCl I~Jj. i s lR t t. 1 3~~f*大学によるエコ均ム尚一 ROC曲線の作成とAUCの比較 仙 graphicso n ;モデル ( 4変数) proc logistic data二 Neuralgia P し O T SR O C( I D = P R O B ) ̲ ; 二 class treatment sex/param 二g l m ; m o d e l pain二 jtreatment sex age durationl roc age age roc 'd u r a t i o n ' duration: lroccontrast reference(model)Vestimate e ; r u n : 6ヲ ‑ 8 1 1 ‑

816.

時、蜘・自治体鳩山一戸高石…‑ 4 f ‑ . . 2 0 1 4 ROC曲線の作成 :4変数(モデル) モデル『こ対すをL.BQC曲轍 蘭 輔 下 面 指IF 軍荷宮司 , . 。 HJO 002 一 ,/ " 〆 。 ァs 輩。叩 025 0.00 000 0̲25 050 1 075 1{開 特異度 age 1 こ対するl3CJ,;i...曲線 曲輔下蘭槽 0.7011 I 100 075 輩。抽 回 : J / 000 025 050 1‑ 特 異 度 ‑ 8 1 2 ‑ 075 1(由 64

817.

t冨 d 宜 i ' i盛b.. dura t .ion に対掴す篭 曲輔下蘭 ,. " " I 0 . . ・T 〆 。 。 51 ι 0.75 襲。回 055 . : Y 。 F 。 ~2 山 。 曲1 0.00 。 一 ' 恥 . . .。 05 0. 25 75 '正時 65 J:t車査に対する R O C 働 織 100 。 75 輩。田 0. 25 。 曲 I' 0.00 ‑,.一一 0. 25 050 市ー崎県鹿 ROC陰 線 f部 被 》 一一一一奄"7')... (09 。 引3 一一一一一一一也同制副首 (05808) 0.15 1̲OO ・ ・ 伺 ・ " 8 70 66 ‑ 8 1 3・

818.

一一 AUCの比較 ROC関連性の統計量 ROCモ IMann‑Whitne笠 デル Somerslガンマ ITau‑a │面積標準 誤差 95%Wald 信頼限界 のD ( G i n i ) . 0 4 1 2 0 モデル 1 0 . 9 0 5 10 . 8 2 4 4 1 0 . 9 8 5 8 0 . 8 1 0 31 0 . 8 1 0 31 0. 4 006 ( 4変数) 0 . 7 0 1 10 . 0 7 1 7 0 . 5 6 0 50 . 8 4 1 81 0. 4023 1 0. 4211 1 0 . 1 9 8 9 duration 0 . 5 8 0 60 . 0 7 4 4 0. 434810.7263 1 0 . 1 6 1 11 0 . 1 6 9 3 0 . 0 7 9 7 age 67 1 1 1 医療、政府・自治体、大学によるZコ シ ス テ ム ; の 擦 問 漢r 語 rUJ ROC対比の係数 ROCモデル • Row1 。 。 d u r a t i o n , u Row2 モデル a g e ~æ 宇触 ROC対比検定の結果 3種類のモデル全体でAUC(こ差があるか 対比 │自由度 R e f e r e n c e=モデル │ カ イ 2乗 IPr>ChiSq 1 2 0 . 0 0 7 5 行ごとの ROC対比推定と検定の結果 標準 誤差 95%W a l d 信頼限界 カイ 2乗 対比 推定値 a g eーモデル ‑ 0 . 2 0 4 00 . 0 7 4 3 ‑ 0 . 3 4 9 61 ー0 . 0 5 8 4 7 . 5 4 0 2 ‑ 0 . 3 2 4 60 . 0 8 1 5 1 5 . 8 7 8 9 d u r a t i o nーモデル Pr>ChiSq 0 . 0 0 6 0 本* く. 0 0 0 1 * * 68 ‑ 8 1 4 ‑

819.

薬剤 薬剤 計 + + v ︐ ︑ 戸 'hEE ンン ︐h J 卜 イ+一イ ベベ 薬剤│薬斉J II 計 1 0 1 1 5 イベント a 。 + 5 1 1 0 1 1 0 1 2 0 言 十 C n イベント b d n+・ 計 n司 + n n . 09 ∞ 一 一 5 一 O AU一 5 一 一 ‑一 c 一α ︐ 一 ' ba y 一 一 一 侃 分一 布 一 と の 一 r1446 0 ' 5 1 0 額 岨 v 臨。麗 1 70 ‑ 8 1 5 ‑

820.

d a t ad a t a : ・ i n p u txyw@ c a r d s : 00501 5 100 111 0 o d sg r a p h i c so n ; p r o cf r e q ; t a b l e sx * y / pI o t s = f r e q pI o t( T W O W A Y = s t a c k ) l c m h l ; 一 一 w e i g h tw ; r u n ; 7 1 95%信頼限界 ケースコント ロール研究 Mantel‑ Haenszel (オッズ比) ロジツト** 2 1 . 0 0 0 0 I コ ホ ト 研 Mantel Haenszel 究 ( 夢J I1のリスク)ロジット** コーホート研 Mantel‑ 1 1 . 0 0 0 0 0 . 6 8 8 0 1 7 5 . 8 6 2 6 0 . 5 0 0 0 0 . 2 6 9 0 0 . 9 2 9 3 0 . 5 0 0 0 0 . 2 6 9 0 0 . 9 2 9 3 可~ ウ‑ 相対リスクの推定値(行 1/行 2) 値 調整方法 研究の種類 而 一 CMHオプション 回 一 R O l 医痩政府関均とよる1 1 夜 1 1 1一 … ~llJ9 0 . 9 7 1 6 4 5 3 . 9 1 1 6 I Haenszel ( 列 2のリスク)ロジット 計算していない推定値があります。 **セル度数が 0を含む表の場合には、その表の 全セル l こ0 . 5を加えて、調整を行っています。 ‑ 8 1 6 ‑ 72

821.

w m 医 療 、 政 府 ・ 自 治 合 ; みI 寺 . 近 ザ . 議 議 議 議 会 ¥ ト 三 麟 % た 諾 もユ ム哨 セル度数 +0.5 OR=土 互 5.5.10.5=21 .0 C バ α. d 5 . 5・0 . 5 一 薬剤 薬剤 計 薬剤 薬剤 計 十 + . 5 イベント 5 + . 5 イベント 5 1 0 . 5 1 1 十. 5 c + . 5 n.+1 イベント a + 0 . 5 6 イベント b+.5 d+.5 n + . + 1 計 1 1 202 計 1 1 n . + l n+ + 2 + 1n ・ 7 3 proc logistic descending; 二x ; freq w;run; model y proc logistic descending; 附円 1firth~freq 川n; proc logistic descending; model y 二x / ;判 ct xVestimate二 both; freq w ;r u n ; 74 ‑ 8 1 7 司

822.

開度 行一由 ︿ 一自 古巴口同 推一介 定一寸 最一パ 尤一ラ │標準誤差 I W a l d Pr> 力イ 2乗 ChiSq 推定値 I n t e r c e p t x 1 06E‑181 0 . 6 3 2 5 1 0 . 0 0 0 0 1 . 0 0 0 0 1 2 . 5 6 6 1 1 1 6 9 . 3 0 . 0 0 5 5 0 . 9 4 0 8 オッズ、比の推定 効果 点推定値 X > 9 9 9 . 9 9 9 95%Wald 信頼限界 く0 . 0 0 1 WARNING:恐らくデータ点が準完全分離の状態です。最尤推定値は存在しないかもしれません WARNING:LOGISTIC プロシジャは上記の警告にもかかわらず継続します。 最尤反復に基づいて結果が表示されます。モデルの当てはめの妥当性は疑わしいです。 7 5 。 ~ 医積、政府・自治体、大野~工コ巧!Ii3fjj翼民!.," tトザー総会 P 。 ー ラO 1 ‑ M q ? 最大尤度反復履歴 反復 リッジ 。 2 3 4 5 6 7 8 9 1 0 1 1 。 。 。 。 。 。 。 。 。 。 。 。 Q ‑ 2対数尤度 Inte命e~ 〈 ヲ / 。 xi 1 2 2. 493406 1 . 0 9 8 6 1 2 1 5 . 6 8 4 7 1 8 ‑ 0 . 2 3 4 7 2 1 2 . 6 6 6 6 6 7 1 4 . 4 4 6 4 6 0 0 . 0 0 2 1 6 1 3 . 5 1 7 6 5 0 1 4 . 0 7 3 3 0 1 1 3939772 1 3 . 8 9 1 1 3 3 1 3 . 8 7 3 3 0 4 一1 . 6 8 2 4 8 9 E ‑ 94 . 5 4 9 4 1 6 1 3 . 8 6 6 7 5 4 ‑ 1 . 0 6 2 5 2 E ‑ 1 68 . 5 6 5 7 6 7 1 3 . 8 6 4 3 4 5 7 . 1 2 3 2 0 8 E ‑ 1 79 . 5 6 5 9 5 8 ‑ 1 . 0 6 3 6 E ‑ 1 6 1 0 . 5 6 6 0 2 8 目 1 3 . 8 6 3 4 5 9 1 3 . 8 6 3 1 3 3 1 3 . 8 6 3 0 1 3 町 818‑ 6 . 9 3 8 8 9 4 E ‑ 1 75 . 5 5 9 9 9 0 一1 . 0 7 5 5 3 E ‑ 1 66 . 5 6 3 8 3 9 7 . 1 1 2 3 6 6 E ‑ 1 77 . 5 6 5 2 4 9 7 . 1 2 7 2 7 4 E ‑ 1 71 1 . 5 6 6 0 5 4 ‑ 1 .06353E‑16 1 2 . 5 6 6 0 6 3 司,

823.

メ 1 ↑予thJ 100 の つ ; ミ/万五一一ー pV‑pY× ム ー ( 1 P+10× )0 P‑=5/10=01P+=10/10=1; s o= = 0 , A= = ∞ 。 x < p " ( ゐ x ) y‑1+叫胸珊舟吋叫+叫(∞ x ) 。倒的 e申 (β。 +βI~Y一一 C 1田 7 ' 最尤推定値の分析 パフメータ 自由度 推定値 I n t e r c e p t1 ‑ 0 . 0 0 0 0 30 . 6 3 2 5 3 . 0 4 4 6 1 . 6 4 4 6 X 標 準 誤 差 Wald Pr> 力イ 2乗 ChiSq 0 . 0 0 0 0 1 . 0 0 0 0 3. 42 7 0 0 . 0 6 4 1 オッズ、比の推定 効果 X 点推定値 9 5 %Wald 信頼限界 0 . 8 3 6 7 8 ‑ 8 1 9 ‑

824.

予測確認'" y=1 町、慣帽圏界 100 075 冊。叩 離 。 25 000 000 025 050 100 075 3 。 祖 剖 櫨 ー … … … 予 測l 憧 7) イベント + イベント 1 5 1 1 0 l i k e l i h o o d(尤度) 1 5 1 0 薬剤一 :x=o,薬剤 +:x=l L) =モデルの下でデータが得られる確率 L=P‑5×( 1 ‑ P ‑ ) 5×P + 1 0×( 1 ‑ p j o p e x p ( β。 ) ~ ̲ exp(so+β'1) =1 +e x p ( β )'P+‑1+exp(P+ β ' 1) 。 。 最尤法:s o,sーの値を動かしてしが最も大きくなるよう にする先ポ MLE:MaximumL ikelihoodEstimator 80 ‑ 8 2 0 ‑

825.

対数尤度とスコア関数 。 L=P5×( l ‑ p ‑ ) 5×P + 1 0×( l ‑ P + ) logL=5 1 o g p ̲+51ogq‑p̲)+IO logp++Ologq‑pJ U( A )ニ dlogL , ^ ̲ ̲ 10 7 f 10‑(10+0)p+= O => p+= 10+0 1 ^ /1 ^ ,m ̲ ̲ 一 二 一一 dlogL s o )=. ̲~ßo- =5+10‑(5+5)p̲一 ( 10吻'+=0勾 = 一 U( 5+5 81 log7‑L=β。+ん 1‑P 5 / ( 5+5 ) =log‑=O ‑01‑5/(5+5) ‑ ‑ 05 β。 =log~二一 =log リ l‑p̲ 1 1 0 0 / ( 1 0+0 ) β。 +βI=logiL=log=log‑=∞ 1‑p+ 1 ‑ 1 0 / ( 1 0+0 ) ‑ 00 L ̲ <:7 D D • (10・5i β ' 1=l o g~ r+ ‑log~ r̲ =l o g l一 一 1 =∞ 1‑p+ ~ 1‑p̲ ~\ 5 ・0ノ , . 82 咽 8 2 1 ‑

826.

)帥井戸 n o om 面 尤 nh × u 同 F 句 ‑ AU au n u n u n U 0.000325 0.000000 100 1 0 . 0 0 6.67 00 ‑1000. 83 ‑ p + 10 対数尤度 の等高線 0 . 5 ¥ n u nリ ‑10 0 . 0 1 0 g l R → 。0 シ + ∞ s 1ー ¥ ‑0.5 1 ~ 2 . 5 5 . 0 7 . 5 1 0 . 0 ‑20.55 一 一 ‑'l3. 2 5 ‑14.10 ‑1195 一 一 ‑7.65 ‑9.80 ‑ 8 2 2 ‑ 84

827.

尤度に罰則項を積算 尤度: L(PI Y), U(P):スコア関数,情報行列: I ( P ) 罰則項付き尤度: C(PI Y)= L(PI Y)xlII(P)I V J • I l o g L*( PI Y)=l o gL(PI Y)+0 . 5 1 o g I I ( P ) 1 . 5乗 I I ( P ) IO.S :罰則項,情報行列の行列式の 0 │ ー 1d I ( P )I rlI U~ ( P )= U( P )+0 . 5 t ( P ) 可│ e x p ( β。 +β'JXJ 単変量のモデル: J}; = 1+e x p ( β。 +βJXJ 五 85 │州.一‑幽 医積、政府守吋 j法r1ìI怜~令'冷 幻 1 仁、J勺 f U 幻 J= プ日‘ i ( 侃 1Y ‑ L= p(β0+βlXj) 1 γ 1 ¥1+e x p ( β +βJ Xj) ) ¥l+exp(β +βJ X i )) 。 。 l o gL= LYi(β。 +βJXJ‑L l o g [ l+ 叫( β。 +βJXJ] U O = 型笠主=~ンt-Zexp(β0+βJXi) 。 e x p ( β +βJ X i ) =エ ( Y i‑p J UJ=型笠主=エ xiYi‑ZXiexp(β0+βlXj) 。 +exp(β +βJ X i ) =L Xi(Yi一 P i ) uT = ‑ 8 2 3・

828.

1=‑d l o g L a 1 J a 1 3 1 d21 0g L d21 0 g L 一瓦瓦‑瓦瓦 1 ‑ 'LPi(1‑pJ む' i P i( 1‑pJ 一己盛一自彊 1 ‑ 1LXi P i( 1 ‑P i ) む訓l‑pJ 1 1 4 βt d s o dA 訓 推定値の分散は情報行列 の逆行列によって与えられる. 87 1 = [ 釘4 5 2 1 : 7 1 1 i ;~l e=( α ,+ b ) p ̲( l ‑ p ̲ ) + ( c + の 1 j J + ( 1 ‑ P + ) のI p +( l‑ p + ) f=(c+ 1I=ef‑f2= f ( e ‑ j )= ( c+ のI p +( l‑ p + )い + b ) p ̲( l‑ p ̲ ) =ドリ十(トp + ) ' p ‑ t トp ̲ ) I 88 ‑ 8 2 4 ‑

829.

L=p ̲ ax( l ‑ p‑txp/x( l ‑ pJd I I I = ( c + のI p +( l‑pJG α+ b ) p ̲( I‑p̲) 、 l ‑ p ̲ ) bxp/X( l ‑ pJd>lre~(1 -pJp_(1 _p_)f2 L *ぽ 艮αx( ニ p ̲ a+ 5 .X( 1 ‑p ̲ ) b+ 5 .Xp / + ( 1̲ p J d + . 5 のへ (b + O .分( c + O .分 OR=expf ! 3 ) 1= … (α+0.分(d+O.分 8' L*=LxI I I1I2 LxV[y+JxV[y̲J 二 L 二 p̲aX (1‑p ̲ ) bX p + cX (1‑p+)d =p̲ aX ( 1̲p̲ )bX p/ 111=(c+ 囚 P+(1‑p+)(α+b)p̲(1‑P̲) =φ +( 1‑p+)(a+b)p̲(1‑p̲) Max L 二今 p+= 1 M似 1 1 1コ p+ニ 0 . 5 P ( l ‑ y マ ) 90 ‑825・ I

830.

[町内竺竺竺空竺巳竺 2 0 9 o* L=155デ( 1‑ p ̲ i .5xp 十郎 x ( 1 ‑p + ) U . 5 尤度曲面 尤度 I ん10出 ) = 3 . 0 5 0.0000638 0.0000426 0.0000213 0.0000000 100 1 0 . 0 0 0.33 6 . 6 7 3.33 00 ‑1000. 91 2 . 5 ‑22.23 一一 2 0 . ‑14.29 ‑12.31 ‑826・ ずげ度線 ト吋数等一 P 尤高 F W 一対の一 ム¥ n × ¥一 ρ一 ¥ ↑ L l o g l V¥/ ︑ ︑¥! 峨一一¥﹂仇¥↑ =//it ‑11K11 臥仏↓ ¥γι d?一 1 一 550 0 0 . 0 7 . 5 1 0 . 0 ‑18.26 ‑10.32 ‑16.28

831.

│一関;ぷ結城ぶ…WlJ 9 田 中 勇 輔 浜 田 知 久 馬 佐 野 雅 隆( 2 0 1 4 ) 稀なイベントを対象としたメタ・アナリシス の性能評価計量生物学会 0セル存在下のメタアナリシス 通常の方法でオッズ比を算出すると, 2群の一方で 0セルがあるとメタアナリシスの対象外 ,オッズ、比は 0または無限大 安全性のメタアナリシス ロシグリタゾン(心筋梗塞)では ( 3 0 / 4 2 )研究が除外 ベバシズ、マブ(治療関連死)では ( 2 / 1 4 )研究が除外 日 しかし 2人の死亡確率は 大きく違った. ジャックは 20歳男性で 3等船室の乗客 ローズは 20歳女性で 1等船室の乗客 h t t p :f f w w w . e n c v c l o p e d i a ‑ t i t a n i c a . o r q f i n d e x . p h p タイタニック号の乗員のデータベース 94 幽 8 2 7 ・

832.
[beta]
ジャックは 20歳男性で3等船室の乗
l
o
J̲
̲
̲
̲
P
̲1
=‑
3
.
5
2
2
1
+2.
4978+2
.
2
8
9
7
+
大1‑p)
p=0.95

ローズは 20歳女性で 1等船室の乗客
l
o
!
!
1̲
p
̲
̲
ニ ‑3.5221+0.0344x20
~\1- p)
p=0.20 穴 } 駒
凪

P

ローズ昏章、者は男性で 1等船室の乗客
l
o
J̲
̲
̲
̲
P
̲1
=‑
3
.
5
2
2
1
+2.
4978+0
.
0
3
4
4
x20
l)‑p)

p=0.45

〆、'‑‑ .
r/

l
og
J~ι1= ‑3.5221+2.
497&
S
EX(MAL
め+1
.
28
0
伊 αAS
S
(2
)+2.2897P
αASS(3)+0.0344AGE
¥
.
.
l
‑
Pノ
固 ¥ 占
守主輩、 τ箪
2隼
纂

>
1

c
l
a
s
ss
e
xp
c
l
a
s
s
/
p
a
r
a
m
二g
l
mr
e
f二 f
i
r
s
t
;
e
xp
c
l
a
s
sp
c
l
a
s
s
*
s
e
x
;
m
o
d
e
ls
u
r
v
i
v
e
d二s

I
s
m
e
s
ti
mateI
p
c
l
a
s
s
*
s
e
x I
,

J
a
c
k
‑
R
o
s
e
‑

, Jack-fiance~
,

fi
a
n
c
e
‑
R
o
s
e
'
,

‑
1 000 0 1
0‑
1 00 0 1
‑
1 10000

A
a
d
j
=
s
i
m
u
l
a
t
e
l
e
x
P
Rr
p
n
;
回目四四回国
男女男女男

‑
8
2
8・

%

833.

LeastSquaresMeansEstimates Adjustmentf o rM u l t i p l i c i t y :Simulated 効果 値 フベル 推 定 値 標 準 誤 z 差 B o n f e r r o n i法ほど保守的で はない 多 重 性 調 整p i 直 Pr>I z l調 整 済 指 数 P 4721 10.68 く0001 く.0001 154.94 SEX*P Jack‑ 5.0430 0. CLASSRose 1. 40 く.0001 く.0001 43.6578 SEX*P Jack‑ 3.7764 0.3312 1 CLASSf i a n c e i a n c e ‑1.2666 0.5488 2 . 3 1 SEX*P f CLASSRose 0.0210 0.0516 3.5489 生存 生存 シンテ、レフ美女と野獣 0.05x0.80 =0.04 生存 死亡 ある愛の詩野菊の慕 赤い疑惑 0.05x0.20 =0.01 死亡 │生存 l タイタニック愛と誠 続星の金貨 死亡 │死亡 │口ミオとジュリエット 失楽園 ‑ 8 2 9 ‑ =0.76 =0.19

834.

C h r i s t o p h e rZorn( 2 0 0 5 ) AS o l u t i o nt oS e p a r a t i o ni nB i n a r yResponse Models.P o l i t i c a lA n a l y s i s13:157‑170 大倉征幸・鎌倉稔成 (2007) 精確ロジスティック回帰の近似推定値. 応用統計学, 36‑2, 3, 87‑98 ヨ3 ‑ 8 3 0 ‑

835.

TUTORIAL 政府統計ミクロデータの符号表から SAS変数のラベルと フォーマットを自動生成する SASプログラムの作成方法 Howt oWriteaSASProgramt oA u t o m a t i c a l l yC r e a t eL a b e l sandFormatsf o rSASV a r i a b l e s a b l e "Providedt o g e t h e rw i t hP u b l i cMicroDataofJapaneseGovemment froma CodeT 周防節雄(兵庫県立大学・名誉教授) 要旨 日本の政府機関が作成したミクロデータには、メタデータとして「符号表」が付随している。この符 号表は、政府機関共通の「政府統計個票データレイアウト標準記法 J (平成 1 8年)に準拠して作成され ており、エクセルファイルで、ネットからもアクセス・保存が出来る。そこには、変数名、変数の長さ、 変数の型(数値/文字)、ラベル、変数コードとその内容等が階層構造で表現されている。このエクセル ファイルから SAS変数のラベルと SASフォーマットを自動生成し、かつ、 SAS変数も自動的に r e n a m eす る SASプログラムについて解説する。本チュートリアルでは、 SASユーザー総会のデータ分析コンペに 6年全国消費実態調査の教育用擬似ミクロデータの符号表を例題として用いるの 使用されている平成 1 で、今後データコンペに参加予定のユーザーには大いに参考になるはずである。 1.はじめに 近年、パソコンの急速な高性能化と、データ分析用の優秀なソフトウェアの整備のおかげで、以前 ではメインフレームコンビュータでしか出来なかった公的統計 lのミクロデータ分析が大学・研究機関 の研究室レベルで、盛んに行われるようになってきた。公的統計のミクロデータの利用は、平成 1 9年に 新「統計法」が制定される以前は、ミクロデータの「目的外使用 J と一般的に呼称されていたが、今 では「調査票情報の二次利用 J2と言われている。 ミクロデータの提供の際は、以前は各省庁がそれぞれ独自のファイルレイアウトを使っていた。平 成1 8年に政府機関共通の「政府統計個票データレイアウト標準記法」が制定され、現在では、ミクロ データ本体と共に、この標準記法に準拠した「レイアウト表」と「符号表」がエクセルファイルで提 供される。符号表(付録 l)fこ含まれる主な情報としては、項目名、長さ、型(数値型、文字型)、変数 名、符号(し、わゆるコード値)とその内容(意味)がある。 データ分析の過程では、変数のラベルとフォーマットが不可欠であるが、ミクロデータには変数の 数が多いのが通例で、その作成には大変な手間と時聞がかかる。そこで、手作業で変数のラベルとフ ォーマットを作成する代わりに、符号表を入力データとしてこれらを SASプログラムで自動的に作成 1 公的統計とは、国・地方公共団体やその他の公的機関が作成する統計を指し、以前は「政府統計 j とか「官庁統計」 と呼称していた。公的統計のわかりやすい解説本として、『公的統計の体型と見方~ (松井博 2 0 0 8 )がある。 2 統計法(平成十九年五月二十三日法律第五十三号)の第三十二条以下に関連の規定がある。統計法の条文は以下の URL で閲覧出来る。 h t t p : / / l a w . e ‑ g o v . g o . j p / h t m l d a t a / H 1 9 / H 1 9 H 0 0 5 3 . h t m l ‑ 8 3 1 ‑

836.

すれば、便利だと考えた。本チュートリアルでは、 SASユーザー総会で、 2013年からデータ分析コンペ 6年全国消費実態調査の教育用擬似ミクロデータの符号表を例題として用いて で使用されている平成 1 いるが、このプログラムは他の公的統計のミクロデータの符号表にもそのまま適用できるので、利用 者には役に立つプログラムと自負している。 2. 全国消費実態調査の教育用擬似ミクロデータ 2 .1概 要 全国消費実態調査の教育用擬似ミクロデータ(以下「ミクロデータ」と呼称する)については「教育 用擬似ミクロデータの開発とその利用~平成 16 年全国消費実態調査を例として ~J と題する文書が 以下の URLで閲覧出来るので、詳細についてはそちらを参照して欲しいが、ここでは同文書の 1 2 . 2 教育用擬似ミクロデータ」を以下に引用しておく。 http://www.nstac.go.jp/services/pdf/sankousiryou2407.pdf 調査票情報から作成したものは、調査票情報であることを踏まえて、教育用擬似 ミクロデータでは、個票データから高次元の集計表を作成し、その高次元の集計表 から個票データに近似したミクロデータを作成するという方法をとっている。集計 表から作成するために、個票データでも、匿名データでもない擬似的なミクロデー タと言える。それでいて、この教育用ミクロデータは、実証分析に利用した際に 我が国の実態を反映できるように、つまり個票データの分布にできる限り近似する ように工夫して作成する方向で考えた。 このように集計表から作成する教育用擬似ミクロデータは、基本的に、①個票デ ータの分布に近づけるなど、元の個票データに近似したデータであること、②量的 属性の相関関係を保つなど、量的属性問の関係、が整合的であること、③全国消費実 態調査で言えば収入総額と支出総額が合致しているなど、調査特有のデータ構造を 保持すること、④標本調査における集計用乗率を考慮すること、⑤データ量は元の 個票データに合わせること、の考えの下で作成している。作成例としての全国消費 実態調査における考慮、点として、質的属性 5については、集計表の作成における分 類項目が該当し、その項目数は限られたものになり、量的属性については、分析上 必要と思われる収入項目、支出項目を収録する。 2 .2教育用擬似ミクロデータの S A Sデータセットへの変換 本チュートリアルの議論に必要なので、提供されるミクロデータ本体の SASデータセットへの変換 方法について簡単に触れておきたい。 9 7変数、 3 2,028レコードから成る CSVファイルであるが、提供に際し 提供されたミクロデータは 1 ては 7つの CSVファイルに分割されている。最初のレコードから直ぐにデータが始まっており、いわ ゆる項目名とか変数名に相当するメタ情報はない。このような場合、 SASデータセットへ変換するには m p o r tを使うのが最適で、ある。 様々な方法があるが、一番簡単にしかも確実に変換するには、 proc i 当初、 7つの CSVファイルをそれぞ、れ先にエクセルファイルに変換してから、 proc i m p o r tのマクロ e t文で縦に結合しようとした。 を作って、 7つの SASデータセットに取り込んだ後に、その 7個を s m p o r tを使うと、文字変数の長さは、各ファイル内で、最大の長さが自動的に定義され ところが、 proc i るので、データセットによっては同じ名前の変数なのに lengthが異なるケースが出て、結合しようと ‑832‑

837.

すると、エラーになり、うまくし、かなかった。どうしても、 p r o ci m p o r tを使いたかったので、まず、 DOSコマンドで事前に CSVファイル 7個を縦に結合してから、 p r o ci m p o r tで SASデータセットに変換 l~F197 の変数、 32 , 028 オブザベーションから成るデータセットが作成できた。 した。その結果、 F このデータセットをそのまま使うのでは、各変数が何を意味しているかわかりにくく、分析過程で は大変な不便を感じるし、何よりも重大な変数の取り違えが起こりかねない。そこで、少なくともよ m n e m o n i cn a m e )に変えて、かつ、変数ラベルも付けておくのが望ま く使う変数はそれと分かる変数名 ( nemonic化、変数ラベルの自動設定及び、変数の f o r m a tの作成をする方法を以 しい。この変数名の m 下で解説する。 2 . 3 符号表と S A Sデータセット化 ミクロデータの提供を受けると、ミクロデータ本体の他に、メタデータとして、 「レイアウト表」と 「符号表 Jがそれぞれのシートに保存されたエクセルファイルも提供される。本チュートリアルでは、 この符号表から、変数のラベル・フォーマットの作成、及び変数の mnemonlc化をする SASプログラム を論じているので、まず、符号表の中味に限定して概要を解説する。 6年全国消費実態調査符号表」の先頭部分を付録 1に示す。このエクセルファイル 提供された「平成 1 のオリジナル版にはセキュリティ用のパスワードが設定されており、そのままでは SASプログラムで読 めないので、パスワード設定を外したファイルに変換して使う必要がある。そのファイルに対しては、 p r o ci m p o r tで SASデータセットに取り込む前に加工を施している(付録 2 )が、詳細は、 3 .2節で述べて いる。このエクセルファイルをそっくり同じイメージで SASデータセットに取り込んだ結果を表示した 「結果ビューア画面」を付録 3に示す。 3. 本システムの解説 窒ち e2 ミ ク 3 .1全工程のフローチャート SAS 生 タ データ セット: 全工程のフローチャートを図 uこ示す。 筆者自身が作成した SASプログラムは、プ ログラム l~ プj ログラム 4 の 4 個あるが、 プログラム 4が自動作成した SASプログラ a u t o ̲ f o r m a t .s a s )が 1個ある。 ム( 以下のプログラムを自動作成する SASプログラム(プログラム 4) • prncfonnat ; v由 e xKouzou 1=*木 造 ' 2=*防火木造" 3=*鉄骨・鉄筋コンクソート遣が 4=*その他〔ブg ック造仏レンガ造りなどY J 不詳* プログラム 3 図1 ‑ 8 3 3 ‑

838.

3 .2符号表を S A Sデータセットに変換 ブρログラム 1でプログラムの動作環境を設定する。利用者は自分のパソコン環境に応じて、ここで設 定しておけば、以下に示す一連のプログラムで再度設定は不要である。 エクセル形式で統計センターから提供される符号表(付録 1)の先頭部には符号表に関する情報や、各 列の項目名があるが、 p r o ci m p o r tを使う際には、余分なレコードなので削除して、その代わりに、項 目名に相当する S A S変数名を入力しておく(付録 2)。プログラム 2を実行すると、このエクセルファイ ルがパーマネント S A Sデータセット c o d e ̲ t a b l e (付録 3)に変換される。これを使って、次節以降の処理 を行う。│ 1 *path̲define.sas* 1 *以下の① ⑤を指定して下さい。; *①符号表 ( E x c e1形式)が保存されているパスの設定; 引e tf o l d e r = G:~全消半全消擬似ミクロデータ, *② S A Sデータセット(ミクロデータ本体)の保存先 f o l d e r名の指定, 女この f o l d e rは①で指定した f o l d e rの直ぐ下に作成しておく女, 切l e td s ̲ f o l d e r =z e n s h o ̲ p a r m a n e n t ; *③ S A Sデータセット(ミクロデータ本体)のファイル名の指定; 女このファイルは②で指定した f o l d e rに保存しておく女; 弘l e tdsname =o r i g i n a l ; *④ミクロデータ符号表(エクセルファイル)のファイル名の指定; 女このファイルは①で指定した f o l d e rに保存しておくこと*; 引e tCodeTable =統計センタ‑̲ Ia y o u t ̲ c o d e(鍵なし).x1s ; *⑤ミクロデータ符号表(エクセルファイル)のシート名の指定; 弘l e ts h e e t=s h e e t 1 ; *⑥統計調査名(日本語/英語)の指定; *途中結果表示の際に title文で使用; 引e tSurveyName二平成 1 6年全国消費実態調査擬似ミクロデータ; * * * │ i b n a m ex v z" & f o l d e r判 d sf o l d e r " ; *この命令はそのまま; プログラム 1 プログラム実行環境の設定 1 *giji̲micro̲zensho̲codetable̲import.sas * 1*符号表を SASデータセットに変換; p r o ci m p o r to u t = x y z .c o d e ̲ t a b l e d a t a f i1e 二" & f o l d e r半 品C odeTable"d b m s = e x c e lr e p l a c e ;g e t n a m e s = y e s ;s h e e t = " & s h e e t " ; r u n, p r o cp r i n td a t a = x y z .c o d e ̲ t a b l e ( o b s = 5 6 ) ;t i t l e可 S u r v e y N a m e .符号表". r u n ; プログラム2 符号表を SASデータセットに変換 3 . 3 階層構造の符号表 符号表から変換した S A Sデータセット c o d e ̲ t a b l e (付録 3)は、いわゆる、階層構造型である。つまり、 複数のオブザベーションでひとまとまりの情報を構成しており、 S A Sで処理するのには若干の熟練度が 必要となる。この S A Sデータセットをよく見ると、以下の規則性が読み取れる。 ( 1 )一つの変数に対する情報は、一行または複数行から成る。 ( 2 )変数の区切り目のオブザベーションの S A S変数 VcodeContentsの値は「項目の区切り」 ( 3 )変数が数値型の場合は、変数 V t y p eの値は 1 1 J で、一つのオブザベーションから成る。 ( 4 )変数が文字型の場合は、変数 v t y p eの値は「欠損値J (半角ブランク)で複数のオブザベーシ ヨンから成る。変数フォーマットが必要なのはこのタイプである。 ( 5 )変数フォーマット作成に必要な変数は、 V c o d e (コードの値)と VcodeContents(コードの意味) のベアである。 ( 6 )変数ラベル作成には、変数 v a r i a b l eと変数 V l a b e lがあればできる。変数 variableに変数名 のローマ字表記のあるオブザベーションだけを対象にすればよい。 ‑ 8 3 4 ‑

839.

3 . 4変数名の mnemonic化と変数のラベル作成をする SASプログラム:label̲rename.sas 前節の(1)から ( 6 )を考慮しながら、階層構造の S A Sデータセット c o d e ̲ t a b l eを読み取り、率盆主2 m n e m o n i c化と変数のラベル作成をするプログラムをプログラム 3(次ページ)に示す。 このプログラムでは二つのテキストファイルをー且 S A Sの外に出力して、 それらを再びこのプログラムの中でl%include文│によって、命令文の一部 として使っている。一つは、変数の r e n a m eに使用する右のテキストファイ ルF 1 t o F 1 4 .t x t、もう一つは、変数ラベルの作成のためのテキストファイル 1 a b e1 .t x t(付録 4 )である。この二つのテキストファイルを見ると、誰でも 進んでやりたくない手作業なので、自動化できることは作業の大幅な効率 化になる。 このプログラムの各データステップで作成されるデータセットは、「結果 ビューア」の① ⑤に表示しているので、プログラムの流れを理解し易い。 3 .5変数 formatを作成する SASプログラム :format.sas 分析の過程や出力結果を見る場合、変数のコードのままでは大変読みに くいので、変数フォーマットを使用すべきである。変数の数が多いミクロデ F 1 = S e t a i K u b u n F 2 = S e t a i J i n i n F 3 = S h u u g y o u J i n i n F 4 = K o u z o u F 5 = T a t e k a t a F 6 = S h o y u u F 7 = S 1S e x F 8 = S 1 ̲ A g e F 9 = S 1 ̲ S h u u g y o u F 1 0 = S 1 ̲ K i g y o u K u b u n F 1 1 = S 1 ̲ K i g y o u K i b o F 1 2 = S 1 ̲ S a n g y o u F 1 3 = S 1 ̲ S h o k u g y o u F 1 4 = W e i g h t ファイ J レ名: F 1 t o F 1 4 .t x t ータの場合、この変数フォーマットを作成するのに手間暇がかかる。符号表 のS A Sデータセットから、これを自動的に作成する S A Sプログラム format.sas をプログラム 4に示 A Sプログラム│ a u t o ̲ f o r m a t .sasI(付録 5)が自動作成される。 す。このプログラムを実行すると、 S これを使用する際は、│ % i n c l u d e │文で対象の S A Sプログラムの中に埋め込めば良い。簡単な使用例 を付録 6に示す。 なお、プログラム 1~4 は|http://mighty.gk.u-hyogo.ac. j p j c o n f i d e n t i a l j T u t o r i a l ̲ S u o h 2 0 1 4 .zi~ からダウンロード出来る。 4 まとめ 日本の政府機関が作成したミクロデータの提供を受けると、エクセル形式の「符号表」がメタデータ として付随してくる。変数名を分かり易い名前に r e n a m eをする、変数ラベルを付ける、変数フォーマッ トを定義するといった作業は、大変手間と時間がかかる。この作業は通常は手作業で行われるが、既に 電子ファイル化された今回、符号表を S A Sプログラムの入力データとして読み込み、こうした作業を全 自動で行える S A Sプログラムを開発した。今回は、平成 1 6年全国消費実態調査の擬似ミクロデータの 符号表を使用例として取り上げたが、他の政府統計の場合でも、ユーザーのパソコン環境の設定をする S A Sプログラムを最初に実行するだけで、後のプログラムは変更なしに簡単に使えるように設計した。 S A Sユーザー総会のチュートリアルでは、これら一連の S A Sプログラムの作成方法と解説を行う。階 A Sプログラムで処理するトレーニングにもなるはずで、ある。これを通じて、 S A S 層構造型のファイルを S システムの持つ強力な「データハンドリング機能」を改めて認識する機械になれば、極めて有意義だと 信じる。なお、本システムの利用方法は「利用の手引き J (付録 2の後)を参照されたい。 参考文献 松井博 ( 2 0 0 8 ) W公的統計の体系と見方』日本評論社 ‑ 8 3 5 ‑

840.
[beta]
/
* label̲rename.sas *
/*教育用擬似ミクロデータの変数ラベル作成と変数の rename;
fi1ename o
u
t
1 可 folder平1abe1
.txt"; *変数ラベル定義用テキスト(最後に自動削除);
fi1ename out2 可 folder半F
1
t
o
F
1
4
.t
x
t
"
; 本変数 F1‑F14の rename用テキスト(最後に自動削除);

*オ 1
)ジナル変数 F15‑F197に変数ラベルを付すための L
A
B
E
L文の中昧を外部ファイルに出力;
data l
a
b
e
l
̲
d
e
f
i
n
e
; keep var̲label variableV
l
a
b
e
l
;
eo
u
t
1
; キL
A
B
E
L文の中味を外部ファイルに出力;
fi1
l
e
n
g
t
h var̲label $1
0
0
;
l
e
n
g
t
h No 8
; *数値変数;
set xyz.code̲table; コ
1i
サ録 31
t
e
;
L
‑
一
一
一
ー
i
fv
a
ri
ab1e=" "then de1e
i
f substr(variable,15)="Youto"
);
then d
o
; No=substr(variable,63
v
a
r̲
Iabe1=compress(
'v
' 1
1N
o
) 1
1 川
= 1
1 compress(Vlabel 1
1 "");
e
n
d
;
elsevar̲label=compress(variable) 1
1
'
=
'
" 1
1 compress(Vlabel 1
1
'
'
'
'
)
;
put v
a
r̲
Iabe1;
r
u
n,
proc p
r
i
n
t
; title "
I
a
b
e
l
"
;v
a
rv
a
r
̲
l
a
b
e
l variableV
l
a
b
e
l
;r
u
n
;

← l結果ビューァ(1)

data renameF1toF14; keep statement v
a
r
i
a
b
l
e
;
f
i1e o
u
t
2
;
*変数 F1‑F14を「符号表」にある変数名に変える rename文の中味をテキストファイルに出力;
array F F
1
‑
F
1
4
;
set l
a
b
e
ld
e
f
i
n
e
;
i
f N く= 1
4 then d
o
; statement=compressCF" 1
1 ̲N̲ 1
1" 1
1v
a
ri
a
b
l
e
)
;
put s
t
a
t
e
m
e
n
t
;
e
n
d
;
else s
t
o
p
;
r
u
n
;
proc p
r
i
n
t
; title "renameF1toF14"; r
u
n
;

←│結果ビューア@

data x
; *変数 F1‑F14だけを renameをする;
set xyz.&dsname;
rename
平出力テキストファイル平 F1toF14.txt";
引 nclude "&folder平program
proc print data=x(obs=40); title "変数 F1‑F14の r
e
n
a
m
e
"
;r
u
n
;

←│結果ビューア@

data x
; drop iF
1
5
‑
F
1
9
7
; *オリジナル変数 F15‑F197を V1‑V183に renameする;
set x
;
arrayV {
1
8
3
}
;
array F {
1
8
3
}F
1
5
‑
F
1
9
7
;
do i
=
1 to 1
8
3
; V{
i
}=F{
i
}
;e
n
d
;
l
a
b
e
l
見i
n
c
l
u
d
e"&folder平1
abe1
.txt";
r
u
n
;
│結果ビューア制
proc printdata=x(obs=20);
title "
&
S
u
r
v
e
y
N
a
m
e
. (先頭 40件:変数名表示γrun;
abe1
; ti
t1
e可S
u
r
v
e
y
N
a
m
e
. (先頭 40件:変数ラベル表示)"; r
u
n
;
proc printdata=x(obs=20) 1
蹄果ビューア⑨↑
data x
y
z
.x
&
d
s
n
a
m
e
; set x
;r
u
n
; *ミクロデータのパーマネントデータセット完成;
x"
d
e
l &folder平label.txt"
x "echo l
a
b
e
l
.
t
x
tを削除しました OH;
X"del &folder半F1toF14.txt"; x "echoF1toF14.txtを削除しました。ぐ

プログラム 3 変数名の mnemonic化と変数ラベルの自動作成 SASプログラム l
a
b
e1r
e
n
a
m
e
.sas

‑836・

841.

結果ビューア① l a b e l var l a b e l S e t a i l くu bun="世帯区分" 2 S e t a i J i n i n = "世帯人員" 3 ShuugyouJinin="有業人員" 住居の構造" 4 Kouzou=" 5 T a t e k a t a = " 住居の建て方" 6 Shoyuu="住居の所有関係" 7 S1 Sex="性見 I J " 8 S1̲Age="年 齢 5歳階級" J " Shuugyou="就業・非就業の見 I 9 S1̲ 10 S1̲ KigyouKubun="企業区分" 1 1 S1̲KigyouKibo="企業規模" 12 S1̲Sangyou="産業符号" Shokugyou="職業符号" 13 S1̲ 14 Weight="集計用乗率" 15 v1="年間収入" 16 v2="収入総額" 1 7 v3="実収入" 18 v4="経常収入" 19 v5="勤め先収入" OBS v a r i a b l e SetaiKubun S e t a i J i n i n ShuugyouJinin Kouzou T a t e k a t a Shoyuu S1 Sex S1̲Age S1̲Shuugyou S1̲ KigyouKubun S1̲KigyouKibo S1̲Sangyou S1̲Shokugyou Weight Youto001 Youto002 Youto003 Youto004 Youto005 中略 187 v173="個人・企業年金保険掛金" Youto173 Youto174 188 v174="他の保険掛金" Youto175 189 v175="有価証券購入" 株式購入" Youto176 190 v176=" Youto177 191 v177="他の有価証券購入" Youto178 192 v178="土地家屋借金返済" Youto179 193 v179="他の借金返済" 194 v180="分割払・一括払購入借入金返済" Youto180 Youto181 財産購入" 195 v181=" Youto182 196 v182="その他" v 1 8 3 ̲ "繰 越 金 197 I Youto183 H 結果ビューア② 変数F 1‑F14の r e n a m e renameF1 t oF14 OBS I v a r i a b l e s t a t e r n e n t b u n I F 1 = S e t a i K u b u n 1ISeta帆 j 2ISetaiJinin I F 2 = S e t a山 i n 3I S h u u g y o u J i n i n I F 3 = S h u u g y o u J i n i n 41 Kouzou I F 4 = K o u z o u 5ITa 胞k a 匂 I F5=T a t e k a t a 6IShoyuu I F 6 = S h o y u u IF7=S1̲S倒 7IS1̲S回 8IS1̲ Age IF8=S1̲ Age 9IS1̲Shuugyou IF9=S1̲Shuugyou 1 o I S 1 ̲ K i g y o u K u b u nI F 1 0 = S 1 ̲ K i g y o u K u b u n t 1 I S 1 ̲ K 脚 o u K i b o IF11=S1̲K肺 o u K i b o 1 2 I S 1 ̲ S a n g y o u I F 1 2 = S 1 ̲ S a n g y o u 1 3 I S 1 ̲ S h o k u g y o u I F 1 3 = S 1 ̲ S h o k u g y o u 1 4 I W e i g h t I F 1 4ヱW e i g h t ‑837‑ V label 世帯区分 世帯人員 有業人員 住居の構造 住居の建て方 住居の所有関係 性別 年 齢 5歳 階 級 就業・非就業の別 企業区分 企業規模 産業符号 職業符号 集計用乗率 年間収入 収入総額 実収入 経常収入 勤め先収入 個人・企業年金保険掛金 他の保険掛金 有価証券購入 株式購入 他の有価証券購入 土地家屋借金返済 他の借金返済 分割払・一括払購入借入金返 財産購入 その他 繰越金 結果ビューア③

842.

結果ビューア④ 平 成 16 年全国消費実態調査擬似ミクロデータ(先頭 40 件:変数名表示} ‑・・以下略... 結果ビューア⑤ 平 成1 6年全国消費実態調査擬似ミクロデー剣先頭 40件:変数ラベル表示) 圃システムのバージョンアップについて プログラム 2を少し書き換えれば、利用の手引き(付録 2の下を参照)の「プログラムの実行手順 ( l ) J を省略できることに気づいたが、本稿の原稿提出締め切り直前だったために、差し替え作業が間に 合わなかった。当初、今回の教育用擬似ミクロデータだけに使うつもりで本システムを開発したが、 汎用性を考慮すれば手順(1)はない方がはるかによい。 新パージョンでは、事前にユーザー側で、符号表のエクセルファイルのヘッダ一行を「全て」削 除し、中味のデータだけにしておく。これを p r o ci m p o r tで読み込むと、変数名が自動的に F l, F 2, ・ ・ ・ a t a ステップを一つ挿入して、この変数 F l,F 2,"・を付録 3にある変数名に となる。その後に、 d renameするコードを挿入するだけで済む。チュートリアルの際は、この新ノくージョンを使って解 説する。 、 3 . 5節に記載の URLからダウンロードできるようにする。 なお、この新プログラム2は ‑ 8 3 8・

843.

1 *format.sas* 1*教育用擬似ミクロデータ用の procformat作成, optionsnocenter: f il e n a m eo u t 1" & f o l d e r ¥a u t o ̲ f o r m a t . s a s " : d a t af o r m a t :k e e pf o r m a t N a m eV c o d eV c o d e C o n t e n t s : s e tx y z . c o d e ̲ t a b l e : *符号表のデータセットを使用; r e t a i ns wf o r m a t N a m e : i fV l a b e l = "," t h e ns w = O : * 文字型変数* 1 i fv a r i a b l eN E""A N DV t y p e = ""1 t h e nd o :s w = 1 :f o r m a t N a m e = v a r i a b l e :o u t p u t :r e t u r n :e n d : i fs w = 1t h e no u t p u t : r u n : :v a rf o r m a t N a m eV c o d eV c o d e C o n t e n t s :r u n : p r o cp r i n t :t i t l e" f o r m a t対象変数(1)" *女======d a t a s e t' f o r m a t 'に対して、 r V Jと r . d .Jの処理を追加する‑‑‑‑‑‑女; d a t af o r m a t :s e tf o r m a t : i fi n d e x( V c o d e,' ' V ' ' )> 0t h e nV c o d e = " ." : 勺 A N DV c o d e 二 "6 . i f( f o r m a t N a m e = " S L K i g y o u K i b o "O Rf o r m a t N a m e = " S L K i g y o u K u b u n t h e nV c o d e = " g g " : e l s eV c o d e = k c o m p r e s s ( V c o d e,".d.勺; r u n : p r o cp r i n t :t i t l e" vconvertedtoperiod": r u n : *~====== d a t a s e t' f o r m a t 'に対する r V J と『ム」の追加処理終了=========女; '1 p r o cs o r td a t a = f o r m a to u t = f o r m a t 1 :b yf o r m a t N a m e :r u n : d a t af o r m a t 1 :s e tf o r m a t 1 :b yf o r m a t N a m e : 1c o m p r e s s ( 'x '1 1f o r m a t N a m e ) : i ff i r s t .f o r m a t N a m et h e ns t a t e m e n t 2 = ' v a l u e '1 1' = ' " 1 1V c o d e C o n t e n t s1 1 ""): s t a t e m e n t = c o m p r e s s( V c o d e1 r u n : p r o cp r i n t : 2 ) ": t i t l e" f o r m a t対象変数 ( v a rf o r m a t N a m eV c o d eV c o d e C o n t e n t ss t a t e m e n ts t a t e m e n t 2 : r u n : I eo u t1: d a t an uI I,fi s e tf o r m a t 1e n d = f i n a l :b yf o r m a t N a m e : i f̲ n ̲ = 1t h e np u t" p r o cf o r m a t : " : i ff i r s t .f o r m a t N a m et h e np u ts t a t e m e n t 2 : i fl a s t .f o r m a t N a m et h e nput" " s t a t e m e n t" : "1 : e l s eput" " s t a t e m e n t : i ff i n a lt h e np u t" r u n : " : r u n : プログラム 4 S ASフォーマットの自動作成プログラム:f o r m a t . s a s ‑ 8 3 9・

844.

付 録 1 平成 16年全国消費実態調査擬似ミクロデータ符号表 (オリジナル先頭部) ì~ 階 層 項目名 行番号 1 ::奪津名γ む 配 ぞ 型 t ; ; :三 発 :置 伎 鐙 一 : ァ 数 イ 1世 帯 区 分 1 1 1 弓 言 台 ドシ常食間 S e t ai K u b u n1 2 3 12 3 1 2 S e t ai J i n i nl 余2‑ 22 & . . . . ̲ . . ̲ . 1 トー 2 l L 9 1 2 8 1 0 1 備考 勤労 勤労以外 無職 項目の区切り 2 3 4 1 . 5世 帯 票 員一 6 7接持みJ s有 業 人 員 j必 J z 坊 hJ γc 符尋 二一 S h u l J g y o u J i n区1 v v 2人 項鼠φ“~盟ヨー 1人 項 E建目一の一区一切り‑‑ E 一 以下略(残りの内容は付録3と同じ) i I n e N O 付録2 平 成 16年全国消費実態調査擬似ミクロデータ符号表 (統計センタ一一 I a y o u t ̲ c o d e(鍵なし).x ls先頭部) ペv 討 議E : x s h u b e t s u ; v H r i a b j 4 3 Jど o s i t i o nb e ' V l a b e l s t r ョt ap 同e sx h a i c h i Vtyp ' V c ' o d e C o n t ー れι t ち 弘 1世帯区分 S e t a i K u b u n 2 3 4 5 1世 帯 票 6 1世帯人員 7 8 1有集人員 9 1 Q l , 勺j 1勤 労 2 1勤労以外 3無臓 2 │項目の区切り 2 2 2 3 5 2 2 S e t a i J i n i n 自 2 2 .1‑ S h u u 町 ' o u J i n i nd 2 8L一一1 d .2‑ w 2人 │項目の区切 L 1人 │不離 項目の区切り 利用の手引き . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 j最初に S陥 プ ロ グ ラ ム│pa出 ̲define.sas│で以下の① ⑥を指定して下さい。 ;①符号表 ( E x c e │形式)が保存されているパスの設定 e tf o l d e r= 1 G :平全消平全消擬似ミクロデータ : 1 プログラムの実行手順 j② SASデータセット(ミクロデータ本体)の保存先 folder名の指定 (1) 3.2節の太字下線部で述べる前 i *この folderは①で指定した folderの直ぐ下に作成しておく* 処理を符号表に対して行う。 ! 制 etds̲folderイzensho̲parmanent1: (付録2の一行目参照) i③ SASデータセット(ミクロデータ本体)のファイル名の指定 この変数名が SASプログラムで *;:のフアセ些室主指定した f o l d e rに保存しておく* 使われる。 制e td s n a m eヰ o r i g i n a川 函 ④ミクロデータ符号表(エクセルファイル)のファイル名の指定 補足(結果ビューア⑤の下)を参照) *このファイルは①で指定した f o l d e rに保存しておくこと* 引e tC o d e T a b l e= 1統計センター̲ Ia y o ut ̲ c o d e(鍵なし).x ls 1 : ( 2 ) 本文のプログラム① ④までを ⑤ミクロデータ符号表(エクセルファイル)のシート名の指定 順番に実行する。 協l e ts h 制ニ巨亘亙; ; 引 I ⑥統計調査名(日本語/英語)の指定; j制 e tS u r v e y N a m e= 1平成 1 6年全国消費実態調査擬似ミクロデータ : 1 ;ファイル配置例 G :栓消¥全消極似ミクロデータ¥統計センター 1 ayouLcode(鍵なし).xI s ① G: 平全3判事全消擬似ミクロデータ¥zensho_Darmanent~ori~inal.sas7bdat ② ③ ‑ 8 4 0・

845.

付 録 3 平成 16年全国消費実態調査擬似ミクロデータ符号表 ( S A Sデータセット c o d e ̲ t a b l eの冒頭部) 平 成1 6 年全国消費実態調査機似ミウロデ告符号表 OBS 唱 2 3 s i IneNO V l abel 1世帯区分 2 3 s t r a t a p o s i t i o n b~唯:es x h a i c h iI v a r i a b l e Vtyp e xshubelsu 1 1 SetaiKubun Vcode VcodeConlents 1勤 労 2勤 労 以 外 3無 臓 去畢 e 6 5世 帯 票 6世帯人員 1 2 3 2 2 8 9 8有業人員 9 2 6 2 2 ,,2‑ 2人 5huugy 四J J i n i n 1"1‑ 1人 5e 回i J i n i n 主富耐 . • 1 w s 不詳 三量破 12 13 唱4 1 1現 住 居 等 に 聞 する事項 12住 居 の 構 造 13 14 唱5 15 官6 16 18 19 20 18住 居 の 建 て 方 19 20 21 21 22 22 23 23 24 25 24 25 27 27住 居 の 所 有 閑 28 28 2持ち家(その他名 29 29 30 30 3 1 3 1 32 32 33 33 34 34 35 36 3民営賃貸住宅(設 備専用) 4民営賃貸住宅(設 備共用) 5県市区町村営賃貸 住宅 6都市再生機構・公 社等賃貸住宅 7社宅・公務員住宅 (借よげ含む) B借 間 9寮 ・ 寄 宿 舎 36 1 1 2 3 自 3 • 1 1 1 Kouzou 1木造 2防 火 木 造 3鉄骨・鉄筋コンウ リート造 4その他{ブロッウ 造り、レンガ造り など) V 亘書・ 1 T a t e k a t a 1 戸建 2長 屋 建 3共 同 住 宅 階建) 4共 同 住 宅 階建) 5共 同 住 宅 。階建) 6共同住宅 建以上) 7その他 V 3 13 不詳 1 (1 .2 (3‑5 (6‑1 (1 1階 不詳 霊 E・ 1持ち家(世帯員名 5hoyuu 義) 係 種) 35 V 不詳 霊童・ 38 39 40 41 42 43 44 45 46 47 48 49 50 5 1 52 53 54 55 38世 帯 員 に 閉 す る事項 39世帯主 40性別 41 42 . 1 43年 齢5慮 階 級 2 3 1 . 4 15 1 51 5ex 4 4 16 17 1 2 51_~e 44 45 46 47 48 49 50 5 1 52 53 54 55 1男 2女 項目の区切り ,,1 2 4揖 未 満 企2 2 5 ‑ 2 9巌 ,,3 3 0 ‑ 3 4歳 企4 3 5 ‑ 3 9鵡 企5 4 0 ‑ 4 4歳 ,,6 4 5 ‑ 4 9歳 ,,7 5 0 ‑ 5 4歳 5 5 ‑ 5 9歳 "8 ,,9 6 0 ‑ 6 4歳 10165‑6 9歳 11170‑74歳 12175歳以上 w 不詳 三皐 SAS デ‑?セット CODE . ̲TABLE: 527オブザベーシヨン、 H変数 ‑ 8 4 1 ‑

846.

付録4 全国消費実態調査擬似ミクロデータ (SAS変数ラベルの定義用テキストファイル:I a b e. 1t x t ) SetaiKubun="世帯区分" Seta 凶n i n : : : : "世帯人員" ShUUgyOl 九 J in in="有業人員" Kouzou="住居の構造" Tatekata="住居の建て方" Shoyuu="住居の所有関係" Sl̲Sex="性別" Sl̲Age="年齢 5歳階級" Sl Shuugyou="就業・非就業の耳 I J " Sl̲KigyouKubun="企業区分" Sl̲KigyouKibo="企業規模" Sl̲Sangyou="産業符号" Sl̲Shokugyou="職業符号" Weight="集計用乗率" v1="年間収入" V2="収入総額" v3="実収入" V4="経常収入" v5="勤め先収入" v6="事業・内戦収入" v7="農林漁業収入" V8="家賃収入" v9="他の事業収入" v10="内職収入" v11二"本業以外の勤め先,事業・内職収入" v12="他の経常収入" v13="財産収入" v14="社会保障給付" v15二"公的年金給付" v16="他の社会保障給付" v17="仕送り金" v18="特別収入" v19二"受贈金" v20="その他" v21="実収入以外の収入" v22二"預貯金引出" v23二"保険取金" v24="個人・企業年金保険取金" v25二"他の保険取金" v26三"有価証券売却" v27="株式売却 w v28="他の有価 E 正券売却" v29="土地家屋借入金" v30="他の借入金" v31="分害J I 払・一括払購入借入金" v32="財産売却" v33二"その他" v34="繰入金" v35二"支出総額" v36="実支出" v37="消費支出" v38="食料" v39="穀類" v40="米" v41="パン" v42="めん類" v43二"他の穀類" v44二"魚介類" v45="生鮮魚介" v46="塩干魚介" v47="魚肉練製品" v48="他の魚介加工品" v49="肉類" v50="生鮮肉" v53="牛乳" v54="乳製品" v55="j J s " v56="野菜・海藻" v57="生鮮野菜" v58="乾物・海藻" v59="大亘加工品" v60="他の野菜・海藻加工品" v61="果物" v62="生鮮果物" v63="果物加工品" v64="油脂・調味料" v65='; 由H 旨" v66="調味料" v67="菓子類" v68="調理食品" v69="主食的調理食品" v70="他の調理食品" v71="飲料" v72="茶類 v73二"コーヒ ・ココア" v74="他の飲料" v75="酒類" v76ニ"外食" v77=" 般外食" v78="学校給食" v79="住居" v80ニ"家賃地代" v81="設備修繕・維持" v82="設備材料" v83="工事その他のサービス" v84="光熱・水道" v85二"電気代" v86="ガス代" v87="他の光熱" v88土砂上下水道料" v89="家具・家事用品" v90="家庭用耐久財" v91="家事用耐久財" v92二 冷暖房用器具" v93=" 般家具" v94二"室内装備・装飾品" v95="寝具類" v96="家事雑貨" v97="家事用消耗品" v98="家事サービス" v99二"被服及び履物 v100="和服 vl0l="洋服" vl02="男子用洋服" vl03="婦人用洋服" vl04="子供用洋服" vl05="シ ャ ツ ・ セ 脅 類 " vl06="男子用シャツ・セ ‑ 1 1 類" vl07="婦人用シャツ・セーター類" vl08="子供用シャツ・セヲ類" vl09="下着類" vll0="男子用下着類" vlll="婦人用下着類" vl12="子供用下着類" vl13="生地・糸類" vl14="他の被服" vl15ニ"履物類" vl16ニ"被服関連サービス" v51="乳 加工卵類肉" v52= vl17ニ "保医健薬医品療 jl" vl18= H H W M ‑ 8 4 2 ‑ vl19="健康保持用摂取品" v120="保健医療用品・器具" v121="保健医療サービス" v122="交通・通信" v123="交通" v124="自動車等関係費" v125="自動車等購入" v126="自転車購入 v127="自動車等維持" v128="通信" v129="教育" v130="授業料等" v131="教科書・学習参考教材" v132="補習教育" v133="教養娯楽" v134="教義娯楽用耐久財" v135二"教養娯楽用品" v136="書籍・他の印刷物" v137="教養娯楽サービス" v138="宿泊料" v139= v140ゴ'月謝類" v141="他 の 教 養 娯 楽 サ ビ ス " v142="その他の消費支出" v143="諸雑費" v144="理美容サービス" v145="理美容用品" v146="身の回り用品" v147="t ニliζ" v148="その他の諸雑費" v149="こづかい(使途不明)" v150="交際費" v151="食料" v152="家具・家事用品" v153="被服及び履物" v154="教養娯楽" v155="他の物品サービス" v156= v157="他の交際費" v158="仕送り金 w v159="非消費支出" v160="直嬢税" v161="勤労所得税" v162="個人住民税" v163="他の税" v164二"社会保険料" v165="公的年金保険料" v166="健康保険料" v167="介護保険料" v168="他の社会保険料" v169="他の非消費支出" v170="実支出以外の支出" v171="預貯金" v172="保険掛金" v173="個人・企業年金保険掛金" v174="他の保険掛金" v175="有価証券購入" v176="株式購入 w vl77="他の有価証券購入" v178="土地家屋借金返済" v179="他の借金返済" v180三'分割払・ 括払購入借入金返済 v181="財産購入" v182="その他" v183="繰越金" M , M

847.

付録 5 全国消費実態調査擬似ミクロデータ (SAS変数用フォーマット) a u t of o r m a t . s a s procf o r m a t ; v a l u exKouzou 1="木造" 2="防火木造" 3="鉄骨・鉄筋コンクリート造" 4="その他(フ ロック造り、レンガ造りなど)" 二"不詳" v a l u exS1̲Shokugyou 1="常用労務作業者" 2二"臨時及び日々雇労務作業者" 3二"民間職員" 4="官公職員 1" 5="官公職員 2" 6="商人及び職人 7="個人経営者 8="農林漁業従事者" 9="法人経営者 10="自由業者 11="その他 12ニ"無職" ‑不詳" v a l u exSl̲Age 1="24歳未満" 2="25‑29歳 3ニ"30‑34歳" 4="35‑39歳" 5="40‑44歳" 6="45‑49歳" 7="50‑54歳" 8="55‑59歳" 9="60‑64歳" 10三'65‑69歳 11="70‑74歳" 12="75歳以上" H H H H H M H 二M v a l u exS1 Sex 1="男" 2="女 " v a l u exS1̲Shuugyou 1="就業" 2=" うちパート" 3="非就業" 4=" うち仕事を探している" 不詳" v a l u exSl̲KigyouKibo 1="1‑4人" 2二 "5‑29人 3="30‑499人" 4="500‑999人" 5="1000人以上 99="非就業文は官公" ‑不詳" H v a l u exSetaiKubun 1二"勤労" 2="勤労以外 H H 3二"無職" 二"不詳" a v a l u exS1̲KigyouKubun 1="民営 2="自営 3="官公 w 99="非就業 w v a l u exShoyuu 1="持ち家(世帯員名義)" 2="持ち家(その他名義)" 3="民営賃貸住宅(設備専用)" M H 4二"民営賃貸住宅(設備共用)" 5="県市区町村営賃貸住宅" 6="都市再生機構・公社等賃貸住宅 7="社宅・公務員住宅(借上げ含む)" 8二"借間" 9="寮・寄宿舎 ゴ'不詳" ‑不詳" H v a l u exS1 Sa円 gyou 1="農業" 2二"林業 3="漁業" 4ニ"鉱業" 5="建設業" 6="製造業" H H 7ニ"電気・ガス・熱供給・水道業" 8="情報通信業" 9="運輸業" 10="卸売・小売業" 1 1二"金融・保険業" 12="不動産業" 13="飲食庖・宿泊業 14="医療・福祉" 15="教育・学習支援業" 16="複合サービス事業" 17="サービス業(他に分類されないもの)" 18="公務(他に分類されないもの)" 19="その他(非就業を含む)" ‑不詳" W ‑ 8 4 3 ‑ v a l u exTatekata 1="一戸建" 2="長屋建" 3="共同住宅 ( 1・ 2階建)" 4二"共同住宅 (3‑5階建)" 5ニ"共同住宅 (6‑10階建)" 6="共同住宅(11階建以上)" 7二"その他H 二"不詳" γ u n ;

848.

付録 6 S AS変数用フォーマットプログラム a u t o ̲ f o r m a t . s a sの使用例 1 *freq.sas* 1optionsnocenter: *擬似ミクロデータ用 S A Sフォーマット設定プログラム r a u t o ̲ f o r m a t .s a s J の使用例; 引e tm i c r o d a t a = x o r i g i n a l : *ユーザーが付けたミクロデータ本体 ( S A Sd a t as e t )のファイル名; I i b n a m em i c r o"G: 半全消半全消擬似ミクロデータ ~zensho_parmanent": *ユーザーの環境に設定; 引n c l u d e"G:~全消平全消擬似ミクロデータ平auto_format.sas": * p r o cf o r m a tプログラム実行; t i t l e"擬似ミクロデータ度数分布表". 協m a c r of r e q ( v a r i a b l e ) : p r o cf r e qd a t a = ヰn i c r o .x o r i g i n a l :t a b l e s& v a r i a b l eIm i s s i n g : f o r m a t& v a ri a bI ex & v a ri a bI e ..: r u n : 首m e n d : このプログラムは平成 16年全国消費実態調査の擬似ミクロデータに含 n c l u d e文によって、 まれる全ての分類変数の度数分布表を出力する。目 i u t o ̲ f o r m a t .s a sが実行さ 実行時に全ての変数のフォーマットを定義する a 首f r e q ( S e t a i K u b u n ) 覧f r e q( K o u z o u ) 首f r e q( T a t e k a t a ) 目f r e q( S h o y u u ) 協f r e q( S L S e x ) 首f r e q( S L A g e ) 見f r e q ( S l ̲ S h u u g y o u ) 見f r e q ( S l ̲ K i g y o u K u b u n ) 覧f r e q ( S l ̲ K i g y o u K i b o ) % f r e q ( S l ̲ S a n g y o u ) 首f r e q ( S l ̲ S h o k u g y o u ) れる。その結果、マクロ f r e q内の f o r m a t文が有効になり、出力されるク o r m a t値 ロス表の表側には、変数コードではなくて、下に示すように、 f が表示される。 なお、表頭には変数名の代わりに変数ラベルが表示されている。 実行結果のうち、 2番目から 5番目までの 4つの表「結果ビューア J画 面を以下に示す。 擬似ミクロデータ度重量分布表 震~J.ミクロデータ度数分布表 FRIヨ~7ロヲ* FRIヨ~7 日!J9ャ 住居@繕造 l 住居@商省調盤 揖:ル掛露,t 8 i 拘刷 j 本書 館事家(t!tI員告書B j 僻輔副リ』描 L j87391 鰭暫定 E そ骨信者指 ト 問 貨 問 嗣 即 m 壱骨盤f プロヲ涜昌弘L.Jti苦情1::") I 1 阜、 民営賃貸住宅母健其 j 県市区町村営賃貸住宅 寝市再生盤情・公泊費事賃貸住宅; 鍵似ミクロデータ度数分布表 枇宅・公強負銭書{骨土庁舎を設; FRI ヨ日ブロヲ予ャ j 欄 I1~L_………ム 震似ミクロデータ度重量分布表 F再 現 7ロヲヲャ I j 陪詞也書。咽踊韓民土〉 1 日).00 ‑844・ 」

851.

L e t ' sデータ分析ミクロデータ分析コンテスト:規定課題 宇野慧 アステラス製薬株式会社開発本部 データサイエンス部 要旨 本稿では、平成 1 6年度全国消費実態調査の個票データに基づき、独立行政法人統計センターが作成した教 育用擬似ミクロデータを用いて、コンテストの規定課題再現の方法及び再現結果を示した。 キーワード:疑似ミクロデー夕、 TABULATEプロ、ンジャ 1.用いたデータ 本稿で用いたデータは平成 16年度全国消費実態調査の個票データに基づき、独立行政法人統計センターが 、 183変数であり、以下ではデータセット名 作成した教育用擬似ミクロデータである。データは 32027行 DATAとする。 2 .表 1 ‑ 1、表 1 ‑ 2、表 1 ‑ 3の再現 表 1 ‑ 1 集計世帯表(各レコードを単純にカウン卜した表)、表 1 ‑ 2 世帯数分布(各レコードを集計用乗 ‑ 3 世帯数分布(世帯数分布を 10万分比でカウントした表)の 3 率で重み付けしてカウン卜した表)、表 1 表について、以下のプログラムを実行することで規定課題の結果を得ることが出来る。 /*初めに、課題表の出力のために必要系列の作成を行うり DATAd a t a ;SETd a t a ; * 1 0万人で基準化した度数分布表を作成するために乗数を作成するり Weight2=W e i g h t / 4 . 9 5 4 6 5 ; / INFORMATd̲12$ 1 . ; I FShuugyoujinini n( 1, 2 )thend̲12=" 1 " ;/*就業人員 1 o r 2名世帯のダミーを作成するり ELSEd 1 2="2";RUN; PROCFOR 乱1A T ; VALUES e t a i j i n i n f1=' 1人'2=' 2人'3=' 3人'4=' 4人'5=' 5人'6=' 6人'7=' 7人'8=' 8人'9=' 9人 , 10=' 1 0人 , VALUES h u u g y o u j i n i n f1=' 1人' 2=' 2人' 3=' 3人' 4=' 4人15=' 5人' 6=' 6人'9999='不詳'; VALUE制 12f1=" (特掲) 1人又は 2人"2 = " 3名以上 ";RUN; /*①の世帯数集計台/ PROCTABULATEDATA=dataMISSING;CLASSShuugyouJininS e t a i J i n i n ; FORMATS e t a i j i n i nS e t a i j i n i n f .ShuugyoujininS h u u g y o u j i n i n ι, KEYLABELN='; ' / 勺m y l a b e lで"N"を出力しないようにするり TABLESShuugyouJinin='就業人員 ' a l l='合計" S e t a i Ji n i n='世帯人員, a l l='合計' /BOX=' 表1 ‑ 1 世幣数, MISSTEXT='O';RUN; ‑847‑

852.

1 *②の集計用乗率で重み付けした集計り PROCTABULATEDATA=dataMISSING;CLASSShuugyouJininS e t a i J i n i n ; FORMATS e t a i j i n i nS e t a i j i n i n f .S h u u g y o u j i n i nS h u u g y o u j i n i n f . ; VAR1WEIGHT=weight; 1 *集計乗数をウェイトとして設定 * 1 KEYLABELN=" SUM=' ; ' TABLESShuugyouJinin='就業人員, *W e i g h t = . . . .*(SUM*F=comma8.) 合計『ま W e i g h t = . . . .*(SUM 叩= comma8.), ( S e t a i J i n i n='世帯人員, a l l='合計ヤ (f=comma8.) a l l = ' IBOX=安 1 ‑ 2重み付け世帯数, MISSTEXT='O';RUN; /合③の 1 0万分比で基準化した集計 * 1 PROCTABULATEDATA=dataMISSING;CLASSShuugyouJininS e t a i J i n i n ; FORMATS e t a i j i n i nS e t a i j i n i n f .S h u u g y o u j i n i nS h u u g y o u j i n i n f . ; VARW e i g h t 2 ; 1 * 1 0万分比のウェイト女 KEYLABELN=',SUM=' ; ' e i g h t 2 = . . . .女(SUM叩 =comma8.) TABLES ShuugyouJinin='就業人員, *W a l l = ' 合計'安 W eight2=川女 (SUM*F=comma8.), ( S e t a i J i n i n='世帯人員 ' a l l='合計 ' ) * ( f ニc omma8.) IBOX=' 表 1 ‑310万分比基準化世帯数, MISSTEXT='O';RUN; 3 . 表 2の再現 表 2 支出額(消費支出及び 1 0大 費 目 ) に つ い て 、 以 下 の プ ロ グ ラ ム を 実 行 す る こ と で 規 定 課 題 の 結 果 を 得ることが出来る。 1 *④ 4人世帯の支出額の集計値勾 PROCTABULATEDATA=dataMISSING;CLASSShuugyouJinin;WEIGHTW e i g h t ; FORMATS e t a i j i n i nS e t a i j i n i n fS h u u g y o u j i n i nS h u u g y o u j i n i n f . ; VARYouto037Youto038Youto079Youto084Youto089Youto099 Youto117Youto122Youto129Youto133Y o u t o 1 4 2 ; TABLESALL="総数", N=" 集計世帯数'叶f=comma8 * f = c o m m a 8 . ) Youto037="吋(SUMWGT="重み付け世帯数 " ( Y o u t o 0 3 7 = "食費支出..Youto038="食料..Youto079="住居.. Youto084="光熱・水道" Youto089="家具・家事用品..Youto099="被服及び履物"Y o u t o 1 1 7 = "保健医療..Youto122="交通・通信" Youto129="教育..Youto133="教養娯楽..Y o u t o 1 4 2 = "その他消費支出..) 六( MEAN="吋 f=comma8.)1MISSTEXT=" O " ; R U N ; 目 / 安 ⑤4人世帯のうち、就業人員 1人または 2人世帯の支出額の集計値 * 1 PROCTABULATEDATA=dataMISSING;CLASSShuugyouJinind ̲ 1 2 ;WEIGHTW e i g h t ; FORMATS e t a i j i n i nS e t a i j i n i n f .S h u u g y o u j i n i nS h u u g y o u j i n i n f .d̲12$d̲12f . ; VARYouto037Youto038Youto079Youto084Youto089Youto099 Youto1 17Youto122Youto129Youω133Y o u t o 1 4 2 ; ̲ 1 2 = m " N=" 集計世帯数時f =comma8. TABLEALL="4人世帯合計..ShuugyouJinin="就業人員数"d Youto037= *(SUMWGT="重み付け世帯数吋 f=comma8.) (Youω037=" 食費支出..Y outo038="食 料 "Youω079=吋主居..Youto084=" 光熱・水道..Y outo089="家具・家事用品" Youto099="被服及び履物..Youtol17="保健医療..Youto122=n交通・通信..Youto129="教 育 nYouto133="教養娯楽" Youto142="その他消費支出..)女 (MEAN="吋f = c o m m a 8 . ) 1MISSTEXT=" 0 " WHERES e t a i j i n i n=4;RUN; 附 ‑ 8 4 8 ‑

853.

表 ト l集計世帯表(各レコードを単純にカウン卜した表) 220 1 0 4 3 1 2 7 6 7 3 3 。 。 。 。 。 。 。 5 2 2 8 1 2 3 390 8 1 1 5 3 5 1 1 6 2 8 4 324 。 。 。 6 29 6 3 1 2 。 。 。 。 。 。 40 6 968 表 1‑2 世帯数分布(各レコードを集計用乗率で重み付けしてカウントした表) 表 1‑3 世帯数分布(世帯数分布を 10万分比でカウントした表) 1 3, 057 1 2, 369 1 3, 3 8 1 4, 590 7 7 0 ! 1 6 8 1 7 44, 3 5 1 1 0, 1 1 9 1 0, 399 1 3, 0 9 2 9 7 7 5, 1 , 3 7 3 4 7 1 89 4 1, 5 2 1 3, 2 1 1 3, 1 5 2 , 6 0 7 1 666 229 1 5 675 273 85 39 7 7 1 6 2 2 1 0 1 0 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 979 トー 7 203 664 8 5 1 7 1 0 3 5 5 1 4 7 8 1 34 7 3 7 9 2 3, 2 6, 6 4 3 3 1. 455 1 3, 6 3 7 3, 4 6 4 1 , 1 3 2 242 42 7 ‑ 8 4 9 ‑ 8, 889 2, 052 1 1 5 20 052 3,

854.

表 2 支出額(消費支出及び 1 0大費目) 3 2, 027 495, 465 328, 1 4 0 7 2, 883 1 7, 687 438 7 6, 362 944 1 5 5, 850 335, 9, 1 5, 3 4 5 20, 214 , 自8 85 1 3 2 6 6, 299 305, 234 7 1, 5 43 4, 1 7, 556 1 8, 854 8, 3 8 3 6 4, 868 347, 740 7 472 8, 1 2, 932 6 2 1 2 0, 8, 917 2 0 1 4, 1 9, 238 トー 1, 0 3 1 1 5, 615 380, 5 2 1 8 3, 796 1 2, 583 2 3, 045 1 0, 276 4, 8 5 1 399, 962 8 5, 083 1 8, 500 2 2, 490 763 1 1, 216 379, 882 8 2, 1 3 4 24, 296 2 2, 238 4, 7, 843 3 1, 1 6 8 326, 256 7 4, 970 333 1 8, 1 5, 269 728 1 9, 8, 647 1, 6 1 1 747 2 1 5, 2, 798 1 0, 1 5 3 24, 682 384, 233 83, 765 ‑ 8 5 0 ‑

855.

L e t ' sデータ分析ミクロデータ分析コンテスト:自由課題 同時方程式モデルを用いた健康/不健康支出の分析 宇野慧 アステラス製薬株式会社開発本部データサイエンス部 要旨 保険に対する需要は、世帯のリスク選好度に関する一種の指標と考えることが出来る(宇里f ( 2 0 1 3 ) )。本稿で は擬似ミクロデータを用いて、生鮮野菜・生鮮果物といった健康支出、酒・タバコといった不健康支出に対 する、貯蓄性の保険料支払い額の傾向を考察した。保険料支払い額自体も世帯の支出選択行動である点を考 慮して、①保険料支払い額の推定式、②健康支出の推定式、③不健康支出の推定式で構成される同時方程式 モデルを最尤法で推定した。その結果、保険料支払い額が多い世帯では、健康支出、不健康支出の両方が高 い傾向が確認できた。また世帯属性のうち、世帯主年齢が不健康支出に対して強いコホート効果として影響 している可能性が示唆された。 キーワード 擬似ミクロデー夕、消費分析、同時方程式モデル、 NLMIXEDプロシ、ジャ 1.はじめに 宇野 ( 2 0 1 3 )では、世帯主の就業状況などの世帯属性が貯蓄性保険需要に対して与える影響を分析した。そ の結果として、公務員世帯の貯蓄性保険料支払い額が他と比較して高額で、あったことなどから、貯蓄性保険 料支払い額が世帯のリスク選好度に関する指標となる可能性が示唆された。この結果を受け本稿では、貯蓄 性保険料支払い額を用いて、リスク選好度が世帯の消費行動においても観察できるかどうかを検証した。特 に、世帯のリスク選好度が顕著に反映されると考えられる項目として、生鮮野菜・生鮮果物といった健康関 6年度全国 連支出、および、酒やタバコといった不健康関連支出に着目した。本稿で用いたデータは、平成 1 2人以上の勤労者世帯;32037世帯)である。 消費実態調査から作成された教育用疑似ミクロデータ ( 以下で本稿の構成を概説する。 2節では分析に用いたデータの変数名や作成方法などについて説明する。ま た健康支出、不健康支出それぞれについて、基本統計量と度数分布図により分布を確認する。加えて保険料 支払い額との散布図を両変数について求め、変数聞の大まかな関係、を把握する。 3節では本稿で行う分析に 関する理論的な背景を説明すると共に、推定に用いたプログラムの概要を記載する。 4節では推定結果の概 略を説明し、加えて簡単な解釈を行う。 5節では本稿のまとめと、今後の分析に対する展望を述べる。 2 . データセットの特性について 2 ‑1.分析に用いた変数名、および作成方法 本稿の分析で用いた変数の情報について、以下の表 2 ‑ 1にまとめた。式表記に関しては、 3節のモテ守ル設定 の箇所で参照するために表記している。 ‑ 8 5 1 ‑

856.

表 2‑1 分 析 に 用 い た 変 数 一 覧 変数名 式表記 保険料支出 y l 詳細説明 貯蓄性保険料の支払い額 (Youω174)を自然対数変換した値 ※支出額が 0の場合は、そのま ま 0としているが、全体の 1%程度であり分析には大きく影響しない 健康支出 Y 2 生鮮野菜 ( Y o u t o 0 5 7 )と生鮮果物 ( Y o u t o 0 6 2 )の支出額を足し、自然対数変換した値 不健康 Y 3 酒( Y o u t o 0 7 5 )とタバコ ( Y o u t o 1 4 7 ) の支出額を足し、自然対数変換した値 合は、そのまま 0としているが、全体の 1%未満で、あり分析には大きく影響しない 支出 大企業 ※支出額が 0の場 X 世帯主の就業先規模 ( 8 1 ̲ KigyouK ib o )が 4:500~999 人または 5 ・ 1000 人以上の場合に 1 ダミー を取るダミー変数 公務員 世帯主の就業先区分 ( 8 1 ̲K igyouKubun)が 3 官公の場合に 1を取るダミー変数 ダミー ※就業属牲については、中小企業に就業している世帯を基準に設定 経常所得 経常所得 ( Y o u t o 0 0 4 )を自然対数変換した値 女性ダミー 世帯主性別 ( 8 1 ̲ 8 e x )が 2の場合に 1をとるダミー変数 ※就業属性については、中 I J、企業に就業している世帯を基準に設定 世帯主年齢 (81_Age) について、 20 代 ~60 代以上のダミー変数を作成。推定での基準: 2 0代 年代 ダミー 世帯人員 (8etaiJinin) について、 2 人 ~6 人以上のダミー変数を作成。推定での基準 :2 人 世帯人数 ダミー 持家 ダミー 住宅ローン Z 住居の所有区分 ( 8hoyuu)が 1 ( 持家(世帯人名義))あるいは 2 ( 持家(その他))の場合には 1を取 るダミー変数 持家世帯、かっ住宅ローンの支払額 ( Y o u t o 1 7 S )がゼロの場合に 1を取るダミー変数 完済ダミー 2‑2. 基本統計量、散布図 2‑1で 設 定 し た Y 2:健康支出、 Y 3:不健康支出それぞれの基本統計量及び度数分布図を図 2‑2‑1、図 2‑2‑2に l:保険料との散布図をそれぞれ図 2‑2‑3、図 2‑2‑4に示す。 示す。また、 Y 図 2‑2‑1 健 康 支 出 の 度 数 分 布 図 、 基 本 統 計 量 図 2‑2‑2 不 健 康 支 出 の 度 数 分 布 図 、 基 本 統 計 量 健直支出{封数姐}の度数分布図 不健康主出{対数値)由度融分布図 ., 0 λ 利l 引 t ・ ゐ 4 4 ︑け制占T}fp︑ 。 ベ e , 。 r つ 。 9 僧康支出(対敏値} 間 一 叩 一ω一世間一凶器一切 1 5 」 5 a 不健 阪支出(対数値) ‑852‑ "

857.
[beta]
度数分布図、及び基本統計量から、健康支出に関しては対数変換により正規分布に近い形となる。一方で、
不健康支出に関しては、対数変換を行っても左に裾をヲ│し、た分布となることが分かる。また、不健康支出に
関しては支出額がゼロの世帯がし、るが、その割合は全体の 1出未満である。

図2
‑
2
‑
3 保険料と健康支出の散布図

図2
‑
2
‑
4 保険料と不健康支出の散布図

保障軒主払輔(封数値)1:瞳康支出〈対数値》由散布罰

保障制支弘睡{封量値比不瞳庫支出(対置値)由散布図

98

電側車

'
g舗な v召凶mu

.
.
""
3
震
、
寄

付
M

g
回

2
自叫
~

。

・

・

ol
<
l
&
(
不
信.
l
f支出);::J245+0078 10K保酸糾) 0 tJOO Q̲
園 圃 圃 掴 幽 ‑ 。
50

1
.
5
保駿総支11.碩{対敏傭〉

0 不・.支出〈剣・舗}

的崎 ~l制限界一ー一一一関働

図からわかる通り、健康支出、不健康支出ともに保険料支払い額と弱い正の相関が確認出来る。単回帰を
行った結果、保険料支払い額の係数はどちらも O
.0
7
8となり、保険料支払い額が高い世帯ほど、健康支出・
不健康支出の額がやや高まる傾向が見られた。
次に、分析に用いる各世帯属性と、健康/不健康支出との関係を確認する。文中で言及している図表につい
ては、本文末尾の補足に掲載している。なお、各世帯属性には不詳データが含まれることから、表によって
は周辺度数を全て足し合わせても全世帯数 (
3
2
0
3
7世帯)に一致しない点に注意が必要で、ある。
はじめに、健康支出に関して検討する。図 2
‑
2
‑
5から分かる通り、モデル推定で基準とする中小企業に比
べ、大企業と公務員では高い支出水準であることが分かる。また、図 2‑2‑6から分かる通り、世帯主が女性
の世帯では支出額の水準が低い。世帯主の年代に関しては図 2
‑
2
‑
7から分かる通り、年代が上がるにつれて
支出額も単調に増加している。最後に、図 2
‑
2
‑
8から世帯人員の増加につれ、支出額も単調滑加している事
が確認できる。
続いて、不健康支出に関して検討する。図 2
‑
2
‑
5から、中小企業、公務員と比べ大企業でやや低い傾向が
見られる。また、図 2‑2‑6から女性世帯では支出額が低いことが分かる。函 2‑2‑7では、モデ、ル推定で、基準
となる 3
0代の支出が最も低く、また 5
0代と 6
0代以上ではあまり差がないことが分かる。最後に世帯人員数
に関して図 2‑2‑8からは、 6人以上の大規模世帯では支出額が多い傾向があるものの、全体的にあまり大き
な違いが無いことが確認できる。
次節では同時方程式モデルを構築し、保険料支払い額以外の世帯属性などを考慮することにより、本節で
検討した支出の傾向について考察する。

3
. 推定モデ、ル
本節では、推定モデ、ルの構成を解説し、最尤推定を行う尤度式を示す。本稿で分析する同時方程式モデル
は、①貯蓄性保険需要に関する推定式、②健康支出に関する推定式、③不健康支出に関する推定式の 3式で
構成される。貯蓄性保険需要はそれ自体が世帯の決定変数であると同時に、世帯のリスク選好度の指標とし

‑853・

858.

て健康支出、不健康支出に関係すると想定し、①式の被説明変数、および②式・③式の説明変数としてモデ ルに盛り込んだ。 モテやルを構成するその他の説明変数として、世帯主属性(就業状況ダミー、年代ダミー、性別ダミー)、世 帯属性(人員数ダミー)、収入等(経常所得)を 3式に共通して用いた。また、①式については住居等に関係す る属性として、持家ダミーと住宅ローン完済ダミーを追加で、モデルに含めた。なお、宇野 ( 2 0 1 3 )では保険料 支払い額の推定に関して、 o(無保険)を考慮した打切り分布の推定 ( T o b itモデ、ルあるいは H u r d l eモデル推定) 弘程度であり推定結果に大きく影響しないことから、今回の を行った。しかしながら、無保険世帯が全体の l 分析では打切り分布は考慮しなかった。 L 以上の設定を数式で記述すると、以下のようになる。 叫 +zrl+& +y1d2 Y 3=X β3+Y lδ3 +ε2 +&3 Y2 = x β2 行列表記を用いて、次のように誘導形に書くことが出来る。なお、推定の誤差項は、以下のような多変 量正規分布に従うと仮定する。 ハ υAUAυ ¥ IIIll111ltノ fillal‑‑11¥ fila‑‑pilli‑‑‑¥ N E 白 し eVA W h ︑ ¥111111211ノ 仰向引戸内 flilt‑111111¥ ¥ill‑‑Jノ / ・ 九九 + A4 AA Aγ ハ lil‑‑¥ Z I l a t ‑ ‑ 1 1 1 1 1 Jノ ¥ ︑B ﹂ E/filili‑‑l¥ 1lltill‑‑ltJノ Juxxx J ︒ 一一九九九 ︑RU ︑ 一一 Y/lil‑‑K 1σII σ12σ131 1 1 :=1σ12 σ22σ23I I ¥σ13 σ23σ33)) また、推定式を以下のような構造形に変換して、 F行列を求める。 1 I l l 1 s Jノ A ︑ ¥ O れ Ao β /FIll‑‑t¥ ¥Illit‑‑it‑‑ノ zoo fill‑‑‑ll¥ 'I xxx 一 一 八 Z ¥Illit‑‑‑‑lJノ AU21A リ ハリハリ 1 4 n A勺 ︑ /11111111 r s 円山 一 一 円 + 以上の設定をもとに、以下の尤度関数が構成でき、この式をもとにパラメータの最尤推定値を求める。 FIML)に基づく尤度関数を定義している。しかしながら、保険料支払い額は頻繁 本稿は完全情報最尤法 ( に変更されることが無いことから、 y lは y 2や y 3よりも前に決定されると考えられる。そのため y 2や y 3 の推定式の説明変数にわが入る一方で、 y lの推定式の説明変数に y 2や y 3は含めない。また、 y 2と y 3 についても誤差の相関以外の関係は設定してないため、 F行列の行列式は 1となり推定には影響しない。 logL(B, rmz-1log2π) 」2log|ヱ1-1)+log( líl)-~(Y 2 ‑XByL‑1(y‑XB) ‑'1 l' ‑ 8 5 4 ‑ ‑'1 l '

859.

また、推定に先立ちパラメータの初期値を指定する必要がある。これについては、各推定式単体で最尤推 定を行って得たパラメータ推定値を、初期値として設定した。 推定プログラムの概要は、以下の通りである。詳細については、別途プログラム本体を参照されたい。 p r o cnlmixeddata=datat e c h=NEWRAP; /台パラメータの初期値設定安/ parmsb100‑b312d2d3sigmall‑sigma33; /*誘導系の右辺を定義する*/ x b e t a=b100+Daikigyou*b101+ー・+NoLoan切 114; e t a i J i n i n 6 o * b 2 1 3+log̲hoken 吋2 ; xgamma= b200+Daikigyou*b201+・+S すb 301+ ・ "+SetaiJinin6o*b313+log̲hoken含 d 3 ; x d e l t a=b300+Daikigyou /合誘導系のモデ.ノレ式を定義する*/ ̲ yasai1‑xgamma; e3=log̲bads‑x d e l t a ; e 1=log̲hoken‑x b e t a ; e 2=l o g /*分散共分散行列の行列式を定義する*/ ニs igma1 1* sigma22*sigma33+sigma1 2 *sigma23*sigma13+sigma1 3 *sigma12*sigma23 d e t ̲ s i g )昔日igma22‑sigma11* ( s i g m a 2 3 * * 2 )ー (sigma1 2 * * 2 ) *sigma33; ‑ ( s i g m a 1 3帥 2 /*分散共分散行列の逆行列の成分(行列式で除していないもの)を定義するり ;s12=sigma13*sigma23‑sigma12*sigma33; s 1 1=sigma22*sigma33・sigma23帥 2 合s igma22;s22=sigma11*sigma33‑sigma13**2; s13=sigma12*sigma23・sigma13 s23=sigma12*sigma13・sigma11女 sigma23;s33=sigma11*sigma22‑sigma12**2; /*尤度関数を定義安/ g ( d 巴t ̲ s i g )‑ 1 I d e t ̲ s i g l l =ー 1 I2 * l o g ( 2 * p i )+l o g( l ) ー1 1 2勺o * ( s 1 1安 e1**2+2女 s 1 2 * e 1* e 2+2合 s13*e1脅 e3+s22*e2**2+2合 s23*e2*e3+s 3 3 * e 3 * * 2 ); /*尤度関数の最大化を定義*/ ̲ yasai1‑general ( l l ) ; r u n ;/*※データセット内にある変数であれば、左辺は何でも良いり modellog 4 . 推定結果および考察 3節で述べた推定プログラムを実行することにより、以下の結果を得ることが出来る(表 4 ‑ 1 )。 ‑ 8 5 5 ‑

860.

表 4‑1 同時推定モデルの推定結果 健康支出の推定 保険需要の推定 p1 直 推定値 標準誤差 p1 直 推定値 標準誤差 P1 直 〆イ ~ / 0. 2019 0 . 0 3 2 8 < . 0 0 0 1 0 . 2 8 4 3 0 . 0 6 6 6 < . 0 0 0 1 推定値 保険料 不健康支出の推定 標準誤差 定数項 ‑ 0 . 6 3 2 0 0 . 1 8 2 0 0 . 0 0 0 5 6 . 3 0 6 0 0 . 0 8 0 3 < . 0 0 0 1 0533 6目 0 . 1 8 1 7 く 大企業 0 . 0 1 0 6 0 . 0 1 6 9 0 . 5 3 2 5 0 . 1 2 2 7 0 . 0 0 7 1 く . 0 0 0 1 ‑ 0. 1290 0 . 0 1 6 3 < . 0 0 0 1 公務員 0 . 2 5 2 9 0 . 0 1 7 6 < . 0 0 0 1 0 . 0 7 6 9 0 . 0 1 1 2 く . 0 0 0 1 ‑ 0 . 1 2 0 7 0 . 0 2 4 0 < . 0 0 0 1 経常所得 0 . 7 4 1 7 0 . 0 1 4 1 < . 0 0 0 1 ‑ 0 . 0 0 1 3 0 . 0 2 5 6 0 . 9 5 9 5 ‑ 0 . 0 6 4 9 0 . 0 5 2 3 0 . 2 1 4 4 女性 。 開4 343 0 . 0 3 5 5 く . 0 0 0 1 0 . 0 3 5 2 0 . 0 2 1 0 0 . 0 9 4 3 ‑ 0 . 6 0 5 9 0 . 0 4 5 5 < . 0 0 0 1 30代 0 . 5 2 5 2 0 . 0 4 1 2 く . 0 0 0 1 0. 1450 0 . 0 2 6 8 < . 0 0 0 1 0 . 0 4 7 3 0 . 0 5 7 4 0. 4 096 40代 0 . 6 8 6 2 0 . 0 4 2 5 < . 0 0 0 1 41 6 6 0. 0 . 0 3 3 0 < . 0 0 0 1 0 . 2 1 8 8 0 . 0 6 9 4 0 . 0 0 1 6 501 ‑ t 0 . 7 6 0 9 0 . 0 4 2 4 く . 0 0 0 1 目 。6 549 0 . 0 3 5 7 < . 0 0 0 1 0 . 3 2 4 8 0 . 0 7 4 7 く 60代以上 0 . 6 7 6 5 0 . 0 4 6 3 < . 0 0 0 1 0 . 9 1 4 9 0 . 0 3 3 8 < . 0 0 0 1 0 . 2 8 8 7 目 。0 712 < . 0 0 0 1 3人 0 . 1 4 7 6 目 。0 203 < . 0 0 0 1 0 . 0 9 5 2 0 . 0 1 0 0 < . 0 0 0 1 ‑ 0 . 1 5 3 1 0 . 0 2 2 2 < . 0 0 0 1I 4人 0 . 2 7 9 7 0 . 0 2 0 7 < . 0 0 0 1 0 . 1 2 4 0 0 . 0 1 3 2 < . 0 0 0 1 ‑ 0 . 2 3 5 9 0 . 0 2 8 4 く 5人 0. 3318 0 . 0 2 5 1 く 0 0 0 1 目 。1 8 2 6 0 . 0 1 6 1 < . 0 0 0 1 ‑ 0 . 1 7 2 3 0 . 0 3 4 6 < . 0 0 0 1I 6人以上 0. 4802 0 . 0 3 7 7 く . 0 0 0 1 0 . 2 6 6 7 0 . 0 2 3 5 < . 0 0 0 1 ‑ 0 . 2 2 8 0 0 . 0 5 0 5 < . 0 0 0 1I 持家 0 . 3 0 0 5 0 . 0 2 0 8 く . 0 0 0 1 ローン完済 ‑ 0 . 1 0 4 2 0 . 0 2 7 3 0 . 0 0 0 1 . 0 0 0 1 . 0 0 0 1 . 0 0 0 1I ル/~ / / / / / ~/ / / / No fo b s e r v a t i o n 23759 N e g .L o gL i k e l i h o o d 59228 AIC 118553 今回のモデルでは、 3式いずれも被説明変数を自然対数変換している。また、説明変数が連続量のものは自 然対数変換を行っていることから、係数値が意味するところは下記の通りとなる。 ・連続量の対数値:弾力性(説明変数が l 出変化した際の、被説明変数が同変化することに相当) ・離散変数:ネイピア数を係数値でべき乗したものが、基準に対する比に相当 以下で推定結果を概観し、解釈を行う。保険料支払し、額は、健康支出に対しては想定通りプラスであり、 保険料支払が多い世帯ほど健康支出が大きい傾向が確認出来た(保険料 l 唱の増額に対して、 O .20 犯の支出増)。 一方で不健康支出に関しては、予想と異なりプラスの結果となり、保険料支払が多い世帯ほど不健康支出が ‑ 8 5 6 ‑

861.

大きい傾向が確認出来た(保険料同の増額に対して、 0 . 2倒の支出増)。この点については、 C I健康リスクが 高い方が却って手厚い保険に加入している可能性、②喫煙者や飲酒者の方が、保険料の支払額が高額に設定 されることが影響した可能性、などが考えられる。 その他の説明変数の結果についても、以下に簡単にまとめる。大企業、公務員のいずれも中小企業に対し て健康支出は高水準であり、比較的健康への関心が高いことが示唆された。一方で不健康支出は大企業、公 務員いずれの世帯でも低水準であり、基本統計量で検討した傾向と不整合な結果となった。また、興味深い 点として、経常所得が健康支出、不健康支出のいずれに対しでも有意とならなかった。この点については、 ①生鮮野菜や酒・タバコなどがいずれも所得弾力性が低い可能性、②特にタバコは低所得世帯の方が多く消 費するなど、消費額が所得額によってあまり変化しない可能性、③高所得世帯は外食等で消費している可能 性、等が考えられる。 この他、女性ダミーについては健康支出に対しては有意な傾向が見られない一方で、、不健康支出は有意に 少なく、飲酒・喫煙に関する男女の噌好差が発現したものと考えられる。年代ダミーについては、基本統計 量で確認した傾向と整合的に、高齢になるほど健康支出、不健康支出の両方が高まる傾向が見られた。また、 世帯人数が増えるにつれ健康支出は増加し、基本統計量と同様の傾向が確認できた。一方で、不健康支出に ついて 3人以上の世帯ではいずれも 2人世帯よりも支出額が低かった。以上を総合すると健康支出に関して は、基本統計量で確認した傾向と全体的に整合的な結果がモデル推定から得られたと言える。結果の頑健性 を確認するために、補足の表 4-2~ 表 4-13 で 2 つの世帯属性の組み合わせに関して度数分布と各区分での基 本統計量を求めた。健康支出に関しては l属性で見られた傾向が 2属性に拡張した場合も大きく崩れる事は 無く、強い一貫性が支持されると考えられる。その一方で、不健康支出に関しては強し、一貫性があるとは言 えず、世帯属性が複雑に関連する事によって推定が不安定になっている可能性が示唆された。この原因とし て、世帯主の年代が強く関係していると思われる。その理由として、世帯主年齢と他の属性の関係では以下 の特徴が確認できる。 6 0歳以上の世帯主は中小企業に勤めている傾向が強く(表 4 ‑ 1 1 )、また世帯人員が少な ‑ 1 2 )。この結果から、世帯主が 6 0歳以上の世帯での高い不健康支出水準が強いコ い傾向が確認できた(表 4 ホート効果となり、就業状況や世帯人数の影響と混合して推定モデルの結果に影響した可能性が考えられる。 以上のような世帯属性の影響を正確に識別して分析する事は困難である。しかし、疑似ミクロデータの生 成元の匿名データでは世帯員の構成も調査されているため、たとえば本稿で定義した不健康支出に影響しな い未成年者数を調整することで、精度の高い推定が可能になる可能性がある。 2 0 1 3 )とほぼ同様の結果が得られた。し 最後に、①式で求めた保険料支払い額の推定結果を見ると、宇野 ( たがって、全体の間程度であるゼロ保険世帯を線形モデ、ルで、推定したとしても、分析結果に大きく影響しな いと考えられる。精微に分析を行う場合は打ち切りを考慮した分析を行う必要があるが、推定式が複雑にな り、推定が収束しない可能性が高まる。 5 . まとめと今後の課題 本稿では、世帯のリスク選好度の指標である貯蓄性保険料支払い額と、生鮮野菜・生鮮果物などの健康支 出、酒・タバコなどの不健康支出との関係を考察した。同時方程式モデ、ルで、推定を行った結果、健康支出に 関しては予想と整合的に、保険料支払が多い世帯ほど健康支出が大きい傾向が確認出来た。一方で、不健康 支出では予想に反し、保険料支払が多い世帯ほど不健康支出が大きい傾向が確認出来た。その他の世帯属性 に関しでも、健康支出では基本統計量ベースで検討した傾向と、モデル推定の結果が整合的であった。一方 ‑857‑

862.

で、不健康支出については基本統計量で確認した傾向とモデル推定の結果に不一致が数か所見られた。。こ の原因として、世帯主年齢が不健康支出に対して強いコホート効果として影響している可能性が示唆された。 今回のデータあるいはモデ、ルで、はこうした可能性の識別は困難で、あり、今後の課題としたい。今回用いた 疑似ミクロデータの生成元である匿名データでは、世帯構成員の詳細データが含まれることから、より詳細 な分析が可能と思われる。 6 . 参考・引用文献 ‑宇野慧 ( 2 0 1 3 ) I 世帯主の就業状況が貯蓄性保険需要に与える影響についての考察 擬似ミクロデー タを用いた Tobit/Hurdle モデル推定 ~J S A Sユーザー会 2 0 1 3論文集 p . 5 1 5 ‑ 5 1 8 •W o o l d r i d g e .J .,(2010),EconometricAnalysisofCrossSectionandPanelData( 2nd e d ., )M I TP r e s s ‑ 8 5 8 ‑

863.

補足 図2 ‑2‑5 世帯主の就業状況別 健康/不健康支出の箱ひげ図 125~ 、 , 塁 ~ 桝 鑑 橿 揺 " 1 按 v ヨ ヨ ・ . . ! 桝 j Bj 大企禦 中小企業 1 5 6 0 7 8 . 8 8 大企業 6 9 9 9 公務員 6 6 5 8 不健康支出 世帯数 0 . 5 2 8 . 9 1 中小企業 1 5 6 0 7 8 . 0 7 1 .0 8 8 . 2 4 8 . 9 9 0. 48 9 . 0 2 大企業 6 9 9 9 7 . 9 9 1 .0 2 8 . 1 4 9 . 0 5 0. 48 9 . 0 9 公務員 6 6 5 8 8 . 0 6 0 . 9 9 8 . 2 1 mean 図2 ‑ 2 ‑ 6 世帯主の性別別 s d mean 健康/不健康支出の箱ひげ図 m 領特 h ‑ a編稼 V22M制 9 }司凶m僧 錘 ハa友 g median ︒↑︒ 世帯数 公務員 ﹁1114liI41111111jill 不健康支出 。 oT川 崎 一「一 一象 十一一一一一 " ' 1 、 企 ' 巨 一ゆ しー 時 ︒+地 6 l l H l 書 留 ・ Wom R 健康支出 不健康支出 男性 男性 女性 女性 ‑859 幽 s d median

864.

図2 ‑ 2 ‑ 7 世帯主の年代別 健康/不健康支出の箱ひげ図 ‑ a 医 a 喜' 桝 2 1 5 2 i141 。。 初代胤下 伸代 泊代以下 回代以上 却代 絹代 AGE 健康支出 世帯数 3 0代以下 7 0 7 0 8 . 5 4 4 0代 7 8 3 1 5 0イ t 6 0代以上 AGE median 不健康支出 世帯数 0 . 47 8 . 57 3 0代以下 7 0 7 0 7 . 7 9 1 .1 2 7 . 9 6 8 . 9 7 0 . 41 8 . 9 9 4 0代 7 8 3 1 8 . 0 6 1 .0 0 8 . 1 9 8 4 8 2 9 . 1 8 0 . 40 9 . 2 0 5 0代 8 4 8 2 8 . 2 2 0 . 9 6 . 35 8 2 7 0 0 9 . 2 8 0 . 3 9 9 . 2 9 6 0代以上 2 7 0 0 8 . 1 9 0 . 9 7 8 . 3 2 s d 健康/不健康支出の箱ひげ図 ロl e a n s d median 50 20 11 図2 ‑ 2 ‑ 8 世帯人員数別 mean Zm 事 実 高 州 側 言刊 。 , e 人以上 0 ,人以上 S.t a i S e t a l 健康支出 世帯数 2人 7 4 3 8 8 . 8 4 0 . 5 4 3人 8 5 3 7 8 . 9 0 4人 9 9 4 4 5人 6人以上 不健康支出 世帯数 8 . 8 9 2人 7 4 3 8 8 . 0 2 1 .2 0 8 . 2 4 0 . 5 3 8 . 9 6 3人 8 5 3 7 7 . 9 6 1 . 14 8 . 1 7 8 . 9 4 0. 48 8 . 9 6 4人 9 9 4 4 8 . 0 1 1 .0 0 8 . 1 4 4 4 0 5 9 . 0 5 47 0. 9 . 0 7 5人 4 4 0 5 8 . 1 4 0 . 8 9 8 . 2 6 1 7 0 3 9 . 2 0 0 . 45 9 . 2 0 6人以上 1 7 0 3 8 . 2 0 1 .0 2 8 . 3 7 mean s d median ‑ 8 6 0 ‑ mean s d median

865.

表 4・ 2 世帯主性別および世帯主就業状況に関する度数分布と健康支出の基本統計量表 健康支出 │中小企業 大企業 公務員 │ 全体 男性 女性 全体 表 4・3 世帯主性別および世帯主年代に関する度数分布と健康支出の基本統計量表 健康支出 I 30代以下 40代 50代 60代 以 上 │ 全体 94.74% 表4 ‑ 4 世帯主性別および世帯人員数に関する度数分布と健康支出の基本統計量表 健康支出 I 2人 3人 4人 男性 ‑ 8 6 1・ 5人 6人 以 上 │ 全体

866.

表 4・5 世帯主年代および世帯主就業状況に関する度数分布と健康支出の基本統計量表 中小企業 大企業 公務員 全体 世帯数(%) 13.77% 7.55% 5.09% 41% 26. 平均値 8 . 4 6 8 . 6 4 8 . 6 5 8 . 5 4 世帯数(%) 14.33% 32% 8. 7.62% 30.27% 平均値 8 . 8 8 9 . 0 6 9 . 0 9 8 . 9 7 世帯数(%) 16.85% 7.90% 40% 8. 3 3. 15% 平均値 9. 11 9 . 2 6 9 . 2 6 9. 18 世帯数(%) 7.81% 1 .09% 1.26% 1 0. 17% 平均値 9 . 2 5 9 . 3 3 9. 37 9 . 2 8 世帯数(%) 52.76% 24.86% 22.37% 平均値 8 . 8 8 8 . 9 9 9 . 0 5 健康支出 30代以下 40代 50代; 60代以上 全体 表 4・6 世帯主年代および世帯人員数に関する度数分布と健康支出の基本統計量表 2人 3人 4人 5人 6人以上 全体 世帯数(%) 4.24% 34% 8. 10.68% 3.19% 0.66% 27.11% 平均値 8. 33 8. 48 8 . 6 0 8 . 7 1 8 . 9 6 8 . 5 4 世帯数(%) 2.57% 5.12% 12.89% 6.73% 2.71% 30.02% 8 . 9 7 健康支出 30代以下 40代 50代 平均値 8 . 7 1 8 . 9 0 8 . 9 7 9 . 0 5 9 . 1 9 世帯数(%) 8.52% 9.96% 8.93% 4.06% 1 .06% 32.52% 平均値 9 . 0 2 9. 17 9 . 2 6 9 . 3 3 9. 32 91 8 世帯数(%) 5.75% 3.16% 0.95% 0.31% 0.17% 35% 1 0. 平均値 9 . 2 1 9. 33 9 . 3 9 9. 47 9 . 4 1 9 . 2 8 世帯数(%) .09% 21 26. 58% 3 3. 45% 14.29% 4.59% 平均値 8 . 8 4 8 . 9 0 8 . 9 4 9 . 0 5 9 . 2 0 目 60代以上 全体 表4 ‑ 7 世帯主就業状況および世帯人員数に関する度数分布と健康支出の基本統計量表 健康支出 世帯数(%) 2人 3人 4人 5人 6人以上 全体 45% 1 3. 14.64% 15.93% 6.61% 2.69% 53.33% 8必5 8 . 8 4 8 . 9 7 襲. 8 8 41% 6. 8.72% 3.50% 23.92% 9 6 8. 9. 0 2 9j )9 8 . 9 9 5.68% 7.03% 3.63% 22.75% 中小企業 大企業 事J 鰐 公務員 全体 平均事裏一 ヲ 8 . 8 7 世帯数(%) 23.07% 9 . 0 5 26.74% 31 .68% a ; 習 。 8 : 94 ‑862‑ 13.73% 4.79%

867.

表 4・8 世帯主性別および世帯主就業状況に関する度数分布と不健康支出の基本統計量表 不健康支出 1 │中小企業 大企業 公務員 │ 全体 男性 女性 全体 表 4・9 世帯主性別および世帯主年代に関する度数分布と不健康支出の基本統計量表 不健康支出 I 3 0代以下 2 6. 15% 4 0代 5 0代 6 0代 以 上 │ 全体 2 8 . 3 2 % 3 0 . 2 5 % 1 0 . 0 3 % 9 4 . 7 4 % 表4 ・1 0 世帯主性別および世帯人員数に関する度数分布と不健康支出の基本統計量表 不健康支出 世帯数(%) I2 人 I19.17% 3人 4人 5人 6人以上 │ 全体 2 3 . 9 9 % 2 9 . 9 6 % 1 3. 40% 5 . 2 1 % I94.74% ‑ 8 6 3 ‑

868.

2人 3人 4人 5人 6人以上 全体 世帯数(%) 4.24% 8.34% 10.68% 3.19% 0.66% 2 7 .11% 平均値 7 . 6 8 7 . 6 0 7 . 8 9 8 . 0 3 8 . 2 5 7 . 7 9 世帯数(%) 2. 57% 5.12% 12.89% 6.73% 2.71% 30.02% 平均値 8. 19 8 . 0 7 7 . 9 7 8 . 1 3 18 8. 8 . 0 6 世帯数(%) 8.52% 9.96% 8.93% 4.06% 1.06% 32.52% 不健康支出 30代以下 40代 50代 平均値 8 . 2 5 8 . 2 2 8 . 2 0 8 . 2 5 8 . 2 0 8 . 2 2 世帯数(%) 5.75% 3.16% 0.95% 31% 0. な 17% 10.35% 平均値 8 . 1 9 8 . 2 0 8 . 2 2 8 . 1 0 8 . 0 5 8. 19 世帯数(%) 21 .09% 26.58% 45% 3 3. 14.29% 4.59% 平均値 8 . 0 2 7 . 9 6 8 . 0 1 8. 14 8 . 2 0 6 0代以上 全体 表 4・1 3 世帯主就業状況および世帯人員数に関する度数分布と不健康支出の基本統計量表 不健康支出 中小企業 2人 3人 4人 5人 6人以上 全体 1 3. 45% 14.64% 15.93% 6.61% 269% 5 3. 33% 目 8 . 0 4 8 . 0 4 8 . 1 7 8. 16 8 . ぴ7 6. 41% 8.72% 3.50% 0.73% 23.92% 7 . 9 9 7 . 9 1 8 . 01 8 . 3 0 7 . 9 9 5.68% 7.03% 3.63% 1 . 36% 22.75% 8 . 2 0 8 . 0 6 大企業 公務員 4.79% 全体 8 . 0 1 ‑864‑

869.

第 2回ミクロデータ分析コンテスト規定課題 木下陽介,若林将史,飯塚政人,中川│雄貴 東京理科大学大学院工学研究科経営工学専攻 カテゴリー B Thecompulsoryprograminthecontest YosukeK i n o s h i t a,MasashiWakabayashi, MasatoI i z u k a, YukiNakagawa DepartmentofManagementS c i e n c e,G r a d u a t eS c h o o lofE n g i n e e r i n g, TokyoU n i v e r s i t yofS c i e n c e l.第ト l表 3 .第 1 ‑ 3表 作成したプログラムと出力結果は以下の通り. 作成したプログラムと出力結果は以下の通り qd a t a=d a t an o p r i n t ; p r o c企e a t an o p r i n t ; p r o cf r e qd a t a= d t a b l e sShuugyo uJi n i n * S e t a i J i n i n/o u t= o u t 1 ( d r o p= t a b l e sShuugyouJi n i n * S e t a i J i n i n/o u t= ou t 3( d r o p 二 c o u n t ) ; p e r c e n t ) ; whereS h u u g y o u J i n i ni n(1 , 2 )andS e t a i J i n i ni n( 4 ) ; w e i g h tW e i g h t ;r u n ; n m t 3 ;s e tou t 3 ; d a t aou p r o cp r i n td a t a= o u t 11 a b e 1 ;r u n ; c o u n t 1 0ニ p e r c e n t*1 0 0 0 ; r ̲ c o u n t 1 0= r o u n d (c o u n t l O,1 . ) ; OBS 有 業 人 員 世 帯 人 員 度 数 l a b e lc o u n t 1 0='官数"rc o u n t 1 0=吋疹正度数". 4 4132 44 2 0 1 2 2 叩 p e r c e n t ;r u n ; d r p r o cp r i n td a t a= ou t 3l a b e l ; uJi n i ni n(1 , 2 )andS e t a i J i n i ni n whereShuugyo 2 . 第 1 ‑ 2表 ( 4 ) ; r u n ; 作成したプログラムと出力結果は以下の通り. OBS 有 業 人 員 世 帯 人 員 p r o c仕e qd a t a=d a t an o p r i n t ; uJi n i n * S e t a i J i n i n/o u t=o u t 2 ( d r o p= t a b l e sShuugyo 3 度数 修正度数 4 1 3 3 81 .2 3 1 3 3 8 1 40 4 1 3 0 9 2. 1 3 0 9 2 p e r c e n t ) ; 1 0 n i ni n(1 , 2 )a n dS e t a i J i n i ni n( 4 ) ; whereShuugyouJi 2 4 . 第 2表 w e i g h t羽T e i g h t ;r u n ; 作成したプログラムと出力結果は以下の通り.た d a t ao u t 2 ;s e to u t 2 ; o u n d (c o u n t,1 . ) ; r ̲ c o u n t= r だし,出力結果の一部は加工を施している. 1 a b e 1rc o u n t=吋修正度数";r u n ; %macromeans ̲m c r (d a t a ̲o u t,w h e r e ) ; u t 2l a b e l ;r u n ; p r o cp r i n td a t a= o OBS 有 業 人 員 世 帯 人 員 qd a t a= d a t an o p r i n t ; p r o c仕e 度数 d r o p= p e r c e n t ) ; t a b l e sS e t a i J i n i n/o u t= tempO1( 修正度数 where& w h e r e . ; 2 2 46 6 2 9 9 . 2 7 66299 46 4 8 6 8 . 2 3 64868 w e i g h tW e i g h t ;r u n ; d a t atempO1 ;s e ttempO1 ; ‑865‑

870.

d a t a&data̲ou t . ; r ̲ c o u n t=r o u n d (c o u n t,1 ) ; l a b e lrc o u n t二円世帯数分布(抽出率調整) " ;r u n ; l e n g t hwhere$ 5 0 . ; p r o cmeansd a t a=d a t an o p r i n t ; where=" & w h e r e . " ;r u n ; where&where.; d a t a&data ̲ou t . ;merge&data̲out .temp22tempO1 ( k e e p v a rS y o u h i s h i s y u t uFoodHouseKounetsu̲Suidou 二 吋iHihukuHoken̲IryouKoutsuu̲Tsuushin Kagu̲K %mendmeans m c r ; KyouikuKyouyouOther ̲S y o u h i s h i s y u t s u ; %means ̲mcr(o u t O O1 , ShuugyouJi n i ni n( 1 )and w e i g h tW e i g h t ; S e t a i J i n i ni n( 4 ) ) ; o u t p u to u t=templl(drop TYPE̲̲FREQ̲);r u n ; r ̲ c o u n t )templ2;r u n ; n i ni n( 2 )and %means̲mcr(o u t 0 0 2,ShuugyouJi 二 一 d a t atemp1 2 ;s e ttemp1 1 ; S e t a i J i n i ni n( 4 ) ) ; %means̲mcr(ou t 003,ShuugyouJi n i ni n(1 , 2 )and where̲STAT ̲i n("MEAN"); a r r a yy o u t o{ 1 1 }S y o u h i s h i s y u t uFoodHouse S e t a i J i n i ni n( 4 ) ) ; Kounetsu ̲SuidouKagu ̲K a j iHihukuHoken ̲ I r y o u d a t ao u t O1 0 ;s e tou t OOl ‑ o u t 0 0 3 ;r u n ; Koutsuu̲TsuushinKyouikuKyouyou p r o cp r i n td a t aニ ou t Ol Ol a b e l ;r u n ; 博議糊舟 WW礼司 問医 叫芯湖u 71543 17556 4201 64868 347740 78472 12932 3 8333 131168 326256 74970 15269 ← r̲Kounetsu̲Suidour̲Kagu̲Kajir̲Hihuku r ̲Hoken ̲I r y o ur ̲Koutsuu ̲T s u u s h i nr ̲Kyouiku r ̲Kyouyour ̲O t h e r ̲S y o u h i s h i s y u t s u ; doi=1t o1 1 : . . . . F 存 B 日 18854 8383 13579 11656 42703 2 20621 8917 14876 10538 52141 3 19728 8647 1 4 2 2 1 11103 47371 l a b e lr ̲S y o u h i s h i s y u t u="消費支出 "rFood="食料" rHouseニ"住居"rKounetsu Suidouニ"光熱・水道" 淘き 1 e n d ; 凶開端清・ N穴山田 WM 副・悩而 遣料 持 争 当毎 荊湾問渦潮 進E 山郁肯寸持 争 時 掴 対 世間国間Npq r ̲ y o u t o { i }=r o u n d (y o u t o { i , }1 . ) ; ( 葺E 伽育訓週嚇) 305234 2 a r r a yry o u t o{ I I }r ̲S y o u h i s h i s y u t ur ̲Foodr ̲House 議場同E 66299 書庄胤が存持 4132 Other ̲S y o u h i s h i s y u t s u ; r̲Kagu̲K 勾iニ"家具・家事用品 "rHihuku="被服及 び履物"r̲Hoken̲Iryou="保険医療" rKoutsuu T s u u s h i n="交通・通信"r̲Kyouiku="教 d a t atemp21;s e ttemp1 1; where̲STAT ̲i n( " N " ) ; δ昏3 31202 31959 57801 2 39485 33681 76078 3 35298 32810 66839 Koutsuu̲TsuushinKyouikuKyouyou O t h e r ̲S y o u h i s h i s y u t s ui ;r u n ; 占印 勾iHihukuHoken̲Iryou Kounetsu̲SuidouKagu̲K 鑓 耳 場 E d r o p̲STAT̲S y o u h i s h i s y u t uFoodHouse 叫疎滞以内 r ̲O t h e r ̲S y o u h i s h i s y u t s u二"その他の消費支出". 鉢叫府演以m 車庄恥が存持 育"r̲Kyouyou="教養娯楽" * 1:就業人員 l人,世帯人員 4人 2:就業人員 2人,世帯人員 4人 keepwhereS y o u h i s h i s y u t u ;r u n ; 3:就業人員 1 , 2人,世帯人員 4人 d a t atemp22;s e ttemp21 ; renameS y o u h i s h i s y u t u=n ; l a b e ln="集計世帯数";r u n ; ‑866‑

871.

ジニ係数による所得格差の解析 木下陽介,若林将史,飯塚政人,中川雄貴 東京理科大学大学院工学研究科経営工学専攻 カテゴリー B Thea n a l y s i so fincomegapbyGinic o e f f i c i e n t YosukeK i n o s h i t a,M a s a s h iWakabayashi,MasatoI i z u k a, Y u k iNakagawa G r a d u a t eS c h o o lo fE n g i n e e r i n g, TokyoU n i v e r s i t yofS c i e n c e D e p a r t m e n tofManagementS c i e n c e, 要旨 近年の就職活動の傾向として,学生の大手志向が注目されている また,公務員もその安定性から就職先 として人気のある業種である.本研究では,多角的な視点から,勤め先収入の中央値とジニ係数を算出し, 企業規模の大きさや産業が勤め先収入とその格差に与える影響を解析した 本稿では,企業規模の他に,産 業,性別,年齢などが,勤め先収入の高さとその所得格差へ与える影響についての結果,考察を示す.その 結果,企業規模,産業によって所得格差に影響を与えることがわかった.また,医療・福祉は特に所得格差 が大きく,この原因について解決するため,更なる追加解析をおこなった. キーワード:所得格差,ジニ係数,年齢,労働環境,企業区分,企業規模,性別, SGPLOT 1.背景 今日,学生の企業選択基準のひとつに「大手企業」という指標がある.大手企業が好まれる理由として, 「働きがいのある仕事がしたしリ r 責任のある仕事がしたし、」といった理由に加え, r 安定して高所得を得た いJ としづ意見が多く挙げられる.しかし,実際に「大手企業であれば安定した高収入が見込めるか」とい うことには検討の余地がある. 我々は,この問題について調べるため,企業規模を始めとし,様々な方面から,給与所得について調べ, 所得格差についてみるため,ジニ係数を算出した.ジニ係数は格差の指標として用いられる.集中・独占・ 不平等といった傾向を見出す指標として,特に所得分布を表す場合に広く利用されている.本研究では,こ のジニ係数を用い,所得格差について調査をおこなった. 2 . 目的 所得格差に影響しうる要因として,企業規模に加え,産業,性別,年齢等が考えられる.そこで,各要因 別に勤め先収入の中央値,ジニ係数を算出し,給与水準,及び,所得格差の違いについて調べ,比較するこ とを目的とした.今回は,勤労者が 1人(世帯主=勤労者)である世帯に絞り,給与所得として勤め先収入を 用いた解析をおこなった. ‑ 8 6 7‑

872.

3 . 方法 3 .1.解析対象 本研究では勤め先収入を対象とし,勤労者が 1人である世帯に絞り解析をおこなった.勤労者が 1人であ る世帯に絞った理由として,勤め先収入は世帯ごとの合計値で表されるため,勤労者の人数が異なると,見 かけ上所得格差が大きく算出されると考えたためである.また勤め先収入の分布は非常に偏っているため, 比較のために,外れ値の影響を受けづらい中央値を算出した. 本研究では,解析の対象となる因子として,企業規模,産業,性別,年齢を用いた. 3 . 2 . ジニ係数 ジニ係数は,所得格差を見る際に用いられる代表的な指標の 1つである.ここでジニ係数と関連の深い, ローレンツ曲線について述べ,ジニ係数の算出方法について説明する. 3 . 2 .1 . ローレンツ曲線 ローレンツ曲線は所得の不平等や集中の度合いを観察するために,度数分布表から作られる曲線である. ローレンツ曲線は,横軸に低所得世帯からの累積相対度数,縦軸に所得の累積相対度数を目盛り,対応する 点を順次結ぶことで描くことができる.したがってローレンツ曲線は 0から 1まで単調に増加する曲線とな 5度線と一致する.この 4 5度線のことを る.もしすべての世帯が同一の収入であれば,ローレンツ曲線は 4 完全平等線という. 3 . 2 . 2 . ジニ係数の算出方法 ジニ係数は,ローレンツ曲線と完全平等線で固まれた面積の 2倍と定義される.本研究では度数分布表か らローレンツ曲線の下側の面積を台形の面積の総和として求め,ジニ係数を算出した.尚,平成 16年度の全 . 2 5 7であった.我々が算出したジニ係数は 0 . 2 4 3であ 国消費実態調査結果から,勤労者世帯のジニ係数は 0 り,擬似ミクロデータからもジニ係数がある程度再現できると判断した. 盗事問販入の累積相対 1 1鎗 " 0 . 9 i l7 8i5 4‑ ‑ a 08 00000 0> 0 . 1 。 。 寸 T-T--~-T-' 一一一一寸一 01 0. 2 γγ 03 ヤ一門 ・ r-- , --~--r-~- T" -'-~-I---'-----'--.'---' 0. 5 0 . . 0 0. 1 … 0 ̲ 8 累積縄対度数 図1.勤労者世帯における年間収入のローレンツ曲線 齢 8 6 8 ‑ O J l

873.

4 . 解析結果・考察 ︑ 11いい‑ いも十 四明 図2 . 企業規模別の勤め先収入中央値とジニ係数 円トいUJ t Dcode]年 齢 5 . 階級 白星~t>1t.(R;入ゆ失0・ ロ勧'"先限入令失値一一ーーージニ保険 hいいいじもど 円 Hll ︺旬︑J. v 冶 ・ も h • ‑ 九 1 償却人以上 ι 4 ︐ 句 " ' 羽入 " " ‑ m 人 企業観績 ・ 5‑Z9 人 九 v ‑ ・ ‑ ,4人 トlili‑‑ 1 11L11lili‑‑ トートザ ﹁ <00000 ヲニ係倣 図3 . 年齢 5歳階級の勤め先収入中央値とジニ係数 表1.産業区分の解析結果 産業 勤め先収入の中央値(円) ジニ係数 N 男性比率 飲食庖・宿泊業 133548 0 . 2 6 3 684 4 36. 不動産業 234879 0 . 2 7 6 510 1 0 0 . 0 医療・福祉 302243 生 豆57 4920 4 8 . 6 建設業 328991 0 . 2 4 1 12496 9 8 . 1 サービス業(他に分類されないもの) 342899 0 . 2 6 3 13968 4 9 3. 卸売・小売業 345234 0 . 2 5 6 1 6 6 6 1 8 9 . 2 運輸業 345968 0 . 2 1 9 7 2 3 1 1 0 0 . 複合サービス事業 366410 0 . 1 9 5 1 2 9 8 1 0 0 . 0 製造業 389719 0 . 2 2 1 39577 9 6 . 0 公務(他に分類されないもの) 428968 0 . 1 9 4 23557 9 4 . 7 教育・学習支援業 4 6 3 1 1 2 0 . 2 1 2 7312 情報通信業 466461 仏語宣 6621 1 0 0 . 0 電気・ガス・熱供給・水道業 477757 0 . 2 2 3 1 6 5 2 1 0 0 . 0 金融・保険業 489375 0 . 2 6 6 4393 .6 91 ※勤め先収入の中央値の高い順 . 性別区分の解析結果 表2 勤め先収入の中央値(円) 166338 384194 業勤め先収入の中央値の高い順 ‑ 8 6 9 ‑ 。

874.

図 2で企業の規模別に勤め先収入の中央値とジニ係数を算出したところ,企業規模が大きくなるほど収入 が高まり,ジニ係数が低くなることが確認できた.最も収入が高く,ジニ係数が少ないのは,官公で、あった. したがって,最近の学生に多く見られる「安定・高収入 Jを求めての大手志向,あるいは公務員の人気は妥 当なものであると判断できる. 図 3を見ると, 24歳未満から 55‑59歳に至るまで,勤め先収入・ジニ係数ともに上昇傾向にあることが わかる.勤め先収入に上昇傾向がみられた要因として,今日の日本において年功序列の慣習の影響が大きい と考えられる.また,ジニ係数が上昇傾向にある理由に,年齢に対する給与の推移が挙げられる.入社して 聞もないうちは,多くの者は変わらない収入を得ているのに対して,歳を取るにつれ,その人の能力や出世 の度合いにより収入の格差が開いていくのではないかと予想できる. 60歳以降,急激に収入が減る理由とし て,定年の影響が考えられる.さらに 60歳以降,ジニ係数が急激に高まっていることから,収入の格差がよ り開いていることがわかる.このようになった原因のひとつとして, 60歳以上の就業者に対して,定年後に 再就職をして収入が減ったものと, 60歳以前とそう変わらない収入を得ているものがし、る影響で,ジニ係数 が高まった可能性が考えられる.平成 26年度現在,定年は 65歳に引き上げられつつあり,現在の年齢によ る勤め先収入への影響は興味深い. 表 1は産業別に勤め先収入の中央値とジニ係数を算出したものである.これより,医療・福祉,情報通信 業,公務で特徴的な結果が得られた.まず,医療・福祉では他の産業に比べ,ジニ係数が非常に高いことが わかった.情報通信業では勤め先収入が高く,ジニ係数が他の産業に比べて最も低い値であった.同じく, 公務に当たるものも勤め先収入が高く,ジニ係数が低いという傾向がみられた.公務については前述した企 業規模別の官公のものと同様の結果が得られており,やはり安定・高収入の面で優れていると考えられる. 情報通信業は月収が高く,ジニ係数が低いことから安定・高収入の面で優れている可能性がある.しかし, 情報通信業は男性比率が 100.0%となっており,女性の勤労者が存在していない.性別に勤め先収入を比べ た時,男性は女性に比べ収入が多い傾向にあり,情報通信業では男性のみのデータを取り扱うことから,ジ ニ係数が減り格差が減ったようにみられた可能性がある. 医療・福祉ではジニ係数が最も高い結果が得られた.このような結果が得られた理由の一つに医療・福祉 では男性比率が 48.6%と他の産業に比べ少ないことが原因だと考えられる.この産業で勤労者の女性比率が 高い理由として,女性看護師が多いことが考えられる.医師と看護師では収入に差が大きく,ジニ係数が高 くなった可能性がある.そのため,医療・福祉について給料格差が大きい原因を探るため,性別に給与の分 布について,追加解析をおこなった. ‑870‑

875.

5 . 追加解析 表3 . 医療・福祉の性別にみた解析結果 勤め先収入の中央値(円) 223938 425918 1 7 . 5 い い 1 5 . 0 ふ 必良市町白 演岨事官官Sロ︼ daMa 句︐︐︐ 思 λ 尉・l て ‑'hnu ぃi 引い ijeUF い い い ー ド い い い い :;jii; ! ト ー!;!j 20 . 0 5 . 0 2 J i 。 四β 1 7 . 5 "RAW ︐ AH ︐ 4 λ 相l て i ︐ 1 5 . 0 5. 0 2 . 5 民間置"。 鍵虻帥曲 520000 ・樹耳旧o 8制lOOO 1 叫陶軒両 打倒潰焔o1 3 2 0 1 陶o1 4 8 O O 1 l O 16 ・00(田'倒X四割) 1 ・6 0000 勧め先根入 図4 . 医療・福祉の性別ごとにみた勤め先収入の中央値のヒストグラム 2万円程度であるのに対して,男性 医療・福祉で,性別に勤め先収入の中央値を算出したところ,女性が 2 2万円と大きな差がみられた.前述したように男女比率も均等に近いため,ジニ係数が高まったものと考 は4 えられる.また,性別ごとにジニ係数を算出すると男性が高い傾向にある.これは他の産業におけるジニ係 数の傾向とは異なる.図 4は医療・福祉の性別ごとにみた勤め先収入の中央値についてのヒストグラムであ る.これにより,男性でより広く分布していることが確認できた.このようになった理由として,医療・福 祉の中で収入の高い集団と低い集団が混合していることが挙げられる.医療・福祉に従事する男性は,医師 などの高収入な集団と,介護職などの比較的収入が低い集団が混合していることが予想できる.したがって, 男性の中での収入格差が高い傾向にあったのではないかと推察する.このことも医療・福祉全体で見たジニ 係数の高さに影響をしていると考える. ‑ 8 7 1・

876.

6 . まとめ 本研究では,多角的な視点から,勤め先収入の中央値とジニ係数を算出し,企業規模の大きさや産業が勤 め先収入とその格差に与える影響を調査した.所得格差に影響しうる要因として,企業規模に加え,産業, 性別,年齢等が考えられる.そこで,各要因別に給与の中央値,ジニ係数を算出し,給与水準,及び,所得 格差の違いについて調べ,比較した.ただし,ジニ係数は不平等を表す指標で、はあるが,調査対象に特定の 傾向がある場合,不平等が必ずしも悪いことになるとは限らない点に留意する必要がある. 年齢が上昇するにつれ,勤め先収入の中央値に増加傾向がみられた.これは,年功序列の慣習が色濃く残 っていると考えられる.同様に,ジニ係数にも上昇傾向がみられた.年齢を重ねるごとに,その人の能力や 出世の度合いにより収入の格差が開いていくためにこのような結果となったのだと推察できる.企業規模が 大きくなるほど収入が高まり,ジニ係数が低くなることが確認できた.最も収入が高く,ジニ係数が少ない のは官公であった. したがって,最近の学生に多く見られる「安定・高収入」を求めての大手志向,あるい は公務員志向は妥当なものであると判断できた.産業別にみると,医療・福祉では他の産業と比較して,ジ ニ係数が非常に高いことがわかった.この原因として,男性比率が他の産業に比べ少ないことが考えられる. 追加解析の結果,医療・福祉に従事する男性は,医師などの高収入な集団と,介護職などの比較的収入が低 い集団が混合していることが推察された.したがって,医療・福祉のジニ係数を高めたと結論付ける. 7 . 参考文献 0 0 3 . 山 作 間 逸 雄 . SNAがわかる経済統計学.有斐閣アルマ. 2 [ 2 ] 白砂堤津耶.例題で学ぶ初歩からの計量経済学第 2版.日本評論社. 2 0 0 7 . 0 0 9 . [ 3 ] 田中勝人.現代経済学入門経済統計.岩波書庖. 2 6年度全国消費実態調査 f h t t p : / / w w w . s t a t . g o ・ j p / d a ta/z e n s h o / 2 0 0 4 /J [ 4 ] 平成 1 (最終閲覧日 : 2 0 1 4年 5月 2 7日) [ 5 ] マイナピ採用サポネット│新卒企画 f h t t p : / / s a p o n e t . m y n a v i . j p / e n q ̲ g a k u s e i l i s h i k i l i n d e x . h t m l J (最終閲覧日 : 2 0 1 4年 5月 2 7日) ‑ 8 7 2 ‑

877.

擬似ミクロデータにおける集計表の再現 芥)1 麻衣子 (参加カテゴリー:C) 株式会社タクミインフォメーションテクノロジー システム開発推進部数理解析グループ 1 . データ読み込み INFILEステートメントで読み込みを行った。一連の DATAステップには、マクロプログラムを適 用した。読み込んだ 7つのデータセットを縦結合して Iつのデータセットにした。 2 . 集計表の再現 2一I 第 1 一l表 集計世帯数(各レコードを、単純にカウントしたもの) FREQプロシジャを用いた。結果は表 lの通りである。 2 ‑ 2 第1 ‑ 2表世帯数分布(各レコードを、集計用乗率で重み付けして、カウントしたもの。) FREQプロシジャに、 WEIGHTステートメントで重みづけをした。データセットに出力し、 TRANSPOSE プロシジャ等で成形した。結果は表 2の通りである。 2 ‑ 3 第1 ‑ 3表 世 帯 数 分 布 ( 10万分比) Iり 、 100,000を掛けた。結果は表 3の通りである。 表 2の値を 495,465で害J 2 ‑ 4 第 2表 支 出 ( 消 費 支 出 及 び 十 大 費 目 ) まず、有業人員 l又は 2人のフラグ、重みづけした世帯と支出をデータセットに作成。次に、総 数、世帯人員 4人、有業人員 1又は 2人に分けて、支出の平均を算出。平均の算出は、 MEANSプロ シジャで集計の後、 DATAステップ内でループ処理にて行った。最後に、 3つのデータセットを縦結 合し、表の形を得た。結果は表 4の通りである。 表 l 集計世帯数│ [再現] トー 表 :S h u u g y o u j i n i n事 S e t a i j i r u n 合計 iqG 噌 人一人 以一仏一以一一以 ‑ 8 7 3 ‑

878.

表 2 分布世帯数[再現] 3人 5人 。 。。。 6人 0 1 4人 │不詳 。 。 。 。 0115, 912 1 5, 615 7, 963 丸 刈 川 7 1 7 6 1 3 6 1 0 1 4, 8 5 1 3, 345 川 4 1 即 断 383 0 1 0 1 0 1 0 1 8 0 1 1 0 8 1 0 1 0 1 4 9 1 0 1 0 1 5 1 1 1 , 0 0 6 1 3, 2 8 7 1 4, 2 1 6 1 3, 51911, 7 6 1 1 7 2 7 14 0 1 11 7 0 1 3 3 0 1 3, 2 1 1 1 3, 15211, 6 0 7 1 6 6 6 12 2 9 1 1 5 1 7 1 0 1 9791 6751 2731 8 51 3 9 1 01 0 表 3 世 帯 数 分 布 (10万分比)[再 現] 3人 1 4人 5人 6人 。o 。。 。。 2 0 3 1 不詳 6 6 4 1 0 1 7 7 1 1 6 1 2 21 0 1 0 1 0 0 1 0 1 1 0 1 1 0 1 0 1 0 8 5 1 1 7 1 0 1 3 5 5 11 4 7 1 8 1 1 3 4 1 7 0 1 表 4 支出(消費支出及び十大費目) [再現】 うち世帯人員が4人 9, 944 850 1 5 5, 335, 438 76, 362 1 5, 345 20, 214 有業人員 1 人 4, 1 3 2 299 6 6, 305, 234 7 1, 5 4 31 7, 556 1 8, 854 有業人員 2人 4, 2 0 1 64, 868 347, 7 4 07 8, 4 7 21 2, 932 20, 6 2 1 有業人員 3人 1 5, 615 23, 045 有業人員4人 4, 8 5 1 22, 490 不詳 (特掲)有業人員 1 人又は2人 E 2 1 6 1 4, 2 5 6 1 882182, 134124, 2 9 6 1 3 7 9, 1 6 8 1 326, 256174, 970115, 269 1 3 1, 8, 3331 ‑874・ 22, 238

879.

( 表 4続き) 8, 885 1 4, 45 2 1 0, 987 4 7, 894 3 3, 442 383 8, 1 3, 579 1 1, 656 4 2, 703 3 202 1, 3 1, 959 5 7, 8 0 1 1 0, 5 3 8 1 4 13 9, 485 5 2, 3 3, 6 8 1 078 7 6, 1 0, 3 3 1 5 2, 406 2 2, 513 2 7, 852 1 6 0 1 2 1, 目 276 1 0, 763 1 1, 1 4, 0 9 1 0, 812 5 1, 310 4, 509 769 3 2, 1 4 8, 628 843 7, 1 4, 238 1 0, 0 1 1 4 3, 5 2 14 9, 453 3 1, 206 942 9 4, 647 8, 1 4, 2 2 1 1 1, 1 0 3 4 7, 3 7 13 5, 298 3 2, 810 839 6 6, ‑875‑

880.

ミクロデータを用いたセルフメディケーション の実態把握に関する検討 芥川│ 麻衣子 (参加カテゴリー:C) 株式会社タクミインフォメーションテクノロジー システム開発推進部数理解析グループ 1.はじめに セルフメディケーションとは、「自分自身の健康に責任を持ち、軽度な身体の不調は自分で手当てす ること」と WHOは定義している。このような観点から、 OTC ( O v e rTheC o u n t e r ) 医薬品の活用と合わ せて語られることが多い 1)。そして、セルフメディケーションによって、医療費の削減が期待される。 しかし、市民が自身の健康を管理した上で、 OTC医薬品使用の適正な判断ができているかについては、 議論の余地がある。そこで本研究は、ミクロデータを用い、各世帯における生活習慣、 OTC医薬品の使 用、医療費の関係について実態把握することを目的とする。 2 . 研究の概念 研究の概念を図 1に示す。前項で述べた通り、セルフメディケーションは、広義には自分の健康に責 任を持った生活習慣、狭義には OTC医薬品の活用である。健康的な生活をした上で、 OTC医薬品が利 用されることが望ましい。また、セルフメディケーションは、医療費の削減に繋がる。そこで、本研究 機能性補助食品の活 では生活習慣として、ミクロデータより取得可能な情報から、「健康的な食生活 Ji 健康行動」を項目とする。これらと、 OTC医薬品の活用との関係について確認する。アウトカム 用Ji として、医療費との関係を確認する。 休初閉玖瑚象となる関係を実線対射ト を材搬な示し布、ゑ本稿'i.型摺聞こ よる国寮静J濯笥義務嘗て元京工く、。配医 薬品の使用を介した間接影響に着目す る 。 ) 図 l 研究の概念図 3 . 方法 3 ・1 変数の採用 研究の概念に基づき、使用する変数について説明する。健康的な食生活として、食料の項目を使用す る。健康的な食生活をしている世帯は、各食材をバランスよく購入していることが予想される。そこで、 食料に関する項目を主成分分析し、第一主成分をその指標とした。機能性補助食品の活用として、健康 保持用摂取品の項目を使用する。これは、栄養成分の補給など保健、健康増進のために用いる食品と定 ‑ 8 7 6・

881.

義 さ れ て お り 、 サ プ リ メ ン ト な ど が こ れ に 類 す る 2)。健康行動として、たばこの項目を使用する。 OTC 医薬品の活用として、医薬品の項目を使用する。但し、当該項目には、医師の処方筆により院外で購入 した薬も含まれている 2 ) 1。 医 療 費 と し て 、 保 健 医 療 サ ー ビ ス の 項 目 を 使 用 す る 。 こ ち ら に つ い て も 、 世 帯が負担した額がベースであり 2)、 負 担 率 の 影 響 を 受 け て い る 点 に 留 意 が 必 要 で あ る 。 属 性 と し て 、 年 間収入を用いた。健康と経済社会的要因との関係が先行研究により示されているためである 2 3‑2 属性 表 l 収入階級の要約統計量 各 世 帯 の 属 性 と し て 、 年 間 収 入 を 7階 (千円) (千円) 級に分けた。階級範囲には、四分位点に加 範囲 階量量 最高収入階級 2 0 0 0 0以上 高収入階級 1 1 4 91 .5 9 7以上 同 9 0 2 8 8 2 1 3 3 6 3 . 0 7 7 5 首 4 8 0 4 1 0 0 7 0 . 4 4 7 1 2 . 5 7 9 9 8 3 . 8 5 6 7 1 9 . 7 3以上 5 0 % 8 0 0 7 7 7 6 7 . 5 2 6 4 8 . 3 0 7 7 2 4 . 9 0 9 5 9 . 8 8 6以上 低収入階級 4 2 5唱 8 0 0 7 5 8 3 3 . 6 3 5 0 7 . 5 7 5 8 3 0 . 5 2 低収入階級 3 6 8 6 . 8 8 6以上 1 0 首 4 8 0 4 4 3 6 5 . 8 2 3 6 4 . 1 4 4 3 9 0 . 1 5 最低収入階級 3 6 8 6 . 8 8 6より低い 3 2 0 2 2 8 1 9 . 8 5 6 9 6 . 0 1 2 9 9 0 . 3 5 高 所得層については大きな幅があったため、 中収入階級 中 級 に お け る 年 間 収 入 の 要 約 統 計 量 は 表 lの ;盤準盤整 ̲ I I I j 軽鐘 豆塑 1 5 7 2 4 9 7 6 . 5 2 7 .2 8 2 2 2 7 4 . 9 5 9 41 N 9 8 9 . 0 8 2以上 中収入階級 8 え て 、 低 所 得 者 層 は 下 位 10%を分離し、高 000万 円 以 上 を 分 け た 3 。各階 上 位 10%と 2, i 分位点 2 9 4 6 . 7 6 1 5 0 9 . 0 5 1 通りである。 3‑3 食生活指標 表 2 第一主成分の固有ベクトル 主成分分析には、飲料を除く食料の下位項 I I J ! J 鑑 定 穴 Z 畳屋 0 . 1 6 l l s 0 . 2 0 生鮮野菜 0 . 2 1 乾物・海藻 0 . 1 5 大豆加工品 0 . 2 3 他の野菜・海藻加工品 0 . 2 1 果物 0 . 2 2 果物加工品 0 . 2 0 油脂 0 . 2 4 調味料 0 . 2 2 菓子類 0 . 1 9 主 食的調理理食食品品 相1( J ) 言 闇 日1 ~ 米 パン 44.3%、固有ベクトルは表 2 の 通 り 全 て 正 の 値 めん類 他の穀類 で あ っ た 。 よ っ て 、 第 一 主 成 分 は 食 材 を 満 遍 生鮮魚介 なく摂取している指標に代えることができる。 塩干魚介 魚肉練製品 さ ら に 主 成 分 得 点 を 算 出 し た 。 各 階 級 の 第 一 他の魚介加工品 生鮮肉 主 成 分 得 点 の 平 均 値 は 表 3の 通 り で あ る 。 正 加工肉 目 を 用 い た 4。 結 果 、 第 一 主 成 分 の 寄 与 率 は の値ならば満遍なく摂取できており、負の値 牛乳 豆1 1 魁 f C i , 4 値ぷ 0 . 2 3 0 . 2 5 0 . 2 0 0 . 2 4 0 . 2 2 0 . 2 0 0 . 1 0 0 . 1 8 0 . 2 7 0 . 2 1 0 . 1 6 0 . 1 9 ならばできていないと解釈できる。また、健康的な食生活の変数として、これを使用している。 表 3 収入階級の第一主成分得点の平均値 i量司区駆入省銀 I .蔵大礎調量町三 i 竃~中収入磨a~i │1.26 1 0 . 7 5 1 0 . 4 8 1 E 争収入僧鍾 0 . 1 7 1 1 や 過重複入鎗儀会ぷ鉱級入階級 i盆 低 級 入 継 級 l 1 ‑0.19 1 ‑0.47 1 ‑0.74 1 1 平成 24年度の市場規模は、医療用医薬品 8兆 7, 660億円に対し、 一般財医薬品 7, 161億円である。(厚生労働省 薬 事工業生産動態統計調査より。市場規模は、園内出荷額を使用している。尚、同調査における一般医薬品とは、配置用家 I に 庭薬を除く。)国民医療費の薬剤比率は、 20%台である。(厚生労働省 炭薬品産業ビジョン 2013より)保健医療調斉J おける院外処方の割合は、日本薬剤師会の処方せん受取率で知ることができるが、平成 24年度時点、全国で 65.1%であ る。平成 21年に厚生労働省が算出した院外処方率によると、全体で 62.0'%、病院は 70.0%、診療所は 59.0%とある。 2社会経済的属性として、収入と就労状況が考えられる。平成 1 9年の内閣府 経済社会総合研究所による「健康と経 済社会的属性との関係に関する調査研究報告書 Jもこれらの関係を、個票データより検討している。報告によると、個人 内では、収入の増減よりも就労状況の変化が健康度の変化と関係しており、これは健康度が下がった人が非就労へ移行し ていることによると考察されている。一方、集団関では、収入水準と健康度が相関していた。よって、本研究は一時点の 個票データであるため、収入を属性とした。 399% 分位点(17681 .528千円)を検討したが、 1000万円台は数が多く、 2000万円から急激に減り、 7000万円まで分布し ていたため、 2000万円以降として分離することとした。 4擬似ミクロデータでは明示されていないが、食料項目は中分類とノj 、分類に分かれる(例えば、中分類穀類の中に、米、 パンなどが入っている)。中分類項目は小分類と 0.8以上の相関があったことから、除外した。 明 877‑

882.

3 ‑ 4 各項目の関連 3 ‑ 1 で定義した変数同士の関連を、散布図により確認する。まず、集団傾向を把握するため、収入階 級別に支出額及び主成分得点の平均値をプロットし、回帰直線をひく。回帰直線は傾向線として、プロ ットが直線より上にあるものは x軸項目への支出傾向に比べ y軸項目への支出が多く、プロットが直線 より下にあるものは x軸項目への支出傾向に比べ y軸項目への支出が少ないと読むことができる。 次に、中所得層の 3階級について、階級内の個票をプロットする。散布図の外れ値を検討し、セルフ メディケーションの観点から考察する。尚、散布図を作成するにあたり、食生活指標以外の支出項目は 対数変換を行った。そのため、支出が Oの個票は除外されている。食生活指標である主成分得点は基準 化して正規分布に近い形であったため、対数変換していない。 4 . 結果と考察 4 ‑ 1 収入階級の散布図 最高収入階級.' .円叡入階級 E .高収入階級 v ‑ 高 中lN入階級 1 匂2 間切 a 温 E 宅 医 .高 中版入階級 収入階級 書 • .中 低限入階級 別淘 4 中 低阪入階級. 級 階一 級入一 階収⁝ 入低い ω 収置い 低.一 7関 低4u筒級 .最優綬入級 , ぺ15 00 05 1醐 H)OO 10 食集活指練 ' " ま こ 級 • 』中収入階級 醐 噌幽開催 』盤ゐ監盤 入階級 1 縦 訓 。 .中 低収入階級 低限入階級 • .低収入階級 級 僧 λ 蜘 一 咽 眼 醐 たばこ 司 8 7 8 ・ 円‑ 高収入階級.最高取 級 収 階 入 高 最 .高収入階級 2 2 ' "

883.

量高取入階級. 高収入階級. 愚高期久階級. 高収入市甲. f ( 収入階級 .高 τJ .高 中収入階級 ;入階級 ."'収入階級 .中ゥぽ収入階級 F 入級 級 階 ・収一 低入国 収階 /嚇 醐 醐 1 .最低限入時級 医'"晶 4 ‑ 2 収入階級別の考察 たばこ以外の項目同士で正の相関が見られた 5。また、各項目への支出額が多いほど、収入が高いとい う関係も見られた。よって、健康的な食生活の上に機能性補助食品を活用し、さらに OTC 医薬品が活 用されていることが示唆される。 ここからは、項目聞について考察する。健康的な食生活と機能性補助食品の活用では、低収入層は食 生活が良好でなく、機能性補助食品摂取に偏っており、コンビ、ニ食に機能性補助食品をプラスする食生 活が想像される。中収入層以上は機能性補助食品に偏らない傾向が見られたが、最高収入階級で機能性 補助食品の摂取が高かった。 たばこは機能性補助食品の摂取、 OTC医薬品の使用に関連がなかった。しかし、最高収入階級が相関 関係に大きな影響を与えていることが散布図から解釈できる。そのため、最高収入階級を除くと負の相 闘があることが予想される。つまり、喫煙をしない、健康行動をしている人ほど、機能性補助食品や OTC医薬品を活用している。この点について、仮説を支持する。また、たばこは低所得者層ほど支出額 が多い傾向も見られた。これは、平成 22年度の国民健康・栄養調査の結果と一致する 3)。 食生活と医薬品の関係では、食生活指標の得点に比べ、低収入と最高収入階級は医薬品への支出が低 く、高収入階級は高い。機能性補助食品と医薬品の関係では、機能性補助食品の支出傾向に比べ、低収 入層と最高収入階級は医薬品への支出が低く、高収入階級は特に高い。医薬品と保健医療サービスの支 出の関係では、医薬品の支出傾向に比べ、低収入と最高収入階級は保健医療サービスへの支出が高く、 その他の群は低い。特に、最高収入階級と高収入階級は医薬品への支出額は近いが、保健医療サービス の額に聞きがある。尚、最低収入階級については、生活保護世帯が含まれる可能性があり、医療費が過 小評価されている可能性がある。また、医薬品と保健医療サービスでは、負の相関が望ましいと考えて いたが、正の相関で、あった。しかしこれは健康に関するイベントの違いで、医薬品も活用するが、保健 医療サービスも利用するという可能性もあり、この結果だけでは OTC 医薬品が医療費削減に寄与して いないとは言えない。 以上より、低収入階級において食生活指標に比して健康保持用摂取品への支出が高いが、 OTC医薬品 への支出は低く、 OTC医薬品の支出傾向に比して保健医療サービスへの支出が高いという、セルフメデ ィケーションが良好でない可能性が見られた。一方、高収入階級において食生活指標に比して OTC 医 5飼粟から算出した相関係、数でも、有意性はないながら、たばこの項目は負の相関、その他の工貞日は正の相関があった。 ‑ 8 7 9 ‑

884.

薬品への支出が高く、 OTC医薬品の支出傾向に比して保健医療サービスへの支出は低いという、セルフ メディケーションが良好な可能性が見られた。このように、低収入層と高収入層というセグメントでは、 セルフメデ、ィケーションに対する行動が違うことが浮き彫りとなった。次に、中収入層については個票 にドリルダウンし、特徴を見出す。 4 ‑ 3 個票の散布図 . 捲 . ,.. =高‑.,.叙 λ d・..盆ゆ駆入訓量級 d 1"4>>‑低根入暗線 c ! a c皐 : 4 1 ‑骨量犯人同宣蝕 , 1 , ・= ‑.,.駆入階. e 、 曜 MM 際軍駐車側智 5 唱毎駆 ER怠雌喧単電側揖 " 'e e静 岡 白 ∞ 。図 。 ‑ H 00 25 50 75 100 司 2 . 5 00 巴 25 50 75 100 ‑25 00 25 50 。 75 100 たI tこ 食生活指揮 cllln"轟‑.,.叙入階級 c l .・ , z 中畑低級入階級 clUI:轟‑.,.叙入鳴. clllu"q..‑偲叙入階級 ' " I l ! a g 50 50 鰍 温 凶 。 。 因 。 司 目 ‑25 00 25 , . " ' : ~ø: 。 50 15 100 ‑ 2,5 00 25 50 75 100 ‑25 00 25 00 」二三」 。 50 75 100 た I:~二 食筆活?量禄 dl"'''O:T級入踏紐 ♂ 図。 。 。 c l .・.,ゅー億叙入間旨鍾 cllll"'&‑!T坂入贈. 6 ・,.,.般入曜級 包 d・ 8・ , " , q : , ‑t阪λ 贈 @ 図 。 1 0 1 凶 5 K M 令領凶軍慰 曜 日 鰍 . 。 ‑ 2,5 00 25 50 75 100 u 僧康保縛周回 ヌ j j , 。 。 ‑25 00 25 50 75 100 ‑ 2,5 00 25 50 75 100 奮薬品 4 ‑ 4 中所得層の考察 中所得層については、個票の散布図により検討した。食生活指標が集団に比べ相当程度高い集団でも、 伊 8 8 0 咽

885.

機能性補助食品と OTC 医薬品の使用は平均的であった。この集団に効果的な使用方法を教育すること によって、より健康が高まることが期待される。たばこについては、機能性補助食品や OTC 医薬品へ の支出が低い集団の中でたばこへの支出額はばらつきがある。健康保持用摂取品と医薬品についても同 様に、医薬品への支出が低い集団の中で健康保持用摂取品への支出額はばらつきがある。医薬品と保健 医療サービスとの関係では、医薬品の使用が低い群の中に、医療費が平均(回帰直線)より低い群と高 い群に分けられた。後者は、セルフメディケーション啓発の対象となり得ると言える。 5 . 結語 セルフメディケーションの概念に基づき、各世帯における生活習慣、 OTC医薬品の使用、医療費の関 係について考察した。 まず、収入階級別にみると、健康的な食生活の上に機能性補助食品を活用し、さらに OTC 医薬品が 活用されていることが示唆された。また、収入が高いほどこれらへの支出が高い傾向も見られた υ そし て、低収入階級においてセルフメディケーションが良好でなく、高収入階級においてセルフメディケー ションが良好な可能性が見られた。このように、セルフメディケーションの成否に、所得水準が関係す ることが示唆された。所得格差と健康格差の一因に、ヘルスリテラシーが挙げられている 4)。低所得層 にはセルフメディケーションを含め、健康教育が必要であろう。一方、最高収入階級についても、一部 000万円以上の 1 5 7 セルフメディケーションが良好でない可能性が見られた。この階級は、年間収入 2, 名という大変特異な集団である。そのため、例えば保健医療サービスに高額な自費診療が含まれている など、特殊ケースが混在している可能性はある。しかし、国民医療費の削減の観点から考えると、この 階級にも軽度な身体の不調は自分で手当てするという、セルフメディケーション啓発は必要である。 中所得層については、食生活が良好な集団に、健康保持用摂取品や医薬品の効果的な使用方法を教育 する必要性が示唆された。また、医薬品の使用が低い群の中に、医療費が高めの群が見られた。この集 団は、セルフメディケーション啓発の対象となり得る。 研究の限界について 2点挙げる。まず、医薬品と保健医療サービスの項目について、筆者が想定して いる項目外の要因が影響していた点である。医薬品には院外処方が含まれ、保健医療サービスは世帯に よって負担割合が異なる。次に、生活習慣として運動に関する項目が取り上げられなった点である。運 動は健康の重要なファクターでありながら、個人差が大きい。これを変数に加えることによって、より 特徴を見出すことが期待される。 本研究により、世帯の家計状況からセルフメディケーションの実態を把握し得る可能性が示唆された。 今後は、他の属性でも確認することで、セルフメディケーションの啓発が必要な世帯の特徴を浮き彫り にすることを課題とする。それにより、セルフメディケーション、 OTC医薬品を活用した医療費削減施 策への一資料とする。 本研究には、 「擬似ミクロデータ(平成 1 6年全国消費実態調査) J (独立行政法人統計センター) を利用した。 ‑ 8 8 1 ‑

886.

引用・参考文献 1 ) 日本 OTC医薬品協会 h t t p : / / w w w j . s m i . j p / i n d e x . h t m l (アクセス日:2 0 1 4年 5月 1 4日) 2 ) 総務省統計局 平成 1 6年 全 国 消 費 実 態 調 査 用 語 の 解 説 h t t p : / / w w w . s t a t .g o j . p / d a t a l z e n s h o / 2 0 0 4 /k a i s e t s u . h t m (アクセス日:2 0 1 4年 5月 1 4日) 3 ) 厚生労働省 平成 2 2年国民健康・栄養調査結果の概要 h 即: / / w w w . m h l w . g o . j p / s t f /ho u d ou ! 2 r 9 8 5 2 0 0 0 0 0 2 0 q b b . h t m l (アクセス日 : 2 0 1 4年 5月 2 1 日) 4 ) 日本学術会議 わが国の健康の社会格差の現状理解とその改善に向けて h 句:/ / w w w . s c j . g o伊 j /a/i n f o / k o h y o / p d f /ko h y o ‑ 2 1 ‑ t I 3 3 ‑ 7 . p d f(アクセス日:2 0 1 4年 5月 2 6日) 帽 8 8 2 ‑

889.

e ・ 2014年 5fl28日 クルーズ株式会社 吉田大祐 金謡 │ 長谷健司 │ 野口光伸 参加カテゴリー: r C ) SASまたは JMPの使用歴 2年未満J 自由課題テーマ f ゲ 考 ど の 議 ト鱗き' Z { ,時間命、 してしきるのか?り Eはじめに 弊社クルーズ株式会社 (h t t p : / / c r o o z . c o . j p / )は 、 SASI n s t i t u t e]apan様と同じく六本木ヒルズ 森タワーに所在しており、ソーシャルゲームやネット通販を中心に世界中にインターネットサービスを 提供するエンターテインメント企業です。現在データマイニング分野の業務強化を行っており、今回の 「ミクロデータ分析コンテスト Jを通して、社内データアナリストのスキル向上と SASプロダクトを弊 社に導入した際の将来の可能性を導き出したいと考えて参加させて頂いています。ちなみに弊社データ アナリストは全員 SASプロダクトの業務経験はなく、このコンテストで初めて使用します。 またご了承いただきたい点として、弊社の企業コンセプトは「 オモシロカッコイイ"をツ クY レjであり、他の参加チームの方々とは書類の形式が若干異なるかと思いますが、楽しんで読んで いただければ幸いです。データサイエンテイストの不足が課題となっている中、難しいと恩われがちな 統計や分析の世界を、より多くの人々が楽しく魅力的なものに感じ、データサイエンテイストの仲間と なり、今後も成長し続けるピックデータによる情報社会を進化・革新を期待しています。 1 1 .テーマの選定理由 弊社で特に注力しているソーシャルゲーム分野事業において、通常はゲームユーザーの方々と直接お 会いすることはないため、どういった生活・消費行動の傾向があるのかを「擬似ミクロデータ j より調 べたい思いこのテーマを選定した。生活・消費行動の傾向から新たなマーケティング施策へも展開でき ることを行いたい。 1 2 .前提条件 ‑データ加工・分析には S ASE n t e r p r i s eGuide6 . 1および SASE n t e r p r i s eMiner 3 . 1を用いる。 Workstation1 6年全国消費実態調査) Jの次の図表 1‑3の ・独立行政法人統計センター「擬似ミクロデータ(平成 1 データ列を利用する。今回は食品支出の傾向を分析するが、それが世帯や収入で影響を及ぼしていな いかを念のため確認をする。 占酬糊 ‑ 8 8 5 ‑

890.
[beta]
図表1.目的変数
衰退亘

._11函_l'II岨画 a匝Z記l:I!"i5DiII.>l'iII亙彊・陪節~,'S;I!尉型司王・・・

│

!

教劃犠用品

世主事人員
有業人員

年庖収入
(
1
,
回x
l
円単位のため1
,航路倍する]

図表 3
. 説明変数 2

,

主・
食務

魚肉練製品

野菜・海嚢

漉腫

他の歓絡

設
霊
童

他の金1'1加工畠

生鮮野菜

調練絹

沼類

米

肉鑓

箆縄・海蕩

草子寮

外食

パン
めMI

生鮮肉

大豆加工晶

調理食畠

一般舛食

加工肉

処¢窓際・海藁加工品

主食的調理食品

学技指食

他E沼
田署

乳揮類

果轡

他の義理食畠
飲科

魚介類

牛乳

生量産累暢

生録魚介

事息晶

畢繍加工品

奈類

塩干魚介

揮

漉題・翼線網

コヒ・ココア

「ゲーム・インターネット好き」の定義は、「教養娯楽用品jおよび「通信jの支出項目の
合計金額が 1
8,
000円以上の世帯とする。

•r
教養娯楽用品Jには[テレビゲーム機,ゲームソフト等,他のがん具jの他に「文房具jおよび
ゲーム好き Jと仮定する。
「運動用具類Jも含まれる(総務省統計局より)が、支出金額が多いほど f
・「通信j については平成 1
6年のデータであるため、現在の通信環境とは大きく異なるが、支出金額
が多いほど「インターネット好き j と仮定する。

8,
0
0
0円という値は、「教養娯楽用品j と「通信jの合計金額の中央値(18,111円)から決定した
・1
(図表 4
)。

r

図表 4
. 教養娯楽用品j と『通信Jの 合 計 舗 の 要 約 統 計 量
ー
ー吋
分析重重量:敏轟謀議 .w;+通信 …

m

F

L
'
2
0
ω
5
裕
7
9
.
0
ω
9包
1
2
飽
8
2
6
.
7
8

0怨
2
9
3
針1
臼
5
4
.
綬
4
2
'3
笠2
日
位
2
7

千…一…!

1
包
2
2
雪
笥
9
.
引
6
1
甘11
8
1
1
刊1
.
2
4
1

2
5
8
1
8
.
6
5

弊社のような Web業界でのデータアナリストは、高度あるいは精度の高い分析モデルよりも、
刻々と変化する環境の中で最短で効果的な次のアクションを起こせるマーケティング分析が必要と
されることが多〈、最終意思決定の担当者でも理解しやすいディシジョンツリーによる分析を行う。

r

図表 5
. [参考) 教養娯楽用品j と「通信jの 合 計 舗 の f
ピクトグラム Jおよび「箱ひげ図J

分
布
・
・
・".m&+

s

量偲

ぷ捌醐

‑
8
8
6
‑

894.

1 4 .アクションプラン 既に弊社を含めソーシャルゲーム業界では、菓子メーカーや清涼飲料メーカーとのコラボレーション 商品の開発やキャンペーンを実施しており、また外食チェーンレストランとのタイアップも多く存在し ている。 弊社のキャンペーン例(図表 9) では、コンビ .弊祉のソーシャルゲームと、アサヒ飲料様、 図表 9 ローソン様とのキャンペーンの例 ニエンスストアのローソン様にてアサヒ飲料様の 製品を購入するとレシートにゲーム内でアイテム が貰えるシリアル番号が発行される。 こうしたマーケティングはターゲットユーザー 層と一致しており、売上の向上やゲームユーザー の新規獲得、プランディングに効果などを発揮し 擬似ミクロデータ j からもその ており、今回の f 重要な関係を証明できる。 また今回のディシジョンツリーの結果からの重 要度としては現れなかった「生鮮野菜jや「果実j、 「魚介類j 、「茶類jなどの健康な生活や食育に関 連する項目に注目し、そうした行動を促すゲーム・ アプリケーションの開発やキャンペーンの実施な どをすることにより、新規ゲームユーザーの開拓 と共に農産業や小売業の活性化にもつながる可能 性はある。 '今後の展開 今回は食品支出に絞り分析を行ったが、他にも「擬似ミクロデータjからは詳細な世帯環境との 関係や医療支出、スポーツを行っているかなど様々な角度からマーケティング分析ができる活用で きる。さらに最新版の「擬似ミクロデータjが公開されれば時系列での分析が可能で、世帯での環 境の変化も調査を行っていきたい。 また今回の「ミクロデータ分析コンテスト j を過して、弊社にご関心をお寄せいただければ、今 後、是非とも情報交換や共同研究など行えれば幸いです。 r S A Sユーザー総会J ( ' 以上になります。 先表?を~こヒを楽しみに しマおります! ‑890・ 6

895.

L e t 'sデータ分析第 2回ミクロデータ分析コンテスト:規定課題 KGあならいず 笹谷知輝大野嵩護 カテゴリー C 要旨 本稿では、本コンテストの規定課題である「集計結果J の再現の過程および結果を示す。なお、使用するデ 6年全国消費実態調査」の個票データに基づいて、独立行政法人統計センターによって作成さ ータは「平成 1 れた「教育用疑似ミクロデータ j である。これらのデータを取り込む際、 DOSで 7つの csvファイルをひと つのファイルに結合した後、 importプロシジャを用いて SASにインポートした。 キーワード:教育用疑似ミクロデータ 集計用乗率 1.第 1 ‑ 1表、第 1・2表、第 1・3表の作成 第 1・1表、第 1・2表、第 1・3表は freqプロシジャを用いて作成した。第 1・2は weightステートメントを用 いて集計用乗率を加味した。また、第 1・3では、 10万分比にするために、 1051全データ数、すなわち、 1051 495465と集計用乗率の積からなる 10万分比集計用乗率を作成し重みづけを行った。 第 1‑1表 集 計 世 帯 数 轟 :S""_"瞳, .~in procfreqdata=kadail; ホS etaiJinin tableShuugyouJinin /missingnopercent n o c o ln o r o w ; formatShuugyouJinin S h u u g y o u J i n i n . SetaiJinin SetaiJini~ ; r u n ; 第 1‑2表 世 帯 数 分 布 procfreq d a t a = k a d a i l ; e m b e r tableworkmember州出l / out=kadail̲2.kadail̲2missing nopercent n o c o l norowformat=F7.0; weightw e i g h t ; formatworkmember w o r k m e m b e r . HHmember H H m e m b e r .; r u n ; 第 1‑ 3 表 世 帯 数 分 布 (10万分比) proc freq d a t a = k a d a i l ; tableworkmember*HHmember / out=kadail̲3missingnopercent n o c o l norowformat=f7.0; weightw e i g h t 2 ; formatworkmember w o r k m e m b e r . HHmember H出l e m b e r .; r u n : ‑ 8 9 1・

896.

2 第 2表 の 作 成 第 2表については、総数の 1行、世帯人員が 4人(特掲行を除く)の 6行をそれぞれ tabulateプロシジャ で作成し、特掲の 1行は世帯人員が 4人で有業人員が 1人と 2人の和を先述の 6行の表から計算し、 s e tステ ートメン卜を使ってそれらを結合することで作成した。 第 2表 /*世帯人員が 4人で有業人員が 1‑4およびその総数*/ proc tabulate data=kadai2̲original out=hh4̲w1t04; where HHmember=4; class HHmember workmember / missing; var weightx consume food house 日l ec̲gas furniture clothes medical transport edu amuse other; ), table HHmember*(workmember a l1 N consum日本mean*f=8 O food*mean*f=8.0 house判n e a nキf=8.0 elec̲gas*mean*f=8.0furniture*mean*f二 8.0 clothes*mean*f=8.0 medical*mean*f=8.0 transport*mean*f=8.0 edu*mean 本f =8.0 amuse*mean*f=8.00ther*mean*f=8.0; weight weightx; key1abe1 a11="総数" mean=" " N="集計世帯数". run, 目 / /*総数(世帯人員の制限なし) * proc tabulate data=kadai2̲original out=hhtotal; class / missing; var consume food house elec̲gas furniture clothes medical transport edu amuse other; table N consume判nean*f=8.0 food判nean*f=8.0house*mean*f=8.0 elec̲gas*mean*f=8.0 furniture棚 田 n*f=8.0 本f =8 O clothes判nean*f=8.0medical*mean transport* mean*f=8.0 edu*mean*f=8.0 amuse*mean*f=8.0 other*mean*f=8.0; weight weightx; keylabel all="総数" mean=" " N="集計世帯数". r u n ; / * (特掲) 1人または 2人*/ data tokkei a v e ; arrayexpense ( 1 1 ) consume Mean food Mean house̲Mean elec̲gas̲Mean furniture Mean clothes Mean medical Mean transport̲Mean edu̲Mean amuse Mean other Mean; array t o t a l ( 11 ) ; array resuI t( 11 ) ; set endニf i n a lo b s ; do i = 1 to 1 1 ; total(i)+sum̲weight*expense(i); e n d ; one̲two+sum̲weight; i ff i n a l obs then d o ; do i = 1 to 1 1 ; result(i)=total( i ) /one̲two; e n d ; output; e n d ; r u n ; 目 竺 丘 川 」主主的平ふ時的記明坊 総書1 3 2 0 2 7 4 9 5 4 6 5I 3 2 8 1刊 ,時 j i 干戸時三平時よび原町時間 i 交 通 ' i ! ! 戸j 今宵;均時 E 叫叩戸出 1 t t 4 吟坦 7 2 8 8 3 1 7 6 8 7 1 9 2 3 8 9 2 0 4 1 4 1 3 8 1 1 3 6 6 4 7 9 6 1 2 2 2 7 0 3 1 3 9 9 9 2 0 0 3 1 4 4 ‑5 2 1 0 9 9 7 4 7 8 9 4 3 3 4 4 2 3 2 2 6 9i 7 5 5 8 8 1 3 5 7 9 1 1 6 5 6 ' 42703312目2 3 1 9 5 9I 5 7 8 0 1 1 4 8 7 6 1 0 5 3 8 5 2 1 4 1 3 9 4 8 5 3 3 6 8 1 ! 7 6 0 7 8 1 6 5 6 1 1 0 3 3 1 5 2 4 0 6 2 2 5 1 3 2 7 8 5 2 1 1 2 1 1 6 0 1 4 8 6 2 8 1 4 0 9 6 1 0 8 1 2 5 1 3 1 0 4 5 0 9 3 2 7 6 9 2 5 6 1 5 5 9 5 0' 3 7 9 8 8 29 2 1 3 42 4 2 9 6 2 2 2 3 8 7 8 4 3 1 4 2 3 8 1 0 0 1 1 4 3 5 2 1 4 9 4 5 3 3 1 2 0 6 9 4 9 4 2 8 3 3 3 1 3 ¥ 1 6 8 1 9 7 2 8 8 6 4 7 1 4 2 2 1 1 1 1日3 4 7 3 7 1 3 5 2自8 3 2 8 1 0 6 6 8 3 9 3 2 6 2 5 67 4 9 1 0 1 5 2 6 9 ‑892‑

897.

年代別の魚食傾向に関する考察 ‑教育用疑似ミクロデータを用いてー KGあならいず 1 笹 谷 知 輝2 しゅうこ柚 大野嵩護3 カテゴリー C A n a l y z i n gF i s h ‑ E a t i n gT e n d e n c ybyAgeGroup U s i n gt h eP s e u d oM i c r oD a t af o rE d u c a t i o n a lP u r p o s e‑ 2 T o m o k iS a s a y a S h u g oOno3 K w a n s e iG a k u i nU n i v e r s i t y e ・ル也、内 要旨 ii~~ 3 昨今、日本では消費傾向の変化による「魚離れ」が問題となっている。そこで、疑似ミクロデータを用いて、年代別の 魚介類支出の割合を算出し、他の品目と比較することで「若者の魚離れJ の実態を検証する。 F a s tF i s h ) キーワード:教育用疑似ミクロデー夕、魚離れ、若者、ファストフイツシュ ( 1.はじめに 国連食糧農業機関によると、日本の魚介類産出量は世界で 5番目の規模[ 1 ]を誇り、日本の一人あたりの魚介類消費量は 世界で 6番目 [ 2 ]であることから、日本は魚と密接な関係を持っているといえる。しかし、近年「若者の魚離れJが指摘さ 魚離れj の原因として、魚の下処理や調理器具が汚れることなど、多忙な現代人のライフスタイルにそぐ れている [ 3 ] 0r わないことが挙げられる問。これは日本の水産業界にとって大きな問題であるため、様々な解決策が講じられている。そ F a s tF i s h ) 商品の選定である。ファストフイツシュとは「手軽・気軽においしく、水産 のひとつが、ファストフイツシュ ( 物を食べること及びそれを可能にする商品や食べ方のことで、今後普及の可能性を有し、水産物の消費拡大に資するもの」 と水産庁は定義している [ 4 ] 0 このように、「若者の魚離れJ は社会から一定の関心を集めている。そこで若者の魚離れの 6年全国消費実態調査のデータから作成された教育用擬似ミクロデータ(以後「ミクロデータ」と呼 実態に関して、平成 1 称する)を用いて分析しその結果について考察する。 本稿では、年齢階級ごとに各食料品目の平均支出を比較し、「若者の魚離れJを概観する。食料支出に占める魚介類支出 の割合の年齢階級による違いを明らかにし、魚介類と他の食料品目を比較した上で、魚介類の代わりに消費していると考 えられる食料品目を検討する。佐藤ら向は、魚の噌好は親等の調理担当者や家庭での食生活が大いに関係していると結論 付けている。したがって、世帯主の年齢階級別に魚食の動向を考察することは正当であるといえる。 l 関西学院大学共通教育センター f データ分析研究会 ( KGあならいず) j 2 関西学院大学経済学部 3年 3 関西学院大学商学部 3年 ‑ 8 9 3 ‑

898.

2. 年齢階級別でみる食料支出と魚介類支出の検討 魚介類の支出を検討するにあたり、ミクロデータから食料品目の支出を考察した。「食料」に大分類されている食料品目 I 食」グループに、「菓子類」、「果物 j、「油脂・ のうち、「穀類」、「魚介類」、「肉類」、「乳卵類」、「野菜・海藻」を「主食・面J 、「外食 J を「その他」グ、ループとして、三つのグ、ループ 調味料」、「飲料」、「酒類」を「噌好品」グループに、「調理食品 J 分けを行った。なお、世帯の食料費の支出は世帯人員が増えれば当然糟加するので、まず、食料支出と世帯人員の相関係 数を求めた。 P値 <0.0001で相関係挙手.0.2.73の弱い正の相関があったので、世帯主の年齢階級幅を 5歳とした年齢階級別 に一人当り平均支出額を、乗率による重み付けを行った上で算出した。また、世帯主の年齢階級が不詳の世帯は除外した。 乗率を換算した世帯主の年齢階級のサンプル分布を図 l に示す。サンプル数の少ない r24 歳未満」、 r25~29 歳」の年齢 階級を r29 歳未満」に、また r65~69 歳」、 再分類後の年齢階級は r29 歳未満」を l 、 r70~74 歳」、 r75 歳以上」の年齢階級を r65 歳以上」に再分類した(図 2) 。 r30~34 歳」を 2 、以降を 9 までの整数値とした後、分析を行った。 まず、各食品グ、ループの各世帯の一人当たりの平均支出額 y と、世帯主の年齢階級 xの関係を調べるために次の回帰式 (1)を用いた。 4Eム ) ( y=日 +sx 計算結果を表 lに示す。表 lより、「主食・高J I 食」グループの戸が、他のグループの結果より大きいことがわかる。した I 食」グ、ループが世帯主の年齢に最も影響を受けているといえる。次に、世帯主の年齢が低いほど「魚介 がって、「主食・高J 類 J の支出額が少なくなるかどうかを調べる。上記(1)式を用いて:;~ f 魚介類」の支出額を[主食・扇J I 食」グ、ループの支 出額の合計で割った値を yに、世帯主の年齢階級を xとして回帰分祈巷行った。また、「主食・高J I 食」グ、ループ内の「魚介 類 J以外の食品項目である「穀類 J 、「肉類」、「乳卵類」、「野菜・海藻」についても向様の回帰分析を行い、その結果を比 較した(表 2 )。これらの食料品目の中では「魚介類」の変化量が最も大きく、魚介類の支出額の変化と世帯主の年齢階級 の変化に正の相関関係があることがわかる。すなわち、世帯主の年齢階級が低い世帯ほど「魚介類」への支出が少ないと いえる。 24 歳未満 I 1 . 2 0 2 25~29歳姐闇闘闘聞 29 歳未満・・園田 1 5, 224 14,021 3 9, 8 3 4 30~34歳 5 6, 1 2 4 5 9, 9 3 8 5 9, 780 6 5, 3 1 9 6 2, 3 5 5 40~44歳 45~49歳 50~54歳 55~59歳 60~64歳 35~39歳 938 5 9, 45~49歳 780 5 9, 50~54歳 7 5歳以上 372 1 o 319 6 5, 55~59歳 65~69歳圃圃圃 8 , 517 1 ,66θ 5 6, 1 2 4 40~44歳 30,953 70~74歳・ 3 9, 8 3 4 30~34歳 35~39歳 3 5 5 6 2, 60~64歳ーーーーーー田一ー. 30, 9 5 3 6 5歳以上・・・ 1 0, 5 5 7 000 2 0, 40, 000 6 0, 0 0 0 8 0, 0 0 0 「 一 司 自 由 同 一 ー ー 一 一 回 ‑ . ‑ ‑ o 2 0, 0 0 0 世帯数 図 1 世帯主年齢階級別の分布 α F 3, 617.7 3, 030.9 6, 178.6 1 , 320.9 497. 3 92.9 6 0, 000 図 2 世帯主年齢階級別の分布(再分類後) 表2 r 主食・副食」グ、ループの各項目と 年齢階級の回帰分析結果 表 l 各食品グ、ループと年齢階級の回帰分析 食品グループ 主食・品J I 食: R 者好品 その他 40, 000 世帯数 決定係数 食品項目 魚介類 野菜・海濠 穀類 乳卵類 肉類 0. 33 0 . 1 5 0.00 ‑ 8 9 4 ‑ 決定係数 α 0.119 0.235 0.247 0 . 1 5 1 0.248 0.0157 0.0066 ‑0.0036 ー 0.0088 0.0098 酔 0.34 0.08 0.02 . 2 1 0.17 。 8 0, 000

899.
[beta]
3
. 全食料支出における「魚介類 J の支出額
「魚介類 j の支出は世帯主の年齢が低いほど少なくなることがわかった。次に、若年層が「魚介類」の代わりに消費し
ている食料品目について検討した。まず、被説明変数を全食料支出に占める各食料品目の支出の割合とし、世帯主の年齢
階級な説明変数として回帰分析を行った。その結果得られた各回帰直線の回帰係数の比較(図 3
) から、年齢階級別の各
食料品目の全食料支出に占める割合の違いがわかる。「魚介類」は他の食料品目と比べて変化の割合が最も大きい。一方、
「外食」は他の食料品目と比べて変化量が大きい負の数になっている。これは、世帯主の年齢階級が低いほど食料支出に
占める「魚介類」の割合が小さく、食料支出に占める「外食」の割合が大きくなることを示している。図 4は年齢階級別
の全食料品目の支出額の積上げグラフである。食料の支出額は年齢階級が低いほど少なく、各食料品目の支出も少なくな
っている。 しかし、「外食」の支出は年齢階級間ではあまり差が克られない。全食料支出に占める「外食 J の割合を図 5
に、「魚介類」の割合を図 6に示す。年齢階級が低いほど「外食」の全食料支出に占める割合は大きくなるといえる。
方、「魚介類」の全食料の支出額に占める割合は年齢階級が低いほど小さい。そこで、全食料支出に占める「魚介類 Jと「外

魚介類
野菜・海藻
果物
穀類
酒類
肉類
調理食品
油脂・調味料
手L
J
ls
類
飲料
菓子類
外食
‑
0
.
0
0
60
.
0
0
4

。

‑
0
.
0
0
2

一
一
一
一
一
一
一
ー
一
一
一
ー
ー
一
ー
叩
「
0
.
0
0
2

0
.
0
0
4

0
.
0
0
63 全食料品目の回帰直線の回帰係数

魚介類

野菜・
肉類乳卵類海藻

穀類

油脂・
果物調味料菓子類飲料

酒類

凡例̲̲̲̲̲.̲:・.̲:.̲.Y'_'_'_'_'_'_'_'i._~_^--_ハ.-..-..--<1 111111111111111田_..田山山叫抗日町、可

調理
食品

外食

・・帽園田圏直 ::::::::::::::1

29歳未満置:・ふ閣制1
1
1
1
1
1
1
1
1
1
.臨 制 ・ : 園 田m
m
m
n続 immH
30歳‑
3
4
歳 ・E
γ
.
:
'
:
'
哲Z
捻罰 1
1
1
1
1
1
1
1
1
1
.
1
8
舘お羽園田B
mmmimmmmH
世帯主の年齢階級

35
歳
一39歳
圃
.
:
.
:
'
,
へ
ぺ
,
:
'
.
:
:
.
:
'
立
'
,
:
'
,
乙
'
.
:
:
.
:
'
ぐ'.:'λ.

n
ι
.
.
.
:.・刀鴎窃掴託剖 111111111111..' 民謡お~:::_~mm器問 H iiI

│
j
:
4
ω
0
歳‑
4
4歳 .
圃
子
"
,
:
.
:
.
ρ
子
J
ι
守
.
:
"
'
,
:
.
:
:
'
,
:
,
紹
「
協
憶 窃S
沼
司
│
聞
1
馴
剛
聞
11
111
川
川
11
1
圃 隠怒R
悶羽 :
ι匝置圃.:出
主
H
詰
H
!
i
日
~出
誌
nm出
誌
Hw出
主H:日H出
i訟出制日主出鋭:日主刈
司
i
H
45歳 ‑
4
9
歳圃園町

50歳品歳 E・_'.::::.::::.::::留詔跡却 11111111111111圃1:-:18器お油園田園田説i総 ~iHH~1

5
釘5
歳‑
5
9歳 圃
圃
圃
圃
骨
島
匝
配
'
.
己
'
:
ぷ

ι

一
一
一
一
一
一
ぷ
,
'
:
'
.
:
'
九
イ
60歳 ‑
6
4
歳 一
6
5歳 以 上

。

.λ
点勺 λ
丸:.::',:.乙
ν.':f:昌招詔~司週11
川川剛
11川山剛
11山川川
11聞川
11川川
11川川
11山酬
11山川酬
1111川川川
川川川
11川川
11川川
11川川
11川川剛
11叩川
1111川川
11問聞剛
11聞川川
11叩川
11川刷
11山間
11111圃圃圃 . ・
隠語読お弘、~: :
・
置_mmmmmmm~15000

1
0000

1
50
0
04 平均食料支出額

‑
8
9
520000

2
5000

30000

3
5000
(円)

900.

29 歳未満 29 歳未満 30歳‑ 3 4 歳 3 0歳‑ 3 4 歳 35歳 ー39歳 3 5歳‑ 3 9 歳 40 歳 44 歳 4 0歳‑ 4 4 歳 45歳 49歳 4 5歳 49歳 50歳‑ 5 4歳 5 0歳‑ 5 4 歳 55歳 59 歳 5 5歳‑ 5 9歳 60歳 64 歳 6 0歳‑ 6 4 歳 65歳 以 上 65歳以上 。 1 0 20 30 。 1 0 20 30 (%) (%) 図 5 一人当たりの全食料支出に占める「外食 Jの割合 図 6一人当たりの全食料支出に占める「魚介類」の割合 食」のそれぞれの平均支出額の割合に対して、 proccorrを使って無相関検定を行ったところ、相関係数がー 0.5518であり、 P値が 0.0001未満という値が得られたため、負の相関があるといえる。 この分析の結果、全食料支出額において、世帯主の年齢が下がるにつれて「魚介類」の支出額の割合が減少することが わかった一方で、「外食 j の支出額の割合は大きくなっており、世帯主の年齢階級が低いほど外食に多く支出しているとい える。これは、労働形態の変化や外食産業の発達によるライフスタイルの変化が、こうした消費傾向を後押ししていると 考えられる。 4. まとめ 本稿では「平成 16年全国消費実態調査」教育用疑似ミクロデータを用いて分析を行った。まず、食料品目を 3グループ に分類し、各食品グループと年齢階級との関係を分析したところ、「主食・副食」グ、ループが最も年齢階級に影響を受けて いるという結果を得た。また、魚介類の支出額の変化と世帯主の年齢階級の変化には正の相関関係、があり、世帯主の年齢 ; 魚介類」の支出額が少ないことがわかった。そして、若者が「魚介類」の代わりに消費している食料品 階級が低いほど、 f 目を調べるために、全食料品目に占める各食料品目の支出額の割合を比較した結果、年齢が下がるほど「外食」への支出 の割合が大きいことがわかった。以上より、世帯主の年齢に基づき「魚介類」に対する消費傾向を見ることができたが、 世帯構成員全員の年齢を含むデータを用いることができれば、より正確な分析が可能になると考える。 参考文献 1 )農林水産省 我が国における魚介類摂取の特徴,くhttp://www.maff.goj . p / j / s y o u a n l t i k u s u i / g y o k a i / g ̲ k e n k o / t o k u c y o / > (参照 2 0 1 4 ‑ 0 5 ‑ 2 8 ) 2 ) 水産庁・水産業をめぐる情勢の変化 < h t t p : / / w w w j . f a . m a f f . g o j . p / j l k i k a k l l i 恒h o n k e i k a k t 卯d f i s h i r y o 2 ̲ 4 . p df > (参照 2014‑05‑28) 3) 農林水産省第 2 節急速に進む「魚離れ J~魚食大国に壁寄りくh抗p:/.八l/WW.maf王 go .j p/.hakusyo/su凶118/.html/sl_1_2.htm> (参照 2 0 1 4 ‑ 0 5 ‑ 2 8 ) a s tF i s h (ファストフィッシュ)関係資料くh t t p : / / w w w . j白 .ma 任g o . j p / j l k i k a k u/ s h i a w a s e 2 . h t m l > (参照 2 0 1 4 ‑ 0 5 ‑ 2 8 ) 4 ) 水産庁・ F 0号. p p . 1 1 1 ‑ 1 1 8( 2 0 0 3 ) 5 )佐藤和美,薬師寺園人:若者の魚晴好と魚食の実態研究,鎌倉女子大学紀要,第 1 欄 896‑

901.

規定課題 谷口裕明 ソニー銀行附 総合リスク管理部 参加カテゴリー :C 基礎集計表の計数について、再現した結果を以下に示す。 第 1‑ 1表 集計世帯数(各レコードを単純にカウン卜したもの) 世帯人員 総数 総数 有 業 人 員 3 4 5 6 32, 027 7, 438 8, 537 9, 944 4, 405 1, 214 3, 908 4, 132 1 , 436 256 5 1 。 。 。 。 。 。 。 。 。 。 494 162 1, 035 1, 0 3 1 559 232 8 4 324 220 1 0 4 3 1 27 6 7 3 3 。 。 。 。 。 。 。 。 。 │ 。 。 。 75 119 52 28 3, 239 2, 950 6 9 1 5 40 6 6 v v 968 1 0 1 5 1 , 943 4, 124 3 9 8 1 4, 2 0 1 913 1 3, 1 3, 459 4 8 390 3, 3 9 1 1 2 第 1‑2表 7 2 203 256 220 6 29 6 3 1 2 1 2 (各レコードを、集計用乗率で重み付けして、カウン卜したもの) 世帯人員 総数 5 6 7 8 3 2, 006 155, 850 495, 465 115, 835 1 67, 565 1 7, 1 6 1 5, 6 1 1 197 1, 1 219, 743 64, 6 9 1 22, 740 3, 813 8 3 1 84 2 205, 723 50, 138 3 44, 0 4 1 総数 有 業 人 員 2 4 1 0, 168 5 570 6 99 v v 1 5, 120 3 6 1, 284 4 66, 299 。 。 。 。 。 。 。 。 。 。 9 。 │ 。 。 。 。 。 。 。 。 。 。 。 523 5 1, 64, 868 29, 616 6, 8 0 1 2, 336 441 1 5, 912 1 5, 615 7, 963 3, 302 1 , 137 76 4, 8 5 1 3, 345 1, 354 422 195 80 108 383 49 5 1 1, 7 6 1 727 1 , 006 3, 287 4, 216 3, 519 2 3 4 5 6 7 100, 000 23, 379 26, 643 3 1, 455 1 3, 637 3, 464 1 , 132 1 44, 3 5 1 1 3, 057 1 2, 369 1 3, 3 8 1 4, 590 770 168 1 7 2 4 1, 5 2 1 1 0 . 1 1 9 1, 373 4 7 1 89 第 1‑3表 1 0 207 33 36 0 1 l 4 0 1 170 33 ( 10万分比) 世帯人員 総数 総数 有 業 人 員 3 889 8, 4 052 2, 5 115 6 20 v v 3, 052 。 。 。 。 。 。 。 。 。 。 203 g 8 242 1 0 1 0 。 。 。 。 。 。 。 355 147 8 1 1 0, 399 1 3, 092 5, 977 3, 2 1 1 3, 152 1, 607 666 229 1 5 979 675 273 85 39 77 1 6 22 664 8 5 1 ‑897‑ 710 1 0 42 7 7 。 。 。 。 。 。 34 7 1

902.

第 2表 (消費支出および十大費目) 集計世帯 数 総数 うち世帯人員が4人 1 有 Z 業 3 人 4 員 v v f 特椙】一人主た l 主ー λ 世帯数分 3 2 , 0 2 7 9 , 割4 1 3 2 4 , 2 0 1 1 , 0 3 1 3 2 4 2 5 6 且謁3 布 率 翻 ( 抽 整 出) 消費支出 4 9 5 , 4 6 5 , 8 5 0 1 5 5 66~ 飢磁調 1 5 , 6 1 5 , 8 5 1 4 4 , 2 1 6 1 3 1.1曲 3 2 8 , 1 咽 3 3 5 , 4 : 謁 車置 2 剖 担7 . 7 , 岨 革 担 ' ,5 2 1 田 ' ,9 6 2 3 胃 ' ,8 8 2 3 3 2 6 . 2 5 6 食料 花~, 833 7 6 , 3 6 2 71 . 5帽 司Mη 8 3 , 7 拓 8 5 , 0 8 3 8 2 , 1 担 苅 7 4 . 9 ' 光拠・水 道 住居 家具・家 事用品 被服及び 保険医療 贋物 1 叫 9 , 2 8 , 皿5 1 7 , 曲7 1 5 , 3 4 5 1 7 , 5 弱 , 2 3 8 1 9 2 凪2 1 4 1 8 . 邸4 邑耳目 1 2 . 舗 担 ‑2 0 . 6 2 1 8 . 91 U, 5 8 3 1 8 , 5 0 0 2 4 , 2 拓 2 3 , 倒5 2 2 , . ( 間 2 2 , 2 3 8 1 9 . 7 羽 1 0 , 2 7 6 1 1 , 7 6 3 , 制3 7 15.副酒 邑制 1 4 , 1 3 8 , 4 5 2 1 4 1 3 , 5 7 9 ,8 47 ' 1 1 6 , 5 6 1 14 , 田6 1 4 , 2 3 8 1 4 .2 2 1 1 1 , 3 師 1 0 , 9 8 7 1 1,世話 1 0 .538 1 0 , 3 3 1 , 8U 1 0 1 札 口1 1 1 1 . 1 伺 交通・通 信 47 , 9 6 1 47 , 8 9 4 位,百沼 5 2 .141 5 2 , 4 国 5 1 , 3 1 0 4 3 , 5 2 1 4 7 . 3 7 1 教育 2 2 , 2 7 0 3 3 , 4 4 2 31 . 2 0 2 却1 . 4 罰 2 2 , 5 1 3 4, 5 0 9 49 , 4 5 3 軍1 . 2 蝿 教養・娘 楽 その他の 消費支出 3 1 , 3 田 3 2 , 2 6 9 31,型盟 82 , 00 ョ , 5 8 8 7 5 57 , 801 指 , ,6 8 1 76 , ( 1 苅 27 , 8 5 2 3 2 , 7 1 印 3 1 , 2 侃 3 2 . 8 : 却 1 2 1 , 1 回 1 帽,臼8 9 4 ,同2 麹菌邑剥 以 上 ‑ 8 9 8・

903.

住宅ローン返済中における家計の逼迫と消費行動に関する分析 谷口裕明 ソニー銀行側総合リスク管理部 参加カテゴリー :C 要旨 住宅ローンを抱える 30 代 ~40 代の世帯を対象とし、家計の逼迫度を 0%~100% で予測する確率モデル を極力シンプルに構築することを本分析のゴールとする。金融機関サイドからは把握出来ない消費行動 を明らかにし、住宅ローンをとりまく環境の将来予測や、戦略策定の一助としたい。 1 . はじめに 住宅ローン融資は事業性融資と異なり、融資実行後における債務者の実態把握が現実的に困難であり、 多くの金融機関において債務者が支払困難な状況に陥り、デフォルトに至るプロセスをリアルタイムに 把握していないのが現状である。今回、全国消費実態調査のデータを活用し、家計が逼迫している世帯 に共通して見られる特徴を明らかにするとともに、住宅ローンがデフォルトに至るプロセスの一端を明 らカ斗こしたい。 ここで、借入金返済に充てる資金を実収入から工面できていない世帯を「家計が逼迫している世帯」 とし、以下に記載の条件に該当する世帯と定義する。本分析のゴールは、住宅ローンの返済を行ってい る世帯を対象に、 「家計が逼迫している世帯」に該当する確率を、極力シンプルに(少数の因子で)予 測するモデルを構築することであり、具体的には、 AUCが 0.9以上となるロジスティック回帰モデルを構 築することと定める。 前提として、住宅ローンは主に 30 代 ~40 代がメイン層となるため、この世代に限定しデータを絞り込 むこととし、また、 3 0代と 40代では、収入、世帯人数、子供の年齢など、その消費行動の背景が大きく 異なることが想定されることから、年代を分けて分析を実施する。 「家計が逼迫している世帯Jに該当する条件・・・実収入一実支出 借入金返済※ < 0 (※)借入金返済=土地家屋借金返済+他の借金返済+分割払・一括払購入借入金 キーワード:全国消費実態調査、住宅ローン、ロジスティック回帰モデル、 AUC 2 . ドライパー候補(指標)の選択 擬似ミクロデータの主要な項目を従属変数、家計逼迫フラグを独立変数とするノンパラメトリック検 定(ウィルコクソンの順位和検定)を実施し、ドライバー候補の選別を実施する。 検定の対象となる項目は、 「家計が逼迫している世帯J に該当するか否かを決定する要素である実収 入、実支出、借入金等の中から以下の通り定める。 ※この論文の内容は、全て執筆者の個人的な見解であり、所属する組織の公式的な見解を示すものではありません。 ‑ 8 9 9・

904.

中区分 大区分 小区 分(ドフイパ一候補) 勤め先収入 事業・ 内戦収入 本業以外の勤め先事業 ・ 肉職収入 他の経常収入 受贈金 その他 食料 住居 光熱 ・ 水道 家具・家事用品 被服及び履物 保健医療 交通・逓信 教育 教養娯楽 その他の消費支出 直接税 社会保険料 他の非消費支出 土地家屋借金返済 他の借金返済 分割払・ 括払購入借入金返済 経常収入 実収入 特別収入 消費支出 実支出 非消費支出 借入金等返済 ( 実支出以外の支出 ) 仮にドライパ ー として有効であれば 、 収入に該当する項目 いほど、支出に該当する項目 (Yo u to0 0 5~ Y out o020) は小さければ小さ ( Y outo 0 38~Yo ut o 1 80) は大きければ大きいほど「家言 | が逼迫している世 帯」に該当する確率は高くなると容易に想像出来る ことから、前者は左側1 [ %を、後者は右側11 %を有意 水準とし、 ドライバ一候補として採用するか否かの判定を行う 。 検定結果は以下に示す通り 、30代において 1 6指標が、 40代において 1 6指標がドライバ一候補として 残された。 支出に該当する項 目で採用されなかった項 目は、どれも左側 1 %であれば有意と判定されており 、支 出 でありながら 小 さければ小 さいほど「家計が逼迫している 世帯」に該当する可能性が高くなるものであ 羽が高いものであり、 ここ で ドライバー としては使用し る。 直接税や社会保険料の支払 いは収入 との粍1 ないが 、本結果は容易に理解出来るものである 。 ( 3 0代) ※ こ の 論 文 の 内 容 は 、 全 て 執 筆 者 の 個 人 的 な 見 解 で あ り 、 所 属 す る 組 織 の 公 式 的 な 見 解 を 示 す も の で は あ り ま せ ん。 ‑ 900‑

905.

( 40代) 3 ロ ジ ス テ ィ ッ ク 回 帰 モ デ、ルの構築 前項で選択されたドライバ一候補(指標)を独立変数、 「家言│が逼迫している世帯」に該当するかど 、 ロジスティック回帰による モデ/ レ桝築を行う 。 うかを示すフラグ(該当する場合は 1) を従属変数と し ここ で、変数選択はステッ プ ワイズ法にて行い、変数の追加 ・削除ともに有意水準を 1 %とする。 変数選択のステップ数は 、構築モテ、ルの AUCが初めて 0 .9を超えたとき以降 、次のステップには逃ま ないものとする 。 ( 30代) 選択された変数は 7つ。パラメータ推定値の符号と P値は問題なく、折L定相関行列の水準から多重共 線性も問題なし。収入サイドの勤め先収入がステップ lで選択されており 、相応の存在感を示すなか、 支出サイドでは、教養娯楽、家具 ・家事用品 のオッス 比が比較的高く、土地家屋借金返済のオッズ比は 比較的低い。 刻果 ス子 ッブ 入 力 済 削 除済 11Youto005 21Youto133 31Youto122 41Youto142 51Youto129 61Youto089 71Youto178 スナップワイズ法の 要約 Wal d 変数 スコア だ 数 カイ 2乗 カイ 2乗 Pr>ChiSq フベル < .0001勤め先収入 1 1 3978. 42 8 1 < . 0 0 01教養 娯楽 43 94 215736. <. 0 0 0 1 交通・通仏 31 5 0 6 8 . 6 2 5 4 4 1 4 3 7 5 . 3 4 6 <. 0 0 0 1 その他の消費支出 5 13 7 6 2 . 3 5 6 9 < . 0 0 0 1教 育 < . 0 0 0 1 家具 ・家事用品 6 13 9 6 9 . 6 4 4 5 7137 4 4 .3479 < .00 0 1 土地家屋借金返潰 取り込ん 自由度 1 1 ※この論文の内容は、全て執f 在者の炉l 人的な見解でユあり、所属寸る組織の公式的な見解を示すものではありません。 ‑ 9 01‑

906.
[beta]
最尤推定値の分析
パラメー
$
1

Wald

推定値

標準誤差

0.8329191585
0.0000194956
0.0000381943
0.0000335493
0.0000322461
0.0000415363
0.0000279867
0.0000223091

0.0430000000
0.0000001880
0.0000011000
0.0000005453
0.0000006435
0.0000006350
0.0000004307
0.0000003942

自由度

Intercept
Youto005
Youto089
Youto122
Youto129
Youto133
Youto142
Youto178

1
1

カイ 2 Pr>ChiSq
374.6213
10759.26
1205.
4256
3785.2294
2511.2609
4
2
7
8
.
2
1
4221.7625
3202.
4
207

<
.
0
0
0
1
<
.
0
0
0
1
<
.
0
0
0
1
<
.
0
0
0
1
<
.
0
0
0
1
<
.
0
0
0
1
<
.
0
0
0
1
<
.
0
0
0
1

fIE定相関行列
パフメー

Intercept
Youto005
Youto089
Youto122
Youto129
Youto133
Youto142
Youto178

Intercept Youto005 Youto089 Youto122 Youto129 Youto133 Youto142 Youto178

0
.
0
2
7
8

0
.
0
6
6
2
0
.
0
0
4
2

0
.
0
1
5
0.5529
0.0318
0.0427

0
.
2
1
7
5

0
.
4
4
9
5

0
.
3
3
8
3

0.
4974

0
.
5
5
2
9

0
.
5
2
3
6

0
.
5
2
3
3

0
.
2
1
7
5
0
.
0
5
0
5
0
.
0
9
1
0.0339
0
.
1
1
6
1
0.0278
0.0979

0
.
0
6
6
2

0.
4
495
0.0505
0
.
1
5
4
2
0
.
2
0
2
1
0
.
1
2
8
7
0.2395

0
.
3
3
8
3
0
.
0
9
1
0
.
1
5
4
2
0.1502
0.0042
0
.
1
7
0.1256
0.0318

0.
4974
0.0339
0
.
2
0
2
1
0
.
1
5
0
2
0
.
1
7
2
7
0.2075

0
.
5
2
3
6
0
.
1
2
8
7
0
.
1
7
0.0427
0
.
0
9
7
9
0.1727
0.2303

0
.
5
2
3
3
0
.
1
2
5
6
0
.
0
1
5
0
.
1
1
6
1
0
.
2
3
9
5
0.2075
0
.
2
3
0
3

金モデル機績の工穏に対する間C曲 




一←一


オッズ比の 95"W.ld億鰻限界

v

1
冊

Y
似......側

v
.
.
.
.
.
岨9

。"

トート叶


・4

V~ω12'

自附

Y
o
u
t
o
l2i

争+‑l

0
2
5
V臥Jto1
3
3




0
0
0

V
ω.
I
t
o1
4
2

.
7


。50

0
2
'

'
0
0

1‑特興庫

(
0
6
9
2
3
)


{



一̲ S
s
̲

t

a





2
4



1

{
0


8

7


5


"
2
1
》
1
}
雇
二
←
1
面
台叩三下
E
蜘
S
滋
民.
岬
f
.
r
1
5
3
p
F

ト+‑l

{
@
O
87
1
M
e
3
a
'
O
}
}
!

《【 以

→

l

ト
制

・

vu
絡η
a
0
9
9
9
9
8

同

4

.
0
0
曲2

制
質
調
。
'
0

オ
ッ
ズ
比

(40代)

選択された変数は 6つ

O

パラメータ推定値の符号と P値は問題なく、推定相関行列の水準から多重共

線性も問題なし。収入サイドの勤め先収入がステップ lで選択されており、相応の存在感を示すなか、
支出サイドでは、分割払・一括払購入借入金返済、教養娯楽のオッズ比が比較的高く、その他の消費支
出のオッズ比は比較的低い。
ステッフワイズ法の裏、
ステップ 入力済

効果

l
1
Y
o
u
t
o
0
0
5
2
1
Y
o
u
t
o
1
4
2
3
1
Y
o
u
t
o
1
2
9
4
1
Y
o
u
t
o
1
3
3
5
1
Y
o
u
t
o
1
2
2
6
1
Y
o
u
t
o
1
8
0

圃
)
1
除済

取り込ん
W
a
l
d
変数
スコア
r>C
h
i
S
qフ
自由度
だ数 カ
イ 2乗 カ
イ 2集 P
ベ jレ
1
<0
0
0
1勤め先収入
1
16
1
3
6
.
8
1
9
1
<
.
0
0
0
1 その他の消費支出
1
2
11
3
1
9
4
.
5
9
2
1
<0
口0
1教 育
3
11
6
0
9
7.
2
6
5
1
<
.
0
0
0
1教 養 娯 楽
4
19
4
4
7
7
3
1
5
1
5
19
4
9
4
.
2
2
1
6
<
.
0
0
0
1交通・通信
1
<
.
0
0
0
1分割払・一括払購入借入金返済
6
17
2
5
6
.
7
8
7
1

※この論文の内容は、全て執筆者の個人的な見解であり、所属する組織の公式的な見解を示すものではありません。

‑
9
0
2
‑

'
0
0
国4

907.
[beta]
"
"

最尤推定値の分析
Wald

パフメー

9

自由度

推定値

標準誤差

1
1
1
1

1.5073880678
‑0.0000162808
0.0000259915
0.0000269216
0.0000300534
0.0000230351
0.0000339548

0.0308000000
0.0000001152
0.0000003249
0.0000002761
0.0000004120
0.0000002218
0.0000004089

Intercept
Youto005
Youto122
Youto129
Youto133
Youto142
Youto180

カイ 2 Pr>ChiSq
2387.742
19960.
492
6397.8386
9508.0609
5322.1575
1
0
7
8
6
.
1
6894.2566

<
.
0
0
0
1
<
.
0
0
0
1
<
.
0
0
0
1
<
.
0
0
0
1
<
.
0
0
0
1
<
.
0
0
0
1
<
.
0
0
0
1

推定相関行列
パフメー

9

Intercept Youto005 Youto122 Youto129 Youto133 Youto142 Youto180

0
.
6
4
5
2

0
.
0
1
2
8
0.1692
0.0038
0.1815
0.204

0
.
5
1
8
1

0.
4
405

0
.
6
2
6
3

0
.
5
7

0
.
6
4
5
2
0.
4298
1
0.1802
0.1606
0.1672
0.1882

0
.
0
1
2
8
4298
0.
0.3179
0
.
2
6
5
1
0.1692

0
.
5
1
8
1
0.1802
0.
2148
4
405
0.1606
0.
2148
0.2322
0
.
1
2
9

0.
0.0038
0.2322
0.3234
0.1815

0
.
6
2
6
3
0.1672
0.3179

0
.
5
7
0
.
1
8
8
2
1
0
.
2
6
5
1
0
.
1
2
9
0.3234
0.204

Intercept
Youto005
Youto122
Youto129
Youto133
Youto142
Youto180

全宅ヂル機嫌の工程 1
=対   附cl
!
l
l




~- 
/

o ,.~

: 0

/

} 



//

オッズ比の 9
5
1
1W.ld健編限界
y""",,間│倒

4

/



/

vd図像 122

悼4

j /

v
.
岨峰、定書



/

J

  /

1
:
(
:

/
/
。曲目,





冊。" 


v
.
.
.
.
.
.,2

}


0

'四韓国車

R6C
‑
e
面積 I
画
面jj)

説e
f
j
O(
OSl:刻。)‑

s
t
岬 2(
07
回1)

s
.
岬, (
08616)
l
ー

・
+4

V儀氏。 1
3
3

同4

V刷 出 回

,
申

s
t {O曲 却'
)
1
s
t
 3(
08301)J

鎌崎き

0..999

(
O田lO)1

モデル {O!183)

'D
政XlO

100(0)

~ッズ比

'
'
'
陰2

'00
曲3

4
. 今次構築モデルより
30代と 40代の今次構築モデルを比較すると、勤め先収入、教養娯楽、交通・通信、その他の消費支出、

教育といった項目が共通しているのに対し、家具・家事用品、土地家屋借金返済が 30代のみに、分割払・
一括払購入借入金返済が 40代のみに選択されており、家計逼迫に至る背景が年代によって少なからず異
なることがわかる。
まず、共通している項目を見ると、勤め先収入の水準が低ければ家計が逼迫する可能性が高いという
のは大方の予想通りであるが、教養娯楽や教育といった項目は子育てに大きく関わる項目であり、多少
の無理をしてでも子供への投資を惜しまないという親心が見て取れる部分である。また、交通・通信や

※この論文の内容は、全て執筆者の個人的な見解であり、所属する組織の公式的な見解を示すものではありません。

‑
9
0
3
‑

908.

その他の消費支出は自動車や趣味など、多かれ少なかれ無駄遣いが家計を圧迫している側面があるので はないかと推察される。 0代のみで選択されている項目を見ると、住宅ローンの返済が相応に家計を圧迫する中で、日 次に、 3 常生活で必要な消耗品にかける出費をいかに減らせるかなど、家事における節約・浪費といったスタン スの差異が家具・家事用品といった項目に表れていることも十分に考えられる。 また、 4 0代のみで選択されている分割払・一括払購入借入金返済は、 3 0代と比べると年収の水準が高 い中、家計のキャッシュフローが回らず、借入金による消費を余儀なくされている世帯が一部存在して いることを示唆している。 5 . おわりに 今回の分析から、大きく「子育て」と「浪費」という 2つの要因が住宅ローンを抱える世帯の家計を 圧迫し得ることがわかった。 前者について、少子高齢化が加速度的に進んでいる背景を如実に示すものであり、行政の早期の対策 が待たれるところである。また、金融機関としても、子育てを主因とする家計の逼迫が極力回避される よう、柔軟な対応が期待される。 後者について、現行の住宅ローンの審査では、債務者に浪費癖があるかどうかまでは十分に見ていな いことが多く、融資実行後の取引振りもモニタリングされていないことが一般的であり、金融機関とし ては一定程度こういった層を取り込んでしまうことは不可避である。今後は、大容量のトランザクショ ンデータを活用した浪費癖の有無の判別など、一層のリスク管理高度化が期待される。 以 上 ※この論文の内容は、全て執筆者の個人的な見解であり、所属する組織の公式的な見解を示すものではありません。 ‑904・

909.

・ ー ~_. .~

910.

主催 :SASユ ー ザ ー 会 世 話 人 会 代表世話人 世話人 (氏名 5 0音順) 大橋靖雄 中央大学 伊藤陽一 北海道大学 小野潔 株式会社インテツク 岸本淳司 九州大学 ARO次世代医療センター 堺伸也 イーピーエス株式会社 坂巻英一 宮城大学 菅波秀規 興和株式会社 周防節雄 兵庫県立大学 高橋行雄 B i o S t a t研究所株式会社 高部勲 総務省統計局統計調査部経済基本構造統計課 八木章 近畿大学 山之内直樹第一三共株式会社 協賛 株式会社 ACRONET アマゾンデータサービスジャパン株式会社 イーピーエス株式会社 スタツ卜コム株式会社 株式会社タクミインフォメーションテクノロジ一 日本メディア株式会社 ファーマ・コンサルティング・グループ・ジャパン株式会社 富士通株式会社 協力 SASI n s t i t u t eJapan株式会社 SASユーザー総会事務局 干160 ・0 022 東京都新宿区新宿 6・27・56 新宿スクエア 5F 1 0 : 0 0 ‑ 1 7 : 0 0 ) TEL:03・5485・7858(開設時間 : ※但し、 1 2:00‑13:00の問、また土日祝日を除く. E ‑ m a i l :sasuser 2014@sascom.jp 4 a ‑司会 可 S 緒川崎川﹂ 一A ド M山 一 FSA︐m M M 'vzh. ﹄ 医療、政府・自治体.大字による エコシステム申書目正 論文集 2014年 7月24日初版第 1刷発行 n s t i t u t eJapan株式会社 発行 :SASユーザー会 SASI