>100 Views
April 21, 25
スライド概要
医薬品製造販売承認申請時のCDISC標準のバリデー ションにおける考察 高浪洋平
Multiple Imputationを実施した際の電子データ提出方法 の検討 大内喜海
Therapeutic Area Data Standards User Guide for Breast Cancerの解析データ使用報告 坂上拓
日米同時申請する際の電子データ提出に関連する問題点と解決方法の検討 鈴木正人
医薬品承認申請畤の電子データ提出開始に向けて 安藤友紀
家計調査に基づく収入・支出の統計解析 武田凌波
国勢調査ミクロデータから全自動で構築したSASデータ ベースに基づく新世帯類型の設計と開発 安井浩子
新世帯類型による国勢調査ミクロデータの分析結果の 概要 新井郁子
4回の学生調査に基づく学生の文化・芸術に対する意識の現状と変化 有馬昌宏
全国消費実態調査の匿名データから見た食料品目別消費傾向による食生活の変化について 池田瑞穂
匿名データを用いた夫婦共働き世帯における子あり世 帯と夫婦のみ世帯の比較:横断研究 井上貴博
匿名データを用いたコメ離れと食事づくりの簡素化につ いての検証 中松建
DS2言語によるデータハンドリングについて 森岡裕
デフォルトと複数格付の同時推計によるロジットモデル 構築手法の提案 木村和央
ガンマ過程を用いた比例ハザードモデルによる解析 矢田真城
落語協会の有力一門の勢力分布をD3.jsで「分かりやすく」ビジュアライズする-JSONプロシジャを用いてー 坂部裕美子
SASによる迷路の自動生成 松沢享
Server版SASを基盤にした「生物統計解析システム」の 紹介 栃澤欣之
SASで作成した統計解析帳票の柔軟なQC体制構築に 向けた取り組みの事例紹介 仲川慎太郎
区間打切りを考慮したノンパラメトリックな生存関数推 定法の推定性能を向上させる診断スケジュールの検討 野村怜史
PROC SGPLOTによるSwimmer Plot 一見やすさを求め てー 福田裕章
欠測のあるデータの解析のためのSASプログラムの紹介~データ発生・DIAマクロとプロシジャの進展~(1)セッションの概要 土居正明
欠測のあるデータの解析のためのSASプログラムの紹介~データ発生・DIAマクロとプロシジャの進展~(2)シミュレーションデータ発生方法 横山雄一
欠測のあるデータの解析のためのSASプログラムの紹介~データ発生・DIAマクロとプロシジャの進展~(3) MNARの仮定の下でのSelection Modelに基づく解析 黒田晋吾
欠測のあるデータの解析のためのSASプログラムの紹介~データ発生・DIAマクロとプロシジャの進展~(4) Pattern Mixture ModelとMultiple Imputationに基づく解 析1 (Delta adjustmentとTipping Point Anatysis) 大浦智紀
欠測のあるデータの解析のためのSASプログラムの紹介~データ発生・DIAマクロとプロシジャの進展~(5) Pattern Mixture ModelとMultiple Imputationに基づく解析2 (Reference・based imputation) 藤原正和
欠測のあるデータの解析のためのSASプログラムの紹介~データ発生・DIAマクロとプロシジャの進展~(6)MIプロシジヤで実行可能なPattern Mixture Modelと Multiple Imputationに基づく解析 渡邊大丞
欠測のあるデータの解析のためのSASプログラムの紹 介~データ発生・DIAマクロとプロシジャの進展~(7)セッションのまとめと質疑応答 大江基貴
SASでのNetwork Meta-Analysisの実施例~頻度論に基づくアプローチ~ 舟尾暢男
ナニワデータサイエンス研究会~第1回ダイジェスト版 ~ 高浪洋平
Sales Analytics の可能性一医薬品営業を例としてー 武藤猛
JMP Clinicalを用いたセントラルモニタリングの経験~ RBMを推進するために~ 福升悠一
SAS XML Mapperを用いたdefine.xmlのメタ情報の有効活用及び 業務効率化の取り組み 林三男
申請時電子データのLengthにまつわる実務上の問題点と対処法 片山雅仁
欠測を含む順序カテゴリカル経時データの解析-MIプロシジヤの有用性- 藤原正和
ADaM/TLF経験者がSDTMを作成できるまでのサクセス ストーリー 小林千鶴
欠測を含む順序カテゴリカル経時データの解析ーGEE プロシジヤの有用性ー 駒嵜弘
Multi・Regional Clinical Trialの生存時間解析における地 域ごとのイベント発現数の予測 淀康秀
用量設定試験におけるMCP・Modの3つの実行例~多重比較と用量反応関係のモデリング~ 加藤雅章
指数分布に従うデータへの層別ロクランク検定の検出 力の検討 小松邦岳
PPK解析時の潜在的なデータ不備が推定値に与える影 響の検討 川崎勝己
ポアソン分布に従うと仮定された総ケース数が固定され た条件の下でのrate ratioの条件付き信頼区間 伊藤要二
JMPスクリプト言語(JSL)を用いた前臨床における割付 け手法のアドイン開発 原茂恵美子
Kaplan・Meierプロット・Forestプロット作成の応用:グラフ出力範囲内・範囲外への数値出力 魚住龍史
臨床試験におけるSGプロシジヤを用いたGraphic Designの考察 山崎文寛
SASプロシジヤを用いた生存時間データに対する例数 設計の変革 魚住龍史
生存時間データに対するベイズ流例数設計 矢田真城
SASにおける文芸的プログラミングへの試み 吹谷芳博
医療・健診データに対するSAS Visual Analytics/ Visual Statisticsの適用可能性の検討 大津洋
SASによる生存時間分布の予測「Death Noteの統計学」 浜田知久馬
データハンドリングにおけるSQLプロシジヤの利活用― PROC SQL入門- 古隅弘樹
JMPによる第4回Let'sデータ分析の規定課題の解析 高橋行雄
SASユーザー総会2016における「Lefsデータ分析第4回 ミクロデータ分析コンテスト」の規定課題のSASプログラム解説 周防節雄
局外トレントのある回帰モデルの推測 藤原滉
ベイジアンモデルによる地域人口予測モデルの可能性 について 片桐智志
貧困・中流・富裕世帯における教育費の実態調査 四方克成
消費税率の引上げ及び軽減税率制度の導入は低所得者にどのような影響を与えるか 松本光右
シングルマザー世帯の家計の実態一片働き世帯と共働き世帯との比較からー 買慧玲
世代別及び経常収入別に見た官民の平均貯蓄率の差 異に関する考察 田中健一郎
一戸建て・共同住居住まい世帯における傾向の比較 田中基史
収入と医療費の関係から見える「医療格差」に関して 村木淘太
業種で見る中小企業の収入~大企業との比較~ 野田斉
マイナス金利下におけるローン事業の発展性と疑似ミクロデータに見るローン利用者の行動特性 内田晃秀
SAS言語を中心として,解析業務担当者・プログラマなのコミュニティを活性化したいです
可 f 正ーザー総会 1 論文集
S A S、S A Sを構成するプロダクト群は、 S A SI n s t i t u t eI nc.の登録商標です。 その他、本論文集に記載されている会社名、製品名は、一般にそれぞれ告社の商標または登録商標です。 本論文集の一部または全部を無断転載することは、著作権法上の例外を除き、禁止されています。 本論文集の内容を実際に運用した結果の影響については、責任を負いかねます。
目次 Cl t J . ( : D ] 企画 セ 、yション I i 3 医薬面製造販売承認申請時の CDISC額準のバリデーションにお付る考察 高浪洋平(武田薬品工業株式会社) 山崎文寛、山田出吃子 4 M u L t i p L eImputationを実施した際の電子データ提出方法の検討 大内喜海(協和発酵キリン株式会社、 C JUG‑ADaM) 吉崎正浩(小野薬品工業株式会社、 C JUG‑ADaM)、浅見由美子(第一三共株式会社、 CJUG‑ADaM) TherapeuticAreaDataStandardsUserGuidef o rB r e a s tCancerの 5 解析データ使用報告 板上拓(株式会社中外臨床研究センター) 6 日米間時申請する際の電子データ提出に関連する問題点と解決方法の検討 鈴 木 正 人 (MSD 株式会社) 7 医薬晶承認申請時の電子データ提出開始に向付て 安蕗友紀{独立行政法人医薬品医療機量総合機構) 「 ォ1&方ヲヨ、 家計調査に基づく収入・支出の統計解析 I 1 1 武田凌波(東京理科大学大学院) l‑ 金融三経済・吾首開運 ! 国勢調査ミクロデータから全自動で構築した SASデータベースに基づく 新世帯類型の設計と開発 ‑ 15 安井浩子(公益財団法人統計情報研究開発センター) 中川雅義(公益財団法人統計情報研究開発センター)、周防節雄(兵庫県立大学) 新世帯類型による園調謂査ミクロデータの分析結果の概要 23 新井郁子(公益財団法人統計情報研究開発センター) 米津香、中川雅義 4固の学生調査に基づく学生の文化・芸術に対する意識の現状と蜜化 33 有馬昌宏(兵庫県立大学) 全国消費実態調査のE名データから見た食料晶目別消費傾向による 禽生活の変化について 43 池田瑞穂(京都大学大学院) 匿名データを用いた夫婦共働き世帯における 子あり世帯と夫婦のみ世帯の比較:横断研究 52 井上貴博{ノパルティスファーマ株式会社) 矢田徹(イーピー工ス株式会社) 匿名データを用いたコメ離れと食事づくりの簡素化についての検証 中松建(株式会社タクミインフォメーションテクノロジー) 62
S~ システム 052言語によるデータハンドリングについて I 73 森岡裕 デフォルトと複数桔付の同時推計によるロジツトモデル構築手法の提案 85 木村和央(株式会社金融工学研究所) ガンマ過程を用いた肱倒ハザードモデルによる解析 100 矢田真域(東京理科大学大学院、エイツーヘルスケア株式会社} 浜田知久馬(東京理科大学) 藩語協会の有力一門の勢力分布を D 3 . j sで『分かりゃすく』ピジユアライズする ‑JSONプロシジャを用いてー 110 坂部裕美子{公益財団法人統計情報研究開発センター) S m:Jシステム/その他関連分野 目 113 SASによる迷蹄の自動生成 松沢事{株式会社インターサイエンティフィックリサーチ) 生物統計・医薬関連 S e r v e r版 SASを基盤にした『生物統計解析システムJ の紹介 目 117 栃津欣之(大塚製薬練式会社) 角元慶二、佐々木和典、菱垣閥次 SASで作成した統計解析帳票の栗軟な QC体制構築に向けた取り組みの事例紹介一一一一 1 2 2 仲川慎太郎(中外製薬株式会社) 吉本拓矢、吉田寛輝、久力洋、河田祐一 『区間打切りを考慮したノンパラメトリックな生存関数推定法の 推定性能を向上させる診断スケジュールの検討J 123 野村怜史(東京理科大学) 寒水孝司、浜田知久馬 PROCSGPLOTによる SwimmerP l o t ‑見やすさを求めて・ 124 福田裕章 (MSD株式会社) 吉田秀幸(株式会社タクミインフォメーションテクノロジー)、韓士栄 (MSD株式会社) │企画セッション l 欠測のあるデータの解析のための 5 錨プログラムの簡升 データ鮭・ D I Aマクロとプロシジャの進展 ( 1 )セッションの概要 ‑125 日本製藁工業協会医叢晶評価委員会データサイエンス部会タスクフォース 4欠測のあるデータの解析検討チーム 土居正明(東レ株式会社} │企画セッション│匁澗のあるデータの解析のための S A Sプログラムの唱介 データ発生・ D I Aマクロとプロシジャの進展 ( 2 )シミュレーションデータ発生方法 日本製薬工業協会医薬筒評価委員会データサイエンス部会タスクフォース4欠測のあるデータの解析検討チーム 横山雄一(持田製薬株式会社) 大滞留紀(日本イーライリリー株式会社ふ土居正明(東レ株式会社) ‑126
│企函セッション│欠澗のあるデータの解析のための S A Sプロタラムの紹介 データ魁・ D I Aマクロとプロシジャの進展旬 ‑127 e l e c t i o nModel' こ基づく解析 (3)MNARの仮定の下での S 日本製薬工業協会医薬品評価委員会データサイエンス都会タスクフォース 4欠測のあるデータの解析様せチーム 黒田晋醤(武田薬晶工業株式会社) │企画セッション│欠測のあるデータの解析のための S A S 1 ロタラムの咽升 データ尭生・ D I Aマクロとプロシジャの進展 ‑128 r nM i x t u r eM o d e lとM u l t i p l eI m p u t a t i o nI こ基づく解析 1( D e l t a副I j u s t m e n tとT i p p i n gP o i n tA n a l y 由) ( 4 )均投e 日本製薬工業協会医薬品評価委員会データサイエンス部会タスクフォース 4欠測のあるデータの解析樽すチーム 大浦智紀(日本イーライリリー株式会社) │企濁セッション│欠測のあるデータの解析のための S A Sプロタラムの謂介 データ姓・ D I Aマクロとプロシジャの進展 ‑129 枕e r nM i x t u陀 M o d e lとM u l t i p l eI m p u t a t i o n ' こ基づく解析 2( R e f e r e n c e ‑ b a s e di m p u t a t i o n ) ( 5 )P a 日本製業工業筋会医薬品評価委員会データサイエンス部会タスクフォース 4欠測のあるデータの解析櫛サチーム 醸原正和(塩野義製薬株式会社) │企圏セッション│欠却のあるデータの解析のための S A Sプロタラムの謂介 データ羅生・ D I Aマクロとプロシジャの進展 ‑130 ( 6 ) M Iプロシジャで実行可能な P a t t e r nM i x t u r eModelとM u l t i p l eI m p u t a t i o n ' こ基づく解析 日本製薬工業協会医務局評価委員会データサイエンス部会タスクフォース 4失調j のあるデータの解析検討チーム 渡選大丞(サノフィ株式会社) │銅セッション│矧のあるデータの解析のための S A Sブロタラムの紹介 データ勉・ D I Aマクロとプロシジャの進展 ‑131 ( 7 )セッションのまとめと質蝿応答 日本製薬工業協会医察品評価委員会データサイエンス部会タスクフォース 4欠測のあるデータの解析樽サチーム 大江基貴(株式会社大塚製薬工場) 土居正明(東レ株式会社) SASでの NetworkM e t a ‑ A n a l y s i sの実施例 頻度論に基づくアプローチ 1 3 2 舟尾暢男(武田薬晶工業株式会社) 黒田晋吾 ナニワデータサイエンス研究会 第 1固タイジェスト版 154 高浪洋平(ナニワデータサイエンス研究会) 北西由武(塩野義製薬株式会社)、麗原正和(塩野義製薬株式会社)、坂井絵理(梅野義製薬株式会社)、 黒田普吾(武田薬品工業株式会社)、舟尾暢男(武田薬品工業株式会社) S a l e sA n a l y t i c sの可能性 一医薬晶営業を例としてー 1 5 5 武 穫 猛 (MarkeTechC o n s u l t i n g ) JMPC l i n i c a lを用いたセントラルモニタリングの経験 ‑RBMを推進するために 1 6 5 福升悠一(エイツーヘルスケア株式会社) 近蕗秀室、樋口天裕、小幡智憲、畑山知慶、林行和 SASXMLMapperを用いた d e f i n e . x m Lのメタ情報の有効活用及び 業務効率化の取り組み 166 林三男(大日本住友製薬株式会社) 山本繁 申請時電子データの Lengthにまつわる実務上の問題点と対価去 片山雅仁(趨野義製薬株式会社) 平野勝也、鈴木ゆら 1 6 7
欠測を曾む順序カテコリカJ L ‑ 経時データの解析 MIプロシジャの有用性・ ・ 168 藤原正和(塩野義製薬株式会社) 駒寄弘(マルホ株式会社) ADaM 庁L F経験者が SDTMを作成できるまでのサクセスストーリー 169 小林千鶴(塩野義製禁株式会社) 神谷亙香里(塩野義製薬株式会社)、坂本佳代子(株式会社エス・シー・エー)、勘場大(塩野義製薬株式会社)、 江川広明(塩野義製薬株式会社)、角谷伸一(趨野義製薬株式会社) 欠測を富む順序カテコリカル経時データの解析 ‑GEEプロシジャの有用性・ 170 駒寄弘{マルホ株式会社) 藤原正和{塩野義製薬株式会社) Mu 刷 ・R e g i o n a LCi L n i c a LT r i a Lの生存時間解析における 地域ごとのイベント発現数の予測 171 淀康秀(大日本住友製藁株式会社} 浜田知久馬(東京理科大学) 用量設定試験における M CP ・ . M o dの 3つの実行倒 多重肱較と用量反応関係のモデリング 1 7 2 加藤雅章(武田薬品工業株式会社) 清水康平、佐々木英麿、舟尾暢男 指数分布に従うデータへの層別ロクランク検定の検出力の検討 193 小松邦畠(臨床評価研究会} P P K解析時の潜在的なデータ不備が推定値に与える影響の検討 204 川崎勝己(株式会社ベル・メディカルソリユーションズ) 碇新里、新城博子 ポアソン分布に従うと仮定された総ケース数が固定された条件の下での r a t er a t i oの条件付き信頼区間 205 伊藤要二(アストラゼネカ株式会社} J M Pスクリプト冒語(JS L )を用いた前臨床における割付け手法のアドイン開発 2 1 5 原茂恵美子(株式会社タクミインフォメーションテクノロジー) 佐蔵拓哉、篠津和夫、佐蔵耕一 K a p L a n ‑ M e i e rプロット・ F o r e s tプロット作成の応用: グラフ出力範囲内・範囲舛への数値出力 2 1 6 魚住龍史(京都大学} 吉田早織〈日本化藻株式会社)、平井隆幸(日本化祭株式会社)、浜田知久馬(東京理科大学) 臨床試験における S Gプロシジャを用いた G r a p h i cD e s i g nの考察 233 山崎文寛(武田薬晶工業株式会社) 清水康平、高浪洋平 SASプロシジャを用いた生存時間データに対する例数設計の蜜草 魚住龍史(京都大学) 矢田真城(エイツーヘルスケア株式会社)、浜田知久馬(東京理科大学} 250
2 6 8 生存時間データに対するベイズ溝例数設計 矢田真城(エイツーヘルスケア株式会社) 魚住龍史(京都大学)、浜田知久馬(東京理科大学) ‑ │ 生物統計;医薬蘭連〆~システム S A Sにおける文芸的プログラミングへの試み 2 8 1 吹谷芳樽(株式会社エスアールディ) 医療・健診データに対する S A SV i s u a LA n a L y t i c s /V i s u a LS t a t i s t i c sの適用可能性の擬古 ‑294 犬津洋(国立国際医療研究センター 臨床研究センター) 大橋錆雄(中央大学) 1 子三一ドリ討し L S A Sによる生存時間分布の予測 r O e a t hN o t eの統計学j ← I 297 浜田知久馬(東京理科大学) 魚住龍史(京都大学) データハンドリングにおける S Q Lプロシジャの利活用 298 ‑PROCSQL入門ー 古隅弘樹(兵庫県立大学) J M Pによる第4固 L e t ' sデータ分析の規定課題の解析 313 高橋行雄 ( B i o S t a t研究所株式会社) S A Sユーザー総会 2 0 1 6における r L e t ' s データ分析第4 回ミクロデータ分析コンテスト』の A Sプログラム解説 ‑330 規定課題の S 周防節雄(兵庫県立大学) 統証理論 二 二 三 局舛トレンドのある回帰モデルの推測 1 1 3 5 1 穣原混(県立広島大学) 丸川真友子、富田哲治 ペイジアンモデルによる地域人口予測モデルの可能性について 352 片桐智志(ネイチャーインサイト株式会社) 山下論史 出 し1 1デー勢佐析 一ー ャ 円 I │割目カテゴリーB│ラドラー 自由課題レポート:貧困・中流・富裕世舗における教育賓の実臨調登 規定課題レポート 365 374 │割肋テコリー A│チームベイ 自由課題レポート:消費税率の引上げ及び軽減税率制麿の導入は低所得者にどのような影智を与えるか一一一‑380 規定課題レポート 3 8 9
│告書畑カテコリー C 1 3 ‑ g i r l sfromC h i n a 自由課題レポート:シングルマザー盤情の家計の実績ー片飽き世績と共働き世情との肱較から‑ 規定漂題レポート 393 403 │捌カテコリー B│田中健一郎 自由課題レポート:世代別汲び経緯収入別に見た富民の平均貯蓄率の差異に関する考窃 規定課題レポート 409 419 │倒防テコリー B│椋式会社コネクティポ 自由課題レポート:一戸建て・共同住居住まい世滞における傾向の肱絞 規定課圏レポート 423 428 │倒防テコリー c l 三度の飯より分析 自由課題レポート:収入と匿寝賓の関係から見える『医疲格差』に関して 規定課題レポート 430 434 │曾畑カテコリー B IFEG̲Freshe 隠 自由課題レポート:業種で見る中小企業の収入 大企業との肱較 規定課題レポート 449 456 │割肋テコリー B│筑漉銀行宮襲企画部タイレクトマーケテインタグループ 自由課題レポート:マイナス金利下におけるローン事鍵の発慢性と疑似ミクロデータに見るローン利用者の行動特性 ‑464 規定課題レポート 474
医薬品製造販売承認申請時の CDISC標準のバリデーションにおける考察 0高 浪 洋 平1、山崎文寛 l、山田佳代子 l e 武田薬品工業株式会社) 2 0 1 5年4月に「承認申請時の電子データ提出に関する実務的事項について J (実務的通知)及び「承 認申請時の電子データ提出等に関する技術的ガイドについて J (技術的ガイド)が発出され,いよ いよ本邦において 2016 年1 0月より医薬品製造販売承認申請時電子データ提出が開始される. さら 1月に PMDAより電子データ提出対象となる CDISC 標準の SDTM,ADaM 及びD e f i n e . x m l に , 2015年 1 について「バリデーションルール一覧」が公開され,電子データ作成時の具体的な要件が定められ た.一方, FDAでは既に電子データの受け付けを開始しており, SENDとSDTMについてバリデー ションルールが公開されているが,グ、ローパルに展開する製薬企業は,それら両方の要件を満たす 電子データの準備が必要となる.本発表では,日本で医薬品製造販売承認申請を実施する申請者側 の視点、から, PMDAのバリデーションルールの概要を整理するとともに,実務上,電子データを準 備するにあたって留意すべきポイントを報告する. 3
Mult 中l eIm p u t a t i o nを 実 施 し た 際 の 電 子 デ ー タ 提 出 方 法 の 検 討 0大内喜海 I、吉崎正浩2、浅見由美子3 e 協和発酵キリン株式会社及びCmG‑ADaM、旬、野薬品工業株式会社及びCmG‑ADaM、 第一三共 3 株式会社及びC町 G・ADaM) 臨床試験は様々な理由により欠測値が発生することがあり、臨床試験の成績は欠測値を含むデー タから評価される。欠測値は、 ICHE9において「臨床試験において偏りを起こし得る代表的な原因」 R 1 )のE s t i m a n dにも関連するため、臨床試験の成績を評価する とされ、現在検討されている ICHE9( a t i o n a 1ResearchCouncilが2010年に公表した うえで適切に取扱う必要がある。 FDAの依頼により N i T h eP r e v e n t i o nandT r e a t m e n to f M i s s i n gD a t ai nC l i n i c a lT r i a l s J、EMAが2010 年に公表した i G u i d e l i n e nConfmnatoryC l i n i c a lT r i a l s J により、欠測値の予防や欠測値を含んだデータに対 onM i s s i n gD a t ai する解析手法について提言がなされたことをきっかけに、圏内においても欠測値を含む臨床試験デ 6 年6 ータの解析手法が活発に議論されるようになった。そのような状況下で、規制当局より平成2 月20日付で「承認申請時の電子データ提出に関する基本的考え方について」、平成27 年4月 27日付 で「承認申請時の電子データ提出に関する実務的事項について/技術的ガイドについて」が発出さ れたことにより、平成 28 年 1 0 月 1日以降(経過措置期間あり)の承認申請品目は、 CDISC 標準 (SDT Ml AD aM)に基づくデータセット、 Define‑XML(An a l y s i sr e s u l t smetada 匂を含む)、 D a t aGuide ( R e v i e w e r ' sG u i d e ) 及びADa Ml解析帳票作成プログラム等の提出が必要となった。 これまで、欠測値に対する解析手法に関して活発な議論がなされているものの、それらの電子デ ータ提出方法に関する議論は活発になされていなかった。そこでCDISC、規制当局、 FDAがそれぞ ADaMImplem 印 刷i o nG u i d e J 、 「承認申請時の電子データ提出に関する実務的事 れ公表している i 項について/技術的ガイドについて J 、 rSTUDYDATATECHNICALCONFORMANCEGUIDEJ 等の関連資料と照らし合わせて考察したが、 M u l t i p l eIm抑制i o n (以下、 MI)を実施するうえで以下 のような点で電子データ提出方法が明確ではないと考えられた。 .MI プロシジャがADaMのBDS 型で実行できないため、実行前後でCDISC非準拠のデータセット が発生するが、それを電子データとして提出する必要性があるのかが明確ではない .MIによる解析結果を得る過程で中間データセットが発生するが、それらも電子データとして提 出する必要性があるのかが明確ではない ・上記2点のようにMIを実施することでCDISC非準拠のデータセットや中間データセットが発生 r a c e a b i l i t yを残せばよいのかが明確ではない するが、どのようにT 本発表では上記の点を踏まえて MIを実施した際の電子データ提出方法を検討し、その検討結果を 報告する。 4
T h e r a p e u t i cAr eaDataS t a n d a r d sUserGuidef o rB r e a s tCancerの 解 析 デ ー タ 使 用 報 告 0坂 上 拓 (株式会社中外臨床研究センターバイオメトリクス部データサイエンスグループ) 標準のバリエーションや,安全性解析に関わる ADaMのサンフ。ルが増えてきたこと 近年, ADaM から,これらを元に ADaMを作成し,安全性に係る解析帳票の開発を効率的に進める事が出来るよ うになりつつある。このため,安全性解析で作成するような ADaMに関しては,各社で共通の認識 を得ることができるようになり,問題点の共有や情報交換もスムーズになってきている一方で,有 効性の解析は,疾患領域特有の要件が多く,公開されているサンプルも少ないことから, ADaM 標 準をベースに各社各様の解析仕様やデータ構成で開発を進めているのが現状である。 CFASTが主導して開発している, TAUG( T h e r a p e u t i cAr e aD a t aS t a n d a r dU s e rG u i d e )は,特性疾患 領域の臨床試験に対する, CDISC 標準の活用方法を多くの例と共に示した文書で,有効性解析を目 的とした ADaMの標準ついても定義されていることから,このような問題を解決し, CDISC 標準を 更に活用する上で重要な役割を果たす文書となっている。 現在リリースされている TAUGの一つである, TAUGB r e a s tC a n c e rには,腫虜縮小効果判定結果 と生存時間解析を実施するために, 4つの ADaM(ADSL, ADEVENT,ADTTE,ADRESP)のメタデータ が提案されている。その中でも特に興味深いのが, T i m e ‑ t o・e v e n t 情報が格納されている ADTTEを作 成するための中間データセットである ADEVENTで,本データセットを作成することにより, ADTTEが効率的に作成することができ,且つ,シンプルにトレーサピリティを保持することができ るようになった。また, ADRESPは,腫蕩縮小効果判定結果の解析を目的として,非常にシンプル な構造で最良総合効果を格納している。 しかし当然ながら, TAUGで示されているメタデータや例示だけでは,実際に実施されるすべて の解析を網羅することはできない。このため, TAUGに定義されているメタデータや例示を元に, 各社の解析方針,ケースカードの収集項目やデザイン, SDTMのマッピング方針を考慮しながら応 用していく必要がある。 実際の業務で使用した経験を元に, OS( O v e r a l lS u r v i v a l )の解析の打ち切りデータの格納方法や, OSや PFS( P r o g r e s s i o nF r e eS u r v i v a l )とT i m e ‑ t o ‑ e v e n tを算出するための起点目が異なる, DOR( D u r a t i o n や ADTTE への応用について解説し,こうし、ったチャレンジが議論を呼び, ofR e s p o n s e )のADEVENT 更なる標準化の発展につながることを期待している。 5
日米同時申請する際の電子データ提出に関連する問題点と解決方法の検討 0鈴木正人 l C'MSD 株式会社) FDAから発出されている ConformanceGuide 等の規制要件と PMDAから発出されている各種通知と 技術的ガイドの間に違いがあることから、国際共同試験であっても、 FDA申請とは別にPMDA申請用 にデータガイドや定義ファイルを追加・修正する必要があり、いわゆる Doubles t a n d a r dが発生して いる。また、 l e g a c y 試験のデータを提出する場合、例えばSDTM1 0 3 . 1 . 1であっても、米国において は、猶予期間中はFDAと事前合意することで、U p ‑ v e r s i o n i n gをすることなく電子データ提出をするこ ができる。一方、日本においてはSDTM1 0 3 .1 .2以上にU p ‑ v e r s i o n i n g することが実務者通知で求めら れており、その際にPMDAに提出する U p ‑ v e r s i o n i n gした SDTM及 びADaMから作成した解析結果と SDTM 1 G 3 .1.1から米国本社が作成した CTDに お け る 解 析 結 果 が 一 貫 し た も の に な る よ う に T r a c e a b i l i t yを担保する必要がある。特に Oncology領域においては、 SDTM 1 G 3 . 1.3から Oncology domainが追加されたことから、生存時間解析用のADaMデータセット、例えばADTTEの作成に際し、 米国本社が準備した SASプログラムを複製して再生することが簡単にできなくなった。また、中間 解析で有効中止になった場合、データカットオフに関連する諸問題が発生する。 1 0月 l日以降の電 子データ提出の準備に際し、国際共同試験を使って日米同時申請する場合の規制要件や承認申請プ ロセスの違いによる悩ましい問題点を紹介する。 6
医薬品承認申請時の電子データ提出開始に向けて 0安藤友紀 (医薬品医療機器総合機構) 医薬品医療機器総合機構 (PMDA) では、承認申請データを一層活用した承認審査や相談の質の 向上を図るため、次世代審査・相談体制の構築として、医薬品承認申請時に添付される臨床試験デ ータ利用のための具体的検討を行ってきている。実際に、本年 1 0月 1日以降の承認申請品目より、 医薬品承認申請時の臨床試験の電子データ提出が開始される。申請時電子データ提出に関しては、 これまで、 「承認申請時の電子データ提出に関する基本的考え方について J (平成26年 6月20日薬 食審査発 0620第6号)、 「承認申請時の電子データ提出に関する実務的事項について J (平成27年4 月27日薬食審査発 0427第 l 号)、技術的詳細に関する「承認申請時の電子データ提出に関する技術 的ガイドについて J (平成27年4月27日薬機次発第 0427001号)が発出され、その方針が示されてき ている。さらに、電子データ提出において用いるべき各種標準とそのパージョンを示した「申請電 子データ提出に際して利用可能な規格一覧 J (平成 27年 7月30日)、 CDISC標準に準拠した電子デ 1月 1 8日)、 PMDAにおける経験や業界か ータに関する「バリデーションルール一覧 J (平成27年 1 らの問い合わせ等に基づきまとめられた「申請電子データに関する FAQJ が公表され、提出すべき データの詳細が明らかにされてきている。 PMDAにおける提出された電子データの利用に関しては、平成25年よりパイロットとして 4回に わたり、試行的に提供された CDISC標準に準拠した臨床試験デー夕、及び臨床薬理試験データを用 いた検討が行われてきた。また、平成27年5月からは、治験相談の新たな相談枠として、電子デー タの提出内容(仕様等、定義ファイルやデータセット作成用プログラムを含む)等に関して助言を 行う申請電子データ提出確認相談が設置され、具体的な提出内容に関する相談に応じている。これ らパイロット及び治験相談において経験した内容の一部は、これまで発出された通知、ガイド及び FAQに反映されていてきており、さらに、本年 1 0月 l日のデータ提出開始に向けて、技術的ガイド の更新やFAQの追加等により、今後も情報が提供されていく予定である。 本発表では、 PMDAにおける次世代審査・相談体制の構築状況、及びこれまでに実施されてきた パイロットや申請電子データ提出確認相談の経験を踏まえた、電子データ提出に際して留意すべき 事項等の最新の状況について紹介する。 7
家計調査に基づく収入・支出の統計解析 0武田凌波,寒水孝司,浜田知久馬 (東京理科大学大学院工学研究科経営工学専攻) 総務省統計局は,国民生活における家計収支の実態を把握し,国の経済対策・社会政策の立案の ための基礎資料を提供することを目的として、家計調査を行っている [2]. 家計調査は毎年行われ, 世帯や世帯主の年齢、職業などを調査し,経常収入や消費支出などと言った、収入・支出の詳細ま で調査する.本研究では,経常収入と消費支出についての解析を行う.経常収入とは,家計の消費 行動に大きな影響を与える定期性あるいは再現性のある収入のことを表し,消費支出とは,日常の 生活を過ごすのに必要な商品やサービスを購入して実際に支払った金額のことを表す. 現在,総務省統計局での発表では,平成2年から平成27年までの年齢階級や世帯人員数などと言 った条件での収入・支出の結果が掲載されている.先行研究 [3]では,経常収入・消費支出は年齢に 依存すること,世帯人員が多いほど消費支出が高くなることが発表された.しかし,多変量解析の モデルは発表されていない.例えば,年齢が 30代で世帯人員が4人のときの収入・支出の結果は不 明である.また,世帯主の職業によって収入が異なるため,総務省統計局が発表されたものが,各 家庭においての基準になることは難しいと考えられる. そこで,年齢や世帯人員を含む 1 3項目を利用して,経常収入・消費支出についての統計モデ ルを 検討する.交絡の影響もあるため,複数の項目における収入・支出についての多変量解析を行う. 外れ値が存在し,等分散性が成り立たないため,分位点回帰 [4]を用いて統計モデルを作成すること を目的とする. 本研究では,収入・支出の関係がどのようになっているかをそれぞれの分位点ごとに傾向を表し, 格差がどれだけ広がるかどうか,ということを明らかにする.それに基づき,現在の総務省統計局 での発表方法は適しているかどうかを述べる. 参考文献 [ 1 ] 大橋靖雄,浜田知久馬.生存時間解析‑ S A Sによる生物統計東京大学出版会. 1995. [ 2 ]総務省統計局. 日本の統計2 0 1 6 . 総務省. 2 0 1 6 . [ 3 ] 阿部修人.近年の日本家計消費の動向一一家計調査の結果を中心として一一.一橋大学機関リ ポジトリ. 2 0 1 0 . [ 4 ]RogerKoenker, KevinF .H a l l o c k ." Q u a n t i l eR e g r e s s i o n ", J o u r n a lofEconomicP e r s p e c t i v e s, Volume1 5 Number4, F a l l2 0 0 1 .1 4 3・ 1 5 6, 2001 . 1 1
国勢調査ミクロデータから全自動で構築した SASデータベースに基づく新世帯類型の設計と開発 安井浩子(公財)統計情報研究開発センター研究開発部 中川雅義(公財)統計情報研究開発センター研究開発部 周防節雄兵庫県立大学・名誉教授 DevelopmentandD e s i g no ft h eNewH o u s e h o l dC a t e g o r γ I n v e n t e d仕omt h e h eM i c r o d a t ao ft h eR e c e n tj a p a n SASDatabaseF u l l ‑ a u t o m a t i c a l l yC o n s t r u c t e d仕omt P o p u l a t i o nC e n s u s . M a s a y o s h iNakagawa H i r o k oY a s u i, S t a t i s t i c a lI n f o r m a t i o nI n s t i t u t ef o rC o n s u l t i n ga n dA n a l y s i sR&DD i v i s i o n S e t s u oSuoh TheU n i v e r s i t yo fHyogo P r o f e s s o rE m e r i t u s 要旨 国勢調査ミクロデータから SASデータベース構築後、世帯主と直系親族世帯員との続柄の構成 で世帯を分類する「新世帯類型分類jを開発、実装した。本報告では、提供された国勢調査のミクロ データ (CSVファイル)から全自動で SASデータベースを構築する SASプログラム、および、新世帯 類型分類の開発プロセスとそれを国勢調査の SASデータベースに実装する SASシステムの概略を 報告する。 キーワード:国勢調査、世帯、続柄、新世帯類型分類、公的統計、ミクロデー夕、 SASデータベース 1 . はじめに 国勢調査の結果として集計・公表される様々な統計は、国や地方公共団体の各種行政施策の 基礎資料として用いられている。民間部門においても、「男女、年齢別人口」など個人属性に関す る統計は、消費動機を分析し、製造・販売などの企業活動に広く活用されてし、る極めて重要な情 報である一方、個人レベルでも、消費には自分のためだけの消費の他に、家族のため、あるいは 家族と一緒に行うための消費もあり、個人が属する世帯の構造も消費動機に少なからず影響を及 l ましてし、る。 5年国勢調査から「家族類型別世帯数」を公表してい 国は、世帯の構造別世帯数として、昭和 4 る。我々は、この従来の家族類型が個人の消費に影響を及ぼす世帯の構造を知る分類として適し ているのかをつぶさに検討した。その結果、現行の家族類型では、核家族世帯など世帯の構造別 分布を大局的に把握するのには適しているが、世帯内の最も若い夫婦と他の世帯員との関係によ 1 5
って世帯を分類しているので、社会通念上異なる世帯が閉じ世帯区分に分類されていることになり、 個人の消費に影響を及ぼす世帯の構造を知る分類としては必ずしも最適ではなし、かもしれないと 考えた。 我々は、この点についていろいろ試行錯誤した結果、世帯主と直系親族世帯員との関係から世 帯を分類するシステムを開発し、「新世帯類型分類」と名付けた。この新世帯類型分類は、世帯主 (または世帯主夫婦)と他の世帯員との続柄に基づいて世帯を分類している 1。 本報告では、新世帯類型分類に基づく分析結果を開示するのではなく、その新分類体系につい て、その設計過程、及び実際の国勢調査の調査票情報(ミクロデータ)から構築された SASデータ ベースへの実装作業の概要を報告するに留める。 2 . 国勢調査の続柄 本プロジェクトで使用許可を得た国勢調査の調査票情報(ミクロデータ)は大規模調査の 1980 年 、 1990年 、 2000年 、 2010年調査の 4 回分である。 1995年の簡易調査から「父母」が「世帯主 の父母」と「世帯主の配偶者の父母jに分割されたので、表 1上側に示すように 1990年以前と 2000 年以降の調査では続柄のコード値が異なっている。従って、この 4 回次分の調査データを分析 する際には、表 1下側に示すように 2000 年と 2010年の「父母」の続柄を分割前の値に変換する と同時に、他の続柄のコードの再編成も行った。 表 1 国勢調査の続柄一覧 符号 4 変 9 E 相 E 唱 主E 主 。t 。2 03 04 05 06 0 07 07 06 08 見諭・崎鎌 09 09 他由観篇 1 0 住み込みの居人【京事} 叩 1 1 住み込み骨組人【営泉) 1 1 0 。 , 世帯主主 l 孟代患者 。2 世帯主由包鋼者 03 予 04 子四E偶者 05 撮 ・ " 12 │ │ そ 調 由 車 値 件 肺 .~. 品目 1 2 L' 2 冊。年【平成日年} 時田容【平成2 年} 柑同年【唖相田年} 曲箆璽揖 畠 換 符号 , 。 世帯主主は代表者 02 世帯主のE偶者 03 干 。4 子の也偶者 05 孫 06 父掴母 金量 07 見動締掠 0 09 他骨観旗 1 0 家事使用人 1 1 営察使用人 1 2 ・ w 0 1 02 03 04 05 06 07 符号 ・ 0 。 , 1 0 , 。 1 1 1 2 , 。 世帯主または代謀者 02 世帯主由E偶者 回 二F 04 干叩毘偶者 05 世帯主由父母 06 世帯主由毘偶者由記母 07 08 。 , 他 見 由 f l 節観 隼 操 , 。 1 1 住み込み由恩人 1 2 J 図膏世帯】 w │そ軍由陣他(l1li脅IIlI' ・川市明白~ 変 田 豆 島 畿 畠 0 1 02 03 04 06 0 05 07 。g 09 1 0 ・ H 1 2 却,.年【平成田年} I 0 1 02 03 04 05 06 07 08 09 1 0 1 1 1 2 w 符号 世帯主または代審者 世稽主由 E偶者 子 干の毘偶者 世帯主由父母 世帯主由也鋼者自父母 縞E 人 λ調 不 舗 査 世 区 智且} 新世帯分類に使用した続柄 0 1 世帯主又は代表者 02 世帯主の配偶者 03 子 04 子の配偶者 05 孫 06 父母 07 担2 主母 08 兄弟姉妹 09 他の親族 10 住み込みの雇人 1 1 そ 不 の 詳他 1 2 直 系 親 族 傍系 親族 3 ド 親 族 1 このアルゴリズムの手法を最初に適応したのは、インドネシアのミクロデータ S U S E N A S ( 2 0 0 0 ) である [ S u o h . S . ( 2 0 1 4 ) ] 。今回は、帰宅時両親不在世帯の特定や昼間独居老人世幣の特定などにも応用した。 16 国 05 07 見舗姉妹 他由観篠 住み込み由庖人 そ田他 本俸{世俗主以併の各寧項目 ! . o . . o . ~ 」 密 の 豊 裏 重 書 聖」 。 , 02 03 04 06 ・ 0 。 , 1 0 1 1 1 2
3 . 国勢調査の調査票情報の SASデータベース化 利用を許可された 4 回次分の国勢調査の調査票情報は全て SASデータベースに組み込ん だ 。 SASによるこの処理は、 1回次分の「ミクロデ、ータ本体と符号表(エクセルファイノレ)を自動的に読 み込み、 SASデータセットを作成する SASプログラム jを自動生成する SASマクロプログラムを書く ことによって、 4回次分が同じプログラムで自動処理されたので、極めて効率的に行うことができた。 さらに、第 4節で解説する作業によって作成されたエクセル表を SASプログラムで読み込んで、新 世帯類型コードを SASデータベースに組み込んだ後、種々の分析作業を行った。詳細な分析結 2 0 1 6 )に収録されている。 果2は伊藤( SASプログ ラムによるミクロデ、ータの全自動データベース化技法は、昨年の SASユーザー総会で P 行った報告(周防 2 0 1 5 )において、全国消費実態調査の匿名データで実用化済みであり、本シス テムでも同様の手法を採用した。その時は、全国消費実態調査の匿名データのレイアウトが複雑 で作業が難航したが、今回の国勢調査の匿名データのレイアウトは単純だ、ったので、あまり時間を 要せずに作業が完了した。 4 . 新世帯類型の作成プロセス 新世帯類型の設計には、エクセル表を活用した。この手法は極めて直感的に、かつ、正確に全 てのパターンを網羅できる利点がある。 4 . 1 プロセス 1:世帯主と直系親族の全てのパターンの析出 第 2節の表 1下の続柄を使って、直系親族 7種類の全ての組み合わせパターンを、表 2の左 側にある r O, 1 , 2 Jのパターンを作成・特定した。単に各続柄の有無だけであれば、 r O, l Jの組み合わ に区別もしたかったので、続柄「父母」だけは せで済むが、世帯主の親を、「両親」と「ひとり親 J r O, 1 , 2 Jとして、人数を区別できるようにした。その結果、 7つの続柄3の全ての組み合わせパターン = 3X25)になった。 は 、 96 通り ( 表 2の r O, 1 , 2 Jの組み合わせパターンを見ながら、「続柄の構成J 欄に日本語で各ノミターンの世 帯構造を表現していき、で、きあがった「続柄の構成 Jに基づいて、「同居世代の数」及び「世帯主の 世代」を格付けしていった。 4 . 2 プロセス 2 :続柄の構成の整理 表 2左側の「続き柄の構成」を、以下のルールで、表 2の右側に示す「新世帯類型用の区分の名 称、」に変換した。表 2右側にある黒色セルに白字の箇所がそれに該当する。 ①子供夫婦が成立しなかった「子供の配偶者 J は、「子供」とした40 ②「両親」または「ひとり親 J は 、 4世代以上の世帯については「親」に統一した九 2 分析結果の一部は新井他 ( 2 0 1 6 )にも掲載。 実際には、「世帯主」は必ずしもので、この続柄の有無は考慮しなくてよい。 国勢調査報告書で使用されてしも家族類型に於ける扱いに合わせた。 5 親を両親とひとり親に分ける必要性を検討した結果と、区分の数を抑制するために、このように処置した。 3 4 1 7
4 . 3 プロセス 3 :新世帯類型番号の付与 プロセス 2の処理の結果、当初 96 個あったパターンの中に、同じ「新世帯類型用の区分の名 称J が出現した。この点の整理を含め、かつ、世帯内の世代数の多い順番に並べ替えるために、 以下の①"'‑'@のソートキーをエクセル関数を用いて作成後、この順番に l回のソートでJ ! 国序を並 べ替えた結果、表3ができた。 ①「同居世代の数6 J欄を降順でソート。「同居世代の数」が多い世帯が上位に来るようにした。 ②「世帯主は何世代目 7J 欄を昇順でソート。世帯主の順位が高い方が上位に来るようにした。 ③世帯主夫婦のいる世帯を上位に配置するため、「世帯主夫婦の判定 jができるように、表 2の左 側の「世帯主」と「世帯主の配偶者」の値を加算して、新たな欄を作り、この欄を降順でソート。 ④「続柄の個数」をカウントする新たな欄を作り、この欄を降順でソート。続柄の数の多い方が上 位に来るようにした。 ⑤子供夫婦の有無については、子供夫婦のいる区分が上位に来るように、「子供夫婦の判定 J( = 「 子J と「子の配偶者」欄の合計)欄を作り、この欄を降順でソート。 ⑥子供の有無については、子供のし、る方が上位に来るように、降順でソート。 ⑦孫の有無については、孫のしも方が上位に来るように、降順でソート。 ⑧両親の有無については、両親のしも方が上位に来るように、降順でソート。 x c e l関数を使って閉 このようにできた表 3の「新世帯類型用の区分の名称」が同じ行に対して、 E じ連番号を l番から順番に振り、「小分類符号J を付与、親族世帯の新世帯類型を 56 区分に集 1区分)、非親族世帯 ( 1区分)、単独世帯 約することができたB。この他に、親族・非親族同居世帯 ( ( 2区分:世帯主男性、世帯主女性)、特掲(枝番号付与の世帯)した世帯として、核家族世帯 ( 4区 分)、兄弟姉妹から成る世帯 ( 1区分)があり、最終的に 65 区分9に分類した。 プログラムで処理ができる。 結果的には、エクセル上で、のこの一連の手作業は、全て SAS 5 . まとめ 今回は、世帯類型のパターンを特定するのにエクセル表を使って作業を行ったが、これは試行 錯誤をしながらパターンを作成するとし、う行程を経たからである。この方式で 8つのソートキーがエ クセル関数を使って自動作成できたとし、う確証を得たので、同様の処理を他のミクロデータに対し て行う際は、最初から SASで行うことができることが保証された。つまり、エクセルを使って実験を行 った結果、成功したので、次に同様の作業を行う際には、最初の段階から SASで、このアルゴ、リズム を参照しながら新世帯類型を S ASデータベースに組み込むことができる。 6 定義については付録参照。 7r 世帯主は何世代目」とは、年記の世代から数えて何番目の世代かとし、う意味である。例えば、「祖父母と世帯主J だけの世帯の場合、祖父母と世帯主の聞に「両親Jが抜けているが、世帯主は 3番目の世代とする。 8 この分類では核家族世帯の区分はないが、追加処理で、 5 6区分に枝番号付与した区分(傍系親族「兄弟姉妹、 )がしも世帯を除外した世帯)を特掲しており、核家族世帯の特定ができる仕組みになっている。 他の毅族 J 9こ の 65区分の一覧表は新井他 ( 2 0 1 6 )で表 2として掲載されている。 18
エクセル表で数の多いパターンを分類する手法は極めて合理的であり、どの分野のデータでも のi f. . . . . . . t h e n . . . . . . . e l s e文や、 s e l e c t ‑ w h e n文 有効で、かつ、正確性を保証している。仮に、これをSAS で記述した場合、それが正しく機能していることをベリファイすることはかなり厄介で、ある。また、フロ ーチャートを描けたとしても、手間ばかりかかって実用的でない。 参考文献 ①Suoh, S .( 2 0 1 4 )TheC o n s t r u c t i o no faD a t a b a s eS y s t e mf o rt h eM i c r oDataA n a l y s i so fA s i a n H o u s e h o l dS u r v e y s :ACaseS t u d yo fI n d o n e s i a ,IncomeD i s t r i b u t i o nI nA s i a nR e g i o n s : S o c i o e c o n o m i cA n a l y s e s8asedonM i c r oD a t aS i n c et h eS e c o n dH a l fo ft h e2 0 t h C e n t u r y( e d i t e dbyKamiya, D .e ta l よJapanS t a t i s t i c a lA s s o c i a t i o n, I n c ., p p 6 5 ‑ 1 1 7 . ②周防節雄( 2 0 1 5 ) r 全国消費実態調査の匿名データから SASのリレーショナルデータベースを 完全自動構築するシステムの開発」、統計数理研究所 ( h t t p : / / w w w . n s t a c . g o . j p / s e r v i c e s / p d f / 1 5 1 1 2 7 ̲ 3 ‑ 2 . p d f ) ③伊藤彰彦( 2 0 1 6 ) W 新たな個人消費を創造する新世帯類型別世帯数・世帯人員』、 S i n f o n i c a研 o.25、(公財) 統計情報研究開発センター 究叢書 N 2 0 1 6 )r 新世帯類型による国勢調査ミクロデータの分析結果の概 ④新井郁子、米津香、中川雅義( 要J、WSASユーザー総会 2016論文集』 謝辞 本研究は、独立行政法人日本学術振興会の科学研究費(課題番号 2 6 3 8 0 2 8 0 :研究代表:伊藤 彰彦、「新世帯類型の構築と世帯構造の変動に係る長期時系列分析J Jの助成金で行われた。記 して謝意に替えたい。 19
表2 新世帯類型の初期段階の設計 斬世帯媛型周の区分の名称 20
表 3 8つのキーでソート後 新世帯類型番号付与済 新世帯類型用の区分の名称 21
付録ソートキーの計算方法 ソートキーの作成には、エクセル関数とエクセルの種々の操作を組み合わせた。これら 8 個のキーの作成の詳細な解説は、本稿の目的ではないので、二つのキーを取り上げるに留 める。下に示したエクセル表は表 3の一部を抜粋したものである。 ( 1 ) r 同居世代の数J とは、祖父母(第 l世代)、父母(第 2世代)、世帯主・世帯主の配偶者(第 3世代)、子・子の配偶者(第 4世代)、孫(第 5世代)のうち、異なる世代の数であるが、単なる数 ではない。例えば「世帯主と孫がしも世帯Jは、第 3世代と第 5世代から成り、第 4世代がいないが、 同居世代の数は2ではなくて、 3とする。 2 Jに「世帯主と孫がいる世帯J があるが、列 B~H に rO , 1 , 2J で有無を表現 ① 下 図 の A列の種類 r している。この情報から、「世帯主・世帯主の配偶者 J (第 3世代)と「子・子の配偶者 J (第 4世 l, O Jで表現した後、第 l世代 第 5世代をひとまとめ 代)の有無をそれぞれひとまとめにして r にしたパターン (N列にある黒いセルに白字)を、エクセルの数式で作る。 r = B 7 * 1 0 0 0 0 + R O U N D ( C 7/ 2, 0 ) * 1 0 0 0 + D 7 * 1 0 0 + R O U N D ( S U M ( F 7 : G 7 ) / 2, 0 ) *1 O + H 7J ②計算式で計算した M7列の ( 0, 1 ) から成る値を左の L列のセルに「値J で貼り付ける。 ③その貼り付けたパターンに対して 0を半角ブランクに一括変換して K列に保存。その結果、末 尾に Oがあった場合は、サプレスされ、桁数が減る。 EN関数を使えば、同居世代の数が ④そのサプレスされたパターンの桁数を J列でエクセルの L 判る。こうすれば含まれていない世代も半角ブランクで表現されているので、その世代も「同居 世代の数」に含まれることになる。 ( 2 )r 世帯主は何世代目」とは、「世帯内で年配の世代から数えて世帯主は何番目」品、う意味で M列にある黒いセルに白字」に対して r = L E N ( M 7 )一2 Jを計算すれば求まる。 ある。これも同じく、 r 22
新世帯類型による国勢調査ミクロデータの分析結果の概要 新井郁子・米海香・中川雅義 (公財)統計情報研究開発センター B r i e fSummarγofS t a t i s t i c a lA n a l y s e so nt h eM i c r o d a t ao fj a p a n 'sP o p u l a t i o nCensusesBased ont h eNewHouseholdC a t e g O J γ . YukoAr a i,K a o r iYonezawa,M a s a y o s h iNakagawa S t a t i s t i c a lI n f o r m a t i o nI n s t i t u t ef o rC o n s u l t i n ga n dA n a l y s i s 要旨 国勢調査のミクロデータを使って新しし、世帯分類「新世帯類型分類」を開発し、 SASデータベー スに組み込んだ。その新世帯類型分類を用いて種々の分析を行い、研究叢書として出版したので、 その一部を紹介する。 キーワード:国勢調査、新世帯類型、高齢化、少子化、単身世帯、核家族世帯、非親族世帯、 r o ct a b u l a t e、p r o c仕巴q ミクロデー夕、 p 1 . はじめに 国勢調査の大規模調査年 1 9 8 0年 、1 9 9 0年 、2 0 0 0年 、2 0 1 0年の調査票情報(ミクロデータ)を使 って、世帯を分類する新しいシステムを開発した。この新世帯類型分類 lは、「個人が属する世帯の 構造」も個人の消費に少なからず影響を及ぼしていることから、「個人の消費に影響を及ぼす世帯 を把握するために開発した世帯分類である。この分類を用いて国勢調査の 1 9 8 0年(昭和 の構造J 5 5年)と 2 0 1 0年(平成 2 2年)の世帯数を比べてみると、この 3 0年間に、世帯構造の分布に大きな 変化が起こっていたことが判明した。その概要について解説する。なお、集計・分析には SASを使 用した。 2 . 新世帯類型の分類区分 国勢調査で、は世帯員全員について「続柄」を調査し ているが、調査年次によって定義が異なるので、新世帯 (表 1 ) 。 類型の開発用に「続柄Jを統一した2 ① ⑨までを親族品、い、⑩と⑪を非親族とし、う。ま た、親族のうち① ⑦を直系親族といい、⑧と⑨を傍 l 詳細については安井他 j 表 l 新世帯類型作成用の世帯員の属性 ( 2 0 1 6 )を参照。 2 続柄の統一作業の詳細についても安井他 ( 2 0 1 6 )を参照。 23 閥族の種類 醐 撫 世 子 帯干主の配偶者 子の配偶主主 孫 父母 祖父母 I D 兄弟姉妹 9 他の親族 住み込みの雇人 ⑪ その他 ⑫ 不詳 。 直 系 親 族 傍系 非親族
系親族とし、う。 新世帯類型は国勢調査の一般世帯3を対象にしており、 2人以上の世帯員から成る世帯のうち、 ①と② ⑨の続柄から成る世帯を「親族世帯J 、2人以上の世帯員から成る親族世帯に⑩または⑪ の世帯員が含まれる世帯を「親族・非親族同居世帯」、 2人以上の世帯員から成る世帯のうち、①と ⑩または⑪の続柄から成る世帯を「非親族世帯」、世帯員が①の世帯主のみの 1人世帯を「単独世 とした(表 2の A ' " " ‑ ' D )。 帯J 親族世帯については、直系親族の①と② ⑦の組み合わせにより 5 6区分に分類し、さらに表 2 に示すとおり、 1' " " ‑ ' 5世代世帯に区分される。親族世帯(1) ' " " ‑ ' ( 5 5 )の世帯区分には、傍系親族が同居 表 2 新世帯類型区分 新世帯類型 A 規族世帯 (5世代世帯) ( 1 ) 世帯主夫婦と子供夫婦と孫と親と祖父母がし、る世帯 ( 2 ) 世帯主夫婦と子供と孫と親と祖父母方丸、る世帯 ( 3 ) 世帯主夫婦と子供夫婦と孫と祖父母がいる世帯 ( 4 ) 世帯主夫婦と子供と孫と祖父母がし、る世帯 ( 5 ) 世帯主夫婦と孫と親と祖父母がし、る世帯 ( ω 世帯主夫婦と孫と祖父母がし、る世帯 ( 7 ) 世帯主と子供夫婦と孫と親と祖父母がいる世帯 ( 8 ) 世帯主と子供と孫と親と祖父母がL、る世帯 ( ω 世帯主と子供夫婦と孫と祖父母がし、る世帯 ( 1 ω 世帯主と子供と孫と祖父母がいる世帯 ( 1 1 ) 世帯主と孫と親と祖父母がし、る世帯 ( 1 2 ) 世帯主と孫と祖父母がしも世帯 (4 世代世帯) (4 世代世帯・世帯主 2世代目) ( 13 ) 世帯主夫婦と子供夫婦と孫と親がいる世帯 ( 1 4 ) 世帯主夫婦と子供と孫と親がいる世帯 ( 1 5 ) 世帯主夫婦と孫と親がL、る世帯 ( 1 6 ) 世帯主と子供夫婦と孫と線がし、る世帯 ( 17 ) 世帯主と子供と孫と親がいる世帯 ( 18 ) 世帯主と孫と親方丸、る世帯 (4世代世帯・世帯主 3世代田) ( 19 ) 世帯主夫婦と子供夫婦と親と祖父母方弘、る世帯 ( 2 ω 世帯主夫婦と子供夫婦と祖父母がいる世帯 ( 2 1 ) 世帯主夫婦と子供と親と徳父母がしも世帯 ( 2 2 ) 世帯主夫婦と子供と祖父母がし、る世帯 ( 2 3 ) 世帯主と子供夫婦と観と祖父母がし、る世帯 ( 2 4 ) 世帯主と子供夫婦と祖父母がいる世帯 ( 2 5 ) 世帯主と子供と親と祖父母がいる世帯 ( 2 6 ) 世帯主と子供と祖父母がし、る世帯F (3世代世帯) (3世代世帯・世帯主 1世代目} ( 2 7 ) 世情主夫婦と子供夫婦と孫がいる世帯 ( 2 8 ) 世帯主夫婦と子供と孫がいる世帯 川~日3q9立2)L)政J世盟 帯 主 主 主 夫と主珪孫婦世がと君主雄し孫、主るが主b主世i油、陛 t帯 it (3世代世帯・世帯主 2世代目) ( 3 3 ) 世帯主夫婦と子供夫婦と両親が L、る世帯 ( 3 4 ) 世帯主夫婦と子供夫婦とひとり親がいる世帯 ( 3 5 ) 世帯主夫婦と子供と両親がしも世帯 ( 3 6 ) 世帯主夫婦と子供とひとり親方丸、る世帯 ( 3 7 ) 世帯主と子供夫婦と両親方丸、る世帯 ( 3 8 ) 世帯主と子供夫婦とひとり親がいる世帯 ( 3 9 ) 世帯主と子供と両親がいる世帯 ( 4 ω 世帯主と子供とひとり親がいる世帯 (3世代世帯・世帯主 3世代目} ( 4 1 ) 世帯主夫婦と両親と祖父母が b、る世帯 ( 4 2 ) 世帯主夫婦とひとり親と祖父母がし、る世帯 ( 4 3 ) 世帯主夫婦と祖父母がいる世帯 ( 4 4 ) 世帯主と両親と祖父母がしも世帯 ( 4 5 ) 世帯主とひとり親と祖父母がし、る世帯 ( 4 6 ) 世帯主と祖父母がいる世待 (2 世代世帯) (2 世代世帯・世帯主 1世代目) ( 4 7 ) 世帯主夫婦と子供夫婦がし、る世帯 ( 4 8 ) 世帯主夫婦と子供がいる世帯 ( 4 9 ) 世帯主と子供夫婦がし、る世帯 ( 5 0 ) 世帯主と子供がいる世帯 (2 世代世帯・世帯主 2世代目) ( 5 1 ) 世帯主夫婦と両親がいる世帯 ( 5 2 ) 世帯主夫婦とひとり親がいる世帯 ( 5 3 ) 世帯主と両親がいる世帯 ( 5 4 ) 世帯主とひとり親がいる世帯 (1世代世帯) ( 5 5 ) 世帯主夫婦がいる世帯 ( 5 6 ) 世帯主と傍系親族から成る世帯 ( 5 6 )・ 2 うち、兄弟姉妹から成る世帯 B 親族・非親族同居世帯 C 非親族世帯 D 単独世帯 ( 5 7 ) 世帯主(男性) ( 5 8 ) 世幣主(女性) ぱは E同五EE百必U&l)U:- E盤252-号う主塞ちJ主、盤投世盤J資坊帯艶主 主去( 一男女盟一性 主圭) 一と 飽一子 供 一~ か 議一 る没世虫 帯汲.1¥堂‑笠‑一一一一一一一一…一…一一一一一一 ‑ ら ら 室 感 成 盤 宣 る 笠 投 世 箆 帯 …一…一一一一一一一一ー 一 ( 5 5 )ー2 うち、世帯主夫婦のみの世帯 J 3 国 勢 調 査 で は 全 世 帯 を 「 一 般 世 帯 」 と 「 施 設 等 の 世 帯 」 に 分 類 し て い る 。 「 一 般 世 帯 とは以下の世帯を言う。1)住 居と生計を共にしている人の集まり、又は一戸を構えて住んでいる単身者。ただし、これらの世帯と住居を共にする 単身の住み込みの雇人については、人数に関係なく雇主の世帯に含む。 2 )前記 1 )の 世 帯 と 住 居 を 共 に し 、 別 に 世 帯を維持してしも間借りの単身者又は下宿屋などに下宿している単身者。 3 )会 社 ・ 団 体 ・ 商 庖 ・ 官 公 庁 な ど の 寄 宿 舎 、 独身寮などに居住している単身者。 ちなみに「施設等の世帯」とは、寮・寄宿舎の学生・生徒、病院・療養所の入院者、社会施設の入所者、自衛隊営 舎内居住者、矯正施設の入所者、その他定まった住居を持たない者の世帯を言う。(総務省統計局ホームページ 「平成 2 2年 国 勢 調 査 ユ ー ザ ー ズ ガ イ ド 」 参 照 ) 24
してしも世帯も含まれているため、これらの区分の名称の末尾を「がしも世帯」とした。 一方、親族世帯のうち傍系親族が同居していない世帯は、区分名に明示された続柄の世帯員し かいない世帯となるので、これらの世帯区分の名称の末尾は「から成る世帯 J とした。表 2の末尾の 別掲で示した「核家族世帯 J は、「から成る世帯 jの典型的な例である。 3 . 新世帯類型別の時系列分析の結果 本節に示す結果の概要は、前節で解説した新世帯類型分類に基づいている。 3 . 1 新世帯類型(中分類)別世帯数 1 9 8 0年から 2 0 1 0年の聞に世帯数は1.4 5倍増加している。しかし、 3世代以上の世代が同居して いる世帯は減少し、親子から成る 2世代世帯は、1.12倍に留まってしも。これに対し、世帯主夫婦の 世代世帯 ( 2 . 2 4倍)や単独世帯 ( 2 . 3 6倍)は大幅に増加してしも(表 3 )。 みの世帯が大半を占める 1 表 3 新世帯類型(中分類)別一般世術数ー全国(1980年、 1990年、 2000年、 2010年 ) 世帯数 新世帯類型 (中分類) 倍率 構成比(%) 昭和田年 5年 昭和5 ( 1 9 8 0年) 平成 2年 ( 1990年) 2年 平成 1 ( 2 0 0 0年) 平成 22年 ( 2 0 1 0 年) 総数 35, 8 2 1, 270 40, 670, 250 46, 7 7 , 11 4 0 5 1 自 ,43, 690 , 145 1 0 0 . 0 0 泊 1 0 0 . 0 0 % A 親族世帯 28, 493, 320 3 , 11 0 8, 050 3 3, 655, 510 3 4, 526, 310 1 .2 1 6 6 . 6 0鳴 5世代世帯 740 570 760 570 。 79.54% 7 7 0 . 0 0 % 0 . 0 0 % 4世代世帯 340, 430 3 3 1, 370 250, 540 1 9 3, 500 0 . 5 7 0.95% 0 . 3 7 % 世帯主2世代目 253, 680 200 250, 1 9 4, 750 1 6 3, 260 0 . 6 4 0.71% 0 . 3 1 % 世帯主3世代目 86, 750 8 , 11 8 0 5 5, 800 30, 230 0 . 3 5 0.24% 0 . 0 6 % 5, 439, 040 5, 302, 390 4, 555, 430 3, 56 , 1990 0 . 6 5 1 5 . 1 8 % 6 . 8 7 % 3世代世帯 平成 2 2年 昭和 55年 ( 1980年) 平 成 22年 ( 2 0 1 0年) 世帯主 1世代目 2, 1 1 0, 850 2, 1 3 7, 020 , 1940, 390 1 , 639, 620 0 . 7 8 5 . 8 9 % 3 . 1 6 % 世帯主 2世代目 3, 302, 020 3, 1 3 8, 390 2, 587, 880 1 , 898, 260 0 . 5 7 9 . 2 2 % 3 . 6 6 % 世帯主 3世代田 2 6, 1 8 0 990 26, 2 7, 1 6 0 24, 1 1 0 0 . 9 2 0 . 0 7 % 0 . 0 5 % 1 7, 954, 460 1 8, 842, 300 1 9, 605, 440 20, 092, 890 1 . 12 50.12% 38.76~‘ 世帯主 1世代目 1 7, 096, 480 1 7, 7 0 3, 1 8 0 1 8, 1 4 9, 370 1 8, 489, 200 1 .08 47.73% 3 5 . 6 6 % 世帯主 2世代目 日5 7, 980 1 , 1 3 9, 1 2 0 1, 456, 070 1, 603, 700 1 .87 2 . 4 0 % 3 . 0 9 % l世代世帯 4, 758, 650 6, 63 , 14 20 9, 243, 340 1 0, 677, 370 2 . 2 4 1 3 . 2 8 % 2 0 . 6 0気 2世代世帯 日親族・非親族同居世帯 1 6 9, 750 9 1, 980 84, 830 1 0 6, 980 0 . 6 3 0. 47% 0 . 2 1 % C 非親族世帯 6 , 14 80 7 7, 440 1 8 9, 250 345, 730 5 . 6 2 0.17% 0 . 6 7 % D 単独世帯 7, 096, 720 9, 392, 780 1 2, 84 , 1550 1 6, 778, 530 2 . 3 6 1 9 . 8 1 % 3 2 . 3 6 % 世帯主(男性) 3, 950, 970 5, 25 , 1050 6, 920, 600 8, 807, 710 2 . 2 3 11 .03% 1 6 . 9 9 % 世帯主(女性) 3, 1 4 5, 750 4, 1 4 , 17 30 5, 920, 950 7, 970, 820 2 . 5 3 8 . 7 8 % 1 5 . 3 7 % 注)総数には、新世帯類型不詳を含む。 3 . 2 世帯の高齢化 世帯主の平均年齢をみると、非親族世帯以外の世帯区分で、世帯主の平均年齢が上がっており 9 8 0年から 2 0 1 0年にかけての年齢差は9歳とな 世帯の高齢化が進んで、いる。全国全世帯平均は、 1 っており、中でも、単独世帯の年齢差が 1 2,9歳と大きし、(表 4 )。 25
表 4 新世帯類型(大分類)別世帯主の平均年齢ー全国 ( 1 9 8 0年 、 1 9 9 0年 、2 0 0 0年 、2 0 1 0年) 世帯主の平均年齢 新世帯類型 平成2年 ( 1 9 9 0 年) 5年 昭和 5 ( 1 9 8 0年) 総数 4 5 . 1 7 A 親族世帯 4 7 . 0 6 51 .4 1 4 4 . 0 7 3 7. 47 B 親族・非親族同居世帯 C 非親族世帯 D 単独世帯 世帯主の年齢階級別世帯数をみ ると 2人以上世帯と単独世帯ともに 高齢世帯の増加がみられる一方で、 平成 1 2 年 ( 2 0 0 0 年) 平成 2 2 年 ( 2 0 1 0 年) 平成2 2年 4 8 . 3 2 5 0. 42 51 .1 1 5 3 . 2 2 5 4 . 1 9 5 6 . 0 8 9 . 0 2 9 . 0 2 5 2 . 8 8 41 .0 8 41 .3 6 5 3 . 9 2 3 9 . 9 9 4 5 . 7 2 5 4. 42 .5 6 41 3 . 0 1 ‑ 25 1 5 0 . 3 8 1 2 . 9 1 目 表 5 世帯主の配偶関係 ( 2区分)、世帯主の年齢 ( 5歳階級 ( 4 5歳以上 1 0歳 階 級))別、二人以上の一般世帯数一全国 ( 1 9 8 0年 、2 0 1 0年) 2人以上の世帯主の年齢階級 1 4 5 世帯主の配偶関係、 世帯主の年齢 ~54 歳 J 以下の各階級の世帯数は 総数 減少し、特に 130~34 歳J 以下の各 年齢差 5 年 昭和 5 既婚 5年 昭和 5 ( 1 9 8 0年) 平成2 2年 ( 2 0 1 0 年) 倍率 2 8, 7 2 4, 5 5 0 3 5, 0 6 5, 1 6 0 1 .2 2 2 8, 1 6 1, 1 2 0 3 3, 3 5 1, 5 2 0 1 . 18 階級の減少が大きし、ことが特徴的 である。これは 130~34 歳」以下の 1 9歳以下 , 自0 5 0 2, 9 8 0 0 . 3 7 20~24歳 2 7 0 2 4 5, 1 4 4, 7 1 0 0 . 5 9 各階級において既婚者の世帯数が 25~29歳 1 , 5 7 1, 3 3 0 2 9 0 8 8 3, 0 . 5 6 大きく減少したためである(表 5 )。 30~34歳 3, 4 6 5, 9 8 0 1 , 9 7 7, 2 3 0 0 . 5 7 35~39歳 3, 7 8 4, 0 0 0 2, 9 2 4, 8 4 0 0 . 7 7 40~44歳 7 6 9, 4 8 0 3, 9 3 5, 3 1 0 2, 0 . 7 8 45~54歳 7, 3 7 9, 4 4 0 5, 8 2 7, 3 9 0 0 . 7 9 55~64歳 4, 5 0 1, 6 5 0 7, 6 5 0, 430 1 .7 0 65~74歳 2, 6 4 1, 4 3 0 6, 48 3, 5 6 0 2. 45 7 5歳以上 7 9 4, 4 9 0 4, 5 2 1, 7 8 0 5 . 6 9 5 6 3, 2 7 0 , 13 1 8, 4 0 0 2 . 3 4 3.3 核家族世帯の構造別分布 親族世帯に占める核家族世帯の 割合は、 1980年 (74.1%)から 2010 年 (82.2%)にかけて増加しており、 核家族化が進行している。 未婚 内訳をみると、核家族世帯におけ 1 9 歳以下 1 1, 9 2 0 8, 1 8 0 0 . 6 9 20~24歳 9 9, 2 4 0 84, 3 3 0 0 . 8 5 子供から成る世帯 J は 1980年当時 25~29歳 0 4 0 1 2 7, 5 4 0 1 4 1, 1 .1 1 より僅かながらも減少 ( 0 . 9 6倍)し、 30~34歳 1 1 4, 4 1 0 1 2 9, 3 1 0 1 . 13 代わって「世帯主夫婦のみの世帯J 35~39歳 6 6, 2 6 0 1 4 8, 5 0 0 2 . 2 4 (2.31倍)、「世帯主(女性)と子供か 40~44歳 7 1 0 4 1, 1 5 1, 3 5 0 3 . 6 3 ら成る世帯 J(2.23倍)が、それぞれ 45~54歳 6 6, 2 0 0 2 8 0 3 0 0, 4 . 5 4 55~64歳 8 7 0 2 6, 5 8 0 2 4 9, 9 . 2 9 65~74歳 7, 5 7 0 7 1, 9 0 0 9. 49 7 5歳以上 0 4 0 2, 3 3, 4 4 0 1 6 . 3 9 る主要な世帯である「世帯主夫婦と 大幅に増加しており 4、この 30年の 聞に、核家族世帯の構造が大きく変 化したことが分かる(表 6 )。 注)総数には、世帯主の配偶関係不詳及び世帯主の年齢不詳を含む。 4 規模としては少ないが、「世帯主(男性)と子供から成る世帯 J( 2 . 2 9倍)も大幅に増加している。 2 6
表 6 新世帯類型(核家族世帯 H J I J ‑般世帯数 全 国 (1980年 、 1990年 、 2000年 、 2010年) 世帯数(実数) 新世帯類型 (核家族世帯) 総 数 世帯主夫婦と子供から成る世帯 世帯主(男性)と子供から成る世帯 世帯主(女性)と子供から成る世帯 世帯主夫婦のみの世帯 昭和5 5年 ( 1 9 8 0年 ) 平 成 2年 ( 19 9 0年 ) 平 成1 2年 ( 2 0 0 0年 ) 親族世帯に対する割合(%) 倍率 昭和 5 5年 平 成22年 ( 2 0 1 0年 ) 昭和 5 5年 ( 1 9 8 0年 ) 平 成22年 平 成22年 ( 2 0 1 0年 ) 8, 3 7 2, 7 3 0 6 1 2. 41 0 2 6, 6 0 6, 6 0 0 2 3, 2 1, 1 0 0, 6 5 0 2 1 .3 4 7 4 . 0 5 % 8 2 . 1 8' 1 . 0 7 8, 3 6 0 1 4, 8 6 3, 1 6 0 1 4, 3 6 1, 2 3 0 5, 1 4, 9 8 0, 1 6 0 1 0 0 0 5 0 4, 0 1 0 6 3 0, 4 5 0 3 9 8, 2 7 5, 7 2 0 1 2 7, 9 0 0 1 .4 0 3, 2 1 0 1 .8 5 : 3, 2 7 0 2. 40 7, 0 2 0 3, 2 8 2, 7 7 0 8, 8 3 2, 4 1 0 1 0, 2 5 3, 1 5 0 4. 44 1, 5 6 0 6, 0 . 9 6 2 . 2 9 2 . 2 3 2 . 3 1 5 2 . 5 7 % 0 . 9 7 % 4 . 9 2 帖 1 5 . 5 9 % 41 .6 0 % 1 .8 3 % 9 . 0 6 首 2 9 . 7 0 ' ゐ ここでは、世帯数の増加倍率が最も高し、「世帯主夫婦のみの世帯」と、増加倍率が最も低い「世 帯主夫婦と子供から成る世帯」に注目した。 3 . 3 . 1r 世帯主夫婦のみの世帯」 世帯数の増加倍率が高い「世帯主夫婦のみの世帯」について注目すると、 1 9 8 0年から 2 0 1 0年と いう 3 0年の聞に、子供の成長・独立により残されたと考えられる高齢の「世帯主夫婦のみの世帯」 (妻の年齢 í65~74 歳 J 5 . 1 5倍 、 i 7 5歳以 1 5 . 9 5倍)が大幅に増加していることと、 上J 独立した子供の世帯と考えられる「世帯 主夫婦のみの世帯J も、妻の年齢 í30~ 3 4歳 J(2.10 倍)、同 í35~39 歳 J ( 3 . 0 1倍) にみられるように増加しており、この 2種 表 7 妻の年齢 ( 5歳階級 ( 4 5歳以上 1 0歳階級))別世帯主夫婦のみ の世幣数一全国 (1980年 、 2010年) 妻の年齢 総数 24歳以下 25~29歳 類の「世帯主夫婦のみの世帯」の併存が 30~34 歳 「世帯主夫婦のみの世帯」の大幅増加の 40~44 歳 要因となっていることが分かる(表 7 )。 45~54 歳 35~39歳 55~64 歳 65~74 歳 3 . 3 . 2r 世帯主夫婦と子供から成る世 帯 」 「世帯主夫婦と子供から成る世帯」に 0年前と比べて、妻の年 ついてみると、 3 齢 í55 歳 ~64 歳」以上の各階級区分に 属する世帯は、大きく増え、 í45 歳 ~54 歳」以下の各階級区分に属する世帯数 は、いずれも減少している。なかでも、妻 の年齢 í30 歳 ~34 歳」以下の各階級区 分に属する世帯数は、いずれも半数以 下となっている(表 8 )。 次に、我が国における人口問題の関 75歳以上 昭和 55年 (1980年) 平成22年 (2010年) 倍率 4, 441, 560 10, 253.150 2 . 3 1 305.640 480.000 260, 550 162.270 193, 690 85, 130 426, 620 546, 050 488, 420 020 382, 0.28 0.89 2.10 3 . 0 1 1 .97 1, 081.160 1, 282, 000 584, 990 91.260 977, 440 2, 877.300 3, 014, 950 1, 455.230 0.90 2 . 2 4 5 . 1 5 1 5 . 9 5 表 8 妻の年齢 ( 5歳階級 ( 4 5歳以上 1 0歳階級))別世帯主夫婦 と子供から成る世帯数 全国 (1980年 、 2010年) 妻の年齢 総数 24歳以下 25~29 歳 30~34 歳 35~39歳 40~44歳 45~54歳 55~64 歳 65~74 歳 75歳以上 27 昭和 55年 ( 1980年) 平成 22年 (2010年) 1 4, 980.160 14, 361.230 0.96 303, 300 1, 830, 310 3, 075, 690 2, 788, 550 2, 424, 850 141, 690 660, 510 1, 545, 070 2, 283, 620 2, 076.820 0. 47 0.36 0.50 0 . 8 2 0.86 3.318.770 1.026.500 192, 200 20, 000 3, 277, 650 2, 645, 190 1.303.900 426.770 0 . 9 9 2.58 6.78 21 .34 倍率
心事とし、える少子化の現状について、新世帯類型分類の視点から集計を行ったo 親と一緒に暮らしてしも可能性の高い子供の年齢上限を 1 7歳とし、かっ妻の年齢が 44歳以下 の「世帯主夫婦と子供から成 る世帯」についてみると、子 表 91 7歳 以 下 の 子 供 の 数 (3区分)別世帯主夫婦と子供から成る世帯数(妻の年齢 44 歳以下)ー全国・ 1都 3県(1 980年、 2010年) 供が 2人しも世帯の割合は イント低下し、子供 1人の世 帯の割合が 28.5%から 36.9%へと 8.4ポイント上昇 している。 さらに多くの事業所が集 中している 1 都 3県(東京都、 埼玉県、千葉県、神奈川県) 都3 と全国を比べてみると、 1 県においては子供 1人の世 帯の割合は全国平均より 4 . 1 ポイント高く、 2人 、 3人以上 の世帯は、それぞれ一1.4ポ 昭和 5 5年 ( 19 8 0年) 1 7歳以下の子供の数 54.1%から 47.5%へと 6 . 7ポ 平成2 2年 ( 2 0 1 0年) 構成比 の差 倍率 1 0. 42 2, 7 1 0 6, 7 0 7, 7 2 0 0 . 6 4 1人 2, 9 6 8, 010 2, 4 7 4, 8 9 0 0 . 8 3 2人 5, 6 4 0, 9 3 0 3, 1 8 3, 1 2 0 0 . 5 6 3人以上 1 .6 0 4, 8 0 0 9 6 1, 7 2 0 0 . 6 0 1 .8 9 1 .7 9 全国 1世帯当たり子供の数 構成比 1人 2 8 . 4 8 首 3 6 . 9 0 % 8. 42 略 2人 5 4 . 1 2 首 3人以上 1 5. 40 % 4 7. 45 % 1 4 . 3 4 唱 ‑ 1 .06% 1 都 3県の計 6 . 6 7 % 3, 0 0 5, 5 2 0 2, 0 1 4, 5 1 0 0 . 6 7 1人 896, 4 9 0 8 2 5, 5 2 0 0 . 9 2 2人 1 , 6 5 8, 6 3 0 9 2 7, 2 7 0 0 . 5 6 403, 9 3 0 2 3 5, 6 3 0 0 . 5 8 1 .8 5 1 .7 2 3人以上 1世帯当たり子供の数 構成比 1人 2 9 . 8 3 百 4 0 . 9 8 覧 1 Ll5 弛 2人 5 5 . 1 9 唱 4 6 . 0 3 也 ‑ 9 . 1 6 % 3人以上 1 3. 44% 1 1 . 70% 1 . 74% イント、一2 . 6ポイント全国より 低くなっている。東京を中心 としたこの地域には、子供を 都 3県の構成比と全国の構成比との差 l 1人 1 .4 0 4 . 1 0 2人 1 . 10 ‑ 1 .4 0 3人以上 ‑ 2。 目 ‑ 2 . 6 0 2人以上持つには難しし、環 境があることが伺われる(表 9 )。 表 1 0 男 女 、 配 偶 関 係 (4区分)別、単独世帯の増加率・寄与度一全国 (1980年 2010年) 単独世帯数 男女、 配偶関係 2年 平成 2 ( 2 0 1 0年) 総数 7, 096, 720 16, 778, 530 2.36 男性 2 . 2 3 3 . 4 単独世帯 1 9 8 0年から 2010年の 3 0 年の聞に単独世帯は 2 . 3 6倍 増加している。男女、配偶関 係別にその増加寄与度をみ ると、男性の未婚 ( 2 6 . 7 % )及 び女性の死別 ( 2 4 . 2 % )と未婚 ( 21 .3 % )が突出しており、単 独世帯が大増に増加したの は、未婚の男性、未婚の女 性、及び死別した女性、がそ れぞれ大幅に増えたことによ 倍率 昭和田年 ( 19 8 0 年) 噌加率・ 寄与度 ※ 136. 43% 3, 950, 9 7 0 8, 8 0 7, 7 1 0 未婚 3, 1 2 9, 4 6 0 5, 024, 950 1 .6 1 2 6 . 7 1唱 有配偶 3 3 4, 3 2 0 7 2 5, 7 9 0 2 . 1 7 唱 5 . 5 2 死別 2 0 0, 290 696, 4 1 0 3. 48 首 6 . 9 9 離別 2 2 7, 080 1 , 0 5 1, 4 2 0 4 . 6 3 .6 2 覧 11 2 . 5 3 3, 1 4 5, 7 5 0 7, 970, 820 未婚 1 .6 0 6, 620 3, 1 1 8, 230 1 .94 有配偶 1 1 7, 1 1 0 300, 340 2 . 5 6 21 .30% 2 . 5 8 首 死別 1 , 059, 440 2, 7 7 7, 460 2 . 6 2 2 4 . 2 1唱 離別 3 1 5, 790 9 8 2, 610 3 . 1 1 9. 40% 女性 ※寄与度は増加率に対するもので、寄与度を合計すると増加率になる。ただ し、本表では、総数に配偶関係不詳を含んでいるため、寄与度を合計した値と 増加率は一致しない。 注1 )増加率・寄与度の欄において、憎加率は総数のみ、その他は寄与度である《 注2 )男性の計、女性の計には、配偶関係不祥を含む。 28
るものであることが分かる。 また、男女ともに離別者の増加倍率が高く、離婚も単独世帯の大幅増加の要因のーっとなって ( 表 10)。 いる5 男女それぞれの増加率に対する寄与度を年齢別にみてみると、男性は r 3 5 ' " ' ‑ ' 3 9歳 jr 4 0 ' " ' ‑ ' 4 4歳 」 5 5' " ' ‑ '5 9歳 jr 6 0 ' " ' ‑ ' 6 4歳」が高く、女性は、 r 2 5 ' " ' ‑ ' 2 9歳 j r 6 0 ' " ' ‑ ' 6 4歳」以上の各年齢階級が高くなっ とr 1 )。 ている(表 1 3 5' " ' ‑ '3 9歳 jr 4 0 ' " ' ‑ ' 4 4歳」については、未婚の寄与度が高く、男性 r 5 5 ' " ' ‑ ' 5 9歳 jr 6 0 ' " ' ‑ ' 6 4歳 」 男性 r については、未婚の寄与度が高い一方で離別の寄与度も r 5 0 ' " ' ‑ ' 5 4歳 J に比べて高くなっており、定 年や子供の自立を機に離婚を選択した者が増加していることが伺える。 女性 r 2 5 ' " ' ‑ ' 2 9歳」の寄与度が高いのは、未婚の寄与度が高いためである。だが、未婚の寄与度が 2 5 ' " ' ‑ ' 2 9歳」に止まらず 3 0歳以上の年代の未婚の寄与度も高なっており、これらの年代の 高いのは r 6 0 ' " ' ‑ ' 6 4歳」と r 6 5 ' " ' ‑ ' 6 9歳」は、離別の寄与度が高し、こと 未婚単身者が増加してし、る。一方で、女性 r が要因となってし、る(表 1 2 )。 表 1 1 男 女 、 世 帯 主 の 年 齢 (5 歳階級)別、単独世帯の僧加率・寄与度一全国(1980年 ‑2010年 ) 男性 世帯主の年齢 女性 単独世帯数 昭和 55 年 ( 1980 年) 平成 2 2 年 (2010 年) 倍率 噌加率・ 寄与度 (%)楽 単独世帯数 5 年 昭和 5 ( 1 9 8 0 年) 平成 22 年 (2010 年) 倍率 糟加率・ 寄与度 (%)※ 3, 950, 970 8, 807, 710 2 . 2 8 122.98 8, 145, 760 7, 970, 820 2.68 168.38 2 4 歳以下 2 5 歳 ‑29 歳 3 0 歳 ‑34 歳 3 5 議 ‑39 歳 1 , 561, 010 875, 880 474, 120 231, 150 , 182, 300 1 976, 140 799, 030 803, 520 0 . 7 3 1 .1 1 1 .69 3 . 4 8 ' 1 0 . 8 5 2 . 5 4 8 . 2 2 1 4. 49 864, 780 241, 200 163, 820 1 2 1, 710 823, 620 617 , 650 457, 990 412, 220 0 . 9 5 2 . 5 6 2 . 8 0 3 . 3 9 ' 1 . 31 11 .97 9 . 3 5 9 . 2 3 4 0 歳 ‑44 歳 4 5歳 ‑49歳 歳 ‑54 歳 5 0 5 5 歳 ‑59 歳 163, 970 155, 440 139 , 480 90, 870 708, 440 626, 490 579, 940 659, 620 4 . 3 2 4 . 0 3 4 . 1 6 7 . 2 6 1 3 . 7 8 11 . 92 1 1 . 15 1 4 . 4 0 1 2 1, 510 166, 510 226, 060 266, 980 339, 880 300, 620 306 , 790 415, 060 2 . 8 0 1 .8 1 1 .36 1 .55 6 . 9 4 4 . 2 6 2 . 5 7 4 . 7 1 6 0 歳 ‑64 歳 6 5 歳 ‑69 歳 7 0 歳 ‑74 歳 7 5歳以上 66 , 030 65, 660 57, 630 69 , 740 685, 550 466, 750 870 342, 575, 870 1 0 . 3 8 7 . 1 1 5 . 9 5 8 . 2 6 1 5 . 6 8 1 0 . 1 5 7 . 2 2 1 2 . 8 1 281, 680 275, 020 213, 030 203, 460 612, 050 655, 940 729 , 940 2, 011, 770 2 . 1 7 2 . 3 9 3 . 4 3 1 0 . 5 0 1 2 . 1 1 16. 43 57. 48 総数 9 . 8 9 ※寄与度は噌加率に対するもので、寄与度を合計すると僧加率になる。ただし、本表では、男性の計、女性の計に年齢不詳を含んでいるため、寄 与度を合計した値と渚加率は一致しない。 注1 )増加率・寄与度の欄において、糟加率は男性の計、女性の計のみ、その他は寄与度である. 注2)男性の計、女性の計には、年齢不詳を含む。 5 単独世帯であるが配偶者のいる者も 6 . 1恥、る。 29
表 12 年齢 (5歳階級)、記偶関係 (4区分)別単独世帯の繕加率・寄与度一全国(1980 年~2010 年)
男性単独世帯 (
3
0歳 ‑49歳)
単独世帯数
年齢、
配偶関係
男性総数
昭和田年
(
19
80年)
2年
平成2
(
2
0
1
0年)
男性単独世帯 (
5
0歳 ‑69歳)
単組世幣数
瑚加率・
寄与度
倍率
年齢、
配偶関係
※
昭和田年
(
19
80年)
3,
950,
970 8,
807,
710
2
.
2
3
122.93
也
8
.
2
2
5
.
3
3
%
5
0
歳 ‑54
歳
1
3
9,
480
未婚
2
8,
470
0
.
1
2
%
‑
0
.
0
2
包
有配偶
死"
'
1
男性能数
2
年
平 成2
(
2
0
1
0年)
3,
950,
970 8,
807,
710
{昔串
増加串・
寄与度
*
'
2
.
2
3
122.931
5
7
9,
940
4
.
1
6
1
1
.
1
5
%
2
8
7,
540
1
0
.
1
0
6
.
5
6
%
6
2,
300
1
2
4,
680
2
.
0
0
530
1
3,
8,
780
0
.
6
5
1
.5
8%
‑
0
.
12%
歳 ‑34
歳
3
0
4
7
4,
1
2
0
030
7
9
9,
1
.6
9
未婚
4
1
2,
040
6
2
2,
460
1
.5
1
有配偶
2
7,
640
3
2,
220
1
.
17
死別
1
,
650
0.
42
1
.3
6
0
.
2
2
%
陸"
'
1
1
6
0
3
2,
1
0
9,
330
3
.
4
0
48
3.
3
.
6
2
1
.5
3
0
.
6
5
1
4.
4
9%
1
0
.
5
9
%
0.
43
%
5
5
歳 ‑59
歳
90,
870
659,
620
7
.
2
6
宋婚
1
4,
1
9
0
3
3,
570
319,
740
1
1
5,
660
2
2
.
5
4
3
.
4
5
2
.
0
8
%
-O.02~‘
死別
1
8,
7
5
0
2
2,
3
4
0
2
4,
940
1
4
6,
1
5
0
1
.
3
3
0
.
1
6
%
6
6,
030
7,
620
685,
550
陸自1
'
2
3,
650
700
3
2,
210
3
5歳 ‑39
歳
2
3
1,
1
5
0
803,
520
未婚
1
5
9,
850
3
2,
460
578,
2
5
0
4
9,
560
,
660
1
有配偶
有配偶
離別
2,
560
3
0,
400
6
7,
630
2
.
2
2
0
.
9
4
%
躍別
織 ‑44
歳
4
0
1
6
3,
970
708,
440
80,
7
4
0
453,
980
8%
1
3
.
7
9
.
4
5
%
6
0様 ‑64歳
未婚
4
.
3
2
5
.
6
2
有配偶
4
2,
790
7
7,
930
1
.8
2
0.89~‘
有配偶
死別
3,
900
2,
560
0
.
6
6
‑
0
.
0
3
%
死別
死別
未婚
1
6,
560
2
4,
1
5
0
390
303,
7
3,
260
1
.
9
5
%
14.40~込
7
.
7
3
%
6
.
5
4
3
.
1
3
%
1
0
.
3
8
3
9
.
8
2
1
568%
7
.
4
9
%
1
.44%
0
.
9
7
%
42
4.
2
.
5
9
離別
3
22
2
0
目
日7,
3
7
0
2
.
7
1
1
.4
0
陸別
1
6,
080
570
6
2,
1
9
2,
280
.96
11
4
.
4
6
%
4
5
歳 ‑49
歳
1
5
5,
4
4
0
626,
490
4
.
0
3
6
5
歳 ‑69
歳
6
5,
660
466,
750
7
.
1
1
1
0
.
1
5
%
未婚
4
7,
960
6
1,
370
3
4
7,
270
1
1
4,
200
7
.
2
4
1
1
.9
2%
7
.
5
8
喝
未婚
有配偶
1
5
2,
450
3
6,
280
6,
920
3
5,
440
4,
310
9
7,
800
1
.3
4
l
‑
0
.
0
7
%
5,
1
5
0
1
2,
1
5
0
2
9
.
6
0
1
.8
6
0
.
6
2
2
.
7
6
1
.
5
8
免
陸別
3
4,
690
1
2,
040
9
3,
830
1
4
3,
490
3
.
7
3
%
0
.
6
1
%
1
.5
0%
3
.
3
3
%
有配偶
死別
離別
死別
女性単独世帯 (
5
5歳以上)
女性単独世帯 (
2
5歳 ‑49歳}
単独世帯数
年齢、
配偶関係
女性蛤数
5
年
昭和 5
(
1980
年}
平成 2
2
年
(
2
0
1
0
年)
3,
145,
750 7,
970,
820
倍率
2
.
9
9
2
.
7
0
1
1
.
9
2
単組世帯数
生田加率・
寄与度
年齢、
配偶関係
(%)滋
2
.
5
3
153.38
女性総数
5
年
昭 和5
(
19
80年)
2年
平 成2
(
2
0
1
0年)
3,
145,
750 7,
970,
820
倍率
増加率・
寄与度
(%)※
2
.
5
3
153.38
2
5
歳 ‑29
議
2
4
1,
200
617,
650
2
.
5
6
11
.9
7
5
5
歳 ‑59
識
266,
980
415,
060
1
.5
5
4
.
7
1
未婚
223,
350
5,
790
524,
550
1
6,
270
2
.
3
5
2
.
8
1
9
.
5
7
0
.
3
3
未婚
46,
810
1
2
5,
840
有配偶
1
8,
940
4
1,
050
2
.
6
9
2
.
1
7
1
25
0
.
7
0
ー2
.
0
9
有配偶
目
死別
390
950
2.
40
1
4
2,
7
9
0
5,
1
3
0
0
.
6
0
敵別
5
3,
300
7
7,
1
4
0
1
4
5,
520
0
.
5
4
8,
510
0
.
0
2
‑
0
.
1
1
死別
離別
2
.
7
3
2
.
9
3
歳 ‑34
歳
3
0
1
6
3,
820
2
.
8
0
9
.
3
5
6
0
J
寵‑64歳
2
.
7
1
40
7.
未婚
612,
050
1
4
2,
200
1
0
.
5
0
1
3
5,
970
2
8
,
16
80
2
4,
840
2
.
1
7
未婚
4
5
7,
990
368,
860
有毘偶
1
8,
720
3
.
4
3
有配偶
38,
990
5
.
7
3
2
.
9
3
3
.
7
3
死別
5,
470
1
,
360
0
.
9
4
死別
1
3,
290
203,
7
7
0
770
1
9
9,
0
.
9
8
離別
1
8,
1
3
0
,
12
80
1
4,
7
2
0
4
2
0.
0
.
0
0
0
.
8
1
‑
0
.
1
1
陸別
35,
020
1
9
9,
730
5
.
7
0
5
.
2
4
歳 ‑39識
3
5
,
17
10
1
2
412,
220
3
.
3
9
9
.
2
3
歳 ‑69
歳
6
5
275,
020
655,
940
2
.
3
9
1
2
.
1
1
未婦
86,
790
315,
590
3
.
6
4
7
.
2
7
未婚
1
4,
280
1
0
9,
7
2
0
7
.
6
8
3
.
0
3
有配偶
5,
470
270
3,
1
5,
460
2
.
8
3
0
.
3
2
有配偶
9,
640
390
25,
2
.
6
3
0
.
5
0
2,
950
0
.
9
0
‑
0
.
0
1
死別
1
.5
2
3
.
6
7
3
1,
070
1
.3
0
0
.
2
3
隠別
2
2
4,
030
2
2,
900
450
339,
2
3,
810
1
5
0,
1
1
0
6
.
5
5
4
.
0
4
1
2
1,
510
7
0,
500
339,
880
238,
820
1
5,
1
3
0
2
.
8
0
3
.
3
9
6
.
9
4
5
.
3
5
7
0
歳 ‑74歳
2
19
0
.
6
1
1
.
4
4
0
.
2
3
‑
0
.
1
1
有配偶
213,
030
7,
490
5,
340
729,
940
8
6,
7
9
0
2
1,
020
0.
43
際
主
主l
1
8
5,
310
1
1,
380
488,
400
1
0
3,
210
3.
43
11
.5
9
3
.
9
3
2
.
6
4
9
.
0
7
1
6.
43
2
.
5
2
0
.
5
0
9
.
6
3
2
.
9
2
死"
'
1
離別
4
0
議 ‑44
歳
未婚
来婚
0
.
8
2
‑
0
.
1
3
離別
7,
880
9,
030
31
,
18
日
4
5
歳 ‑49
歳
1
6
6,
510
3
0
0,
620
1
.8
1
4
.
2
6
7
5歳以上
203,
460
2,
0
1
1,
7
7
0
9
.
8
9
48
5
7.
未婚
7
3,
1
1
0
2
.
3
4
3
.
1
1
未婚
4,
920
1
5
5,
910
1
4,
860
1
.5
8
有配偶
3,
070
死別
2
9,
830
4
4,
990
1
0,
820
6
6,
860
0
.
3
6
1
.4
9
0
.
2
7
‑
0
.
6
0
死別
0
.
7
0
陸別
1
8
5,
040
7,
1
4
0
4
4,
970
1
,
6
2
4,
720
.7
1
31
1
4
.
6
5
4
.
8
0
有
f
t
i
!
偶
,
10
10
1
7
2
3,
440
8
.
7
8
1
7
.
7
4
4
5
.
7
7
3
.
8
0
有配偶
死別
離別
5,
490
4
4,
750
目
死別
1
2
6,
650
1
.3
3
業寄与度は瑠加率に対するもので、寄与度を合計する k
噂加率になる.ただし、本表では、掲織している年齢階級を限定してb喝ので.各年齢階級の寄
与度を合計した値と男性総数または女性総数の綱加率は一致しない.
注1
)噌加串・寄与度の欄において、噌加串は男性総数または女性総数のみ、その他は寄与度である固
注 2)各年齢階級には、配偶関係不詳を含む。
30
3 . 5 非親族世帯 世帯数の規模は小さいが、世帯主と非親族から成る世帯(非親族世帯)が大幅に増加 (5.62倍) しており、これは「世帯主とその他から成る世帯」の増加が影響してし、る(表 13)。 人の世帯が 1980年から 7.86 「世帯主とその他から成る世帯」を世帯人員別にみると、世帯人員 2 倍と著しく増え、その同居形態は異性との同居が 91 .4%(2010年)を占めており圧倒的に多い。この 同居形態は、 1980年の時点でも若者世代を中心に幅広い年代層に存在していたが、この 30年の 聞にその厚みを増し、同棲世帯が生活スタイルとして定着しつつあることが分析結果から読み取れ る(表 14)。 表1 3 非親族世帯の区分 ( 3区分)別非親族世帯数全国(19 8 0年、 2 0 1 0年) 平成22年 昭和 55年 (1980年) 非親族世帯の区分 総数 (2010年) 61, 480 世帯主と住み込みの雇人とその他から成る世帯 世帯主と住み込みの雇人から成る世帯 世帯主とその他から成る世帯 345, 730 昭和5 5年 ( 1 9 8 0年) 2年 平成2 ( 2 0 1 0年) 390 190 49 0. 5, 090 0.31 44, 740 450 340, 7.61 構成比 ( 2 0 1 0年) 倍率 昭和5 5年 平 成2 2年 4 4, 7 4 0 3 4 0, 4 5 0 4 1, 6 1 0 3 2 7, 2 2 0 1 0 0 . 0 0 % 7 . 8 6 男性同居 3 7 0 1 4, 4 5 0 8 1 0 4 0, 4 3 0 1 3, 6 0 0 2 9 9, 1 8 0 4. 42 % 4 . 1 6 唱 3 9 . 5 5 女性同居 91 .4 3 首 7. 40 総数 世帯人員2人 異性同居 7 . 6 1 1 6 . 8 4 2 4歳以下 2 5歳 ‑34歳 1 1, 1 1 0 3 0, 6 5 0 9 . 3 7 首 2 . 7 6 1 1, 3 0 0 1 0 9, 2 3 0 3 5歳 ‑44 歳 4 5歳 ‑54歳 4, 2 7 0 4, 7 7 0 5 4, 3 8 0 3 2, 2 5 0 3 3 . 3 8 首 1 6 . 6 2 弛 9 . 8 6 也 9 . 6 6 1 2 . 7 5 6 . 7 6 5 5歳 ‑64歳 4, 2 0 0 3 8, 0 9 0 11 .6 4% 9 . 0 7 6 5 歳 ‑74 歳 2 4, 3 9 0 7. 45 % 7 . 9 4 7 5歳以上 3, 0 7 0 1 , 7 1 0 3 . 1 1 % 5 . 9 6 平均年齢 3 8 . 7 3 1 0, 1 9 0 41 . 19 世帯人員3人 2, 0 6 0 世帯人員4人 8 0 0 2 8 0 世帯人員5人以上 8, 9 8 0 1 0 0 3, 1 , 1 6 0 31 5.62 16, 350 表1 4 世帯人員 ( 4区分)、世帯人員が2人の世帯の同居形態 ( 3区分)、 異性同居世帯の世帯主の年齢 (7区分)別、世帯主とその他から成る 1 9 8 0年 、2 0 1 0年) 非親族世帯数一全国 ( 世帯人員、世帯人員が2人 の世帯の同居形態、異性同 居世帯の世帯主の年齢 倍率 4 . 3 6 3 . 9 0 4 . 1 6
4 . まとめ 以上に示したように、新世帯類型分類を用いたことで少子高齢化の実態やライフスタイルの変化 9 8 0年と 2 0 1 0年の 3 0年間で世帯の構造別分布に大きな変化が起 などを量的に示すことができ、 1 きていることが分かった。本報告は、 S i n f o n i c a研究叢書『新世帯類型別世帯数・世帯人員.s(伊藤彰 彦( 2 0 1 6 ) )に掲載した時系列分析の一部を紹介したものであるが、その他にも、同書には、「高齢者 乳幼児の保育施策用基礎資料」や f 消費需要分析用基礎資料(夫婦の数、母 施策用基礎資料Jr 住宅需要分析用基礎資料J等新世帯類型分類 親または祖母の数、昼間家にいる者の年齢構成)Jr と他の項目とのクロス集計の分析結果も収録している。 参考文献 ①伊藤彰彦( 2 0 1 6 ) W 新たな個人消費を創造する新世帯類型別世帯数・世帯人員』、 S i n f o n i c a 研究叢書 N o . 2 5、(公財) 統計情報研究開発センター。 ②安井浩子・中川雅義・周防節雄 ( 2 0 1 6 ) 2 0 1 0年国勢調査ミクロデータから全自動で構築した SASデータベースに基づく新世帯類型の設計と開発、 WSASユーザー総会 2 0 1 6論文集』 謝辞 本研究は、独立行政法人日本学術振興会の科学研究費(課題番号 2 6 3 8 0 2 8 0 :研究代表:伊藤彰 Jの助成金で行われた。記して 彦、「新世帯類型の構築と世帯構造の変動に係る長期時系列分析J 謝意に替えたい。 32
4回の学生調査に基づく 学生の文化・芸術に対する意識の現状と変化 有馬昌宏 兵庫県立大学応用情報科学研究科 AnA n a 1 y s i sofU n i v e r s i t yS t u d e n t s 'A t t i t u d et o w a r dC u 1 t u r eandA r t s M a s a h i r oARIMA nf o r r n a t i c s, U n i v e r s i t yofHyogo G r a d u a t eS c h o o 1ofA p p 1 i e dI 要旨 1986年からほぼ 5年間隔で実施されてきた全国の学生を対象とする文化芸術に関する調査の 1 9 9 1年の 0項目の質 第 2回調査から 2008年の第 5回調査まで 4回の調査の芸術・文化に対する意識に関する 1 問への回答から、学生の文化・芸術への意識を対応分析を適用して類型化するとともに、第 2回調査か ら第 5回調査にかけて、文化芸術への学生の意識がどのように変化してきているかを考察する。また、 意識の相違が実際の文化・芸術のライブとメディアによる鑑賞行動にどのように影響しているかについ ても考察する。 キーワード:文化資本,実演芸術,文化的オムニボ、ア仮説,学生調査,名義ロジスティック回帰分析 1.はじめに 文化や芸術への需要構造をデータに基づいて分析しようとすると,データが十分に整備されていないとい う問題に直面する.文化・芸術を提供する劇場・ホールや美術館などでは,来館者を対象としたアンケート 調査を実施しているが,それらの個票データは一般には公開されていない.広く国民を対象とする調査とし 9 7 6年以降 ては, 1 5年ごとの周期調査として実施されている社会生活基本調査の生活行動調査がある.こ の調査では,美術鑑賞のほかに,実演芸術に関連する種目としては,演芸・演劇・舞踊鑑賞,音楽会などに よるクラシック音楽鑑賞,音楽会などによるポピュラー音楽・歌謡曲鍍賞の 3つの種目が取り上げられて過 去 1年間の鑑賞行動の有無と頻度が調査されている.しかし,文化・芸術に対する意識が鑑賞行動に大きな 影響を及ぼすと考えられるにも関わらず,社会生活基本調査はもとより,ほとんどの調査では,行動の有無 や行動頻度は調査されているが,文化・芸術に対する意識についての設聞はされてはいないのが現状である. また,文化芸術への意識を問う設聞がされている調査としては,全国規模では 1 9 8 7年 , 1 9 9 6年 , 2 0 0 3年 , 2009年に実施された内閣府の「文化に関する世論調査 J, 1 9 9 3年と 1 9 9 9年に実施された文化庁の「国民の 文化に関する意識調査し地域的なものでは東京都目黒区で 2 0 1 4年に実施された「文化芸術に関する意識調 33
査」などの調査があるものの,文化・芸術に対する意識についての継続的な設聞はされてはいないのが現状 である. 9 8 5年度からほぼ 5年間隔で実施している有意抽出による 1 そこで,本研究では,我々の研究グループが 1 万人規模の学生を対象とした一連の調査(学生調査)のうち, 1 0の対照的な芸術・文化に対する考え方のど 9 9 1年度に実施した第 2回調査から 2008年度に実施した第 5回 ちらに賛成するかを問う同じ質問を設けた 1 調査までの個票データを用いて,文化・芸術への意識の現状とその変化を考察する.特に,本研究のもとに なっている調査は,大学生が調査対象となっていることから, 1 9 9 8年の学習指導要領の改訂(高等学校は 1 9 9 9 年)により, i 我が国の文化や伝統を尊重する態度を育成する観点などから,小学校から我が国に伝わる楽 器を取り上げられるようにするとともに,中学校では 3年聞を通じて 1種類以上の和楽器を体験できるよう にする」としづ指導方針のもとで中学校の音楽の授業で和楽器指導の導入が義務付けられるなどの日本的な 文化・芸術を重視する教育の文化・芸術意識への影響がどの程度あるかを, 2008年度の第 5回調査の結果と それ以前の第 4回競査までの結果と比較して分析することから可能になると考えられる. 以下,第 2章では,我々が属する研究グ、ループが実施してきた学生調査について概説し,第 3章で, JMP の i2変量の関係Jを適用しての文化・芸術への意識の現状と変化を明らかにする.その上で,第 4章で対 応分析を適用することによって文化・芸術への意識の構造を明らかにする試みの結果を示し,第 5章で文化・ 芸術への意識と実際の鑑賞行動との関係を調べる.最後に,第 6章において本研究のまとめを行うとともに, 今後に残された課題についても言及する. 2. 学生調査の概要 社会生活基本調査は,総務省統計局が所管する基幹統計調査であり, 2011年に実施された最新の第 8回調 査では,層化 2段抽出法により,指定する調査区(全国で約 6, 900調査区)内に居住する世帯のうちから, 0歳以上の世帯員約 20万人が対象とされている。文化・芸術を対象とした調 選定された約 8万 3千世帯の 1 査でこれだけの大規模な周期調査は他になく,非常に有用な調査であるものの,文化・芸術に関して,分野 や種目の細分類による詳細な分析を行いたい場合には,実演芸術は 3種目に統合されており, 目的を達成す ることは難しい.また,先述のように,文化・芸術に対する意識に関する設問はされていない. このような状況を踏まえ,ミクロ統計データ(個票データ)に基づく文化・芸術の需要サイドの分析の重 要性を早くから認、識していた松田芳郎(一橋大学名誉教授)らの研究グループにより,文化・芸術情報の体 系化と統計調査方法の確立を目的として,文化・芸術の需要者側の実態調査『学生の芸術意識と芸術活動に 関する調査(以降, i 学生調査」と略記) ~が 1985 年以降 5 回に渡って実施され,調査研究の進行とともに データの蓄積が図られてきている(加藤・有馬 [ 5 ] ) .学生調査は全国の学生を対象としており.大標本を確 保しながら限られた費用で詳細にわたる調査を実施するために,大学教員のネットワークを活用して,全国 の大学の地域と専門分野別の分布を考慮する割当法で、標本設計を行って調査を実施している.有効回答サン プル数は第 l回調査 ( 1 9 8 5年度実施)で 1 0, 570,第 2回調査 ( 1 9 9 1年度実施)で 1 0, 770,第 3回調査 ( 1 9 9 6 年度実施)で 1 0, 0 6 1,第 4回調査 ( 2 0 0 2年度実施)で 3, 767,第 5回調査 ( 2 0 0 8年度実施)では 7, 475で , 第 1回調査から第 5回調査まで、のサンプルの構造は,表 1に要約して示すとおりである.第 5回調査のサン プルの構造では,設立形態別では短期大学からの抽出率が低く,専攻分野(学部)では理工系学部と人文芸 術系(文芸系)学部からの抽出率が低くなっている.また,医療福祉系(保健系)学部では,医学部からの 抽出率は非常に低く,看護系学部の学生が多くを占めている.地域別では甲信越・北陸・東海と中国・四国 3 4
表 1 学生調査のサンプルの構造 設 大学 立 短期大学 形 高等専門学校 態 専修学校 j J j J 大学院 性 男子 日 j J 女子 専 文芸系学部 攻 社会系学部 分 理工系学部 野 保健系学部 北海道・東北 地 関東 域 甲信越・北陸・東海 自j J 近畿 中国・四国 九州・沖縄 全体 第 1回調査 ( 1 9 8 5年度) 第 2回調査(19 9 1年度) 有効回収 有効回収 抽出率 抽出率 母集団 母集団 サンプル (%) サンプル (%) 1 , 7 3 4, 0 8 0 7 , 8 7 9 0 . 4 5 4 2 , 0 5 2, 3 3 8 8 , 3 1 2 0 . 4 0 5 4 9 7, 3 7 7, 1 0 7 5 6 9 , 4 4 9 0 . 3 8 4 , 0 3 2 0 . 2 0 7 1 1 1 9, 8 1 6 1 8 0 0 . 9 0 8 5 7 9, 2 7 4 1 , 2 4 2 0 . 2 1 4 8 3 4, 7 1 3 1 ,1 5 5 0 . 1 3 8 9 8, 6 5 0 8 7 0 . 0 8 8 1 , 6 6 6, 9 9 1 5 , 4 0 4 , 0 1 0, 7 1 5 6 , 3 4 6 0 . 3 2 4 2 0 . 3 1 6 1 , 0 2 3, 470 4 , 9 4 9 , 4 9 2, 3 7 1 0 . 4 8 4 1 4, 3 7 5 0 . 2 9 3 , 7 5 7 , 1 5 5, 3 1 5 4 0 . 5 4 1 1 3 8 7 9, 5 3 0 , 3 8 7 0 . 2 9 3 7 8 5, 3 0 4 3 , 8 7 5 , 0 5 4, 6 2 9 4, 5 9 7 0 . 4 9 3 1 0 . 4 3 6 4 9 8, 9 6 8 1 , 1 0 1 0 . 2 2 1 8 5 7, 8 6 3 2 , 0 9 2 0 . 2 4 4 1 7 9, 2 2 6 6 6 4 0 . 3 7 0 3 0 9, 8 3 8 5 4 8 0 . 1 7 7 2 0 6, 5 6 4 2 6 9, 8 0 9 9 8 9 0 . 4 7 9 7 9 2 0 . 2 9 4 1 , 4 0 2, 8 9 1 5 , 4 9 6 0 . 3 9 2 1 , 4 2 0, 8 8 7 3 , 4 4 5 0 . 2 4 2 7 6, 9 1 5 4 5 7, 0 2 4 , 7 4 7 0 . 3 8 2 3 2 6 0 . 4 2 4 1 5 5 3, 6 8 5 1 , 7 5 1 6 5 2, 7 4 7 , 7 2 4 0 . 3 1 6 1 0 . 2 6 4 1 7 2, 7 4 3 1 , 0 2 5 2 2 7, 0 0 8 , 1 9 2 0 . 5 9 3 1 0 . 5 2 5 2 4 1, 3 9 8 9 8 3 0 . 4 0 7 3 0 9, 6 6 6 1 , 8 6 7 0 . 6 0 3 2 , 6 9 0, 4 6 1 1 0, 5 7 0 , 5 0 3, 0 8 6 1 0, 7 7 0 0 . 3 9 3 3 0 . 3 0 7 第4因調査 (2002年度} 母集団 │夜明収│個師 lサンプル 1 (%) 第 3回調査(1996年度) 有効回収 抽出率 母集団 サンプル (%) 2, 3 6 8, 9 9 2 9 8 0 8, 0 . 3 7 9 4 6 3, 9 4 8 7 3 3 0 . 1 5 8 2 1, 6 0 8 8 0 0 . 3 7 0 7 9 9, 5 5 1 1 8 5 0 . 0 2 3 3 5 0 1 6 4, 8 3 0 . 0 5 1 ,1 3 6, 1 8 0 2 5 , 3 8 6 0 . 2 5 2 , 6 8 2, 2 6 9 1 4, 4 1 4 0 . 2 6 2 , 0 4 5, 3 4 5 1 2, 5 7 3 0 . 2 4 6 1 , 1 5 7, 9 2 3 5 , 4 9 7 0 . 4 7 5 1 , 0 7 6, 7 2 4 1 , 2 8 0 0 . 1 1 9 3 7 2, 2 6 2 6 6 4 0 . 1 7 8 3 1 4, 5 5 6 9 9 2 0 . 3 1 5 1 , 5 6 9, 3 8 5 3 , 3 9 7 0 . 2 1 6 5 2 8, 3 3 6 1 , 3 6 2 0 . 2 5 8 7 4 7, 8 0 3 2, 1 9 7 0 . 2 9 4 2 6 6, 1 8 1 7 6 1 0 . 2 8 6 5 8 0 3 7 0, , 3 5 2 1 0 . 3 6 5 8 1 8, 4 4 9 1 0, 0 6 1 3, 0 . 2 6 3 第5因調査 (2008年度} 母集団 │有数聞A A . I錆 車 率 lサンプル 1(%) 2, 520, 5 ゆ31 7, 0091 0 . 2 7 8 注1 ) 母集団の構造は,第 1 回調査では文部省「昭和 5 9 霞l 本学 L 2-,~il9,竺7J .. 3 , 里 I ! I J O.1~7 7251 1601 0 . 0 9 3 年度学校基本調査J.第 2回 172, 立l 短期大学 1 267, 0861 一一 1 0 形l 高等専門学校 1 2 1, 3361 一一 1 0 59, 4461 1881 0 . 3 1 6 調査では「平成 3年度版学校 態l 専修学校 1 765 , 5581 4 11 0 . 0 0 5 基本調査J.第 3回調査では 別│大学院 I 2 2 3, 5121 4 . ‑ 4 .o.021 262, 6a61. 1.1ar0~ó45 『平成 8年度版学校基本調 性l 男子一 ーー L .?,.08~1_2PJ . . . ̲ ! , ! ! 旦1 ..!l,(l~71 ..?!Q1~ 哩2L._~~恒 L.J).192 査J,第4回調査では「平成 14 別l 女子 1 1 , 691, 5191 1, 9541 0 . 1 1 6 1 1 , 6 6 1, 3311 3, 3741 0 . 2 0 3 第5 専l 文芸系学部 1 1 , 144, 7811 2, 1701 0 . 1 9 1 1 , 062, 5591 1, 5371 0 . 1 4 5 年度版学校基本調査 J, 0年度版 攻l 社会系学部 1 1, 128, 3651 1 , 30 虚 0 . 1 1 5 1 934, 49 51 3, 6481 0 . 3 9 0 因調査では「平成 2 一 一 一 一 一 一 一 一 ・ 一 一 一 一 ← 一 一 一 一 一 一 ・ 一一 一 一 一 一 一 一 分l 理エ系学部 1 889, 5371 162 斗 0 . 0 1 8 1 725 日 1571 8751 0 . 1 2 1 学校基本調査 J から計算して 野l 保健系学郵 1 506, 0891 1291 0 . 0 2 5 1 295 日 6741 8 崎 1 0 . 2 9 4 E いる. 1 324, 8161 37110.1141 246, 4 821 41510.168 注 2)設立形態別,性別,専攻 .北海道・東北 地l 明男 一 一 I.1,割引 l__ .1!~.~J 一旦6吐~~1.1~6L 坦斗 0.171 分野別,地域別の有効回収サ 域│ ~~~~~.I一 -:-~~~-~.1~~1 ~~~,~~~ . 一 1!~~H__~.~g ・甲信越・北陸・東海 ・ . 一 一 一 一 一 一 ンプルには分類が不明のサン 別l 時 I̲ ̲..,57,哩~L__1.c1制 O.~.~8_L ̲. ~~, 1~5 L 塑 I-~・7坐 .中国・四国 1 261, 7811 1781 0 . 0 6叫 211, 5431 9091 0. 4 30 プルは除外されているため, 九州・沖縄 1 372, 2271 3 幽 1 0 . 0 8 7 1 276.8731 4751 0 . 1 7 2 合計しても全体の有効回収サ 全体 L̲̲̲y 76, 639L .3 , 7 ち 7 ' . 1̲ 0.11 3, 015, 4501 7, 4751 0 . 2 叫8 ンプル数には一致しない. r 1 ̲ 1 からの抽出率が高くなっている. な お , 我 々 の 調 査 は 無 作 為 抽 出 で 実 施 さ れ て お ら ず , 表 1か ら 明 ら か な よ う に , 各 国 の 学 生 調 査 で サ ン プ ルに偏りがある.したがって,以下の分析では,割当法でのサンプルの偏りを補正するための復元乗率を用 いた調整を行う必要があるが,本研究においては,復元乗率を求めることができていないために,直接的な 時系列比較はできないので,注意が必要である. ところで,学生調査では芸術・文化の需要構造の実態把握に焦点を当てており,調査業の質問は,大別す ると,実演芸術 7分 野 44ジ ャ ン ル ( 各 回 調 査 で ジ ャ ン ル の 見 直 し が 行 わ れ て い る の で 調 査 回 に よ っ て ジ ャ ン ル 数 は 異 な る ) の ラ イ ブ で の 鑑 賞 経 験 ( 過 去 通 算 と 過 去 1年 ) と 鑑 賞 希 望 と 実 演 芸 術 7分 野 の メ デ ィ ア に よ る 鑑 賞 経 験 ( 過 去 1年 ) を 問 う 質 問 群 , 映 画 鑑 賞 と 美 術 な ど の 視 覚 芸 術 鑑 賞 の 経 験 と 鑑 賞 場 所 と 同 行 者 を 問 う質問群,鑑賞行動に影響を与える文化・芸術への意識に関する質問群,稽古事や主体的芸術活動の有無と 活動時期に関する質問群,読書(書籍と雑誌)ならびに実演芸術に関する情報の取得源に関する質問群,お よび鑑賞行動と何らかの関連を持っと考えられる個人的属性(文化資本)に関する事項を問う質問群とから 構成されている.文化資本に関する項目は,具体的には,全ての家族構成員について,続柄,年齢,職業, 35
Q8. あ な た は
文学酬@舗・議飽佃掴悼む》について
拘ように脅えていますか.
以 下 の 山 の 捌 締 結 咽 艇 の う い な た の 初1
:
:
町 田 野1
:
:
:
0を 付 げ て 下 さ い ・ }
A
図書.
日
処掴からいいも白書佐取田 λれていけぽ主い.
現代的な畠遺骨活1l>1..てい告たも、.
1
.IB本的なも申告育てでいきたも、.
且 古島崎なも申告守。τいきたい.
"
陪固串喝なも申告a
橿劫にI
I
U
λれ畠 d 告書ι
3
. テー守号事指 1
4
. 書留官邸事由士山=政膚・企盈申書眠量的な相暗・支灘i
J
l
l
!
"
た
5
. 裳相官・委書量阻生【?イプ】でなければ信書11
.
.l
tl:院い主なも、.
6
. 芸街・書極陸国自遣いを'.主て普遍記
テー守中書留陸舗に圃本敢なも自に ζ だわ畠必屡誌なも、.
幸徳留興自たI!Jにほ 害情・書値定自努力iJl:量紫色
書智・芸盆民生でな〈 τも4
合に量目置で量昌.
書街・書量'"陸‘そ自国民でなければ理解で量ないWjjS~~.
7
. 会喝の多犠化に停い.書相官・書館曲中で盗迭す昌も砲も畠畠.
これ酔島阻.書智・書薗ほ
チ ..7~jjS<>てい<.
会媛@噂代だからこそ.キ犠砲事轡・芸趨却費援してい<.
これ.1l>1io民芸術・書醤註噂円!l'T.(:唱も由 kな。てい<.
9
. 芸街・書聾で民政省主睡も才畠由方首~øであ畠.
1
0
‑ 重傷・重曹阻縛代l:l:も E
己変化 Lてい<.
.
.
.
告書己
書留・婁llI!随時代1
"
迎合f畠必慶ほない.
a
y.
,
書街・芸竃1
=民 才 量 主 Eも鏡宵骨暴f
t
‑
t
唱闘が大量礼
A
A
A
A
A
A
A
A
A
A
a
N
l
N
l
N
l
N
l
N
l
N
l
N
l
N
l
N
l
B
B
B
B
B
B
B
B
B
B
自由回答鋼:芸術・芸包について意見があれ民自由に齢、て下さい.
図 1 文化・芸術への意識を捉えるための質問
最終学歴,居住地を問う質問を設けている.また,奨学金の状況,アルバイトの状況,クラブ活動やサーク
ノレ活動の状況, 1ヶ月の小遣いの額なども設問している.
調査方法は,原則として講義などで学生に調査票を配布して,その場で記入させるか,または自宅で記入
して次回講義時に回収する方法で実施されている.
第 2回調査からの鑑賞経験率(過去 1年間に当該分野あるいは当該ジャンルの実演芸術を 1回以上鑑賞し
た学生の比率)の変化については有馬・福永・王 [
3
]で,また稽古事や主体的芸術活動がライブでの実演芸術
の鑑賞率に及ぼす影響については福永・有馬[7]で,家族の職業や学歴などの文化資本の影響が鑑賞行動に及
4
]で分析しているが,本研究では,文化・芸術に関する 1
0項目の対照的な意見のど
ぼす影響については有馬 [
ちらに自身の考えが近いかを問う図 1に示した質問群の回答データを用いて,文化・芸術への意識の現状と
第 2回調査からの意識の変化について,クロス集計と対応分析を適用して分析を試みている.
3. 文化・芸術に対する意識とその変化
文化・意識を捉えるための質問群は,①日本志向か外国志向か,②古典志向か現代志向か,③日本志向か
外国志向か(①とほぼ同じ) ,④補助支援か自助努力か,⑤ライブ鑑賞かメディア鑑賞か,@国際的普遍性
か地域固有性か,⑦衰退か発展か,@アマチュア化かプロフェッショナル化か,⑨才能重視か教育重視か,
0の対照的な意見のどちらに自分自身の考えが近いかを問う形式で構成されている.
⑩流行か不易か,の 1
表 2には,第 2回調査から第 5回調査までの 4回の調査で回答がどのようになっているかを回答者全体と
性別で分けた場合の集計結果として示している.
表 2より,有意抽出のために統計的検定は行えないものの,学習指導要領の改訂を受けて,
1の「日本的
なものを育てていきたい J, 2の「古典的なものを守っていきたい J, 3の「テーマや素材には日本的なも
のを積極的に取り入れるべきだj という意見に賛成する比率が第 4回調査までと比較して第 5回調査では高
外国からいいものを取り入れていけばよい J, 2の「現代的な感覚を活かしていきた
くなっており, 1の f
いJ, 3の「テーマや素材は別に日本的なものにこだわる必要はない J, 6の「芸術・芸能は国の違いを超
えて普遍だJ という意見に賛成する比率は,第 4回調査までと比較して第 5回調査では低くなっている.
3
6
表 2 文化芸術への意識の現状とその変化 ~ 全体 女子学生 左の意見どちらとも右の意見 左の意見どちらとも右の意見左の意見どちらとも右の意見 に賛成 し、えない に賛成 に賛成 いえない に賛成 に賛成 いえない に賛成 1 6 . 1 6 0 . 1 1 4. 4 5 9 . 0 1 8 . 5 6 5 . 3 2 8 . 9 5 9 . 3 1 3 . 5 5 5 . 1 古典的なものを 1 2 . 3 5 3 . 0 守って 2 4 1 4 . 7 59. し 、 き た し 、 。 1 8. 4 5 6 . 9 1 4 . 1 2 9 . 7 テーマや素材に .9 1 3 . 3 31 3 は日本的なものを 積極的に取り 1 6. 4 38. 4 入れるべきだ。 21 .5 4 0 . 3 4 8 . 9 3 5 . 5 芸術振興の ために政府・ 4 0 . 0 41 . 1 4 企業の積極的な 40目3 4 2 . 7 支援が必要だ。 4 0目4 4 4 . 7 2 6 . 7 3 6 . 3 芸術・芸能は 2 2 . 7 3 6 . 8 5 生(ライブ)でなけ れば鑑賞したとは 2 0 . 3 3 6 . 3 いえない。 2 3 . 2 3 7 . 8 4 2 . 1 2 8 . 0 芸術・芸能は 41 .5 2 9 . 5 国の違いを 6 41 .5 3 0 . 8 超えて普遍だ。 3 5 . 7 3 3 . 5 4 3 3 . 5 2 8. 余暇の多様化に 伴い、芸術・芸能 3 0 . 9 3 5 . 3 7 の中で衰退するも 3 5 . 1 3 7 . 1 のも出る。 3 6 . 0 3 9 . 8 51 .3 3 8 . 9 これからは、 芸術・芸能は 4 6 . 3 4 3 . 6 8 アマチュアに 4 6 . 5 4 3 . 7 広がってしだ。 4 0 . 1 4 7 . 0 4 4 . 8 4 2 . 2 芸術・芸能では、 教育よりも 4 5 . 0 4 2 . 6 9 才能の方が 3 5 . 7 4 8 . 6 重要である。 3 5 . 2 4 8 . 0 3 9 . 8 4 0 . 6 芸術・芸能は 時代とともに 4 2 . 1 4 0 . 0 10 変化してして 4 0 . 0 4 4 . 6 べきだ。 44目 。 39. 4 第1段 第2因調査 第2段 第3固鯛査 サンプル数 第3段 第4因調査 第4段 第5因調査 日本的なものを 育てて いきたい。 性別 男子学生 2 3 . 9 1 8 . 6 5 5 . 7 2 6 . 6 1 7 . 0 5 3 . 7 .5 5 9 . 8 1 6 . 2 21 .9 31 .5 5 4 . 8 11 .5 1 3 . 8 5 0 . 3 31 48. 4 3 4 . 8 1 2 . 9 2 5 . 9 1 3 . 8 5 3 . 5 2 4 . 8 1 8 . 2 5 2. 4 5 6 . 3 1 5 . 2 2 9 . 5 5 4 . 7 1 4 . 3 3 2 . 0 4 5 . 2 3 7 . 3 1 6 . 0 3 8 . 3 2 2 . 9 38. 4 4 9 . 9 3 3 . 2 1 5 . 5 1 8 . 9 3 9 . 1 4 0 . 1 .4 1 7 . 0 3 9 . 1 41 3 9 . 9 1 4 . 9 41 .3 3 7 . 0 2 7 . 3 3 5 . 1 3 6 . 9 4 0 . 5 2 3 . 9 4 2 3 . 3 3 5 . 8 4 3. 3 9 . 0 2 5. 4 3 7 . 0 4 2 8 . 0 2 9 . 9 3 6. 2 9 . 0 3 6 . 6 2 9 . 7 3 2 . 8 2 7 . 7 3 6 . 6 3 0 . 8 3 2 . 0 3 2 . 6 3 8 . 1 3 4 . 1 3 3. 4 3 3 . 7 3 5 . 5 3 5 . 5 2 7 . 8 3 7 . 1 3 9 . 2 4 0目l 3 8 . 8 2 4 . 2 9 . 7 4 8. 4 3 9 . 3 1 0 . 1 4 2 . 2 4 4 . 3 9 . 8 4 0. 4 4 7 . 1 1 2 . 9 3 6 . 7 4 6 . 8 1 3 . 0 4 7 . 1 3 8. 4 1 2. 4 4 5 . 5 4 0 . 7 1 5 . 7 3 7 . 1 4 5 . 1 1 6 . 8 3 7 . 0 4 5 . 0 1 9 . 6 4 2 . 9 3 5 . 9 1 8 . 0 4 5 . 2 3 5 . 5 1 5. 4 4 3 . 5 3 9 . 3 1 6 . 6 41 .2 4 0 . 5 1 0, 754 第1段 第2回調査 9, 1 1 9 第2段 第3因調査 3, 370 第3段 第4回調査 7, 098 第4段 第5回調査 4 2 5 . 7 1 2. 6 6 . 2 65目5 2 9 . 3 11 .3 1 8 . 8 1 5 . 9 7 0 . 3 1 3 . 7 2 5 . 8 6 4 . 6 3 6 . 0 1 3 . 0 . 7 61 3 8 . 8 11 .5 5 8 . 6 3 2 . 7 1 5. 4 6 4 . 7 29. 4 1 8 . 7 61 .9 4 1 2 . 6 2 9 . 9 5 5. 5 3 . 7 1 2 . 1 3 2 . 0 4 6 . 8 1 6 . 6 3 9 . 6 3 8 . 7 1 9 . 9 4 2 . 2 4 7 . 7 1 6 . 9 3 8 . 7 2 0 . 9 41 .1 4 2 . 3 46目 。 1 9 . 5 3 9 . 3 1 8 . 7 4 9 . 1 40. 4 3 7 . 6 2 5 . 8 3 7 . 9 3 9 . 3 21 .2 3 6 . 9 4 0 . 9 1 7 . 7 3 6 . 7 3 7 . 6 2 0 . 9 3 8 . 6 3 5 . 6 5 0 . 0 2 8 . 0 3 3 . 7 4 7 . 0 2 9 . 3 3 0 . 6 4 5 . 9 2 8 . 9 4 3 9 . 9 3 4 . 5 3 5. 3 2 . 6 20. 4 3 3 . 8 2 9 . 0 2 5 . 7 3 5 . 2 2 3 . 7 3 3 . 2 3 5 . 1 21 .2 31 .7 4 0 . 8 1 2 . 3 5 5. 4 3 8. 4 1 3 . 6 .0 4 2 . 9 51 1 2 . 5 5 2 . 2 4 0 . 6 1 6 . 5 4 4 . 2 4 7 . 0 1 4 . 5 41 .6 4 7 . 5 1 3 . 9 4 4 . 3 4 5 . 0 1 7 . 8 3 4. 4 51 .8 1 8 . 0 3 3 . 6 51 .0 .3 3 5 . 6 4 7 . 2 21 1 9 . 3 3 8 . 5 4 5 . 2 1 7 . 2 3 6 . 7 4 9 . 5 1 8 . 3 3 7 . 6 4 7 . 9 6, 1 0 8 第1段 第2因調査 4, 769 第2段 第3因調査 1 , 600 第3段 第4因調査 3, 673L 第4段 第5回調査 特に, 2002年 の 第 4回 調 査 と 2008年 の 第 5回 調 査 と の 問 で は I v 21 .4 外国から し、しものを 2 3 . 2 取り入れて 1 3 . 8 し 、 けl : f よ し 、 。 9 . 7 2 5 . 3 現代的な 2 9 . 9 感覚を 活かして 1 9 . 9 いきたい。 1 9 . 5 5 7 . 5 テーマや素材は 5 5 . 9 別に日本的な ものにこだわる 4 3 . 8 必要はない。 3 7 . 9 1 3 . 6 芸術振興の 1 6 . 6 ためには、 芸術・芸能家の 1 4 . 7 努力が先決だ。 1 0 . 6 3 6 . 3 芸術・芸能は、 生でなくても 41 .9 十分に 4 5 . 6 鑑賞できる。 40. 4 2 2 . 1 芸術・芸能には、 2 3 . 7 その国民で 2 5 . 2 なければ理解で 2 5 . 6 きない商がある。 4 5 . 8 余暇の時代だか 3 9 . 2 らこそ、今後は 芸術・芸能が . 7 31 発展してして。 2 7 . 5 6 . 2 これからは、 芸術・芸能は 6 . 1 専門家中心の 7 . 2 ものとなってL、 く 。 8 . 8 1 0 . 9 芸術・芸能には、 1 0 . 7 才能よりも 教育の果たす 1 3 . 8 役割が大きい。 1 5 . 3 1 7 . 2 芸術・芸能は 1 6 . 3 時代に迎合する 1 3 . 8 必要はない。 1 4 . 5 4, 480 4, 138 1 , 759 3, 264 1の 「 日 本 的 な も の を 育 て て い き た し 、 」 4 . 5ポ イ ン ト の 増 加 ) に 対 し て 「 外 国 か ら い い は 10. 4 ポ イ ン ト の 増 加 (1996年 の 第 3回 調 査 と 比 較 す る と 1 も の を 取 り 入 れ て い け ば よ し リ は 4, 3ポ イ ン ト の 減 少 (1996年 の 第 3回 調 査 と 比 較 す る と 14, 7ポ イ ン ト の 減 少 ) で , 賛 成 率 も 2002年 の 第 4回 調 査 ま で と 2008年 の 第 5回 調 査 と の 間 で は 逆 転 を し て い る , 3の 「 テ ー マや素材には日本的なものを積極的に取り入れるべきだ」は「テーマや素材は別に日本的なものにこだわる 必要はなし、 J と 比 較 し て 賛 成 率 は ほ ぼ 半 分 で あ る が , 2002年 の 第 4回 調 査 と 2008年 の 第 5回 調 査 と の 間 で は 5 . 1 ポ イ ン ト の 増 加 (1996年 の 第 3回 調 査 と 比 較 す る と 8 . 2ポ イ ン ト の 増 加 ) に 対 し て , r テーマや素材 は 別 に 臼 本 的 な も の に こ だ わ る 必 要 は な い 」 は 6, 9ポ イ ン ト の 減 少 (1996年 の 第 3回 調 査 と 比 較 す る と 18, 0 37
ポイントの減少) J, 6の「芸術・芸能には,その国民でなければ理解できない面がある j は「芸術・芸能 0 0 2年の第 4回調査と 2 0 0 8年の第 5回調査 は国の違いを超えて普遍だJ を賛成率で、は下回ってはいるが, 2 との間で 3 . 1ポイントの増加に対して「芸術・芸能は国の違いを超えて普遍だ」は 5 . 8ポイントの減少を示し ており,日本文化や我が国固有の芸術・芸能への回帰の傾向が読み取れる.また, 2の「古典的なものを守 っていきたしリは, 2 0 0 2年の第 4回調査と 2 0 0 8年の第 5回調査との比較で 3 . 7ポイントの増加 ( 1 9 9 6年の . 1ポイントの増加)に対して「現代的な感覚を活かしていきたいJはl.lポイント 第 3回調査と比較すると 6 の減少 ( 1 9 9 6年の第 3回調査と比較すると 1 0 . 0ポイントの減少)を示している. 以上から,今後の詳細な分析が必要ではあるが, i 我が国の文化や伝統を尊重する態度を育成する観点な どから,小学校から我が国に伝わる楽器を取り上げられるようにするとともに,中学校では 3年間を通じて 1種類以上の和楽器を体験できるようにする J という指導方針を打ち出した学習指導要領の改訂の影響は, 文化・芸術に対する大学生の意識の変化に表れているのではなし、かと考えられる. 芸術・芸能の発展および広がりについては, i 余暇の時代だからこそ,今後は芸術・芸能が発展していく J が1 9 9 6年の第 3回調査までは「余暇の多様化に伴い,芸術・芸能の中で衰退するものも出る Jを賛成率で上 0 0 2年の第 4回調査で逆転しており 回っていたが, 2 iこれからは,芸術・芸能はアマチュアに広がってい く」は賛成率で「これからは,芸術・芸能は専門家中心のものとなっていく」を上回ってはいるものの,賛 成率は低下してきており,学生は芸術・芸能の発展および広がりについて,パブ、ル期と比較して楽観的には 見ていないことが窺える.ただし,芸術・芸能は才能が必要か教育でカバーできるかに関しては, i 芸術・ 芸能では,教育よりも才能の方が重要である」の賛成率が「芸術・芸能には,才能よりも教育の果たす役割 9 9 6年の第 3回調査では 3 2 . 6ポイントも上回っていたのに対して, 2 0 0 8年の第 5回 が大きし、 j の賛成率を 1 8.4ポイントの差に縮まってきており,教育によって芸術・芸能が広がっていく可能性も意識はさ 調査では 1 れているように考えられる. 0 0 2年の第 4回調査の時点 インターネットの普及に伴う視聴覚メディアの革新と発展の影響に関しては, 2 では「芸術・芸能は生でなくても十分に鑑賞できる」が「芸術・芸能は生(ライブ)でなければ鑑賞したと はいえなし、」を 2 3 . 1ポイント上回っていたが, 2 0 0 8年の第 5回調査では 1 5 . 8ポイントの差に絡まってきて いる. 文化・芸術に対する意識の男女聞の差については,表 2から,女子学生の方にどちらともいえないという 中庸の意識が高い傾向が見られる. 4. 文化・芸術に対する意識の構造 次ページの図 2に示したのは, 1 0の質問の聞で作成いたモザイク図行列の一部である.図 2から類推され るように, 1 0の対照的な意見のベアのどちらに賛成するかという回答には,項目聞で関連性があることが示 唆される. , 0 7 4人の学生,表頭に 1 0の対照的な質問への 3 0の回答選択肢 ( 1 0の質問に対して A か そこで,表側に 7 ABか Bのどれか)をとって作成した反応行列に対応分析 ( C o r r e s p o n d e n c eAna l y s i s ) を適用し,同じように 選択される回答選択肢と 1 0の質問に同じような回答をする学生を分類することを試みた. 主成分分析の適用結果は表 3に示す通りであり, 3つの主成分スコアのそれぞれで降順に回答選択肢を並 0の項目について ABの「どちらともいえなしリという中庸の選択肢と Aま べ替えた表から,第 1主成分は 1 たは B の明確な意見表示の選択肢を弁別する軸であり,第 2主成分は 1から 3までの項目で日本的で伝統志 38
Rq四回目円 同 置 州 問 車昆白Z 室見. 0 1 宮医師明 円富岡崎 車昆包 車昆宙 卑見~ h ロ威同時 重 S i l O 1 図 2 文化・芸術の意識を問う質問聞のモザイク図行列の一部 向の A の回答選択肢と外国にも目を向けて現代志向の Bの回答選択肢を弁別する軸,第 3主成分は 8 と 6 と 4と 1 0の Bの回答選択肢と 7の Bおよび 6と 8の A の回答選択肢が両極端に位置しており r 芸術・芸能 は時代に迎合することなく専門家中心でその国の国民でなければ理解できない面があって振興も自助努力で 対応すべき」としづ文化・芸術を突き放して見る見方と「芸術・芸能は国の違いを超えて普遍的で、アマチュ アにも広がっていき発展していく」という楽観的で文化・芸術に寄り添った見方とを弁別する軸であると考 えられる. この対応分析によって得られた第 1主成分と第 2主成分と第 3主成分のサンプルスコアから,性別の各主 . 0 4 2 0, ・0 . 0 0 2 3,0 . 0 5 1 0であり, 成分のサンプルスコアの平均を計算すると,男子学生は第 1主成分から順に 0 . 0 4 3 5,0 . 0 0 6 5, ・0 . 0 6 1 1であり,第 1主成分から女子学生が ABの中庸の回答選択肢を選 一方の女子学生はー0 択する傾向が強いこと,第 2主成分からはほとんど差はないが,女子学生は 1から 3までの項目で A を選択 39
表 3 対応分析の結果 c 1 c 2 c 3 選択肢 01A 0. 42 6 0 . 8 4 1 0 . 1 6 4 0 . 1 2 2 . 3 5 8 一0 . 1 6 7‑ 01AB 一0 0 . 7 4 7一 1 .213 0 . 2 1 3 01B 02A 0 . 5 1 9 1 .064 0 . 1 3 0 0 . 0 2 2 一0 . 0 8 3 02AB 一0. 41 6‑ 0 . 7 4 6 0 . 0 9 4 02B 0 . 5 7 0‑ 03A 0. 44 3 0 . 9 6 9 0 . 0 0 1 0 . 5 8 9 0 03AB ‑ . 0 7 3 一0 . 0 4 0 038 0 . 3 7 2 一0 . 6 1 9 0 . 0 4 2 04A 0 . 3 0 5 0 . 1 6 8 一0 . 3 3 6 . 5 4 8 一0 . 0 9 7 0 . 1 7 6 04AB 一0 . 2 4 9 0 . 5 2 3 0 . 5 7 3 一0 04B 0 . 3 2 8 0. 42 1 一0 . 2 9 6 05A . 5 3 2 0 . 0 6 2 0 . 0 5 4 05A8 一0 0 . 3 2 0 一0 . 3 0 9 0 . 1 2 5 05B . 1 0 6‑ 0 . 6 3 0 06A 0 . 3 1 8 0 . 6 9 9 0 . 0 1 1 0 . 1 4 9 06AB 一0 0 . 1 3 2 0 . 5 7 0 06B 0 . 3 8 8‑ 42 0 0 . 1 6 6 0. 44 2 07A 0. 07AB 一0 . 6 5 5 0 . 0 0 6 0 . 0 5 5 . 2 5 6‑ 0 . 7 4 6 07B 0. 45 2 ー0 0 . 5 5 5 08A 0. 42 0 一0 . 0 4 1‑ . 5 4 3 一0 . 0 0 1 0 . 1 2 0 08AB ー 0 08B 0 . 6 8 0 0 . 1 4 2 1 . 2 8 6 . 0 2 9 0 09A 0. 44 9 0 . 0 7 5 . 0 3 5 . 5 4 3 一0 . 0 2 5 ー0 09AB 一0 09B 0 . 6 0 5 0 . 0 1 3 一0 . 0 5 8 . 2 4 5 10A 0. 45 7 一0 . 0 9 8 ー0 . 6 1 3 0 . 0 6 8 0 . 0 2 6 lOAB 一0 10B 0 . 5 4 9 0 . 0 5 4 0 . 5 0 7 選択肢 c 2 選択肢 c 1 選択肢 c 3 1 .286 018 0 . 7 4 7 02A 1 .064 08B 088 0 . 6 8 0 03A 0 . 9 6 9 06B 0 . 5 7 0 09B 0 . 6 0 5 01A 0 . 8 4 1 04B 0 . 5 2 3 048 0 . 5 7 3 05A 0. 42 1 10B 0 . 5 0 7 028 0 . 5 7 0 04A 0 . 1 6 8 07A 44 2 0. 0 . 5 4 9 07A 10B 0 . 1 6 6 01B 0 . 2 1 3 02A 0 . 5 1 9 08B 0 . 1 4 2 04AB 0 . 1 7 6 0 . 1 0 6 01A 10A 0. 45 7 06A 0 . 1 6 4 07B 0. 45 2 03AB 0 . 0 7 3 06AB 0 . 1 4 9 09A 0. 44 9 10AB 0 . 0 6 8 02A 0 . 1 3 0 03A 0. 44 3 05AB 0 . 0 6 2 05B 0 . 1 2 5 01A 0. 42 6 10B 0 . 0 5 4 08AB 0 . 1 2 0 07A 0. 42 0 09A 0 . 0 2 9 02B 0 . 0 9 4 08A 0. 42 0 098 0 . 0 1 3 09A 0 . 0 7 5 06B 0 . 3 8 8 06AB 0 . 0 1 1 07AB 0 . 0 5 5 03B 0 . 3 7 2 07AB 0 . 0 0 6 05AB 0 . 0 5 4 05A 0 . 3 2 8 08AB 一0 . 0 0 1 03B 0 . 0 4 2 05B 0 . 3 2 0 02AB ‑ 0 . 0 2 2 lOAB 0 . 0 2 6 0 . 0 2 5 03A 06A 0 . 3 1 8 09AB ‑ 0 . 0 0 1 0 . 0 4 1 09AB 一0 04A 0 . 3 0 5 08A ‑ . 0 3 5 0 . 0 9 7 03AB 一0 . 3 5 8 04AB ‑ . 0 4 0 01AB 一0 0. 41 6 10A 一0 02AB ‑ . 0 9 8 09B 一0 . 0 5 8 0 . 0 8 3 05AB 一0 . 5 3 2 06B 一0 . 1 3 2 02AB ‑ 0 . 1 2 2 . 5 4 3 01AB 一0 . 1 6 7 01AB ‑ 08AB 一0 09AB 一0 . 5 4 3 048 一0 . 2 4 9 10A ‑ 0 . 2 4 5 . 5 4 8 078 ‑ 0 . 2 5 6 05A 一0 04AB ー0 . 2 9 6 . 3 0 9 04A ー0 0 . 5 8 9 05B ー 0 . 3 3 6 03AB ‑ . 6 1 3 03B 一0 . 6 1 9 08A 一0 . 5 5 5 lOAB ー0 0 . 6 5 5 02B 一0 07AB ‑ . 7 4 6 06A 一0 . 6 3 0 06AB 一0 0 . 7 4 6 . 6 9 9 018 ‑ 1 .213 07B ‑ する可能性が男子学生よりも高くて日本的で伝統的な芸術・芸能を志向する傾向が見られるのに対して,男 子学生は現代的なものを活かして素材やテーマは日本的なものにはこだわらず,外国からよいものを取り入 れていけばよいという進取の開放的な志向を有している傾向が見られることが示される結果となっている. ただし,第 3主成分からは,女子学生は「芸術・芸能は国の違いを超えて普遍的でアマチュアにも広がって いき発展していく J とし、う楽観的で文化・芸術に寄り添った見方をする傾向がある一方で,男子学生は「芸 術・芸能は時代に迎合することなく専門家中心でその国の国民でなければ理解できない面があって振興も自 助努力で対応すべき j という文化・芸術を突き放して見る見方をする傾向のあることが示唆されている. 5 . 文化・芸術への意識と鑑賞行動との関係 文化・芸術への意識について,クロス集計結果ならびに対応分析を適用して分析を試みたが,文化・芸術 への意識の違いは,実際の文化・芸術の需要行動にも影響を及ぼすはずである. 学生調査では,既述のように実演芸術のライブやメディアによる鍛賞行動や稽古事ならびに主体的芸術活 動の経験を設問しているが,例えば,伝統演劇J I (能,狂言,歌舞伎など)に関しては,項目 1の A の回答選 40
択肢(r日本的なものを育てていきたい j)の回答者群の過去 1年の鑑賞経験率は 5.22%であるのに対して, 項目 1の Bの回答選択肢 c r外国からいいものを取り入れていけばよい )の回答者群の鑑賞経験率は 2.22% j であるというように,鑑賞経験率に及ぼす影響が認められる. 6 . まとめと今後の課題 本研究では. 1 9 9 1年から 2008年にかけて実施した 4回の学生調査のデータに基づき,学生の文化・芸術 に対する意識の現状と変化の一端を明らかにした.しかし,有意抽出による調査のために時系列変化の有無 を検証できないなどの問題がある. 今後は,性別に加えて,学部別や地域別などで分析することでサンプルの偏りができるだけ生じないグル ープ内での時系列比較を行うとともに,対応分析による分析をさらに深めて文化・芸術への意識に基づく学 生の分類を試み,意識が行動にどのように影響するかを分析するなど,研究をさらに発展させていきたい. 謝辞 本研究はこれまで 5回にわたって実施されてきた「学生調査 j ( 第 4回調査までの経緯は周防 [ 6 ]を参照) の研究成果に基づいて行われている.これらの調査に関係された諸先生ならびに回答者である学生の皆さん に感謝申し上げます.また,第 5回調査のデータ入力にあたっては,科学研究費補助金基盤研究 (B) r 周期 統計調査のミクロデータによるコーホート分析一文化需要の実証的研究一 j (課題番号:2 3 3 3 0 0 7 3 . 研究代 表者:勝浦正樹)の助成を受けており,データの整理にあたっては,兵庫県立大学応用情報科学研究科の博 士前期課程の学生であった加藤優希,福永征世,王程,李秋云の諸氏の協力を得ている. 参考文献 [ 1 ]有馬昌宏. r 全国学生調査に基づく実演芸術鑑賞行動の規定要因の分析 j. W2008SASユーザー総会 カデミア/テクノロジー&ソリューションセッション ア 論文集~ .p p . 9 3・ 1 0 2 .2 0 0 8 . r 鑑賞・観覧活動の変化と現状 j . W統計~ .第 64巻第 3号. p p . 2 3・ 2 8 .2 0 1 3 . [ 3 ]有馬昌宏・福永征世・王程. r 学生の実演芸術鑑賞構造とその変化 一学生調査と社会生活基本調査の結 [ 2 ]有馬昌宏. 果から一 j. WSAS ユーザー総会アカデミア/テクノロジー&ソリューションセッション 20 日論文集~ . p p . 1 1 5・1 2 4 .2 0 1 3 . 伊]有馬昌宏. r 学生の芸術鑑賞活動を規定する要因に関する分析 j. W2015SASユーザー総会 ア/テクノロジー&ソリューションセッション 論文集~ .p p . 9 3・ 1 0 2 .2 0 1 5 . [ 5 ]加藤優希・有馬昌宏. r5回の学生調査から探る実演芸術鑑賞行動パターンとその規定要因 ータベースの構築と分析を通して~ j. アカデミ W2010SASユーザー総会 学生調査デ アカデミア/テクノロジー&ソリュー ションセッション論文集~ .p p . 3 8 7 ・ 3 9 5 .2 0 1 0 . [ 6 ]周防節雄(編). W芸術・文化政策立案のための統計指標の開発と体系化に関する研究~ 平成 1 5年度科学研究費補助金(特別研究促進費( 1 ) ) 研究成果報告書) .2 0 0 4 . 41 (平成 1 3年度
[ 7 ]福永征世・有馬昌宏, r 学生の芸術文化鑑賞活動の現状ー第 5回学生調査の 10% 抽出データ分析から‑J, W S A Sユーザー総会アカデミア・テクノロジー&ソリューションセッション泊神戸 2011論文集L p p . 8 1・8 7,2 0 11 . 42
全国消費実態調査の匿名データから見た 食料品目別消費傾向による食生活の変化について 。、池田瑞穂 l, 笹 谷 知 輝2 大 野 嵩 護2 C 京都大学大学院農学研究科, 2関西学院大学) Changesi ne a t i n gH a b i t sbyt h eFoodConsumptionTendency UsingMicroDatao f N a t i o n a lSurveyofFamilyIncomeandE x p e n d i t u r e 2 k e d aJ,TomokiS a s a y a ,ShugoOno2 oMi却 hoI C G r a d u a t eS c h o o lo fA g r i c u l t u r e,KyotoU n i v e r s i t y 2 K w a n s e iGakuinU n i v e r s i t y ) 要旨 全国消費実態調査の匿名データを用いて,調査年毎に魚介類支出に対する「若者の魚離れ」の実態や世帯 属性の影響に関して検証してきた.本稿では,匿名データを用いたデータハンドリング,データ分析,およ び,評価に至るまでについて述べる.そして, SASの SQLプロシジャを用いた例を紹介する. また,等価所得に換算した結果を用いて回帰分析をおこない,これまでの結果と比較した.世帯主の年齢 階級の低い世帯ほど魚介類を消費していないなどの結果を同じく得たことを確認した. キーワード: 匿名データ,全国消費実態調査, SAS, SQLプロシジャ, GLMプロシジャ l はじめに これまで,平成元年, 6年 , 1 1年 , 1 6年の「全国消費実態調査」の匿名データを用いて若者の魚離れJ の 実態を検証してきた [ 1 ].そして,各調査年の世帯主の年齢階級別「魚介類」支出額割合を算出し,他の食 料品目や各調査年のデータ聞を比較したところ,若いころから消費傾向が決まっていると考えられ r 若者 6年 の魚離れ」の対策として若年層からの魚食に関する食育の重要性が高いことを示した.さらに,平成 1 二人以上世帯のデータを用いて世帯主の年齢階級や他の世帯属性が魚介類支出に与える影響を調べるため分 析をおこなった.等価所得に換算したデータを用い先行研究 [ 2 ]との回帰分析結果の比較をおこなったとこ 3大都市圏在住世帯 j が負の値に転じたが,魚介類支出に対しての考察の影 ろ,等価所得を用いることで r 響は殆どないことを確認した. 匠名データを用いたデータ分析にあたり,データハンドリング部分が後に続くデータ分析に大きな影響を 与えると考えた.そこで,データ準備の手法とデータハンドリング時に用いた SASの SQLプロシジャのプ ログラムを紹介する 2 匿名データを用いたデータハンドリング 匿名データは集計用乗率を用いるためデータ量が 2 0万件を超えるほど膨大となり,データ解析の際,時 聞がかなりかかることが予想された.そこで,コンビュータ環境の整備に要するコストとデータ分析をおこ なう時間の削減のため,対象とするデータを絞り込むこととした. 43
2 .1 変 数 の 絞 り 込 み と 共 通 変 数 の 作 成 匿名データに関する「符号表Jが統計センターの Webサイトに公開されている.コンビュータ環境の制約 や,解析をおこなう時間などのコスト削減のため,平成 1 6年二人以上世帯の符号表を基にあらかじめ今回の 研究に必要と予測した変数を 1 , 7 8 0変数(約 995MB,集計用乗率計算前)から 1 7 0変数(約 32MB,集計用乗 率計算前)に絞り込んだ. 2 .1 .1 共通変数テープ、ルの作成 分析対象とした全国消費実態調査二人以上世帯 4年分の変数の番号や項目名は調査年によって異なってい 6年の変数をもとに共通変数を作成し,他の調査年と共通する変数のマッピングをおこなっ た.そこで平成 1 た.調査年によっては存在しない項目があるが,本研究では 4年分閉じ変数にマッピングできた共通変数を 用いている.表 lに共通変数とマッピングした変数の一部を示す.平成 1 6年のデータの変数は, V0025の次 がV 0 0 3 8であるように連続していない.そこで, SASのデータ読み込みの処理の簡便さのためにできるだけ 連続する値となるようにソートなどの処理をおこなった.これらの処理により,調査年をマクロ変数に指定 するだけで,各調査年に対して同じプログラムを用いてデータの加工,および,検証をおこなうことができ た. 2 .1 .2 データの階層構造の変換 匿名データは,データ属性「階層 J の 1~4 で構造が表現されている.また,共通変数の項目名は「世帯票 一世帯員に関する事項(1)一世帯員番号」のように階層ごとに一(アンダースコア)で名称が区切られており, 階層が一目でわかるようになっている.本研究でのデータ分析では最下位階層の名を利用するため,その簡 便性から,階層別に項目名を分け共通変数テープ、ルに追加した(表1). 2 .1 .3 新しいテーブ、ルの生成 s vファイルとして保存した.これらのテーブルをデー 共通変数テーブルと符号表(データ部のみ)は全て c タセットとして取り込んだ後, SQLプロシジャを用いてデータ加工や複数のファイルを結合し,新しいデー タセットを作成する方法を用いた. 図 2のプログラムは本研究で用いる基本のステートメントである.マクロ macronmの引数である d s iはデ ータの参照元のデータセットであり, d s oは新たに作成するデータの出力先のデータセットである.マクロ中 ではマクロ変数 &dsi,&dsoとして扱われる. 図 3の例に示すように,データセット間の結合をおこなった結果を,新規に作成したデータセットに格納し, データ分析に利用した.変数「共通変数」を含むデータセット & d s i lに各調査年のデータセット &dsi2を左 外部結合し,その結果をデータセット &dsoに格納する例である.ここで d il .c v a rは,データセット & d s i l( 別 名d i l ) に存在する変数 c v 釘とし、う意味である. s e l e c t文の直後に, r 共通変数」と「変数名」を指定してい るのでそれらが最初にデータセット &dsi2に格納される. & d s i lの変数と &dsi2の変数の等価を条件として左外部結合 ( l e f t j o i n ) を行っている.この場合, & d s i lに 存在する変数「共通変数j に対応する &dsi2の変数がない場合, & d s i lのデータはそのまま保存され,対応す る&dsi2の変数欄は空欄となる.左外部結合以外の場合,条件を満足するデータがない場合,抽出する値が変 わる. 44
邑
V0072
V0133
・
・
V0147
V0391
・
・
・'
3 ・・・・今3 令4
4aayaT a
守a
守
令
︐
.
︐s's's'S 司
弓 令
s・
・
・
・'
3S
S's‑3‑s‑3's's's'3 ・
w116
w1
l7
V0017
vω18
V0020
V0021
V0023
V0025
V0028
V0043
V0044
V0045
V0046
V0047
V0048
V0049
V曲 5
0
V0052
V0053
V0054
V仰 5
5
VOOS6
V0057
V0058
H H E ‑ ‑司
︐
.
世 帯 粟 世 帯 員 に 関 す る 事 項 何 各種学校・塾など
用途
調査月数
年﹂
wl02
噌
世 帯 票 世 待 員 に 関 す る 事 項{
η 世帯員番号
・附附・
w45
:‑m
世帯察世書署員に闘する事項:(2) :各種学校・盤など
守
世帯築
ゐ
・
・
3 .
s ︐
.︐
.
.
.︐
骨
骨
︐‑
S's'3'3 ‑
:・・句 4 aaaTaaTaa a
'S 令
3‑s's‑s'S S's‑s‑s‑3 句
‑
‑
3.
︐
令
・
・
・
・
t
wl1
w12
w13
w14
wlS
w16
w17
w18
wl'
w20
w21
w22
w23
w24
w25
w26
w27
w28
w2'
w30
w31
w32
vvvvvvvvvvvvvvvvvvvvvv
世帯票世帯人員
世帯票設業人員
不在理由
支える人
世帯票世帯員以外の家族
その他の人
入院
世帯粟世帯員以外の家族
その他の人
学業
世帯票世帯署員以外の家族
その他
その他の人
世帯慕世帯員以外の家族
世帯票単身世裕の形態
世帯粟世帯事員に関する事項(1) 世帯員番号
1
) 続柄
世 帯 票 世 帯 民 に 関 す る 事 項(
J
世帯票世帯事員に関する事項(1)性>>I
世幣票世干官民に関する事項(
1
) 年鈴5歳階級
1
) 年齢各歳 (
1
5歳未満のみ)
世 帯 票 世 常 員 に 闘 す る 事 項(
世帯言葉世帯民に関する事項(
1
) 歳業・非就業の別
世帯粟世帯持員に関する事項(1) 企業区分
1
) 企業規僕
世 帯 票 世 帯 周 に 関 す る 事 項(
世帯粟世事情員に関する事項(1) 産業符号
世 俗 票 世 帯 員 に 関 す る 事 項(
1
) 職業符号
世帯票世宇野員に関する事項(1) 国公立・私立の別
世帯害緊世帯員に関する事項(1) 学校の種類
世帯票世帯員に関する事項(1)専修学校
1
) 各種学校・塾など
世 帯 票 世 帯 員 に 関 す る 事 項(
(
2
) 世帯員番号
世 帯 票 世帯員に関する事項.
共通変数
停
3
制⁝艶・・附側側制限⁝鵬附附州側州側附附州側仰附馴附則::附
2
必
宅
一
・
・
階層別項目~
1
ωnヨ
表 1 共通変数と各調査年の変数とのマッピング
.•
(
1
) options obs=100;
(
2
) options firstobs=I,
OOOobs=l,
0
0
1,
0
0
0
;1
*対象を 1,000'"'‑'101,000オブザベーションとする *
1
図 1 テスト対象のオプザベーションの指定
45
データセヅ卜&ds
i
か弓取得したデータを
データセ'yト&ds
i
o に格納する.
m
a
c
r
o
̲
n
m
(
d
s
i
,偽0
)
;
珂I
;
c
r
田 t
e也 b
l
e
&
血o
as
l
興 ぽ t
1
*ごちs
に記述された変重量を&出oに繍観する .*
1
1
*犠納する変教はコンマ区切りで列挙する. r
球』の場合,すべての変数が対象となる. *
1
f
r
o
m&dsi
a
sd
i
1 1
*データ取得元のデータセット, as以降は&dsiの別名であり省略してよい.り
*
図 2 SQLプロシジャの基本ステートメント
1
*
‑
‑
‑
‑
‑
‑
‑
一一一一一一一一一一一一一一一一一一一一一一一
データセ ν ト&出i
1と&dsi
2を左外部結合した結果を
i
o に縞織する.
データセvト&ds
一一一一一一一一一一一一一一一一一一一一一一一一一一一ーペ
臨調 a此~mmon_va柑i1, d
s
i
2
,曲,);
p
r
o
c珂 I
;
c
r
田 t
e匂 b
l
e&
d
!
:
抱a
s
担 l
e
c
t
1
*α'ar:持直変数, var変 数 り
d
i
1
.
α
'
a
r
,d
i
l
.
v
a
r
*
1
*その他全ての&出i
lの変数,その他すべての&出i
2の変数り
from&
由:
i
a
s
d
i
l
l
e
f
t
j
o
i
n也 i
2a
s
d
i
2 1
*左外部結合は結合時にテーブル&由iの全データカt
保持される *
1
ond
i
l
.
v
a
r
=
d
i
2
.
v
a
r
; 戸条件:籍合するデータセ v卜の変教が等しいり
図 3 データセット間の結合例
i一
一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一
データセ vト&ds
i
の
断しそ¢燦揮を新しい変数に格納する
条件を満たすかどう力明l
条件を満たすデータを描出し
データセ'y卜&出i
o に格納する.
一一一一一一一一一一一一一一一一一一一一一一一一一一‑
‑
‑
‑
*
1
臨調剖」抽(也i:,卸);
p
r
田 町I;
α田 t
e包 b
l
e&d田 a
s
担│田t
而(
(w399>=4
,
∞0,
0
0
0
)
,
1
刈 酪 伺9
一間百刊
1
*w399:年間収入 *
1
,
i
陀((同ゆn(
同 7
6)=1,'
a
','
b
'
)asf
l
g
̲
s
y
o
同 yo 1
*w078:職業符号 *
1
1
*w3!明,W07怠~~快q汗--9 *
1
,
*
from&
出i
whe
陪 l
a
y
e
r
=
l
;
1
*階層が1と 等 し い り
図 4 データの抽出例
46
図 4はデータセット &dsiに対して条件を満足したデータを抽出するステートメントの例である. s e 1 e c tに続 000 , 000以上の場合 lを,条件を満足しない場合 Oがおで指定し くステートメントにおいて,変数 w399が 4, l g ̲ n e n s y uに格納される.変数 w076の文字の長さが lの時文字 Y を,条件を満足しない場合文 ている変数 f b 'が 変 数 f l g ̲ s y o u g y oに格納される. i f nの戻り値は数値であり, i f cは文字である. 字' 2 . 2 対象とするオブザベーションの指定 SASプログラムを実行する際,オブザベーションの調整を図った. ( 1 ) まず, 1 調査年を対象とし,プログラムのテスト用に数 10~10,000 オブザベーションに絞り込み,動作 確認をおこなった(図 1(1)).回帰分析等においては約 1 0 0, 000オプザベーションを対象にさまざまな分 析をおこない傾向を見た. ( 2 ) データ対象の開始オプザベーションやオブザベーション数を変更し同じ分析をおこなった(図 1( 2 ) ) . それぞれの結果を対比しずれが大きくないことを確認しつつ,さまざまな分析をおこなった. ( 3 ) 最後に全オプザベーションを対象にデータ分析をおこなった. 3 データ分析の目的と手法 世帯主の年齢階級を 1 2階級に分類し,家族形態,在住地域の観点から世帯属性の魚介類支出やその他の支 出への影響を採った.家族形態による比較分析として, 歳未満)の有無J.および, r 年間収入 J ,r 共働きか否か J ,r 世帯主の子供 ( 2 0 r 家族形態に 65歳以上の世帯員の存在の有無」による比較分析をおこなった. 3 . 1 分析の対象データ 匿名データをもとに加工した「世帯主の実子とその親等で構成される世帯J, r 未成年のいない世帯」と, 両者を併せたものを基に回帰分析をおこなった.本稿では等価所得に換算した値を用いた(式(1)).食料支 3 ]に倣い世帯構成の違いを考慮するだけでなく, 出は,森 [ r エネルギーの食事摂取基準:推定エネルギー必 要量J [ 4 ] に基づいて,男性の 20歳から 49歳(以下,成人男性)を l としたときの各世帯員の重みを 作り,世帯ごとの重みの合計値で支出額を割ることで,その世帯の成人男性一人あたりの消費量を算出した. 世帯の年間収入 J /s q r t (r 世帯人員 J) 等価所得= r ( 1 ) 3 . 2 食料支出に関する分析 3 . 2 . 1 魚介類支出に関して 被説明変数は,成人男性で換算された魚介類支出額とし,世帯属性が魚介類消費に与える影響について GLMプロシジャを用いて回帰分析をおこなった.説明変数の定義を表 2 に示す. 使用したモデルは式 ( 2 ) のとおりである. f i s h ;=βlannuaUncome;+s2 I e m a l e ̲ i n c o m e ;+s 3 a g ri ̲ / ' is h ̲ i n c o m e ;+s 4 o v e r 6 5 ;+s 5 u r b a n i ̲h e a d ;+β7 c h i l d r e n i+s s t ωo ̲ i n c 刀m es;+s g a g r i ̲ f i s h ̲ i n c o m e ixu r b a n i +s6a ge g e̲he a d ;xu r b a n ;+βl l a g e̲he a dixc h i l d r e n ;+fi. +slOa ( 2 ) a g r if i s hi n c o m exu r b a nは「農林漁業収入有世帯J と r 3大都市圏在住世帯J,ageheadxurbanは「世帯主 年齢階級」と r 3大都市圏在住世帯J,ageheadx childrenは「世帯主年齢階級」と「実子を含む世帯」の交 互作用項である. 47
表 2変数説明 変数名 定義 a n n u a lincome(年間収入) 世帯の年間収入(万円) f e m a l eincome(女性収入) 世帯主が女の収入+配偶者が女の収入(万円) a g r if i s hi n c o m e 農林漁業収入があれば l (農林漁業収入有世帯,ダミー変数) o v e r 6 5( 6 5歳以上を含む世帯,ダミー変数) 6 5歳以上の世帯人員がし、れば l u r b a n( 3大都市圏在住世帯,ダミー変数) 3大都市圏に住んでいれば l a g eh e a d(世帯主年齢階級) 世帯主年齢階級 ( 1 2階級) c h i l d r e n(実子を含む世帯,ダミー変数) 世帯主の子ども ( 2 0歳未満かっ未婚)がいれば l twoi n c o m e s(共働きである世帯,ダミー変数) 世帯主と配偶者の双方が収入を得ていれば l ※女性収入は月あたりの金額である 表 3 推計結果魚介類支出(平成 1 6年) 説明変数 推定値 t統計量 a n n u a lincome(年間収入) 2 . 0 6 8 6 2 . 8 4 f e m a l eincome(女性収入) 0 . 0 0 ‑ 1 0 0. 39 a g r if i s hincome(農林漁業収入有世帯,ダミー変数) ‑ 1 1 2 . 0 1 ‑ 1 5. 56 o v e r 6 5( 6 5歳以上を含む世帯,ダミー変数) 1 1 7 . 6 2 91 .2 1 u r b a n( 3大都市圏在住世帯,ダミー変数) ‑ 1 8 . 5 3 ‑ 4. 7 6 a g eh e a d(世帯主年齢階級) 8 8 . 5 3 1 2 0 0 . 2 twoi n c o m e s(共働きである世帯,ダミー変数) ‑ 2 2 0 . 6 6 ‑ 1 5 4. 4 6 c h i l d r e n(実子を含む世帯,ダミー変数) 1 2 5 4 . 5 6 2 2 0 . 1 2 a g r if i s hincomexu r b a n ‑ 1 5 9 . 7 1 ‑ 9 . 0 8 a g eheadxu r b a n ‑ 1 . 38 ‑ 1 9 . 6 8 a g eh e a dxc h i l d r e n ‑ 4 5 . 7 0 ‑ 3 8 9 . 3 4 ー1 7 6 4 . 0 5 ‑ 3 9 6 . 8 5 I n t e r c e p t 決定係数 0 . 2 9 9 サンプル数 24, 618, 205 3.3 分 析 結 果 3 . 3 .1 魚介類支出の分析結果 魚介類支出に対しておこなった回帰分析の推計結果を表 3に示す r 3大都市圏在住世帯 j 以外の変数の t統計量は十分に大きな値を示しており,統計的に意味のあるものと考えられる. r 年 間 収 入 J, r 6 5歳以上の世帯員を含む世帯 J, r 世帯主年齢階級 J, r 実子を含む世帯」 は正の影響を, r 農林漁業収入有世帯 J ,r 共働きである世帯」は負の影響を,それぞれ魚介類支出に与えてい 推計結果によると, 48
ることがわかる. 等価所得を用いることで r 3大都市圏在住世帯 Jが負の値に転じた.それ以外の結果は先 行研究 [ 2 ]と同じである. 3大都市圏在住世帯 Jの交差項より,在住地域の影響は殆ど 表 3の推計結果から「世帯主年齢階級J と r なく,世帯主の年齢に依存した魚介類支出が行われていることがわかった.年齢の高い世帯員を含む世帯は そうでない世帯よりも多くの支出を行っているが,外食は少なく,また,共働き世帯は魚介類の消費量が少 ない. 世帯主年齢階級による,魚介類支出の変化を見るため,実子を含む世帯,成人のみの世帯別に,以下の式 ( 3 ),( 4 )を導出した . agehead ,c h i l d r e n,ageheadxc h i l d r e n以外は,平均値を代入している. 実子を含む世 f i s h 巾 I d r e n l= ‑ 8 6 6 . 3 9+4 2 . 1 4xa gehea d . ( 3 ) 成人のみ世帯 f i s h i l d l 酬。=‑35.80+8 7 . 8 5xa gehea d . c帯 h ( 4 ) この式のグラフ(図 5 ) において世帯主が 20歳代の世帯では,実子の存在は魚介類支出にほとんど影響が なく,実子を含む世帯の方が魚介類支出の増加量が少ないことを示している. 3.3.2 他の食料品目を用いた分析結果 3 肉類,野菜・海藻を被説明変数とした回帰分析の推計結果を表 4に示す.肉類において「年間収入 J, r r 世帯主年齢階級 J ,は正の推定値となり r 農林漁業収入有世帯 J ,r 6 5歳以上の世帯員 を含む世帯 J, r 実子を含む世帯 J, r 共働きである世帯J の推定値は負の値をとった. 大都市圏在住世帯J, 8 . 0 0 0 , 0 0 0 7 ∞ , 魚 6 o 1 1 " 5脚 支 4, 刷 。 ∞ , 出 3 日加。 ~ 1 , 000 。 , ∞ 由 。 ー1 5 1 0 1 5 2 1 2 5 3 03 5 40 4 5 5 05 5 6 06 5 7 07 5 8 0 8 5 世帯主年齢階級(歳) ーーー実子を含む世帯 H ・ ・‑成人のみ世帯 H 図 5 子供の有無別にみる魚介類支出の変化量比較(平成 1 6年) 6年) 表 4 推計結果(肉類支出,野菜・海藻支出) (平成 1 肉類 野菜・海藻 説明変数 a n n u a li n c o m e(年間収入) 推定値 1 .4 3 t統計量 8 71 .6 7 推定値 2 . 1 2 t統計量 8 4 0 . 0 4 ‑ 1 2 4 . 5 3 0 . 0 0 ‑ 1 5 2 . 2 0 . 0 0 a g r if i s hi n c o m e(農林漁業収入有世帯,ダミー変数) ‑ 5 7 . 6 4 ‑ 11 .6 3 ‑ 9 9 . 6 6 ー o v e r 6 5( 6 5歳以上を含む世帯,ダミー変数) ‑ 3 0 0. 46 ‑ 3 3 8 . 5 9 1 0 6 . 0 7 7 7. 48 f e m a l ei n c o m e(女性収入) 4 9 1 3 . 0 4
ま urban( 3大都市圏在住世帯,ダミー変数) た, 野 菜 a g eh e a d(世帯主年齢階級) ‑ 4 6 5 . 6 4 ‑ 1 7 3 . 6 4 ‑ 3 2 8 . 1 4 ‑ 7 9 . 3 2 1 5. 31 .6 6 301 95. 18 1 2 1 5 . 5 5 twoi n c o m e s(共働きである世帯,ダミー変数) ‑ 1 3 4 . 7 4 0 7 ‑ 1 3 7. ‑ 4 4 3 . 0 0 ‑ 2 9 2 . 1 2 c h i l d r e n(実子を含む世帯,ダミー変数) ‑ 1 2 2 . 5 3 .24 ‑ 31 1 9 8 3 . 7 5 3 2 7 . 8 8 a g r if i s hincomexu r b a n ‑ 2 1 9 . 8 7 ‑ 1 8 . 1 6 6 8 . 3 0 3 . 6 6 1 4 . 6 6 3 0 4 . 3 8 1 3 . 8 3 1 8 6 . 0 5 a g eh e a dxu r b a n 海 a g eh e a dxc h i l d r e n 藻 m t e r c e p t 1 1 .7 4 ‑ 6 3. 46 ‑ 5 0 9 . 2 3 414. 58 ‑ 1 3 3 6 . 2 2 ‑ 2 8 3 . 1 7 0 . 0 8 4 4 決定係数 お 0 . 9 5 1 2 6 8 . 1 3 0 . 3 3 3 1 24, 618, 205 サンプル数 いて, i 年間収入 J ,i 世帯主年齢階級」は正の推定値となり, i 6 5歳以上の世帯員を含む世帯 J, i 農林漁業収 入有世帯 J ,i 実子を含む世帯 J ,i 共働きである世帯」の推定値は負の値をとった.魚介類と同様に,等価所 得を用いることで i 3大都市圏在住世帯」が負の値に転じた.それ以外の結果は先行研究[ 2 ]と同じである. 「実子を含む世帯」では,魚介類と同様に,肉類,野菜・海藻支出がその他の世帯よりも少ないことがわか った. 4 まとめ 本稿では,匿名データに対するデータハンドリングの効率の良い手法を紹介した.コンヒ。ュータ環境や作 業時間のコスト削減のためにおこなったものである.変数抽出作業をおこなうことで,データ分析対象や目 的,手法を試行錯誤することができたと考えている. 子どもの食育に影響する世帯属性を検討した.一般的に用いられる等価所得を用いて計算を行ったところ i 3大都市圏在住世帯Jのみ先行研究[ 2 ]では正の値であったが,負の値に転じた. 本分析ではいずれの回帰分析においても決定係数は大きい値を示さなかった.そこで.他の決定要因や経 , 1 1 年による世帯属性の影響などをさらに探求する必要がある.ただし,今回利用したのは平成元年, 6年 年 , 16年の全国消費実態調査であり,最も新しいデータでも平成 16年である.平成 28年現在に至るまでの 1 2年,社会経済状況はめまぐるしく変化している.平成 22年をピークに日本の総人口は減少に転じ,今後 ますます減少すると予測されている.また世帯数の増加から核家族化が進行している.また,人口の東京一 5 ] . 極集中が加速している.世帯主の高齢化が進行している.人口に関してだけでも大幅な変化が生じている [ 高齢者対象の宅配,ネットショッピング・電子マネーなどの ICT利活用の浸透 [ 6 ],コンビニエンスストアの 普及など,消費生活のスタイルは大幅に変化している.この聞の食品の消費活動を言及するには, 現在, 平成 26年のデータを入手できるオーダーメイド集計を利用することで,より最近の傾向を見ることが可能と なると考える. 謝辞 本研究を遂行するにあたり, r 匿名データ」をご提供いただいた独立行政法人統計センタ一様,ご支援をいただいた S A S l n s t i t u t eJ a p a n株式会社様に感謝いたします. 50
参考文献 [ 1 ]池田瑞穂,笹谷知輝,大野嵩護:世代別魚介類消費の推移に関する考察,公的統計のミクロデータ等を用いた研究の 3‑ ‑ 9( 2 0 1 4 ) . 新展開(平成 26年度)報告要旨集, pp. [ 2 ]大野寓護,笹谷知輝,池田端穂:食生活から見た食料消費傾向に関する考察ー匿名データを用いてー,公的統計の ミクロデータ等を用いた研究の新展開{平成 27年度)報告要旨集, p p . 1 4 3 ー1 6 2 ( 2 0 1 5 ) . 同森宏:食料消費の年齢・世代効果一文献解題を中心にー:EconomicB u l l e t i nofSenshuU n i v e r s i ザ;Vo . 1 45, Noム p p . 1 1 3 ‑ ‑ 1 3 2( 2 0 1 1 ) . [ 4 ]厚生労働省:食事摂取基準 ( 2 0 0 4 ):坤:内側.抽I w . g o . j p /h oudo u ! 2 0 0 4 / 1 1/h1 1 2 2 ・2 a . h t m l(参照 2 0 1 5 / 1 0 / 18 ) . 同国土交通省:平成 27年度国土交通白書:h t t p : / / w w w . m l i t 伊 . j p /h a k u s y o / m l i t l h 27 血 球u s h o /h 2 8 / p d f 7 n p l0 1 1O O . p d f(参照 2 0 1 6 / 0 6 / 1 8 ) . t t p : / / w w w . s o u m u . g o . j p / j o h o t s u s i n t o k e i / w h i t e p a p e r / ja l h 27 / p d f 7 i n d e x . h t m l ( 参照 [ 6 ]総務省:平成 27年度情報通信白書:h 2 0 1 6 / 0 6 / 1 8 ) . 5 1
匠名データを用いた夫婦共働き世帯における子あり世帯と夫婦のみ 世帯の比較:横断研究 O井 上 貴 博 ¥ 矢 田 徹2 e ノパルテイスファーマ株式会社、 イーピーエス株式会社) 2 C o m p a r i s o n so f t h ed u a l ‑ c a r e e rc o u p l e sw i t hc h i l da n dw i t h o u tc h i l du s i n gTokumeid a t a T o r uYada T a k a h i r oI n o u e, n t e g r a t e dS c i e n c e& O p e r a t i o n sD e p a r t m e n t , N o v a r t i sPharmaK .K . OncologyI S t a t i s t i c sAn a l y s i sDepar 位n e n t1 , EPSC o r p o r a t i o n 要旨 日本で少子高齢化が問題となって久しい。そこで全国消費実態調査の匿名データを用いて、夫婦共働き の子あり世帯と夫婦のみ世帯について世帯主年齢、世帯年収、喫煙率などを比較する。 キーワード:匿名デー夕、全国消費実態調査、少子高齢化、横断研究 1 はじめに 平成 1 7年の国民生活白書 [ 1 ]によると、子どものいない世帯の割合が増加しており、特に 30代におい て 、 「非親族世帯」と「単独世帯」を除く世帯総数に対する「子どものいない世帯」の割合が、 1990 年の 12.1%から 2000 年の 18.6%と大幅に増加している。少子高齢化の要因としては、晩婚化・非婚化 の影響、晩婚化の進展に伴う夫婦の出生力の低下などが指摘されている。夫婦に対する意識調査 [ 2 ] では、子どもを欲しくない夫婦は少ないことがわかっているが、 「子どものいない夫婦Jは子育て に必要な年収を高く見込みすぎている、とも指摘されている。子どもを一人育てるのに最低限必要 な世帯年収について、子どもなしの男性は 714万円であるのに対し、子どもありの男性は 5 9 1万円と 答えており、子どもなしの女性の場合は、 594万円であるのに対し、子どもありの女性は 567万円と 答えている。一方、民間給与実態調査 [ 3 ]によれば、 39 歳以下の給与所得者の男性の平均給与は年442 万円、女性は年283万円であり、合計すれば700万円を超えている。 全国消費実態調査(平成 1 6 年度)から生成された擬似ミクロデータを用いて子どもなしの世帯と子 52
どもありの世帯ではどのような違いがあるのかを調べた先行研究[ 4 ]では、夫婦のみ世帯と一子あり 世帯を比較し、子の有無と世帯主年齢、世帯年収、喫煙有無の聞に関連が見られた。しかしながら、 擬似ミクロデータには含まれないデータもあり、十分な考察が出来なかった。そこで本研究では全 国消費実態調査の匿名データを用いて、夫婦共働きで子どもありの世帯と子どもなしの世帯の比較 を行った。特に子の有無との関連が強し、と考えられる世帯収入については、世帯主(主に男性)と その配偶者(主に女性)別に勤め先収入を比較した。 2 方法 2 . 1全 国 消 費 実 態 調 査 全国消費実態調査は、昭和34 年以来5 年ごとに実施されている国民生活の実態(消費・所得・資産) に係る水準、構造、分布などを明らかにすることを目的とした調査である。平成 1 6年度調査[ 5 ]の標 400世帯(うち単身世帯約5, 000世帯)である。本研究では、二人以上世帯(調査期間9 本数は約59, , . . , ̲ , 1 1月の3か月間)で、世帯票と家計簿(1 か月分以上)の両方が揃っている世帯(平成 1 6年:43, 8 6 1 540世帯、平成6年:44, 6 8 7世帯)に対し匿名化措置を施し、乗率を付与した匿 世帯、平成 1 1年 :44, の場合、収入の中央値を表示しなかった。 名データを用いた。乗率計算前のレコード数が l 集計に際しては、集計用乗率を用いて重み付けした数値を用いた。本研究で対象とする全国消費実 態調査(平成 1 6年度)の世帯数は、匿名データ ( 4 3, 8 6 1世帯)に集計用乗率を用いて算出した25, 268, 1 2 4 027世帯)についても集計用乗率を用 世帯とした。なお、先行研究で用いた擬似ミクロデータ ( 3 2, いて4 9 5, 4 6 5世帯として扱った。 2 . 2抽出条件 表 1 抽出条件 先行研究での抽出条件 (条件 A) 一子+夫婦世帯 夫婦のみ世帯 世帯人員 3名 世帯人員 2名 (有業人員 2名) (有業人員 2名) 介護保険料の支払いなし 世帯主年齢 40歳未満 公的年金給付なし 男・婦人用被服を共に購入 (被服:洋服、シャツ・セータ一類、下着類) 本研究での抽出条件 (条件 B) 一子+夫婦世帯 夫婦のみ世帯 就業世帯主 就業世帯主 +就業配偶者 +就業配偶者 +未婚の子 夫婦とも 40歳未満 先行研究では、擬似ミクロデータを用いて、 40歳未満の夫婦共働き世帯における一子+夫婦世帯と 夫婦のみ世帯の比較を行った。擬似ミクロデータには子どもの有無などの情報が存在しないため、 別の情報を用いて抽出条件を設定し、 40歳未満の夫婦共働き世帯における一子十夫婦世帯と夫婦の 53
み世帯を抽出した。 先行研究での抽出条件(条件A) を用いて、匿名データ(平成 1 6 年度)から 40 歳未満の夫婦共働き 世帯における一子+夫婦世帯と夫婦のみ世帯を抽出し、次いで匿名データ(平成 1 6 年度)に本研究 での抽出条件(条件B) を用いて、 40 歳未満の夫婦共働き世帯における一子+夫婦世帯と夫婦のみ 世帯の抽出を行い、抽出世帯数を比較した。 2 . 3先 行 研 究 と の 比 較 抽出世帯数、世帯主年齢別世帯数、世帯主年齢別・子の年齢別世帯数、世帯主年齢別・喫煙有無別 世帯数について、先行研究と本研究を比較した。 先行研究と本研究(条件B) は、対 1 0万世帯比について、ほぼ一致した(表2 ) 。国勢調査(平成 1 7 年)対 1 0万世帯比の値に比べて、本研究(条件B) の値は低い傾向が見られたが、子の数に対する )。 推移は似た傾向を示した(図 1 世帯数 ( 対1 0万 世帯比) 夫婦 のみ 世帯 一子+ 夫婦 世帯 一子+ 夫婦 世帯 ニ子以 上+夫 婦世帯 全体 表 2 各抽出世帯数 先行 本研究 本研究 国勢調査 研究 (条件 A) (条件 B) ( H I 7 ) 8589 ( 1 7 3 4 ) 308237 ( 12 2 0 ) 439473 ( 1 7 3 9 ) 9 9 2 1 3 1 ( 2 8 6 7 ) 6237 ( 1 2 5 9 ) 256094 ( 10 1 4 ) 365085 ( 1 4 4 5 ) 703814 ( 2 0 3 4 ) 548564 ( 2 1 7 1 ) 972792 ( 2 8 1 1) 1 7 5 7 7 7 ( 6 9 6 ) 299866 ( 8 6 7 ) F ・・ 図1 対1 0万世帯比の比較 5000 ー+ー先行研究 ) ‑0‑本研究(条件A ) ‑0ー本研究(条件B ・ ・. x ・・国勢調査 4000 3000 2000 1000 。 夫婦のみ 一子 二子 三子以上 495465 25268124 25268124 34605447 次に、世帯主年齢ごとに、先行研究と本研究(条件B) の世帯数を比較した(表3 )。 表 3 世帯主年齢ごとの世帯数 本研究(条件B) 先行研究 世帯数(%) 夫婦のみ 一子+夫婦 夫婦のみ 世帯主 一子+ ニ子以上 一子+ 世帯 世帯 夫婦世帯 夫婦世帯 +夫婦 年齢 世帯 世帯 6237 439473 365085 548564 全体 8589 1 7 5 7 7 7 24 歳以下 74 1 9 4 1 5 4 1 0 1 2 1 9 1 4 1 0 1 270 ( 0 . 9 ) ( 3 . 1 ) ( 3 . 3 ) ( 0 . 2 ) ( 3 . 5 ) ( 0 . 8 ) 1 1 2 9 1 3 8 7 5 7 62656 45154 6499 25""29 歳 2825 ( 3 2 . 9 ) ( 1 8 . 1) ( 3 1 . 6 ) ̲ ( 1 7 ) ) ( 8 . 2 ) ( 3 . 7 ) 3584 2 8 9 1 1 6 8 5 3 9 1 5 7 7 0 4 167244 50699 30""34 歳 .7 ) ( 4 3 . 2 ) ( 3 0 . 5 ) ( 2 8 . 8 ) ( 41 ( 4 6. 3 ) ( 3 8. 4 ) 2106 2024 1 1 6 7 6 6 1 3 2 5 3 5 332065 118309 35""39歳 ( 2 6 . 6 ) ( 3 6 . 3 ) ( 6 0 . 5 ) ( 6 7 . 3 ) ( 2 4 . 5 ) 4 ) ( 3 2. ' E i圭ロ+ 1528899 3 1 9 7 1 ( 2 . 1 ) 253067 ( 1 6 . 6 ) 544186 ( 3 5 . 6 ) 699675 ( 4 5 . 8 ) 夫婦のみ世帯と一子+夫婦世帯の世帯主年齢の分布は、先行研究と本研究(条件B) で同様の傾向 54
が見られた。また、本研究(条件B) と国勢調査(平成 1 7年)は、子の数ごとの世帯主年齢の分布 [ 6 ]について同様の傾向が見られた。 表 3 世帯主年齢ごとの世帯数(続き) 世帯数(%) 世帯主 夫婦のみ 年齢 世帯 全体 24歳以下 25""29歳 30""34 歳 35""39歳 992131 38076 ( 3 . 8 ) 258527 ( 2 6 . 1) 409518 (41]) 286010 ( 2 8 . 8 ) 国勢調査(平成 1 7年) 二子以上 一子+ 一子十 夫婦世帯 夫婦世帯 +夫婦 世帯 703814 972792 535178 26665 9272 1106 ( 0. 4 ) ( 3 . 8 ) ( 1 .0 ) 1 5 6 9 1 132149 87996 ( 9 . 0 ) ( 18 . 8 ) ( 5. 2 ) 320709 83134 279345 ( 3 9 . 7 ) ( 3 3 . 0 ) ( 2 7 . 7 ) 265655 554815 199935 ( 3 7 . 7 ) ( 5 7 . 0 ) ( 6 6 . 7 ) 一子+夫婦世帯について、 合計 先行研究と本研究(条件 A) 、本研究(条件 B) の 3203915 子の年齢について比較し 75119 )。 た(表4 ( 2 . 5 ) 494363 先行研究では給食費なし ( 16 . 7 ) 1092706 (用途学校給食、品目 ( 1 ) ( 3 6 . 8 ) 1306415 I一学校給食、品目 ( 2 ) 一学校 ( 4 4. Q ) 給食のいずれもが 0 ) が未 就学児に対応すると考えたが、本研究(条件A) の給食費なし、ありの世帯数の比に大きな差が生 じた。一方で、本研究(条件A) と本研究(条件 B) については、給食費の有無による世帯数の比 が0""5歳・ 6""14 歳の世帯数の比と近い値となった。また、本研究(条件B) については、国勢調査 (平成 1 7年)の 0""5歳・ 6""1 4歳の世帯数の比 [ 6 ]ともよく一致しており、先行研究の抽出条件が擬 似ミクロデータに対しては適切で、はなかったことが示唆された。 表 4 世帯主年齢ごとの子の年齢(給食費の有無) 本研究(条件B) 先行研究 本研究(条件A ) 世帯数(%) 給食費 給食費 全体 全体 世帯主 全 体 給食費 給食費 0""5歳 6""1 4 歳 年齢 なし あり なし あり 24歳以下 194 194 7986 7986 1 2 1 9 1 1 2 1 9 1 ( 10 0 ) ( 10 0 ) ( 10 0 ) 1129 816 313 42296 39261 3035 62656 60810 1846 25""29歳 ( 9 2 . 8 ) ( 7 . 2 ) ̲ ( 3 . 0 ) ( 7 2. 3 ) Q7 型7 .り . ] J 2891 1309 1 5 8 1 104036 82926 21110 157704 135656 21663 30""34 歳 ( 7 9 . 7 ) ( ( 8 6 . 0 ) 日3 3 ) 2 0. ( 4 5 . 3 ) ( ‑ 7 ) .め 54 2024 50 1 9 7 3 101777 50438 51338 132535 69799 61433 35""39歳 ( 9 7 . 5 ) ( 4 9 . 6 ) ( ( 5 2 . 7 ) 坐旦1 4 ) 5 0. 1 ~ 。 表4 世帯主年齢ごとの子の年齢(給食費の有 盤) (続き) 司 . 国勢調査(平成 1 7年) 世帯数(%) 5歳 全体 世帯主 0""5歳 6""1 4 1 年齢 歳 24 歳以下 26665 26149 486 30 ( 0 . 1 ) ( 1 .8 ) ( 9 8 . 1) 132149 123696 8197 256 25""29歳 ( 6 . 2 ) ( 9 3 . 6 ) ( 0. 2 ) 279345 231029 46853 1 4 6 3 30""34 歳 0 . 5 ) ( 8 2 . 7 ) ( 16 . 8 ) ( 265655 144226 113458 7 9 7 1 35""39歳 3 . 0 ) 4 2 . 7 ) ( 3 ) ( ( 5 4. 。 1 5歳 。。 。 385 ( 0. 2 ) 1 3 0 3 也!)) 世帯喫煙率(タノ〈コを購入している世帯(用途 たばこ、品目 ( 1 ) ーたばこ、品目 ( 2 ) たばこのいず れかに0円超の入力あり)の割合)について、先 )。 行研究と本研究(条件B) を比較した(表 5 世帯喫煙率については、数値は先行研究と大きく 異なり給食費と同様に先行研究での抽出条件が 擬似ミクロデータに対しては適切ではなかった ことが示唆された。夫婦のみ世帯の年齢ごとの世 55
帯喫煙率の推移の形状、一子+夫婦世帯の年齢ごとの世帯喫煙率の推移の形状については、先行研
)。
究と本研究(条件B) で似た傾向を示した(図2
表 5 世帯主年齢ごとの世帯喫煙率
先行研究
本研究(条件B)
喫煙世帯数
i旦)
世帯主年齢
夫婦のみ
夫婦のみ
一子+
世帯
夫婦世帯
世帯
4
6
0
5
(
2
9
.
9
)
4
6
(
6
2
.
2
)
10
0
)
194(
1
9
9
4
(
7
0
.
6
) 9
4
5
(
8
3
.
7
) 5
6
1
4
4
(
4
0
.
5
)
2
2
9
6
(
6
4
.
1
) 2
3
5
5
(
81
.5
) 4
6
8
4
9
(
2
7
.
8
)
1
3
3
8
(
6
3
.
5
) 1554(
76
.
8
) 3
1
0
0
0
(
2
6
.
5
)
24
歳以下
歳
2
5
'
"
'
‑
'
2
9
歳
3
0
'
"
'
‑
'
3
4
3
5
'
"
'
‑
'
3
9歳
二子以上+
一子+
夫婦世帯
夫婦世帯
3
6
8
0
(
8
9
.
8
)
10
0
)
270(
2
5
7
0
6
(
5
6
.
9
) 2
5
3
6
(
3
9
.
0
)
62504(
3
]
.
4
) 25517(50.
3
)
8
7
8
8
8
(
2
6
.
5
) 4
0
9
5
0
(
3
4
.
6
)
図2 世帯主年齢別世帯喫煙率(%)
.
.
旬
100
一子+
夫婦世帯
6
6
1
2
(
5
4
.
2
)
2
8
9
3
7
(
4
6
.
2
)
(36.
3
)
5
7
3
11
4
0
9
1
7
(
3
0
.
9
)
、 唱'ーーーーーーーーーー
・ー
一‑
ーーーー一‑‑ー
80
@
‑
ー
ー
60
̲
‑
‑
‑
‑
D
・
ー
ー
ー
ー
ー
ー
ー
̲
‑
r
.
:
:
:
>
.
ベ9・・・・ーーーーー@
40
20
ー噌ー本研究(条件 B
) 夫婦のみ世帯
-~・先行研究夫婦のみ世帯
・
̲
。ー
・.
.
.
.
・本研焼(条件B
) 一子十夫婦世帯
l
:
J
:
;
‑fi
24
歳以下
25~29歳
30~34歳
35~39歳
3 夫婦共働き世帯における子あり世帯と子なし世帯
3
. 1世 帯 年 収 の 比 較
Median
(Ql,
Q3)
n
世帯主
年齢
先行研究
夫婦のみ
世帯
表 6 世帯年収(万円)
本研究(条件B)
一子+
夫婦世帯
夫婦のみ
世帯
一子+
夫婦世帯
一子+
夫婦世帯
二子以上
十
夫婦世帯
24歳以下
4
1
0
.
2
4
3
8
.
1
2
5
'
"
'
‑
'
2
9歳
563.
4
5
2
8
.
3
歳
3
0
'
"
'
‑
'
3
4
6
6
3
.
6
6
2
2
.
0
3
5
'
"
'
‑
'
3
9歳
773.
3
633.
5
416
480
346
(
4
0
5,
5
9
0
) (
3
1
0,
7
0
1
) (
2
8
3,
3
4
6
)
(
・
)
n=1541
O n=12191
n=41
01
n=270
567
344
510
430
(
4
4
6,
7
5
0
) (
7
7
0
) (
3
5
0,
5
0
2
) (
4
2
3
)
3
0
0,
4
2
0,
n=13757 n=62656
n=4
5154
n=6499
493
660
597
510
8
8
8
) (
4
6
0,
7
7
0
) (
4
3
8,
6
5
1
) (
6
6
7
)
4
1
0,
(
5
0
0,
n=168539 n=157704 n=167244 n=50699
760
648
633
597
,
9
6
4
) (
5
0
0,
8
0
9
) (
5
1
0,
8
1
3
) (
7
7
0
)
(
5
6
0
4
8
2,
n=116766 n=132535 n=332065 n=118309
匿名データで利用できる変数を使った抽出条件(条件B) を用いて、匿名データから抽出した夫婦
56
共働きの夫婦のみ世帯と子あり世帯を用いて比較を行った(表 6
)。
世帯年収については、先行研究と同様に世帯主年齢が上がるほど世帯年収が増える傾向、夫婦のみ
世帯に比べて子あり世帯の世帯年収が低い傾向が見られた。世帯主24歳以下の三子以上+夫婦世帯
については、対象世帯が 270世帯で、乗率を乗じる前のレコード数は lであったため検討から除外し
た。なお、国勢調査(平成 17年)での世帯主24歳以下で夫婦共働きの三子以上の世帯数は、全体の
34605447世帯中 1106世帯で、あった。
3
. 2世 帯 主 年 齢 ・ 世 帯 年 収 ご と の 子 の 数 の 比 較
世帯主年齢・世帯年収ごとに、子の数の割合を示した(表 7
)。
世帯主年齢24歳以下の世帯について、世帯年収400""'600万円の世帯で子なしの割合が高かった。 600
万円以上の世帯では一子ありの割合が高くなるが、二子以上ありの世帯は無かった。 400万円未満
の世帯では子なしの割合が最も低く、一子または二子ありの割合 (76.0%) が高かった。世帯主年
齢 25""'29歳の世帯について、世帯年収が多いほど子なしの割合が高くなる傾向が見られた。世帯年
収に関わらず子なしの割合が最も高かった。世帯主年齢30""'34歳の世帯について、世帯年収 600万
円未満の世帯で二子ありの割合が最も高く、 600""'1000万円の世帯では子なしの割合が最も高かっ
た。世帯主年齢3
5
"
"
'39
歳の世帯について、世帯年収に関わらず二子ありの割合が最も高かった。
表 7 世帯主年齢・世帯年収ごとの子の数
世帯年収(万円)
世帯数(%)
く4
00
800=
1000=
1200=<
400=
600=
世帯主 子の数
く6
00
く8
00
く1
0
0
0
く1
2
0
0
年齢
6
3
1
7
1
2
3
7
4
1
3
2
8
0
24歳以 全体
6
6
6
(
4
2
.
2
)
下
なし
2970(
2
4
.
0
) 三神宮毛:[1主:;ø~L: 2
人
l
l調
聖書制盗事, ~, 3236(24.
4
)
一蕗量館勤
2人
4
1
0
1
(
3
3
.
1
)
2
7
0
(
2
.
0
)
3人以上
25~29
1
0
2
9
7
1
5
0
8
4
8
29750
1
1
7
1
6
全体
57782
歳
噂璽事事二坑4
) 193~)(6:S.Öj, ,主甑函}
なし
~~飽き{頭高 ~L 詞塑型52,~i
1
人
1
4
8
2
1(
2
5.
6
) 2
4
2
3
9
(
2
3
.
5
)
1
2
2
4
3
(
2
4
.
1) 9
5
2
7
(
3
2
.
0
) 1
8
2
6(
15
.
6
)
1
7
8
5
0
(
3
0
.
9
) 2
2
7
3
0
(
2
2
.
1)
3
6
7
4
(
7
.
2
)
9
0
0
(
3
.
0
)
2人
1
6
2
2
(1
.6
)
6
5
2
(1
.3
)
3人以上
4
2
2
6
(
7
.
3
)
30~34
全体
7
9
0
8
3
217956
1
2
3
0
2
4
7
3
7
8
5
34148
1
6
1
5
2
0
8
6
8
(
2
3
.
3) ,
歳
1
7
7
7
2
(
2
2
.
5
) 5
13
.
9
)
なし
.̲徴主質事進鋭 L~1~甥~~,;溺L五 占強靭震範~.. 2245(
人
2
2
9
6
6
(
2
9
.
0
) 5
6
1
5
2
(
2
5
.
8
)
4
2
0
6
7
(
3
4
.
2
) 1
8
3
6
8
(
2
4
.
9
) 1
l
4
) :-(~m5,8C4~:g~ '.~
1
3
9
2
(
3
3.
2人
4
)
1
4
5
2
5(
19
.
7
) 4
1
5
7
(
1
2
.
2
) 6
4
9
7
(
4
0
.
2
)
0
.
4
1 27560(22.
掛き壁説主['7$,塑塑4
1
1
9
1
1
(
1
5.
1
) 2
2
9
0
3
(1
0
.
5
)
1
1
0
5
9
(
9
.
0
)
3
5
4
4
(
4
.
8
)
6
3
0
(1
.8
)
6
5
2
(
4
.
0
)
3人以上
2
1
3
1
3
5
35~39
全体
63218
223250
1
1
0
9
0
9
58970
30194
歳
7
8
9
7
(
1
2
.
5
)
2
6
6
9
5
(
1
2
.
0
)
3
5
9
0
1(
16
.
8
) 2
2
1
4
9
(
2
0
.
0
) 1
6
6
6
8
(
2
8
.
3) 7
4
5
6
(
2
4
.
7
)
なし
人
1
7
2
1
5
(
2
7
.
2
) 42532(
1
5
5
0
1(
1
4
.
0
) 1
5
3
7
5
(
2
6
.
1
) 4927(
l
19
.
1
)
3
6
9
8
5(
17
.
4
)
16
.
3
)
2人
緬 品 、~'~Y3$S(5f:7i仁 理想地:41~~) • ~li~-998~4Øll f
1_4.~t~(鶏;i~) I.J@'76 '1(~(持$.~} ら邸時2
3人以上
1
3
5
9
0
(
21
.
5
) 4
6
4
0
8
(
2
0
.
8
)
2
9
9
2
3
(
1
4
.
0
) 1
5
9
0
1(
14
.
3
) 6
7
7
4
(
11
.5
) 5
7
1
3
(
1
8
.
9
)
(網掛け:世帯主年齢・世帯年収三 (
:
1
=
宣言も割合の高いセノレ一、空欄は対象世帯なL‑)
l
3
. 3喫 煙 有 無 別 ・ 世 帯 主 年 齢 別 ・ 世 帯 年 収 別 の 世 帯 あ た り の 子 の 数 の 比 較
57
喫煙世帯と非喫煙世帯別に、世帯あたりの子の数を計算した(表 8 ) 。計算にあたって、子の数が3 人以上の世帯について子の数を 3 人とみなし、各カテゴリ内の子の数の総和を世帯数で除して算出 した。 表 8 喫煙有無別・世帯主年齢別・世帯年収別の世帯あたりの子の数 人以上を示す) は1.5 全体的に喫煙世帯の方が世帯あたり子の人数が多くなる傾向が見られたが、世帯主年齢が 30 代後半 0 0 0万円以上で非喫煙世帯の方が世帯あたり子の人数が多かった。 の層では世帯年収400万円未満と 1 また、世帯年数4 00万円未満では、喫煙有無・世帯主年齢に関わらず世帯あたりの子の数が l 人以上 歳代前半の世帯では、世帯年収 8 00万円以上 1 0 0 0万円未満の世帯で、世 であった。世帯主年齢が 30 帯あたりの子の数が少なくなる傾向が見られた。 非喫煙世帯で世帯あたりの子の数が1.5人以上であったのは世帯主年齢が 30 歳代後半にしか見られ なかったのに対し、喫煙世帯では 3 0歳代前半でも世帯あたりの子の数が1.5人以上である層があった。 3 . 4世 帯 主 年 齢 別 の 世 帯 主 及 び 世 帯 主 の 配 偶 者 の 勤 め 先 収 入 の 比 較 世帯主と配偶者のそれぞれについて勤め先収入(月収)を集計し、比較した(表 9 )。 表 9 世帯主及び世帯主の配偶者の勤め先収入(月収(千円)) 配偶者の勤め先収入 Median 世帯主の勤め先収入 ( Q l, Q3) 世 帯 主 夫婦のみ 一子+夫 一子+夫 二子以上 夫婦のみ 一子+夫 一子+夫 二子以上 世帯 婦世帯 婦世帯 婦世帯 +夫婦世 世帯 婦世帯 年齢 +夫婦世 帯 帯 257 24歳 以 2 7 1 216 1 6 4 3 7 9 1 140 , 2 5 2 ) ( 2 1 0 , 2 5 7 ) ( 9 9, 1 7 3 ) ( 0, 1 0 2 ) 下 ( 2 0 8, 2 7 5 ) ( 9 1) ( 2 3, ( ・ ) ( ー ) 25~29 2 8 5 264 252 2 6 3 1 4 6 1 0 4 49 70 2 2 5, 歳 3 1 8 ) ( 2 1 0, 3 2 3 ) ( 2 2 2, 2 7 9 ) ( 6 3, 2 4 2 ) ( 6 2, 2 2 7 ) ( 1 7, 9 0 ) ( 3 3, 8 6 ) ( 1 8 3, 3 2 8 ) ( 30~34 304 277 1 4 6 3 1 2 298 9 3 6 3 6 0 2 4 4, 3 6 0 ) ( 2 3 3, 3 5 3 ) ( 2 0 1, 3 5 1 ) ( 7 1, 2 6 0 ) ( 2 8, 2 2 3 ) ( 歳 ( 2 5 0, 3 7 7 ) ( 16, 1 2 6 ) ( 3 3, 9 7 ) I 3 5~39 3 3 5 3 4 3 1 0 8 7 3 3 5 8 356 7 5 6 0 ( 2 8 3, 4 3 3 ) ( 2 3 7, 43 3 ) ( 2 4 9, 4 2 0 ) ( 3 9, 2 5 6 ) ( 6, 1 8 2 ) ( 2 4, 1 4 1 ) ( 0, 1 1 3 ) 歳 4 27 ) ( 2 7 9, 世帯主の勤め先収入は世帯主年齢に依存する傾向が見られ、配偶者の収入は子の数に依存する傾向 58
が見られた。特に配偶者の収入が、夫婦のみ世帯と子あり世帯で大きく異なっていた。配偶者の就 0 )。 業形態について、配偶者がパートである世帯の割合を計算した(表 1 0 配偶者のパートの世帯数(割合) 表1 世帯数(%) 本研究(条件B) 世 帯 主 年 夫 婦 の み 一 子 + 夫 一子+夫 二子以上 齢 世帯 婦世帯 婦世帯 +夫婦世 帯 1 5 7 8 0 1 325728 93809 全体 1 4 4 2 1 0 4 ) ( 5 3. ( 3 5 . 9 ) ( 3 9 . 5 ) 4 ) ( 5 9. 24歳以下 3073 4193 1 7 6 2 270 ( 2 0 . 0 ) ( 4 3 . 0 ) 4 ) ( 3 4. ( l Q Q ) 53296 1 7 4 9 0 1 0 0 6 29965 25""29歳 ( 2 7 . 9 ) ( 15 . 5 ) 4 ) 4 ) ( 3 8. ( 6 6. 66218 30852 93288 59633 30""34歳 ( 4 2 . 0 ) ( 6 0 . 9 ) ( 5 5 . 8 ) 4 ) ( 3 5. 61682 200714 41797 56310 35""39歳 ( 5 2 . 1) ( 3 5 . 8 ) ( 4 2 . 5 ) ( 6 0. 4 ) 配偶者がパートである世帯の割合は、 世帯主年齢の影響よりも子の数による 影響が大きかった。特に二子以上の世 帯の 50%""60%で配偶者がパートだっ た。次に世帯主の配偶者を対象として パート以外の就業とパート別に勤め先 1)。パートの月 収入を計算した(表 1 収については、子の数による影響があ まり見られなかった。パート以外の就 業での月収については、子の数に比例して減る傾向が見られた。いずれの場合も、世帯主の月収の ように世帯主年齢に比例して月収が増加する傾向はあまり見られなかった。 表1 1 パート・パート以外別世帯主の配偶者の勤め先収入(月収(千円)) ノミート Median ノfート以外の就業 ( Q l, Q3) 世 帯 主 夫婦のみ 一子+夫 一子+夫 ニ子以上 夫婦のみ 一子+夫 一子+夫 婦世帯 婦世帯 年齢 世帯 婦世帯 +夫婦世 世帯 婦世帯 帯 24歳 以 8 8 49 23 1 7 0 ( ‑) 0, 1 0 2 ) ( 8 4, 1 6 6 ) ( 3 7, 8 0 ) ( 2 3, 3 0 ) 下 ̲ { l39, 2 0 4 ) ( 1 6 2 8 7 49 212 69 67 66 25""29 6 2, 歳 2 5 8 ) ( 0, 1 9 7 ) ( 3 3, 8 6 ) ( 4 4, 1 1 0 ) ( 4 3, 8 8 ) ( 2 5, 8 5 ) ( 15 2, 2 7 2 ) ( 1 9 9 1 3 7 8 2 8 1 2 2 5 67 5 7 30""34 ( 0, 2 6 3 ) ( 0, 1 9 1 ) ( 0, 歳 2 8 7 ) 1 0 3 ) ( 2 9, 9 4 ) ( 2 6, 8 3 ) 5 3, ( 13 3, 2 8 3 ) ( 1 5 0 72 202 1 3 0 5 5 68 35""39 ( 0, 2 7 2 ) 0, 2 5 6 ) 2 0 1) ( 3 7, 1 0 1 ) ( 2 8, 8 2 ) ( 0, 歳 ( 4 1, 3 0 3 ) ( 8 9 ) ( 3 9, 。 。 二子以上 +夫婦世 帯 ( ー ) 7 2 ( 7 1, 9 0 ) 5 8 8 2 ) ( 3 7, 69 ( 3 4, 8 7 ) 表1 2 調査年度ごとの配偶者の勤め先収入(月収(千円)) 本研究(条件B) Median( Q l, Q3) 夫 婦 の み 世 一 子 + 夫 婦 一子+夫婦 調査年度 世帯主 二子以上+ 帯 世帯 年齢 世帯 夫婦世帯 1 2 5( 7 0, 1 9 2 ) 60( 3 5, 1 3 9 ) 24歳以下 1 9 9 4年 ー ( ・ ) 1 9 9 9年 1 0 8( 7 7, 1 7 7 ) 7 7( 2 3, 1 2 4 ) 1 5 6( 5 7, 1 6 0 ) ー ( ‑) 2004 年 1 6 4( 9 9 )7 3 ) 3' 9 1( 2 3, 9 1 ) 回 ( ・ ) U ( ) ,1 0 1 1 1 9 9 4年 1 4 4( 6 7, 2 2 3 ) 6 8( 17 , 1 7 7 ) 7 1( 0, 1 1 4 ) 4 1( 2 1, 6 4 ) 25""29歳 1 9 9 9年 1 7 3( 77, 2 3 0 ) 90( 18 , 2 1 0 ) 5 3( 2 1, 1 0 3 ) 6 7 ) 5 3( 0, 1 4 6( 6 3, 2 4 2 ) 1 2 2 7 ) 70( 17, 9 0 ) 49( 3 3, 8 6 ) 0 4( 6 2, 2 0 0 4年 1 9 9 4 年 1 4 4( 71 , 2 4 3 ) 8 1( 2 8, 2 2 6 ) 56( 0, 1 2 0 ) 56( 0, 8 8 ) 30""34歳 1 9 9 9年 1 6 4( 6 8, 2 5 3 ) 9 9( 3 2, 2 3 4 ) 69( 2 8, 1 4 1 ) 5 3( 0, 8 7 ) 1 4 6( 7 1, 2 6 0 ) 9 3( 2 8, 2 2 3 ) 6 2 0 0 4年 60( 3 3, 9 7 ) 16, 1 2 ̲ Q ) 3( 5 9( 0, 1 9 9 4 年 1 2 2 ) 58( 0, 9 4 ) 35""39歳 1 3 1( 5 1, 2 1 2 ) 7 3( 0, 1771 1 9 9 9年 1( 2 5, 2 2 6 ) 64( 1 5, 1 2 7 ) 1 0 7( 4 9, 2491 7 1 0 5 ) 59( 0, 2 0 0 4年 1 0 8( 3 9, 2 5 6 ) 7 5( 6, 1 8 2 ) 7 3( 2 4, 1 4 1 ) 60(0, 1 1 3 ) 59
配偶者の勤め先収入について、 5 年前(平成 1 1年 ( 1 9 9 9 年) )及び 1 0 年前(平成6 年 ( 1 9 9 4 年) )と 2 )。 比較した(表 1 5歳以上の子あり世帯について、 1 9 9 4 年から 2 0 0 4 年までの聞に配偶者の勤め先収入がや 世帯主年齢2 や増える傾向が見られた。 4 考察 喫煙有無、給食費有無については、擬似ミクロデータを用いた先行研究と異なる結果が見られた。 先行研究では、タバコ購入費、給食費が O円であるか否かで有無を判定する方法を用いたが、擬似 化の処理によって、実データで、は0円で、あった世帯が擬似ミクロデータ上では0より大きい値をとっ たことが原因であると考える。 世帯主年齢と世帯年収については、先行研究と同様に子の数との関連が見られた。世帯年収に関し 0 0万"‑'1 0 0 0万円の層で子の数が少なく、それより ては、世帯年収と子の数が比例せず、世帯年収 6 世帯年収が低い層と高い層で子の数が多くなる傾向が見られた。高収入層で子の数が多いのは、育 児に対して経済的な懸念が少ないという因果関係が考えられる一方、低収入層で子の数が多いのは、 子の数が多いために収入が少ないという高収入層とは逆の因果関係も考えられる。世帯主の勤め先 収入を見ると、子の数の影響は少なく世帯主年齢にほぼ比例しているが、配偶者の勤め先収入は子 の有無による影響が大きかった。配偶者の就業形態を見ると、子あり世帯でパートである割合が高 いことから、出産に伴い配偶者(多くは女性)の就業形態がパートに変わり、その結果として世帯 収入を下げているのではないか、と考える。また、パート以外の就業で、あっても配偶者の勤め先収 入は世帯主のように年齢に比例して上がっていく傾向があまり見られず、子の数に比例して勤め先 収入が減る傾向にあることから、配偶者はパート以外の就業で、あっても育児のために十分な就業時 聞が取れず、結果として収入を得られないのではないか、と考える。 9 9 4 年 、 1 9 9 9年 、 2 0 0 4 年の経時的な変化を見ると、子あり世帯につい 配偶者の勤め先収入について 1 てはわずかながら改善傾向があるように見えるが、夫婦のみ世帯ではあまり変化が見られない。 1 9 9 4 年 、 1 9 9 9 年については就業形態のデータが取られていないため、この傾向が配偶者の就業環境 によるものか、あるいはパートの割合が減ったことによるものかはわからなかった。 参考文献 [ 1 ]平成 1 7 年版国民生活白書「子育て世代の意識と生活」 章 結 婚 ・ 出 生 行 動 の 変 化 第l 節最近の出生率低下の要因 第l h t t p : / / w w w 5 . c a o . g o . j p / s e i k a t s u ! w h i t e p a p e r /h1 7 / 0 1 ̲ h o n p e n l h t m l ! h m 0 1 0 1 0 0 0 1 . h 加 1 >(参照: く 60
2 0 1 6・0 6 ‑ 1 3 ) [ 2 ] 平成 1 7 年版国民生活白書「子育て世代の意識と生活J 第1 章 結 婚 ・ 出 生 行 動 の 変 化 第3 節子どもを持つという選択 < h t t p : / / w w w 5 . c a o . g o 担/ s e i k a t s u/ w h i t e p a p e r /h1 7 / 01 ̲ h o n p e n l h t m l l h m O1 0 3 0 0 0 2 . h t m 1 >(参照: 2 0 1 6・0 6 ・1 3 ) <h 句: / / w w w 5 . c a o . g o伊/ s e i k a t s u/ w h i t e p a p e r /h1 7 / 0 1 ̲ h o n p e n l h t m l l h m O1 0 3 0 0 0 5. h t m 1 >(参照: 2 0 1 60 6 ‑ 1 3 ) ・ [ 3 ] 民間給与実態統計調査「長期時系列データ J 3‑10 1 年勤続者の年齢階層別給与所得者数・給与総額・平均給与(男、女、合計) < h t 恥: / / w w w . n t a . g o 担l/ko h y o / t o k ei / k o k u z e i c h o / ji k e i r e t s u/ O1 ̲ 0 2 . h t m > ( 参照:2 016・06 ・1 6 ) [ 4 ]40 歳未満の夫婦共働き世帯における一子あり世帯と子どもなし世帯の比較:横断研究 WSASユーザー総会2 0 1 5論文集』、 p p 6 1 0・ 6 1 5 [ 5 ]平成 1 6 年全国消費実態調査の概要 [ 6 ]平成 1 7年国勢調査新分類区分による遡及集計 第 1表 世帯の家族類型 ( 2 2区分)別一般世帯数及び一般世帯人員 (3世代世帯,母子世帯及 び父子世帯一特掲) 一 全国,都道府県,市町村 第1 0表 夫の年齢 (5歳階級),子供の有無・数・年齢 ( 1 2 1区分),夫婦の就業・非就業 ( 4 区分)別夫婦のいる一般世帯数及び一般世帯人員(雇用者一特掲) 一 全国 <h 句: / / w w w . e ‑ s t a . tg o . j p / S Gl I e s t a t / G L 0 8 0 2 0 1 0 3 . d o ? ̲ t o G L 0 8 0 2 0 103̲ & t c l a s s I D = O O O O O1 0 3 10 7 6 & c y c 1 e e= O & r e q u e s t S e n d e r = s e a r c h >(参照:2 0 1 6・0 6 ・1 3 ) Cod 2 0 1 5 )全国消費実態調査の匿名データとその符号表から自動的に SASのデータセッ [ 7 ]周防節雄 ( ト、変数ラベルと変数フォーマットを作成する SASプログラム WSASユーザー総会 2 0 1 5論文集』、 p p 2 5 7・ 2 7 8 謝辞 全国消費実態調査の匿名データの利用に便宜を図って頂いた(独)統計センター、代理人となり費 用を負担して頂いた SASI n s t i t u t eJ a p a n 株式会社に感謝の意を表します。また、本研究に際して、匿 名データを自動的に SASデータ化するプログラムを快く提供して頂いた兵庫県立大学周防節雄先 生に感謝の意を表します。 61
匿名データを用いたコメ離れと食事づくりの簡素化についての検証 中松建 (株式会社タクミインフォメーションテクノロジー、医薬品開発事業 1 部) S t u d yo fr e l a t i o n s h i p sb e t w e e ns h i f to ft h ep r e f e r e n c ef o rr i c ea n df a s t e rm e a lp r e p a r a t i o n w i t ha n o n y m i z e dd a t a K e nN a k a m a t s u T a k u m iI n f o r m a t i o nT e c h n o l o g yI n c . 要旨 昨年のミクロデータ分析コンテストにおいて行った、コメ離れと食事づくりの簡素化についての分析 結果を、匿名データを用いて検証した。匿名データに含まれている項目がコメの消費量のうちどの程度 を占めているかを確認し、各世帯についてコメ離れと考えられるか分類を試みた。コメ離れと考えられ る世帯では、外食や清涼飲料等のすぐに飲食が可能な項目が食料費に占める割合が高く、また手間のか かる項目への支出および食料費全体の支出は低くなっていることから、食への関心が低いことが考えら れた。昨年の分析結果と匿名データによる分析結果は比較的近かったことから、擬似ミクロデータによ る分析は予備的分析として有用であった。 キーワード:ミクロデータ分析匿名データコメ離れ 1.はじめに 昨年のミクロデータ分析コンテストにおいて、コメ離れと食事づくりの簡素化について分析を行った。分 析結果からはコメへの支出が減少することによって外食や調理済み食品への支出が増えていると考えられた。 また世帯主の年齢が低いほど、コメ離れの状態と考えられる世帯の割合は大きくなっていたが、食料費に占 める外食および弁当・調理食品等の中食の割合は、コメを一定量以上消費していると考えられる世帯と大き な差はなく、食事づくりの簡素化はコメ離れの強い要因とはなっていないと考えられた。 これまでにコメの消費に関して、農林水産省により w e bアンケート調査による消費者意向の把握や、大規 1 ]。この結果から「食事を短時間で済ませたい J r 調 模家計データからの消費動向の把握が試みられている [ 理や片づけの時間を省きたし、」といったことが、パンやめん類を主食に選ぶ際の理由になっていることが報 告されている。 しかし、コメを消費している世帯と消費していない世帯の比較や、食料費の他の項目との関係についてな どは着目されておらず、またこれまでの研究・報告は多くないことから昨年の分析結果を実証することは有 用であると考えられた。 6年全国消費実態調査の結果をもとに生成された、擬似ミクロデータを用いて行った。 昨年の分析は平成 1 擬似ミクロデータは平均や相関などの特性をなるべく維持してつくられているが、データ作成時の情報の損 62
失により、分析結果は実際のデータを用いた結果とは異なることも考えられるため、平成 1 6年全国消費実態 調査の匿名データ(以下、匿名データ)を用いて分析結果の検証を行った。 2 . 使用する変数および基準の検討 匿名データには、擬似ミクロデータに含まれない「単身世帯 J r 2人以上の勤労世帯ではない世帯」が含 .食事スタイルの変化が起きにくく、得ら まれている。本研究では1.擬似ミクロデータに結果の検証を行う 2 れる結果が特に有用、という 2点から対象は 2人以上の勤労世帯とした。また各集計は集計用乗率を用いて 行った。 擬似ミクロデータではコメへの支出金額が 0であった世帯の割合は1.聞であったが、上記の対象とした世 帯ではおよそ 2 4 .1 %であった。そのため現物支出および外食、中食が消費量に占める割合の算出を試み、流 通先の割合 [ 2 ]と比較し、妥当性を検証した。 2 . 1現物支出 コメの生産者はコメへの支出が 0になると考えられる。生産者 と考えられるのは農業を仕事とする世帯員を含み、食料の現物支 〆 ; 反 ,。 出がある世帯である。コメへの支出が 0であった世帯のうち前の 〆 条件に該当したのは国程度であったことから、調査対象となった 二 ケ 〆 ? 〆 世帯干には生産者による消費はほとんど含まれないと考えられた。 ; 7 % / . < ' 〆 〆 ' / " . . . . / ,. / . . . " / . i シ 三 5 : 川 与 , f 予 f 贈答用や仕送りによるコメへの支出額は品目分類と用途分類 ノ ノ 久 の差により算出が可能であり、品目分類におけるコメへの支出の 分宇ノ:緑錐議議 ) . Q ' j i . およそ聞であった。 現金の支出の伴わない他の無償譲渡は、食料品への現物支出 と交際費のうちの食料費との差が、食料品の無償譲渡と近くな 7 %であった。 ると考えられる。この金額は現物支出のうちおよそ 1 このうちおよそ 2 / 3程度をコメと仮定すると贈答等との合計は 図 1推測されたコメの入手・摂取経路の割合 各支出は重量に換算 外食費と加工品による消費量は流通量より 推測 怖となり、これは流通量からの推測とも 6 コメへの支出のおよそ 1 1 近いことから、食料品の現物支出に占めるコメの割合はおよそ 1 5 協であり、コメの消費量のおよそ l 慨を占めていると考えられた。 2 . 2外食・中食 昨年の分析ではコメへの支出金額を基準として、各世帯がコメ離れと考えられるかを判定した。しかし世 帯主の年齢が低い世帯では中食や外食の利用が多い傾向があり、コメへの支出は少なくてもコメは消費され ている可能性がある。匿名データでは品目分類の主食的調理食品の項目に、弁当やおにぎり等などコメを主 体とする項目があることから、それぞれの単価と l個あたりに含まれる精白米の重量から消費量を算出した。 9年全国物価統計調査から、 l個あたりに含まれるコメの重量は農林水産省による報告を参考に 単価は平成 1 1 0円・ 45.5gとした。 し、弁当類は 1個あたりそれぞれ 498円・ 95.5g、おにぎり類は 1 外食費はコメを主体とする支出金額の項目がなく、支出がこづかいに含まれていることも考えられること から消費量の推測はむずかしい。これらの推測がむずかしい項目は、流通の割合から消費量の 30%を占めて 63
いると仮定することとした。 2 . 3 コメ離れの基準 野菜では 1日あたり 350gの摂取が目標とされているが、コメの目標値は設定されていない。そのため I人 あたりの消費量の維持を目標とし、コメへの支出と弁当・おにぎり等により消費されたと考えられる量の合 計が 1500g未満であれば、平均的な消費量の半分に満たないことからコメ離れの可能性が高い世帯とした。 世帯員 1人あたり 1500g以上を消費していると考えられる世帯は便宜上コメ消費世帯とし、 1人あたりの消 費量が現物支出を合計した場合に 1500g以上となる世帯は、どちらかに分類しないこととした。また年齢が 低い世帯員は食料品の消費量は少なくなるとことから、 6歳未満の世帯員は 0.5人として扱うこととした。 3 .結果 斜交主成分クラスター分析により、食料費の各項目は調理や準備の手間に関係すると考えられる 3つのク ラスターに分割された(図 2 )。第 lクラスターには野菜や魚介類を含んでおり、調理が必要で手聞のかかる 品目と考えられた。パン、めん類が含まれる第 2クラスターには手間のかからない項目として代表的な外食 費、調理食品が含まれており、調理や準備が不要・または簡単な手聞のかからない項目と考えられた。飲料 は缶・ベットボトル飲料や清涼飲料などを含み、菓子類はすぐに手軽に消費でき、食事を代替することもあ ることから、第 2クラスターに分類されると考えられた。第 3クラスターは乳卵類と他の穀類であり、これ らは調理される場合・されない場合のどちらも考えられることから、第 1クラスターと第 2クラスターの中 間的なものであると考えられた。 以上から、主食がコメからパンやめん類となる頻度が増えることによって、調理や準備に手間のかからな い項目への支出は増えることが考えられた。 擬似ミクロデータによる結果と比べると説明率は 0 . 4 6 9と低くなったが、食料費の各項目はほぼ同様のク ラスターに分割された。 ト 一後~宣 国 糧 J : t . ! 1 > 寝 めん 乳初 トー 他の融冊・ 勉鴎・凪除斜 一 野 l I t . 図 2食料費の各項目の分類 ト一一 上から第 2クラスター第 3クラスター 魚介副 コ 1 . 0 0. 8 0 . 6 0 . 4 説明され畠分散の比率 64 第 1クラスター
‑概観いい Illi‑‑?2 筋 蔵崎 聞額一日一一川崎司川!??2 川 凄 断 P . 0 0 0 1*事 < . 0 0 0 1専 権 * 一必 .賜トトトB U B ‑ hllLJt ]g ‑A 凋勾弓 聾 三1 0 6 6 4 5 8 3' f ﹃ 守 叫 6827 守 ﹃ Eon ョ︒ o n u az‑n6n6rコ nU 咽 A F コ anunU 噌ム︒o pコ 向 ︒ 必斗 出円 ‑nwdn 4 'nwd ' n u︑ 3 マ'2Jnu i ・ ヨ'nヨw ' '''' ' ''''' d‑nu 咽ム一司4︑ 3 E J 守' n ヨ nu ﹃ム司4 ト ー 咽 ム 咽 ム 司 ム 噌 ム 咽 ム 噌 ム 噌4 4 司 4 4 コ 吋 ︐ ι 咽 ム 噌 よ 咽 ム 咽 ム 咽 ム 咽4 ヲ‑ 'oonwdn ヨ nu 守 it‑264008701583 引川 ‑EO 寸冴‑守' nヨ 吋 コ 守 ︐ ︒ ︒ マ ' n U 凋 崎 ︒o n U ︽ヨ﹁4 ヨ r コ nur コ ro ︒o r コ rO 凋 出国岨‑ E o n aTnwJFコ p‑ コ 年齢区分 20‑24歳 25‑29歳 30‑34歳 35‑39歳 40‑44歳 45‑49歳 50‑54歳 55‑59歳 60‑64歳 65‑69歳 70‑74歳 75‑79歳 ﹄出 表 1手聞のかかる項目に対する 1人あたりの支出 i 考えられる世帯が多い傾向は同じであった。 コメ消費 ・白 なっているが、世帯主の年齢が低い世帯ほどコメ離れと ・闘機パハけ 汁 川 川 一 一 一 一 斗 ωt ・ データの結果と比較すると年齢区分による差は小さく 制緩蹄枇 多くはコメ離れの状態であると考えられた。擬似ミクロ EBEE 5a3司2 1 1 1 1 i 部程度であることから、分類していない世帯の るのは l ・・・聞綴綴岨己主 宮川(人一路t 鈎 怠 f 支 fH Ill1iitpilli‑‑‑JM 物 れまでに報告されているが、現物消費のうちコメが占め 門 川 l 十一宮 tm鹿 1 1 1 1 1一初t m怠 償譲渡によってコメを入手する割合が大きいことがこ 押川 の年齢が低いほど大きくなっていた。年齢が低いほど無 ・・・朝繍繍 . 1 i e J E t M島 制 閣 HHHHHH れ引いけ J Fい い い け 斗 年 目 と考えられる世帯の割合は小さくなっていた(固め。ま た分類に現物支出の内訳が必要な世帯の割合も、世帯主 賜 務 問 ハ ハ ハ 一 一 一 ハ パ パ す t .. 低いほど大きく、反対に一定量以上コメを消費している ・・・・・聞級協綴綴醐醐一お t羽島コ 園 Ill11111111111lili‑‑‑ i f ‑ ‑ m訓tM鼠 コメ離れと考えられる世帯の割合は世帯主の年齢が 図 3各年齢区分のコメの消費状態による割合 食事づくりの簡素化という点から、 1人あたりの消費に 手間のかかる項目とかからない項目への支出の合計を算出 し、各年齢区分で比較した。項目の分類には斜交主成分ク ラスター分析による分類の結果を参考に、手間のかからな < . 0 0 0 1* * * い項目には外食、中食に加えて菓子類と飲料のうち茶飲料、 < . 0 0 0 1紳 事 コーヒー飲料などすぐに消費可能なものとした。手間のか < . 0 0 0 1紳 事 < . 0 0 0 1帥 * かる項目は穀類(パン・めん類を含む)、魚介類、肉類、乳 < . 0 0 0 1判 事 < . 0 0 0 1材 申 < . 0 0 0 1柿 * 0 . 4 3 4 0 . 8 6 0 0 . 8 6 0 卵類、野菜類、果物類、油脂・調味料類と、飲料のうち茶葉 やコーヒー豆などのすぐに消費できないものを使用した。 その結果、コメ離れと考えられる世帯では手間のかかる 項目への支出額が少なくなっており、世帯主の年齢区分が 64歳以下の世帯において支出額に有意な差が見られた(表 単位:円 1 )。手間のかからない項目への支出は、 どちらも同じ程度 穀類似ン晶ん題を吉む}、魚介類、肉類、乳卵類、野菜 類、果物類、油脂・調味料類、飲料(茶葉目コーヒー豆町み} の金額であり有意な差はなかった。そのためコメ離れと考 えられる世帯では食料費への支出が少なく、またそのなか p値 は T検定(W e l c h )のあと h o l mの方法によって修正 * 切 で 有 意 幹1 唱で有意柿*<1. 1弛で有意 では手間のかかる項目への支出が比較的高い割合となって いた。そのため、世帯は食に対して時間と費用のどちらも かけない傾向があると考えられた。 3 .まとめ 匿名データでは各世帯におけるコメの消費量のうちおよそ 6割をとらえることができ、食料品の現物支出 を加味することにより、コメ離れの状態と考えられる世帯を抽出することができた。 コメ離れと考えられる世帯では、弁当・惣菜などの中食や外食の利用に加えて菓子類や清涼飲料等の調理 や準備に手聞がかからず、すぐに飲食が可能な項目への支出の割合が比較的高くなっていた。また調理や準 備に手間のかかる項目への支出を含む食料費全体の支出ははっきりと少なくなっていた。前回の分析では手 65
聞のかからない項目の占める割合に大きな差はなかったことから、食事づくりの簡素化はコメ離れの強い要 因ではないと推察した。しかし、食料費に占める割合ではなく支出額に着目したところ、コメ離れの状態と 考えられた世帯は食に対し、時間と費用のどちらもかけない傾向があった。以上より食事づくりの簡素化と コメ離れの聞には強い関係があると考えられた。 匿名データによる結果と擬似ミクロデータによって得られた結果はおおむね一致しており、予備的分析と して擬似ミクロデータを使用した分析は有用であった。しかし独自の基準により新たにカテゴリーを作成す る際に、使用する変数の分布が対数分布と大きく異なる可能性がある場合は結果の差が大きくなることが考 えられることから、分析結果の解釈には注意が必要であると考えられた。 匿名データは分析に使用できる項目が多くさまざまな分析が可能な反面、申請にかかる時間や費用から利 用までのハードルは低くない。擬似ミクロデータはファイルの読み込みゃ分析に用いるプログラム作成、ソ フトウェアの操作等の準備に用いるだけでなく、分析方法や内容についてもある程度検討することができる ため、匿名データの利用環境とともにこうしたデータも整備されることを期待する。 謝辞 匿名データの提供依頼申出は一橋大学経済研究所附属社会科学統計情報研究センター・ミクロデータ分析セ クションに行い、平成 2 8年度一橋大学経済研究所共同利用・共同研究拠点政府統計匿名データ利用促進プロ グラムによる助成を頂きました。データの貸与にあたっては多大なお世話をいただいたことを、厚くお礼申 し上げます。 参考文献 [ 1 ] 農林水産省「主食用米消費動向の中期的変化及び要因分析 J h t t p : / / w w w . m a f f . g o . j p / j / s e i s a n / k o k u m o t u / s y o u h i ̲ d o u k o u . h t m l [ 2 ] 農林水産省「米流通をめぐる状況」 h t t p : / / w w w . m a f f . g o . j p / j / s t u d y / r y u t u ̲ s y s t e m / O l / p d f / d a t a 8 . p d f [ 3 ]周防 ( 2 0 1 5 ) r 全国消費実態調査の匿名データから S A Sのリレーショナルデータベースを完全自動構築す るシステムの開発 Jh t t p : / / m i g h t y . g k . u ‑ h y o g o . a c . j p / c o n f i d e n t i a l / s u o h ̲ z e n s h o ̲ t o k u m e i . h t m l *匿名データの読み込みについて 匿名データの読み込みは周防 ( 2 0 1 5 ) により公開されているプログラム [ 3 ]を用い、あわせて動作の検証と 利便性を高めるためのプログラムの作成を行った。 1動作の検証 既知の問題である rWARNING:記号参照 CHKVNAMEを展開していません」という警告は以下の変更に より解消された。 r a n s f o r m . s a s104行目 対象プログラム:t 66
変更前:programCode="if&chkVname=', thend e l e t e ;r u n ; "; 変更後:programCode='if&chkVname=""thend e l e t e ;r u n ; ' ; また p r o ci m p o r tによる読み込みがうまくし、かない場合、 c s v形式で保存し以下の部分を変更することで、 その後の処理が実行可能となった。 u r o ̲ r e a d ̲ z e n s h o ̲ t o k u m e i . s a s1 5行自 対象プログラム a 変更前: p r o ci m p o r to u t = z e n s h o . z e n s h o ̲ f u g o h y o & y e a r .一 世F ̲ T d a t a f i l e = " & f u g o h y o ̲ p a t h¥&year ¥t o k u m e i ̲ z e n & H ̲ y e a r .一& w h i c h .. x l s " d b m s = e x c e lr e p l a c巴 ; g e t n a m e s = n o ; 符号表; s h e e t = r u n, 変更後: d a t az e n s h o . z e n s h o ̲ f u g o h y o & y e a r . ̲ & F ̲ T; l e n g t hF l ‑F 1 5$ 2 0 0; 干& year ¥t o k u m e i ̲ z e n & H ̲ y e a r .一& w h i c h . .C S y "d s dmissoyer t e r m s t r=c r l f l r e c l i n f il e" & f u g o h y o ̲ p a t h =3000 ; i n p u tF l ‑F 1 5; r u n, CSV ファイルの読み込みの際に、論理レコード長の指定がないためデフォルトの設定が使用されるが、 SAS9.3以前ではデフォルトの長さが短いため、文字切れを防ぐために以下のコードの追記が必要であった。 uro̲read̲zensho̲tokumei.sas 対象プログラム: autoexec̲zensho̲tokumei または a 追記箇所:a uro̲read̲zensho̲tokumei.sasの実行前または先頭に追記 o p t i o n sl r e c l=32767; また生成されるプログラムのうち、 c s vファイルの読み込みを行うプログラムはパスにマクロ変数が含ま れているため、単体で実行することができない。これは以下の変更によって単体で、実行可能になった。 i .s a s84行目 対象プログラム:auro̲read̲zensho̲tokume 変更前:p r o g r a m ̲ c o d e = 'f i l e n a m ei n X" & t o k u m e i ̲ p a t h 靴 y e a r . z e n s y o u ̲ & F ̲ T . . c s y " ; ', 変更後:p r o g r a m ̲ c o d e 哨u n q u o t e ( 蜘q u o t e ( ' f i l e n a m ei n X" & t o k u m e i ̲ p a t hぬ y e a r . z e n s y o u ̲ & F ̲ T . . c s y " ; ' ) ) ; 2 追加プログラム 生成されるデータはコード表に沿ったものであるため、コード表およびデータが 0埋めをされていない変 数はコード表の意図したとおりに並ばない。またフォーマットは生成されたプログラムを実行することで作 成できるが、データセットへの設定が必要である。そのため作成されたフォーマットより 0埋めが必要な変 67
数を判定して 0埋めを行い、フォーマットを設定するプログラムを作成した。 1 * 処理内容:ライプラリ Zenshoにある指定された年の各データセットに対して 0極めと XzenshoXXXXにフォーマットの股定を行う. パラメータ:YEAR実行する年 倒J T 出力するライプラリ(指定なしの場合は Zenshoを上書き) autoexec̲zensho̲tokumeLS8S 等のプログラムを実行した直後でなければ 下のマクロ変数とライブラ日の場所を指定する. /柑1etSASPGM= ; *プログラムを置いてある場所のパス ; * 1 I*libnameZENSHO" D :草Tok 皿 e iYsyouhi¥l i b '; 本 / 松田c roF l l T YAD(year= • 0日T= ZENSHO) ; キフォーマット作成プログラムの存在確認; 世if%sysfunc(fileexist( " & S AS 即日.事t ok 岨 e iFormat 前 回r .• s a s ' ) ) = 0l l i t h 閲 覧d o; , 事p ut& . Y E A R .年のフォーマット作成プログラムは存在しません; 世r et 町' n : 世 田d ; 事ライブラリの確認; 首i f胃sysfunc( l i b r e f ( & . O U T . ) )‑ =0略then%do ; 事I P u t 出力先ライブラリ & O U T . は存在しません, 弧r eturn: l l i e n d; 世i f覧sysfunc( libref( Z e n s h o ) ) =0略then%do ; , 事p utライプラリ Zenshoは存在しません; 首ret町 n ; 首e nd ; 州。r kのフォーマットを削除; 首if% sysfunc ( c e x i s t( " w o r k .FO 路I A T S " ) ) = 1弧then制 0 ・ 宵 o ccata10gcat=w o r k .formatskill ; quit : 覧e nd ; $フォー "'7';1 トの競み込みと内容の長さを取得; %inc' ' ' S A S P G M .Ytok 四 e iForma t& Y 開 r . .sas'I田 町 田2 ; procformatcntlout=w o r k .FMTDAT ; run ; procs q l noprint ; createtab1ew o r k .SLLENas 舵, se1ectFMTNA 回 x (1 engthn (START)) a s LEN• Se2 end) asM I N . 斗. E N min (casewhennotdigit (strip (START) )=0then 1engthn (START)el fromw o r k .F l l T DAT , 制E groupbyFMTN 胤 x . . . quit ; procsortdata=w o r k .FMTDAT ; by同町N品IE; run ; *0埋めが必要なフォーマットへの処理とマクロ変数の作成; dataw o r k .F l l T DAT mergew o r k .F A I 円D ATend= EOF 到 work.SLU byF M T N . 品血; 1engthCODEZVARQZVAR$2000 ; retainCODEZVARQZV AR ; i f削 斗EN= 2andMIN J,凶=1andnotdigit (START)= 0thenSTART=put (input (START• b e s t . )• z 2 . ); if1 a s t .F l l T N . 品 l E=lthendo; I D E= catx (• " I D E . scan (F l l T NAME. 1• • ̲.) • cats(ifc(TYPE= " C ' • "$"• ") . 問TN A l IE. '.") ) ; ifM A X ̲ L EN= 2andMIN ̲ U 到 =lthendo: ZVAR=catx ( ZVAR. scan (問TNA 眠 . 1. ケ ) ) ; QZV AR= catx (""• QZVAR • quote (scan (F l l T NA 阻 . 1• " ̲ ")) ) ; end ; end ; ∞ . ∞ " ぺ 68
i f悶 IF=!thendo; c a l l sy 即 u tx ('CODE" • CODE) call symputx ('ZVAR' • ZVAR) ; call symputx (可ZVAR"• QZVAR) ; end ; r u n; proc for 田 tc ntlin= w o r k .F 町D AT l i b=ωut. ; run ; procdatasets l i b=worknolist ; de!eteF l I T D A T; quit ; *0埋めが必要なデータセットとそれに含まれる変数を特定, data̲ n ull !engthVLISTDLIST$200 ; set s a s h e ! p .VCO l . 聞Nend=EOF; by附到NAME ; where libname= 'ZENSHO' andprxmatch(• I X .暗.YEAR.r. 舵 酬 偲 ) >0 andupcase(N,雌) in (ω'ZVAR. ) retainDLISTVL1ST ; i ff i r s t .M団側AMEth聞 do ; 郎 N +! ; DLIST=catx (• • • DLIST. 舵 削 品IE) ; c a l l missing (VL1ST) ; end ; VL1ST= catx (• • • VLIST• NA 舵); i fl a s t .旭 捌AMEt h 聞 d o; 町 u tx (cats (. 阻 胤 馴E'• can sy can 叩lIPutx (cats ('VLIST' end ; DSN) • 鹿 町 雌E) ; DSN). VL1ST ); 悶I p u t x ('DSN" • DSN) ; i fEOF= !thencan s y r u n; *0埋めとフォーマットの設定; 略doi= !%to& D S N . data& Ou t . .悦 服 凶1 A M E & i . set Z e n s h o .鈍 腿MN 州民i. 知 f%index (総M田町品1E&i. .XZ 聞 5HO)>0略I t h e n剃 0 ・ format&CODE %end ; 町 四yZ VAR偽 札 IST&i . dooverZVAR ; i fnotdigit (strip (ZVAR) )= 0 thenZVAR=put (i n p u t (ZVAR• b e s t . )• z 2 . end run ; 略e nd ; 柏 田 町d ; 1 *2004年のデータを上書きせずに Workに出力する * 1 % F I ITYAD (YEAR=2004. 町T=Work) 1 *Work以外に出力した場合、使用時には options fmtsearchで出力先を指定する * 1 Op tions fmtsearch= (ZenshoWork) 御 前' YAD (YEAR=2004) ; *Zenshoの 2004年のデータに上書きする場合, 69
DS2言語によるデータハンドリングについて 森岡裕 D a t aH a n d l i n gw i t hDS2 Y u t a k aMorioka 要旨 DS2言語は SAS9.4から導入され、従来のデータステップに比べて、より柔軟で拡張された処理を行 うことができる機能である。ステートメントや関数名が類似しているが SAS言語とは基本的に別言語 であり、オブジェクト指向を狙って設計されている。処理をメソッド単位に記述することによりコー ドの再利用性が高く、従来のデータステップよりも構造化したプログラム設計が可能となっている。 また SQL との親和性が高く、データ型も多く用意されているため、データベースとの連携がしやす くなっている。さらに、マルチスレッド処理を簡単に記述することができることや、行列計算、ハッ シュテープ、ノレの処理も含めて記述できるなど、 SAS における次世代のデータハンドリングの主軸とな りえる機能だといえる。 ただし、やはり従来の SASデータステップとは別言語であることから、学習コストは高いと言わざ るをえなし、。実際に DS2 がどのようなものかを知る前に、導入の検討を打ち切っているケースも少な くない。 DS2 の詳細まで解説すると一つの言語のリファレンスを作るに等しく、膨大な量になってし まうため、本稿では DS2 の特徴的な部分と、実務に応用しやすい部分について大まかに解説し、感触 を掴んでいただくことを目的とする。 DS2の文法の基本構造 DS2 言語を理解する上での、必要最低限の基本構造について説明する。詳細な部分についてはリ ファレンスで補完いただきたい。なお、本稿では区別しやすくするため、従来の SASデータステップ のことを旧データステップと呼称することとする。まず、以下の 2つのプログラムを比較してみる。 / * PGl* / T l ; d a t aOU s e tTESTle n d = e o f ; i f̲N̲ =1t h e np u t'NOTE:処理の開始'; / * P G 2 * / p r o cd s 2 ; / * 1* / d a t aOU Tl( o v e r w r i t e 寸' e s ) ;/ * 2 * / d e c l a r ed o u b l eY ;/ * 3事 / methodi n i t O ; / * 4 * / Y=X+1 ; i fe o ft h e np u t'NOTE:処理の終わり'; r u n ; p u t'NOTE:処理の開始'; e n d ; methodr u n O ; / * 5 * / s e t TEST l ; / * 6 * / 数値変数 X を含む TES T1というデータセット があったとして、それを s e t して X+l を新規変数 Y に割り当てて、新規データセット OUTl を作る。 なおかつ処理開始時と終了時にメッセージをだ すという処理について、旧データステップで記述 したのが PG1で、 DS2で記述したのが PG2にな る 。 PG2について解説する。まず DS2言語での処理 Y=X+l; e n d ; methodt e r m O ; /吋*/ p u t'NOTE:処理の終わり'; e n d ; e n d d a t a ;/ * 8 * / r u n ; ホ /9 * / q u i t : / * 1 0 * / 7 3
はp r o cDS2 ~quit;の聞に記述する (1 1 0の箇所) (SASU n i v e r s i t yE d i t i o nまたは SASondemand等の環 i b s = w o r kの記述が追加で必要になる場合がある) 境については lの部分に l a t a~ e n d d a t a ;r u n ;( 289 ) が一つの処理プロックになる。 2の da 匂ステートメントの記述につ その中の d いては旧データステップと同様だが、 DS2 ではデータセットの自動上書更新はされず、既に同名のデータ セットが存在する場合はエラーとなる。これを回避するために o v e r w r i t e = y e sを追加する必要がある ( 2 ) 。 3の箇所は d e c l a r eステートメントにより、 d o u b l eという数値型(倍精度浮動小数点型)を使って新規変数 Y を宣言している。 旧データステップには変数の宣言という概念がなく、割り当てステートメントや、 l e n g t h、f o r m a t ステー トメント等による型定義があれば、それによって新規変数が作成されていたが、 DS2では基本的に新規変数 には宣言が必要である。 旧データステップでは変数の型には数値型と文字型しか存在しなかったが、 DS2では一般的なデータベー スで用いられる多くの型が存在し、型を使い分けた処理やデータベースとの連携が容易になっている。 a t e ただし、 SASデータセットは旧データステップで作成しでも DS2で作成しても同じものであるため、 d などの日付型を指定してもデータセットを作成すると数値型に変換される。従来の数値型に対応するのが d o u b l e で、文字型に対応するのが c h a rなので本稿ではそれを説明に用いる。型の詳細についてはリファレ ンスを参考にしていただきたい。 457は全て methodx x ~ end という構造をとっており、これをメソッドという。メソッドにはユー ザーが自由に定義して使用するユ}ザ一定義メソッドと、システム定義パッケージ(後述)に依存したメ ソッド、上記以外で予め用意されている特別な働きを持つシステムメソッドに分類される。 457の i n i tr u nt e r mは全てシステムメソッドで、予め決まった働きをそれぞれ持つ。 4の i n i tメソッドは DS2の d a t a ‑ enddataブロック開始時に、最初一度だけ実行される処理を記述する。旧 f N =1白 e n に似た働きを持つ。ただし正確には i f̲N̲ =1t h e nは 1オプザベーション読 データステップの i み込んだ時点、 i n i tメソッドは 1オブザベーションも読み込んでいない時点なので完全に同一ではない。 7の t e r mメソッドは DS2データステップの終了時に、最後一度だけ実行される処理を記述する。旧デー タステップの ifend変数 t h e n に似た働きを持つ。ただし、正確には i f e n d変数 t h e n は最終オプザベーシヨ e r m メソッドは最終オブザベーションが全て読み込み終わった後(そのため N の値は ンの読み込み時点、 t オプザベーション数+lになっている)となる。 5の r u nメソッドは 1オブザベーション読み込むごとに行いたい処理を記述する。 r u nメソッドの中に 6の e tステートメントを記述することで旧データステップと同様に、 s e tで指定したデータセットが Iオ ように s u nメソッド内の処理が行われる。 ブザベーション読み込まれるごとに以下の r 0 ユーザー定義メソッド I データセット:TEST2] 臼 1 0S 1M 2F 3M 4F 5M 6F / * PG3本/ HEIGHT WE 陥鈍Y 1 6 7 6 6 6 8 1 5 5 ln 56 1 . 6 86 1 8 3 5 6 1 5 8 46 p r o cds2; 由. t an u l l; / * 1 * / methodh̲chk(doubleh ) ; / * 2 * / f .<hく 100thenput i ' w . 組NIG:測定単位確認'h=; システムメソッドおよびシステム定義パッケージ付属のメソッド については、予めメソッド名も機能も決まっているが、ユーザー定 義メソッドは自由に名前と機能を定義することができる。 説明用に上園、 6人分の身長・体重のデータセット【 TEST2】を 使用する。 例として、体表面積を算出する処理を考える。まず体表面積を計 算する前に身長に異常値がなし、かをチェックする必要があったとす る。その場合、右図 [PG3] のように値をチェックするメソッドを 組み込んで書くことができる。 Iの箇所について、データセットを作成する必要がない場合は旧 データステップと同様に n u l l を指定できる。 74 e n d ; methodr u n O ; setTEST2; h̲chk(HEIGHT); / * 3 * / e n d ; e n d d a t a ; r u n ; Q U l t ;
2で h ̲ c h kという任意の名前でユーザ一定義メソッドを定義している。 ( d o u b l eh )というのは、 d o u b l e型で hという引数を受けとるメソッドであるということを意味している。 rumメソッド内 3の箇所で呼び出している (HEIGHT)というのはメソッドの引数 hに HEIGHTをあてると 1 I l t 定単位確認、 h=1 .6 J というメッセージがロ いう意味である。これにより、実行結果として、 fWARNING:i グに出力されることになる。 なお、今回は h ̲ c h kメソッドの記述の後に r u nメソッドを記述したが、逆に r u nメソッドを先に記述して、 後に hchkメソッドを記述していた場合は、実行するとエラーになる。 コード上、先行する r u nメソッド内で、 hchkメソッドを呼び出しているが、その時点で hchkメソッド の定義がまだ読み込まれていないからである。 o r w a r d キーワードを使う。 もし、後ろに記述されているメソッドをそれよりも前で呼び出したい場合は、 f lの d a 包ステートメントの次の行におr w a r dh ̲c h k ;としておけば、先行する r u nメソッド内で h ̲ c h kを呼び出 していても、後で出現する定義部分を参照してくれるのでエラーにはならない。 0 0未満の数字が入った場合、値を 1 0 0 異常値が混じっていることが確認できたので、次に、 HEIGHTが 1 倍して上書き更新するメソッドと、体表面積を算出するメソッドを組み込んだのが下図 PG4になる。右図 【データセット:OUT2] は実行後の出力データセット【 OUT2】になる。 /*PG4*/ BSA p r o cd s 2 ; 1 . 7 4 2 3 7 6 2 3 0 7 1M 1 6 7 6 6 1 .6 7 1 7 5 6 7 7 8 2 2F 3M 4F 5M 6F 1 5 5 1 7 7 1 6 0 1 8 3 68 5 6 8 6 5 6 1 5 8 4 6 問 問r i t e = y e s ) ; dataOUT2(0 1 .6 9 4 8 3 2 7 7 2 5 抑制h ̲ u p d a t ec a l ̲ b s a ;/門事/ f o 1 .8 9 0 2 3 2 1 8 1 7 d e c l a r ed o u b l eBSA; 1 .7 3 6 2 9 4 0 4 2 8 methodr u n O ; 1 . 4 3 5 7 0 3 6 0 2 6 1 0 SEX HEIGHτWEI6HT setTEST2; 峨(H EIGHT);/*2* / h̲upd 一bsa(HEIGHT , WEIGHT);/*3*/ BSA=cal e n d ; methodh ̲ u p d a t e ( i n ̲ o u td o u b l eh ) ; / * 4 * / f .<h<100出 enh=h*100;/*5*/ i e n d ; 一 b s a ( d o u b l eh, d o u b l ew)r e t u m sd o u b l e ; / * 6 * / methodc a l d e c l a r ed o u b l er e s u l t ; / * 7 * / r e s u l t = w**0. 4 25ホ h * * 0 . 7 2 5*0 . 0 0 7 1 8 4 ; / * 8 * / 卸 mr e s u l t ; / * 9 * / r e e n d ; e n d d a t a ; r u n ; q U l t ; 結果をみると 10 =4の1.6であった HEIGHT の値が 1 6 0となり、体表面積が変数 BSAに格 納されている。 コードについて説明する。 lは r u nメソッド内で呼び出す 2つのメ u nメソッドの後に記述し ソッドについて、 r o r w a r dである。逆順に たために必要となる f 記述する場合は不要となる。 2で、引数の値が 1 0 0未満の場合、 1 0 0倍す ̲ u p d a t eメソッドに HEIGHTを指定して呼 るh び出している。 4から 2行先の e n dまでの部分が h ̲ u p d a t e メソッドの定義部分となる。 4で引数指定の d o u b l ehの前に i no u tがついているが、これ はキーワードで、引数かつ戻り値が同じ場合 につけるものである。 5で条件にあてはまっ 0 0倍している。 た場合、引数を 1 2の部分で引数に HEIGHTをあてているた 0 0未満の場合、 め、つまり HEIGHTが 1 HEIGHTを 1 0 0倍した値を HEIGHTに代入、 つまりは上書き吏新していることになる。 3の箇所は、身長と体重から体表面積を計算する c a lb s aメソッドを呼び出し、計算結果の戻り値を変数 BSAに代入している箇所となる。 6から 4行先の e n dまでが c a lb s aメソッドの定義部分となる。 7で r e s u l tという変数を宣言しているが、 [OUT2] には r e s u l tという変数は存在していない。 DS2において変数はメソッドの外で宣言されるグロー パノレ変数とメソッド内で宣言されるローカル変数にわけられる。グローパル変数はどのメソッドからも参照 でき、出カデータセットにも残るが、ローカル変数は宣言されたメソッドの中でのみ参照され、結果のデー e s u l tは出力データセット【 OUT2】には残っていない。 タセットには残らないため、ローカル変数 r 75
6の部分で r e 旬πnsdoubleとしているのはメソッドの戻り値の型を指定している部分となる。 8が体表面積の計算部分(デュポア式)で、結果をローカル変数の r e s u l tに代入している。 9の問旬m ステートメントは指定した値をメソッドの戻り値にする機能がある。例では結果をー且、ロー e t u r n w**0. 4 25*h榊 0 . 7 2 5ホ カル変数にいれてから戻したが、単純な式であるので、 789の部分は r 0 . 0 0 7 1 8 4 ;と一行にしても問題ない。 次にユーザー定義メソッドにおけるオーバーロード(多重定義)について説明する。 オーバーロードとはプログラミング用語で、同一名の関数やメソッド等について複数定義し、呼び出される 際の文脈に応じてどの定義で実行するかを自動的に機能選択させる仕組みである。 a lbsaメソッドは体表面積を計算するために定義したメソッドで、数値型の身長、体重を 例えば、先の c 引数としている。体表面積を計算する場合は、すべてこのメソッドを呼び出すことができれば便利である。 しかし、例えば、使用したいデータセットの身長、体重が文字型で格納されている場合や、他の計算方法 で体表面積を出したい場合などに、いちいち新規のメソッドを定義していくのは煩雑である。とはいえーっ のメソッドを、新しい要望がでるたびに分岐を加えて書き換えていくのも管理上問題がある。 これは SASマクロにも閉じこ とが言える。多くの場所で呼び 出しているマクロの内容を変え ることは危険であり、パラメー タもあまり婚やしたくはない。 しかしマイナーチェンジの度に 新しいマクロを増やしたくもな / 事P G5*/ p r o cd s 2 ; T3( o v e r w r i t e = y e s ) ; d a t aOU f o r w 釘 dc a l ̲ b s a ; d e c l a r ed o u b l eBSAab; / * 1* / d e c l a r ec h a rcd; /勺*/ me 由o d i n i t O ; し 、 。 5 0 ;c = ' 1 6 0 ' ;d = ' 5 0 ' ; a = 1 6 0 ;b= そこで、 PG5をみてみる。 I 結果ログ画面】 ( a ,b ) ; p u tBSA=; 1 竹町 BSA=cal̲bsa BSA=1.50112052420814 BSA=1.50112052420814 BSA=1.53747839882009 BSA=1.45960012718282 B S A = c a l ̲ b s a ( c , d ) ; p u tBSA=; / * 4 * / , b,'新谷式' ) ; p u tBSA=; / * 5 * / B S A = c a l ̲ b s a ( a B S A = c a l ̲ b s a ( , ab,'藤本式' ) ; p u tBSA=; /均車/ e n d ; methodc a l ̲ b s a ( d o u b l eh, d o u b l ew)隠 tumsd o u b l e ; / * 7町 12から abは数値( d o u b l e )、c d は 文 字 型( c h a r )となっている。 3は引数が数値、 4は引数が文 d e c l a r ed o u b l er e s u l t ; r e s u l t=w帥0. 4 25"h * * 0 . 7 2 5申 0 . 0 0 7 1 8 4 ; reωmr e s u l t ; e n d ; 血o dc a l ̲ b s a ( c h 釘 h , c h 紅 w )r e t u m sd o u b l e ; 事 /8 * / me d e c l a r 官d o u b l er e s u l t ; 悶 u l 炉 F 肘旬 i n 叩P 抑u 蜘佃(w 帆' , b飴 e s 託 凶 t . 勾 32 ' ) * 紳 * 句 0. 4 侶2 5 ρ * i 切 目 叩 , p 刷 u 佃 ( 仇 比 h , ' b 凶 e s β 白2 . ' ) * 江 z 百r e s u l t ; r e t u e n d ; me 也o dc a l ̲ b s a ( d o u b l eh, d o u b l ew, c h a rcm)r e 知m s d o u b l e ; /勾ホ/ d e c l a r ed o u b l er e s u l t ; ・ * * 0 . 7 2 5事 0 . 0 0 7 3 5 8 ; ifcm=' 新谷式'血enr e s u l t=w* * 0 . 4 2 5 h . 科 4*h . . . . 0 . 6 6 3ホ 0 . 0 0 8 8 8 3 ; ifcm=' 藤本式・白e nr ω u l t=w柿O t ; r e t u mr e s u l e n d ; e n d d a t a ; r u n ; Q u i t : 76 字 、 56は引数が 3つで数値、 数値、文字のパターンであるが、 呼び出しているのはすべて同名 の calbsaメソッドである。 789 で同じ名前のメソッド を定義しているが引数の数と型 指定がそれぞれ異なるため、共 存することができる。これに よって呼び出し時の引数によっ て 、 3の箇所では 7のメソッド、 4の箇所では 8のメソッド、 56 の箇所では 9のメソッドが自動 選択される。 このオーバーロードの機能を 利用することで同じ働きのもの を同じ名前のメソッドでまとめ ることができるので非常に便利 である。
ユーザー定義ノ号ッケージ DS2はメソッドの組み合わせで処理を組み立てていく言語であるが、毎回個々のステップの中でメソッド を定義していると大変で、再利用や共有もできない。 メソッドの定義部分と、実行部分を分離して管理できると便利である。 DS2ではメソッドを、パッケージ という塊にまとめて保存し、必要に応じてパッケージを呼び出し、そこに含まれるメソッドを使うことがで きる。パッケージは外部フォルダにも保存できるため、複数のユーザー聞で共有でき、開発効率を高めるこ とができる。 PG4で紹介した h ̲ u p d a t eメソッドと c a l 一b s aメソッド、をパッケージ化したい場合、以下 PG6のように記述 できる。 I * P G 6 * 1 p r o cd s 2 ; packagework.p ̲b sa/o v e r w r i t e = y e s ;片付/ d e c l a r ed o u b l ec o n ; methodp ̲b s a O ; / 勺* 1 con=100; e n d ; methodh ̲ u p d a t e ( i n ̲ o u td o u b l eh ) ; 1 * 3 * / i f .<h<cont h e nh=h*con; e n d ; 一b s a ( d o u b l eh, d o u b l ew)r e 旬r n sd o u b l e ; / * 4 * 1 methodc a l d e c l a r ed o u b l er e s u l t ; r e s u l t=w柿 0. 4 25*h紳 0 . 7 2 5*0 . 0 0 7 1 8 4 ; r e t u r nr e s u l t ; e n d ; e n d p a c k a g e ; I * 5 * 1 r u n ; Q u i t : I * P G 7 * 1 p r o cd s 2 ; d a t aOUT 4 ( o v e r w r i t e = y e s ) ; d e c l a r epackagework.p̲bsa i b ( ) ;/ * 1* / d e c l a r ed o u b l eb s a ; methodr u n ( ) ; s e t 1 百 ST2; i b . h ̲u p d a t e 但 EIGHT); BSA=ib.cal̲ b s a (H EIGHT , WEIGHT); e n d ; end 由民 r u n ; q u i t ; 77 パッケージを作成する場合、 lのよ p a c k a g e ライブラリ名.パッ うに r J で開始し、 5 ケージ名/オプション ; のe n d p a c k a g eで終了する。 w o r k . p ̲ b s aとしているが w o r k .は省 略可能である。外部ライブラリに作 成する場合は workの部分を任意のラ イブラリ名にする。 2はパッケージ名と閉じメソッドだ が、これはコンストラクタと言われ る特別なメソッドである。コンスト ラクタはパッケージを呼び出した際 (インスタンス生成時)に強制的に 最初に実行されるメソッドになる。 パッケージが大規模で、各メソッ ドで共通する定数が多い場合や、初 期値の設定を行いたい場合などにコ ンストラクタをうまく使うことで、 引数や記述の繰り返しを減らせ、 コードの見通しをよくすることがで きる。 34は PG4で説明したメソッドと閉 じなので説明を割愛するが、 3のメ ソッドの式の部分はコンストラクタ で設定される conの値を参照するよう にしている。 作成済みのパッケージを呼び出し て、パッケージ内のメソッドを利用 している例が PG7 になる。 1の部分、 d e c l a r ep a c k a g e ライブラリ名.パッ ケージ名インスタンス名 (コンスト ラクへの引数がある場合は括弧内に 引数);で宣言する。 インスタンス名は、パッケージが 呼び出されたステップで通用する参 照名のようなもので、この例では i b という名前を使って p 一b s aパッケージ を参照することとしている。 lの最後の括弧は、 p ̲ b s aパッケー p ̲ b s aメソッ ジのコンストラクタ ( ド)に引数があった場合は、そこに 値を渡せる部分になる。
なお、コンストラクタになるメソッドにもオーバーロードが可能なので、 PG6の 2のブロックの後に r methodp ̲ b sa ( d o u b l ed ∞n);con=dcon;end;J といった号│数があった場合のコンストラクタを追加し、 PG8の b ( 1 5 0 )などとして、引数をもってインスタンスを生成する際に値を変更することも可能であ 呼び出し時に i る 。 システム定義パッケージ ユーザ一定義ノ号ッケージとは異なり、あらかじめ DS2プロシジャで用意されているシステム定義パッ ケージが存在する。それぞれのシステム定義パッケージには固有のメソッドが用意されてり、それらを利用 することでより柔軟な処理が可能になる。 例えば、動的に SQL文を構築でき、 DBMSにパススルーを行ったり、結果を受け取ることが可能な SQLSTMTパッケージ。 IMLプロシジャでしかできなかった行列の処理が可能な MAT 則 Xパッケージ。 ハッシュテープ、ルを生成し、キールークアップ処理が可能な HASHパッケージなどがある。 中でも、 HASHパッケージは旧データステップのハッシュオブジェクトに非常に似ており、さらにハッ シュオブ、ジェクトで不便であった箇所が多く改善されているため、ハッシュオブジェクトを習得していれば 学習コストが低く、有用性が高い。 【データセット:TEST2 再掲】 【データセット:TEST3] HEIGHT W E I G H τ 1 6 7 6 6 1 5 5 6 8 1 7 7 5 6 1 . 6 8 6 1 8 3 5 6 4 6 1 5 8 I DSEX 1M 2F 3M 4F 5M 6F I D AGE COUNTRY 1 2 7 JPN 2 3 3JPN 4 5 2 USA 5 4 1 JPN 前述のデータセット rTEST2J に r TEST3J の AGEと COUNTRYについて IDをキーにして取得する処 理について、旧データステップのハッシュオブジェクト ( P G 8 )と DS2の HASHパッケージ ( P G 9 )を比較して みる /*PG8 ハツ、ンュオブ ジェクト*/ dataOUT5; /叩G9 HASHパッケージ*/ p r o cd s 2 ; d a t aOUT6(overwrit e = y e s ) ; i f Ot h e ns e tTEST3;/*A* / d e c l a r ep a c k a g eh a s hhl0; / * 1* / setTEST 2 ; d e c l a r ed o u b l eAGE; /勺*/ i f N =1t h e nd o ;/ * B * / d e c l a r ec h a rCOUNTRY;/ キ3 * / d e c l a r eh a s hh l ( d a t a s e t :' T E S T 3 ' ) ; methodi n i t O ;/叫*/ h l . d e f m e k e y ( ' I D ' ) ; .da 匂s e t ( ' T E S T 3 ' ) ;/ * 5 * / hl .d e f i n e d a 旬( ' A G E ' ' , COUNTRY'); hl .k e y s ( [ I D ] ) ;/ * 6 * / hl h l . d e f i n e d o n e O ; hl .data([AGECOUNTRY]);/ * 7 * / e n d ; hl . d e f i n e d o n e O ; r c = h l血 l d O ; e n d ; i f r cne0t h e nd o ;/ * C * / methodr u n O ; c a l lmissing(AGE, COUNTRY); 2 ; s e t T E S τ' hl .f i n d O ; / * 8 * / e n d ; e n d ; r u n ; e n d d a t a ; 。t: u i 78 r u n ;
PG9の lが HASHパッケージの呼び出し(インスタンス生成)部分で、 d e 氾l a 問後の h a s hが固定キーワー ド である点以外はユーザー定義パッケージの呼び出しと同様となる。 PG9の 2, 3の箇所について、旧データステップでは変数の宣言とし、う概念がないため、変数情報を PDV 上に用意するために PG8の A のような書き方や l e n g t hステートメントなどが必要であったが、 DS2ではそ れが変数の宣言に代わり、理解しやすくなった。 旧データステップでは、 lオブザベーションずつ処理するという SASの特性上、ハッシュオブ ジェクトの fステートメントでの工夫が必要であったが、 定義部分が何度も繰り返されないように Bの箇所のような i DS2では事前実行される i n i tメソッド ( 4の箇所)に定義部分を入れればよく、見通しがよくなった。 5の箇所、旧データステップでは d e c l a r eh a s hの際に括弧内に、 r d a t a s e t : Jや r o r d e r e d : ( ハッシュ J、 r m u l t i d a t a (重複キーの許容 ) J などを列挙していく定義方式だったが、 テープ、/レ内の昇順降順指定) DS2ではそれぞれ独立したメソッドとして定義可能となった。 67の箇所についてそれぞれ keyと da 匂の指定を[]内に変数リストで指定できる。旧データステップ e f i n e k e yメソッド、 d e f i n e d a t aメソッドも存在するが、 lメソッドご のハッシュオブ、ジェクトと同様に d とに 1変数のみ指定なので、複数変数がある場合いくつも繰り返す必要がある。 k e y sメソッド、 d a t a メソッドであれば 1変数から複数変数まで対応可能なので使いやすい。 なお、別の定義法として 567の内容やその他オプションをすべて、 1の括弧内に決まった順番に引 数指定して定義する方法も可能で、マクロ化する際には特に有用であるが本稿では割愛する。 PG8の C の箇所は、旧データステップのハッシュオプ ジェクトでは命l dメソッドにより keyマッチ e t a i nしてしまう性質があったため、このような分岐が必要であった。 できなかった場合、直前の結果を r しかし DS2では 8のように特に分岐処理をしなくても問題がなくなった。 マルチスレッド処理 DS2にはスレッドとし、う仕組みが存在する。スレッドで定義した処理について、実行時に並列実行 したい数を指定することによって同時に処理が実行され、処理時間を大きく短縮することができる。 スレッド定義内に s e tステートメントが存在する場合(何らかのデータソースからデータを取ってく る場合)と存在しない場合によってイメージが少し異なるので簡単な例で説明したい。 /叩GlO s e tを含まないスレッドの定義*/ /*PGll s e tを含まないスレッドの実行*/ p r o cd s 2 ; p r o cd s 2 ; 仕r r e a d由l/o v e r w r i t e =y e s ; / * 1 * / d a t aO U T 7 ( o v e r w r i t e = y e s ) ; d e c l a r ed o u b l eit h r e a d ; 傘/ d e c l a r et h r e a dt h1t ;/ *1 methodr u n O ; d e c l a r ed o u b l eNO; doi=1t o1 5 ; methodr u n O ; t h r e a d = ̲ t h r e a d i d ̲ ;/ * 2 * / s e t企omtt h r e a d s = 3 ;/ * 2 * / p u t 'スレッド 番号:二t h r e a d i d ̲i = ; o u t p u t ; NO=̲N̲; e n d ; e n d ; e n d d a t a ; e n d ; r u n ; 出r e a d ;/勺*/ end q u i t ; r u n ; q u i t ; PGlOがスレッドを定義するプログラム、 PGllがスレッド数を指定して定義したスレッドを実行す るプログラムになる。 PGlOについて、スレッド定義の仕組みとしてはパッケージのそれに似ている。 1の t h r e a dから 3の e n d t h r e a dまでにスレッド化したい処理を記述する。 lの t h lの部分はスレッド名をつけるところで、任 意の名前で定義できる。今回は workに作成されるが、永久ライブラリに作成することも可能である。 7 9
2の 白r e a d i dは、実行時に並列で処理される場合に、どのスレッドで実行されたかが入る自動変数 になる ( 0から連番)。 PGllでは PG10で作成されたスレッド也 1を使って、 tというインスタンス名を与えて参照している 部分になる。 2の部分、 s e t食: o m はスレッドを実行して、そこからデータを取得するためのステートメントになる。 t h r e a d s =で、スレッドをし、くつ実行するかを指定しており、例では 3を指定している。 PGllの実行で作成されるデータセット OUT7の内容と、ログへの出力については本稿最末の補足図 に掲載している。内容をみると 45オプザベーションであるが、これは 1スレッドあたり 1 5オプザ ベーション出力する処理を 3スレッドで実行したためである。変数 t h r e a dには一白r e a d i ιの値を割り当 てているが、そこから、 s e t企' o mによち 3スレッドのアウトプットを統合して一つのデータソースとす る際に、スレッド番号 0, 2, 1の順にセットされたことがわかる。この順番はランダムになる。 またログ(巻末補足図)を見ているとそれぞれのスレッドが並行して実行されているが、ログウイ ンドウは一つを共有しているので、ランダムにミックスされたようなログ出力になる。 次にスレッド定義内に s e tを含む場合について説明する。 PG12は 1 0 0変数 1 0 0万オプザベーション のデータセット τ ' EST4を作成する旧データステップのプログラムになる。 P G13はスレッド定義部分 で 、 t e r mメソッドで最後に t h r e a d i d とオプザベーション数のカウントをログに出力する以外は単純に TEST4を s e tするだけの内容になっている。 PG14では定義されたスレッドについて、 3スレッド数で 実行しており、その他の処理は特に行っていない。 / * PG12 テストデータ*/ /*PG13 スレッド定義ホ/ /叩G14 スレッド実行*/ d a t aTEST4; p r o cd s 2 ; p r o cd s 2 ; a r r a y a r { 1 0 0 } ; 世r r e a dt h / o v e r w r i t e = y e s ; 包 da doi =1t o1 0 0 0 0 0 0 0 ; OUT8(overw 耐 寸e s ) ; 皿 t ; d c ld o u b l ec o e a dt ht ; dc1也r doj=1t o1 0 0 ; d r o p c o u n t ; methodr u n O ; 紅。}=ran d ( ' u n i f o r m ' ) ; methodr u n O ; e a d s = 3 ; s e t合omt也r e n d ; T 4 ; s e t τ'ES e n d ; o u t p u t ; l ; c o u n t+ e n d d a t a ; d r o pi j ; e n d ; r u n ; e n d ; methodt e r m O ; q u i t ; r u n ; t h r e a d i d ̲ ,が' p u t 'スレッド番号, ̲ c o u n t ' o b s読み込みました'; e n d ; 白r e a d ; end r u n ; q u i t ; PG14を実行した際のログが下図になる スレッド醤号 2 が 3219768 obs読み込みましに スレッド醤号@が 3584169 obs読み込みました スレッド番号 1 が 3295972 obs読み込みました 1 0 0万オプザベーションの処理が、 SASにより適当に 3分割で並列処理が行われたことがわかる。 環境によって異なるので参考程度であるが、 PG5の処理時間は、旧データステッップで同様に単純 s e tするプログラムを書いて実行した場合より 4割程度高速化する結果を得ている。 このように単純に一度定義してから呼び出して実行するだけで、簡単に処理を高速化できるのでス レッドは非常に有用な機能といえる。 80
ただし、どこで分割して処理されるかは制御できず、各スレッドがそれぞれ独立して実行される。 そのため、データセット全体を通して値を r e t a i nするような処理を含めていると正しい結果にならない ため、注意が必要である。基本的には lオプザベーションごとに完結している処理で構成しなければ ならない。 DS2で特徴的なコードの記述法について 旧データステップに習熟した後に D S 2を学習し始めた際に、個人的に使利に感じられた点について 2つ ほど紹介したい。 ① byス テ ー ト メ ン ト を 入 れ た だ け で 自 動 ソ ー ト が 起 き る 例えば、前述の T EST2のデータセットについて、性別ごとに身長が最大のオブザベーションにフラ グ変数= 1を付与したい場合以下のように記述することができる。結果のデータセットは右図になる 傘 /P Gl5 b yによるソートホ/ FL S EX p r o cd s 2 ; d e c l a r ed o u b l eF L ; .F .F 1F m e t h o dr u n O ; .M s e t T E S T 2 ; b ySEXH E I G H T ;/ * 1 * / .M 1M TlO ( o v e r w r i t e = y e s ) ; d a t aOU H(崎JfJ s) W E 蹄 H官 1 . 6 4 155 2 68 1 認 6 46 167 1 儲 1 7 7 3 56 1 回 s 56 86 t .SEXt h e nF L = I ;/ * 2 * / i f l a s 旧データステップでは s e tステートメント後に b yステー トメントをつけて、 f i r s tl a s tの処理をする場合、事前に s o 此 プロシジャなどでデータセットをソートするステップが必 e n d d a t a ; 要であった。 r u n ; DS2では 12の箇所のように b yステートメントがおt後 q u i t ; に出現すると、 s e tで指定されているデータにソートがかか るようになっている。 これによってコード上の記述が簡略化され、見易くなった。 ただし、細かい注意点として D S2のソートアルゴリズムはソートプロシジャと異なり、 SQLで o r d e r b y句をいれた場合のものと一致する。 e n d ; ② デ ー タ セ ッ ト の 指 定 箇 所 に SQL文 を 記 述 す る こ と が で き る DS2は SQLとの親和性が高く、 s e tステートメントでデータセット名を指定する箇所などに SQL文 をそのまま指定することができる。 例えば前述の T EST2データセットを用いて、性別ごとに体重と身長の平均をとり、それを使って体 表面積を計算するコードを書く場合、次頁 P G16のように記述できる。 81
/叩G16 s e tステートメントに {SQL}*/ p r o cds2; 旬 OUT 1 1( o v e r w r i t e =y e s ) ; da d e c l a r ed o u b l eBSA; methodr u n O ; , mean(HEIGHT)a sHEIGHT, mean(WEIGHT)a sWEIGHT s e t{ s e l e c tSEX 合omTEST2 groupbySEX } ; BSA=WEIGHT 紳 0 . 4 25*HEIGHT* * 0 . 7 2 5ホ 0 . 0 0 7 1 8 4 ; e n d ; e n d d a t a ; r u n ; また s e tステートメントだけでなく、例えば HASHパッケージの d a t a s e tメソッドの指定部分にも SQL文を記述できる。 TEST2の SEXに、以下のデータセット TEST4を使って算出した SEXごとの VALの平均値を結合し たい場合、以下のように記述することができる。 【 TEST4) I D SEX A M 1 0 B M 14 C M 1 3 D M 15 d e c l a r epackagehashhl0; VAl /*PG17 HASHパッケージのステートメントに {SQ L}*/ p r o cds2; d a t aOUT1 2 (o v e r w r i t e = y e s ) ; E F 9 d e c l a r ed o u b l eIDV̲MEAN; F F a dropme 姐; G F 1 1 H F 16 括弧 O内の SQLが先に実行され、その結果が 仮想的にデータセットとみなされていることが わかる。 旧データステップにおいてもハッシュ反復子 オブジェクトを利用すればあらかじめ加工した 結果をハッシュテープルに格納できたが、 do w h i l e ループを変則的に利用する必要があり、 難易度が高かった。しかし DS2では SQLの知 識があればかなり容易に記述することができる。 methodi n i t O ; .da 国 e t ( ' { s e l e c tSEX, mean (V AL)a sV̲MEAN hl 企omTEST4g roupbyS E X } ' ) ; h l . k e y s ( [ S E X ] ) ; .da 旬([V ̲MEAN]); hl hl . d e f i n e d o n e O ; e n d ; methodr u n O ; setTEST2; h l品 l d O ; e n d ; e n d d a t a ; r u n ; q U l t ; 82
まとめ 本稿では、 DS2 言語でプログラミングする上で、必要となる最低限の知識を取り上げた。本稿が DS2に興味を持つ一つのきっかけになれば幸いである。 もし興味を持たれた方は、ステートメント、オプション、関数、その他多くの点において本稿で紹 介できていない DS2独自の仕様があるので、ぜひリファレンス等で詳細を確認していただきたい。 SAS 言語は歴史が長く、パージョンアップとともに機能追加されてきた。しかし、データステップ における根本的な文法はほとんど変わっていない。そのため再利用性の高い処理、可変的な処理、共 有機能などは全て SASマクロでまかなう習慣が完全に根付いているといえる。 SAS マクロは強力なツールではあるが、あくまでテキスト展開による処理に過ぎず、大規模かっ複 雑なプログラムを組む上で必ずしも最適とは言えない部分があった。 またデータステップと、 SQL プロシジャ、 IMLプロ、ンジャがそれぞれ独立していたため、それらを 混ぜて一つの処理を作ることが難しい。 加えて、現在主流の他の開発言語と比べて、言語的に旧世代のため、他言語から SAS に乗り換える 際の学習コストが非常に高かった。 それらの問題を解決する上で DS2 言語は大きな役割を果たせると考えている。当面は全ての処理を DS2 だけで記述するということは難しいかもしれないが、効果的な箇所を徐々に置き換え、組織とし て管理していく体制が整えば、開発効率の向上に結びつくはずである。一人でも多くのユーザーが DS2を学習し、知見を共有していけるようにしていきたい。 参考資料 ( 1 )P e t e rE b e r h a r d t ( 2 0 1 6 ) TheDs2P r o c e d u r e :SASP r o g r a m m i n gM e t h o d sa tWo r k ⑧9 . 4DS2La n g u a g eRe 免r e n c e F i 貧hE d i t i o n S A S ( 2 ) SAS 83
補足図 【データセット:OUT7] 岡町 1j E 寵財閥輔副 1 z z 3~ 3: 5; 6 5 6, 7( 7 e a . :4 ー 9~ . 1 . 0 . 1 . 0 1.1.~ 1 . 1 . . 1 2 . ' . 1 2 . 1.31 1 . 3 , 1 . . . . . 1 . . . , 1 . 51 l . 5i 。 。 。 。 ,。 。 。 。 。 。 。 。 , 。 。 . 1 d : . 1 9: s . . , 2 . , 20 s 2 2 2 . ' z 2.1( 6 z 22. 7 2 23' 2 . . . . 9 曇 2.5' . 1 Ci 2 . 6 : . 1 . 1 . z z z 2 2 . 7, . 1 2 . 2: 2B令.1.s 2 2 . 9, 1 . . . . , z 30. 1.5 2 3. 1 ! 1 1 . 1 ' z 33: s 34 35 4 5, 36 3 7, 6 7 S曇 a 39 9, 4c . 1 . 0 . . . . 1i . 1 1 . " ' 2 . ' . 1 2 . 4 3 1 .1.3 . . . . . . : . 1 . . . 45' 1 .5 1 i=1 8 i=6 スレッド曇号: 8 i=7 スレッド醤号: 1 i=2 スレッド§号: 8 i= l l スレッド暑号: 1 i=3 スレ~F暑号: 8 i =9 スレ~F曇号: 1 i =4 スレ~F暑号: 1 i =5 スレ~Fit 号: 1 i =6 スレpド醤号: 1 I=7 スレッF 醤号: 1 i= l l スレッド醤号: 8 i=18 スレ~F醤号: 1 i =9 スレッド脅号:骨 i= l1 スレッド醤号: 1 i=18 スレッド暑号: 8 i=12 スレッド暑号: 1 i= l1 スレ~F暑号: 8 i =13 スレッF 醤号: 2 i=1 スレ~F暑号: 8 i=14 スレ・~F暑号: 8 i =1 5 スレッド暑号: 2 i=2 スレッド暑号: 1 i=12 スレッF 醤号: 2 i=3 スレッド醤号: 1 i = ' 日 スレ・~Fit号: 2 i =4 スレッド醤号: 1 i=1 4 スレッド岳号: 2 i=5 スレッド岳号: 1 i=15 スレッド器号: 2 i=6 スレッド審号: 2 i=7 スレッド骨号: 2 i = I I スレッF i t号: 2 i=9 スレ~Fit号: 2 i =1 8 ヌレッド暑号: 2 I=11 スレッド暑号: 2 I=l2 スレッド曇号: 2 i=13 スレッド醤号: 2 i=14 スレッド暑号: 2 I=l5 スレ~F暑号: スレ~F岳号: i 1 2 . ! スレ~Fit 号: 8 I=l スレpド醤号: 8 I=2 スレッド曇号: 8 I=3 スレッド醤号: 8 i =4 スレッF 暑号 :8i=5 C 1 . 6' 1 . 7 3 : 2 , ' 【ログ】 . 1 ' 1 1 1 1 1 1 1 1 1 1 1 1 84
デフォルトと複数格付の同時推計による ロジットモデ、ル構築手法の提案 f 対 部 括 統 術 技 品川出 一 局 間 央究 和研 村学 木工 l Ad 々 金 A 一品 ι L 式 株 P r o p o s a l sf o rL o g i tModelB u i l d i n gb yt h eS i m u l t a n e o u sE s t i m a t i o nofD e f a u l tandM u l t i p l eR a t i n g s KazuoK i mura F i n a n c i a lT e c h n o l o g yR e s e a r c hI n s t i t u t eI nc . T e c h n o l o g yManagementD i v ., 要旨 ロジットモデ ル構築にあたっては,限られた時間コストの中で,人的スキルによらずに,一定精度を 確保したモデ、ルを得たいという実務上の要請がある.木村 (2015a) では,ソブリン(国)にかかわる デフォルト確率および格付該当確率モデルの構築を題材に, W e i g h tofE v i d e n c e (WoE;対数オッズ, z スコア)を中心に,外れ値処理,変数変換,欠損値補完,同時推計といった手法の提案がなされた.本 稿では,これらの基本的手法をベースとして,格付該当確率モデ、ルについて単一格付から複数格付に自 然に拡張して同時推計するとし、う手法を提案した.この結果を利用して,格付聞の寛厳性についての比 較評価がなされた.なお, SASプログラムについては, NLPプロ、ンジャより一般的な NLMIXEDプロシ ジャへと移行させた.本稿で提案された手法は,一般のロジットモデル構築時にも適用可能な基本的手 法の集合体であり,上記の実務上の要請を効率的に達成するための指針となれば幸いである. ・J o h n s o n変換,欠損値補完,重回帰モデル,同時推計, キーワード:ソプリン,外れ値処理, Yeo 寛厳性評価, NLMIXED プロシジャ, FMM プロシジャ 1.はじめに 企業等が一定期間後にデ、フォルトとなる確率,あるいは格付に該当する確率を推計するために,ロジット モデルが金融機関実務の中で広く活用されている.モデ、ル構築にあたっては,限られた時間コストの中で, 人的スキルによらずに,最良でなくても構わないが一定精度を確保したモデ ルを得たいという実務上の要請 がある.これに対し,木村 (2015a) では,ソプリン(国)のデフォルト確率および格付該当確率モデ、ルの構 築を題材に, W e i g h to fE v i d e n c e (WoEあるいは対数オッズ, Zスコア)を中心に,外れ値処理,変数変換, 欠損値補完,同時推計といった手法の提案がなされた.ソプリンはサンプルが少なく,採用される説明変数 の数が少なくなることが予想され,連続型変数の離散により定義される一般の WoEを用いると,結果である .本稿の内容は筆者に属し,所属組織の見解ではない さらに,商用利用目的でないことも明記しておく. 85
デフォルト確率も離散的になる恐れがあるため, Y
e
o
‑
J
o
h
n
s
o
n変換 (
Y
e
oandJ
o
h
n
s
o
n,2
0
0
0
) を用いて連続型
変数としての WoEに変換がなされた.また,モデル構築のベースとなる過去データは,一部の国のデータ入
力が遅延することに加え,そもそも収録されないデータ項目も多数存在するため,欠損値を含むサンプルを
除外してモデ ル構築をすることは不可能である.これについては前述の WoEを用いて重回帰モデルを繰り返
し推計する単一代入法が提案された.加えて,デフォルト確率モデルと格付該当確率モデルを独立に推計し
たのではデフォルト確率と推計格付聞の整合性がとれないため,両モデルで説明変数とウエイトを共通化し,
両モデ、ルの対数尤度加重和を最大化するとし、う枠組みで同時推計がなされた.
本稿では,木村 (
2
0
1
5
a
) が単一の格付を想定していたところを,複数の格付にも対応できるよう自然な拡
張を試みた.また,この結果を利用した格付聞の寛厳性評価(山下, 2
0
0
5
) として,モデルパラメータを用
いた評価手法を提案した.最後に付録として SASプログラムを添付した.なお, SASプログラムについては,
木村 (
2
0
1
5
a
) で重用された SAS/ORに含まれる NLP プロシジャを,より一般的な SAS/STAT に含まれる
NLMIXEDプロシジャへと移行した.
2
. データと分析の枠組み
対象国は世界銀行(世銀)の加盟国である 1
8
8か国,対象期間は 2
0
0
1年から 2
0
1
5年までの 1
5年聞を採用
785先(国・年)であった.説明変数用データとしては,世銀の WorldDevelopment
した.有効なサンプル数は 2,
n
d
i
c
a
t
o
r
s (WG
I)の年次データをベースに, WDIに収録され
I
n
d
i
c
a
t
o
r
s (WDI) と TheWorldwideGovemanceI
ていない国の対外債務残高については,
Q
u
a
r
t
e
r
l
yE
x
t
e
m
a
lDebtS
t
a
t
i
s
t
i
c
s (QEDS/SDDS) と CIAの TheWorld
F
a
c
t
b
o
o
kにより補完した 1 なお,原データに存在する指標以外にも,いくつかの指擦を計算し追加,さらに
フロー型変数を利用する指標は,過去 2年の算術ないし 3年の幾何平均操作を実施した.
デフォルトフラグ、については,主要債権国会議(パリクラブ)
:
.
.
!
l
'(
1
へ持ち込まれた年と C
r
u
c
e
sandT
r
e
b
e
s
c
h(
2
0日)にて調査され
山
た債務リストラ (
d
e
b
tr
e
s
t
r
u
c
t
u
r
i
n
g
) 年をデフォルトと認定し作
JI
(
J
'
0句
~r.
M三
白
・
.
一色
1
:
'
:
:
(
1
'
f
,
'
,
成した 2 なお,デフォルト年の翌年と翌々年はデフォルトが継
川
1町
続している状態(既デフォルト状態)とみなし,さらに,その
ω
翌年は非デフォルト状態に復帰したか否かの確認に用いるた
仰
l
口氏れれ
80
め,デフォルト後の合計 3年間をデフォルト確率モデル推計時
。園田ー圏圃ー園田園ー
二
{
凶 lυ二 n
;
! u1 f
)
九
の分析対象外とした.図表 lにデフォルト率の時系列遷移を
勺 .
.'
l
̲~え
,10 11 12 l:j 1‑1 1
υ
¥
; 0
‑
;
‑ (
)
>
j m
E盟国 f 〆 n ル
弓
九
J
吹ー一一子
J
!
''
t
.
‑f
'
?
ι
;~î 1定J
図表 1:デフォルト率の時系列遷移
示した.デフォルト確率モデル推計時の分析対象サンプル数は
2,
495先(全体の 8
9
.
6
%
),うちデフォルトサンプル数は 60先,平均デフォルト率は 2.
4
05%であった.
格付については,格付投資情報センター (R&I)を含む格付機関 5社が前年 1
2月末に付与していた格付を
当年の格付とした.対象期間における格付該当確率モデ、ル推計時の分析対象サンプル数は
1社でも格付が
振られていたことを条件として, 1
,
706先(全体の 6
4
.
1
%
) であった.
モデル構築の枠組みとしては,データの収録時期の遅れを考慮し ,
t‑2年の WDIとt‑3年の WGIにより,
t年のデフォルト確率および格付該当確率を推計することとした.
1
2
為替換算方式,基準日の相違等で,各データ聞の対外債務残高は必ずしも一致しないが,補正せず利用した.
債務リストラ年データでは,記憶に新しい 2
0
0
5年のアルゼンチン, 2
0
1
2年のギリシャがデフォルトとして認識される.
8
6
3
. 幾つかの数学記号の事前準備
i:サンプル番号 ,N サンプル数 ,]:変数番号 ,M 変数の数,
Xji: 変数(候補指標),
Uji :データ有無
フラグ (Xjiが欠損値のとき 0,データが存在するとき 1
),δi'デフォルトフラグ(デフォルトのとき 1,非デ
フォルトのとき 0
)とする.変数 jについて巧f
iが欠損値で、ないサンプル番号の集合を初= {
i1
(
1:
$
; i:
$
; N) n
(Uji = 1
)
},サンプル iについて Xjiが欠損値で、ない変数番号の集合を M i = (
j1
(
1:
$
; j三
M)n(
的i = 1
)
}
とする.なお,サンプルにおいて,対象固と基準年を明示的に扱う必要がある場合は, i=i(
1,
t
)と表記し,
1:対象国 ,t 基準年とする.
4
.外れ値処理と Y
e
o
‑
J
o
h
n
s
o
n変換を用いた変数変換
WoEの定義は,サンプル全体と部分集合の(デフォルト率に関する)対数オッズ比であるため,一般に連
続型変数の場合は離散化(カテゴリ化)が必要とされる.サンプル全体のデフォルト率を Po,対数オッズ、を μ,
X
j
i
を離散化し, c
番目のカテゴリ(之i,
c :
$
; Xji く Xj,
C+l) に属するサンプルのデフォルト率を Pj,c> 対数オッズを
2
りょとして,
このカテゴリの WoE (WoEj,
c
)は
,
いん一 ,
W o ι =I
n1
‑
:
‑
ムL‑i‑lnlJL
,
,
‑
¥
1‑Pj,
c
/
μ
¥1 ‑ POI
μは定数項で、あるので, Wo号
E
j
型変数を離散化せず,連続型変数のまま単変数にてロジットモデ、ルを推計し,得られた対数オッズ (
Zスコ
ア)を実数空間上で定義された WoEと考えてもよい.ただし,連続型変数を説明変数とする際には,外れ値
の処理と変数変換の選択が,モデル精度向上のためには不可欠である.前者についてはグリッドサーチ,後
e
o
‑
J
o
h
n
s
o
n変換 (
Y
e
oa
n
dJ
o
h
n
s
o
n,2
0
0
0
) を用いて対応した.
者については Box‑Cox変換を負側へ拡張した Y
具体的な処理の流れは,以下のとおり.
(
1
) 変数 Xji (
iEN
j
) を選択.
(
2
) Xji の下限値候補巧~~n (
k1
=1,… , K1 ) と上限値候補巧~~x (k2 =1,… ,K2) を列挙.
実際の下限候補値は 1%,
2%,…, 20%,上限候補値は 80%,
81%,
・
・
, 99%タイル値.
(
3
)巧E
?と巧恕xを組み合わせて K=K1X K2個の候補変数Yjkiを定義.
n
:
のとき 3 = 明 ~n
i
nく巧zくザアのとき Yjki =巧i ト 巧ki =max(min(
f
),椛?).
明 :
巧 内E
巧i:$;椛
明
i
k
i
イ
x
;g勾 のときめ = ゆ ~X
t
k
i
j
(4)K個の Y
j
l
c
iに対し,基準点移動(恥)を考慮し,累乗パラメータ
J
o
h
n
s
o
n変換
・
) を lつだけもつ Yeo
(
A
‑
jk
を施したものを説明変数とした単変数ロジットモデ、ルを最尤法にて推計 3
パラメータは, min(
$
;1
の範囲に制約
)三匂 k:$;max(
), ‑1三 λjk :
ゆ?, O
明ア, 0
(5) 得られた K 個の結果のうち,尤度が最大となるときのパラメータ(句 k' 舟 k' めk' 今 k' 巧E:n ,巧~~x)
3
基準点における 2階の微分係数の連続条件を課さなければ,基準点の左右で、累乗パラメータを異なるものとしてよいが,
実際には,ほとんどの変数において AIC基準での精度向上(対数尤度の l以上の改善)は認められなかった.
87
および号制を採用し,変数ギ; iから Zスコア勿への変換式を確定(インデックス kを削除). 後続の欠損値処理に利用するため, Zスコアの上下限値号min,ろ maxを計算. 単変数ロジットモデルの構造は以下のとおり. n 制 = 句k T 何 k Pjki r { 1+ m 皿(恥ーりわ O ) } (1+Ajk)ー1 {1‑min(巧ki‑ CjkoO ) } ( l ‑Ajk)‑ 1 1 i 1+Ajk 1‑Ajk I =1 / ( 1+e‑Zjki), なお ,Ajk=士1のときは ,Ajk→ :t1の極限と解釈することで,自然対数関数となる.また,推計にあたっ ては,推計用デフォルトフラグ ( 8 f)として,非デフォルト先は一律ゼロではなく, 0.030%(AAA格 ) , 0.035% (AA+, AA, AA‑ 格 ) , 0.040% (A+, A, A‑ 格 ) , 0.045% (BBB+,BBB,BBB‑格 ) , 0.050% (BB+ 格以下,無格付) とみなし,格付機関 5社で平均した値により微小なデフォルト率を与えた 4 このことにより,デフォルトの Zスコアが発散しないよう推計の安定化に配慮した. ない上位格の序列と, ‑ 2 ‑ 3 ‑ 4 ¥ ド¥ 、 . . . . ‑ 5 、 ‑ 、 ト ‑ 6 ー7 o ~ ~ ̲ ~ ト ー ーー ~ ̲ ~ B ~ 図表 2:1人当たり GDP/ 世界平均[%] (横軸)と Zスコアの関係(左図),デフォルト確率換算との関係(右図) 一例として,図表 2に l人当たり GDP/ 世界平均の原数値[%]と Z スコアの関係(左図),デフォルト確率 換算したものとの関係(右図)を示した.本変数の基準点移動パラメータは匂=1 3 . 1 8,累乗パラメータは Aj =一0.61で あった.原数値と Zスコアの関係は,基準点の右側では 0.4乗変換のため平方根変換に近く,左 側では(区聞が短いのでわかりにくいものの) 1 .6乗変換となっている.また, Y e o ‑ J o h n s o n変換の特性から, 基準点、において滑らかに接続されていることもわかる. 本作業にあたっては,非線形な変数変換パラメータのある説明変数を用いた単変数ロジットモデルの推計 に対応するため NLMIXEDプロシジャを利用した(詳細は付録を参照). NLPプロシジャと同様, NLMlXED プロシジャにおけるパラメータ制約条件も, BOUNDSステートメントにより指定すればよい.上下限値のグ リッドサーチにあたっては,マクロ変数ループにて, 1回目は全探索範囲を 4%刻みのグリッドで探索し尤度 基準により最適格子点を決定, 2回目は l回目の最適格子点の周囲を 2%刻みのグリッドで探索し最適格子点 を決定, 3回目は 2回目の最適格子点の周囲を 1%刻みのグリッドで探索し最終的な最適格子点を決定するこ とで,総当たりでの探索を回避し総探索回数を抑制した 5 はパーゼ、ノレ規制に定められるデフォルト確率の下限値であり,設定の参考とした. 40 .03% 5 したがって,総当たりを実施したときの最適格子点とは異なるかもしれないが,実務的にはそれで十分である. 88
5 .重回帰モデルによる欠損値補完処理 Zスコア Z j iが欠損値である部分 ( ir t .N jまたは j. t rM i) につき,欠損値ノ 4ターンに応じた 4種類の重回帰 モデルを繰り返し推計する単一代入法を用いて補完した.欠損値補完をデータ原数値でなく Zスコアを利用 することの利点は,原数値の欠損値補完において留意しなくてはならない各変数問での分布の相違,あるい は偏りの補正といったことから解放されることが大きい. 具体的な処理の流れは,以下のとおり. ( 1 )勾i ( ir t .N j ) の初期値(推計値)として ,j E Miの Z スコア勾tの単純平均値などにより補完. ただし,前章で決定された Zスコアの上下限値の範囲を超えた場合は,上下限値を採用. ( 2 )Z j t ( iEN j ) を被説明変数 (y) に,説明変数 (X) の異なる重回帰モデ、ル A‑Dを推計. 推計対象:iε1 可 ( t ) の Z スコア Zj 'i ( J ' 学j ) A:Xは Y 以外の同一年 i ‑, 河川 t ‑ l ) B:Xは A の説明変数 +yのtー 1年の Zスコア Zji‑(I, 推計対象 C:Xは Aの説明変数十Yのt+l年の Zスコア Zji+(I, t +l) 推計対象:i , i +EN j D:Xは A の説明変数 +yのt平 1年の Zスコア Zj円 1 ,トザ Z j内 I , t + l ) 推計にあたっては,切片(ザ)を除く係数パラメータは正値に制約 推計対象:i ‑, i , i +ε明 Y 4,Y 4三 0). (pb, なお ,Z j i ( i εN j ) が上限値(ろmax) または下限値(ろmin) をとり,前プロセスで得られた勾iの推計値が Z j iと同じ上限値または下限値にある場合は,当該サンプルは推計対象外(推計値が上下限値の外側にある 場合,一般の最小二乗法では誤差がゼロと評価されないことを回避するため). ( 3 ) ir t .N jに欠損値パターンにしたがって,重回帰モデル A‑Dを適用し, Zスコアの推計値宅; iを計算. A:時系列全データが欠損値のとき適用 B: 過去方向にのみ l時点以上データが存在するとき適用 C: 将来方向にのみ I時点以上データが存在するとき適用 D: 両方向に l時点以上データが存在するとき適用 n) の外側になる場合は,上限値または下限値に変更. j tの値が上限値(ろmax) または下限値 (Zri なお ,Z ( 4 )引と Z j iを比較し,変化が一定値以下となれば終了.軍隊がある場合は ,Z j i ( ir t . N j ) の値を今日方向へ近づ けて更新し, ( 2 )の重回帰モデルの再推計. 重回帰モデルの構造は以下のとおり. 4 1 = m a x im i n iザ +Lj' jpb‑引 +y4今i‑(I,t‑l)+vZ ‑ろ 内t+l), ろmax1 , Zjmin I 学 、、 M=8orD M=CorD / / ここで ,M =A, 8, C, D :モデルタイプである.数式では幾分わかりにくいので,コンセプトを要約する. モデル A は被説明変数 (y) と同時点(クロスセクション)の Z スコアを説明変数 (X) に利用したモデ、ル である.当該国における Yの時系列データが全て欠損値の場合は,モデル A を利用して補完することになる. しかし, y の時系列データの幾っかにデータが存在する場合は,それを利用したほうがクロスセクションの みから推計するよりも精度は高いはずである.モデ ル B/C/Dは Y 自身の l期前のみ/後のみ/前後両方 のデータを X に加えて利用したモデルである.当該国における Y を推計したい時点より前方/後方/前後両 89
方に Iつでもデータが存在すれば,そこを起点として将来方向/過去方向/中心方向にモデ、ル B/C/Oで当 該時点まで連続的に推計がなされるため,安定的な結果を得ることが期待できる. 一例として,図表 3に全期間で欠損 ‑2.5 値補完されたアルゼンチンの一人当た 世界平均 Z スコアと,それと り GOP/ ‑10 関係の強い規制の質 (WG I)の原数値 ‑3.5 と Zスコアを示した 6 ここでの横軸は ‑4.0 1 .0 ι ‑ ̲ , . . . 、 ~‘/ーー ‑ 、 , 一 . . . . . . ・ ! 1 、一、、------~ ~ 1 ¥ 1 ~ーー' 0.5 。 。 1 ‑0.5 デフォルト観測年であり,実際のデー タは, WDIは 2年前, WGIは 3年前の ものを参照していることに留意しなけ 0 0 5 ればならないが,アルゼンチンは 2 年にデフォルトしており,一人当たり 1 .0 ‑ 4 . 5 ‑5.0 2 0 0 10 2 0 3 0 . 1 0 5 0 6 0 7 0 8 0 9 1 0 1 1 ーーー・ Z 一人当たり G D P I世界平均 1~ 1 3 1 4 1 5 1 6 ‑ 1 .5 一 一 ‑2:規制の質{日i Gl ) ••••••••• X:規制の質(百G[) (右目盛) GOPI 世界平均 Z スコアの動きと整合 図表 3:欠損値補完されたアルゼンチンの l人当たり GDPI世界平均の Z 的である.実際の重回帰モデル A を確 スコアと規制の質 (WG I)の時系列推移 ( 2 0 0 5年にデフォルト) 認したところ,係数パラメータが最大 であったものは,規制の質 (WGI) の Zスコアであり,図表より,その影響を反映したものと解釈できる. 0 0 5年以降も高止まりしていることから,別の変数の影響により, ただし,規制の質 (WGI)の Zスコアは, 2 世界平均 Zスコアは 2 0 0 3年以前の水準まで低下したものと考えられる. 一人当たり GOP/ 本作業にあたっては,係数パラメータを正値に制約する重回帰モデルの推計に対応するため FMMプロシ ジャを利用した(詳細は付録を参照).それ以外の部分,たとえばモデル A~O の繰り返し処理,欠損値パタ ーンによる推計値の選択,上下限値処理,収束判定などは,マクロとデータステップで処理した. 6 . デフォルト確率モデ、ルと複数の格付該当確率モデ、ルの同時推計 前章までに得られた欠損値のない Zスコア Zjiのデータをもとに,最終的なロジットモデルであるデフォル ト確率モデルと格付該当確率モデルの推計を実施した.これらのモデルをそれぞれ独立に構築するという考 え方もあるが,説明変数と係数パラメータが異なることになるため,デフォルト確率の高い先の格付が必ず しも低くならないという事態が発生しうる.では,デフォルト先を格付最下位として格付該当確率モデル 1 本で推計すればよいというアイデアもあるが,すべての先に格付が振られているわけではなく,無格付先が 必ずしも格付下位先でもないために,その取扱いに苦慮することになる. 木村 (2015a) では,両モデルの説明変数と重みパラメータを共通とすることでデフォルト確率と格付の整 l p,l R ) の加重平均値 ( I T ) を最大化する同時推計により,パラメ 合性を維持しつつ,両モデルの対数尤度 ( ータ(的, α,s,a , i J sR) を決定した.この方法であれば,無格付先はデフォルト確率モデルの対数尤度に は寄与するが,格付該当確率モデルの対数尤度は一律ゼロとすることで自動的に評価対象外とすることを可 能とした.さて,本稿では複数の格付へと拡張する必要がある.格付機関ごとに格付該当確率モデルを設定 における一人当たり GDPは,購買力平価にて定義されるためか,アルゼンチンには本データが存在せず欠損値. 6 WDI 名目 GDP ,GDP成長率等のデータは存在しており, GDP関連指標がすべて欠損値というわけではない. 90
するのが自然であるが,説明変数と重みパラメータを共通にするか否かは意見が分かれるところである. 《方法 l~ 全格付機関の格付該当確率モデ、ルおよびデフォルト確率モテ、ルで説明変数と重みパラメータは共通. このことにより,いずれの格付機関の推計格付およびデフォルト確率とも整合性がとれる. 一方で,そもそも格付は,格付機関ごとの意見表明であり,それは見るべきポイント,重視するデータ がそれぞれ異なっているからこそ生まれるものだとするならば,上記の共通化は現実に反する. 《方法 2~ 格付機関ごとに格付該当確率モデルおよびデフォルト確率モデ、ルを構築. 格付機関ごとの両モデ、ルでは説明変数と重みパラメータは共通だが,別の格付機関とは異なってよい. このことにより,格付機関ごとに重視しているデータが特定され,その比較は興味深い. 一方で,最終的には全格付機関で平均操作を行い単一の推計格付とデフォルト確率を求めることになる と恩われるが,その際には整合性が崩れる可能性が高い. いずれの方法もメリットとデメリットがあるが,本稿では《方法 1~ にしたがし、検討をすすめることとし た. <<方法 2d>は,出力結果が大量になることが想定され,これについては別の機会に譲ることとしたい. 具体的な処理の流れは,以下のとおり. ( 0 )格付該当確率モデルの分析対象先について,木村 ( 2 0 1 5 a ) では,既デフォルト先を除外していたが,デ フォルト後の格付は急降下し,経済データの悪化も想定されるため,下位格付データを確保するべく本稿 では分析対象先に加えた.なお,デフォルト確率モデルの分析対象先については変更なし. ( 1 ) デフォルト確率モデルと複数の格付該当確率モデルの同時推計.ただし,格付は全 6格に集約. l格 :AAA,2格 :AA+, AA, AA‑,3格 :A+, A, A‑,4格・ BBB+,BBB,BBB‑, 5格 :BB+,BB, BB‑,6格 :B+ 以下. ( 2 ) デフォルト確率モデルについては,同時推計で得られた結果で確定. ( 3 )格付該当確率モデ、ルについては,説明変数と重みパラメータ(すなわち中間変数)を固定し, 全 1 6格の格付にて再推計. l格 :AAA,2格 :AA+,3格 :AA,…, 1 4格 :B+, 1 5格 :B, 1 6格 :B‑以下. ( 4 ) 出力される複数の格付該当確率については,格付機関 5社で単純平均して代表格付該当確率を計算. ( 5 )各サンプルの格付該当確率を上から積算して 50%点が含まれる格付を,当該サンプルの推計格付と決定 7 最終的なデフォルト確率モデルと格付該当確率モデルの構造は以下のとおり. (中間変数) L w i ら一吋=工的叫ぃ Z i= ρ Jr V し .J EeJ ︑ 4Eム ︑P・ .J hn ︑ ︐ ︐ ︑ + 何︑ 日︑一 Itd て︑/'﹄i ウ/ー パ 1f ︑ α デ=+ モ向︒ 率 'b 確あ・ 1 トp 町 オ パ+可 フ一一一一 デ弓ら・ 7 この方式を中央値方式と呼称.これに対し,該当確率が最大の格付を推計格付とする方法もあり,最大確率方式と呼称. 後者の場合,推計格付として登場しない絡付が発生し得ることに注意すること. 91
BB e ‑ノ k ︐ ' t z 4E ム ︑ ︑ ︐ + 工 的 : ? ) , Z : ; ; T何 回 一 1,l R k= ー T =r . max Ea'' 一 A川 bE向 ft kz F‑ 圃 ︐ ︐ ︑1 b‑同 1 B ︐ B EJ 一 J n u z ‑︑ ‑ Lr t ︑ ︑ z z ι ‑ ‑ ‑・ 4i4i41 ee1 ++︐ M i4i4i 噌 b凡 D ba r ‑ L 一 一 ︽ i Z R b κ nur rR α + ゐ民 rL Z 一 一 ff1 t1 I'JI'‑ ftill411111 ︑︑ ‑ ハ ︐︐ ︑ (格付該当確率モデル) (対数尤度の加重平均) l r=α 0・lp+α 1・l R1 +a 2. l R 2+α 3・l R 3+a4・l R 4+α 5・l R S ' ここで, Wj: 旬にかかる重みで,制約条件Z町 =1,町三 Oを満たす.z i ' Pi:サンプノレi のデフォルト確率モ デルの Zスコアと確率 ,z h,P. t k サンプノレi の格付機関 k,格付rIこかかわる格付該当確率モデ ルの Zスコア u と確率 ,Tm酷:全格付数 (6 o r 16),η.k :サンプル こ対して格付機関 kが実際に付与した格付, α。=0.7, a1‑as=0.06・対数尤度の加重で,木村 ( 2 0 1 5 a ) よりも 0 . 1だけ格付該当確率モデルのウエイトを高めた. 本作業にあたっては,対数尤度の加重和という特殊な評価関数の最大化が必要であるため NLMIXEDプロ シジャを利用した(詳細は付録を参照). NLMIXEDプロシジャによるパラメータ確定後は,中間変数である 会を固定すれば,デフォルト確率モデル,格付該当確率モデ、ルをそれぞ、れ独立に推定しでも同時推計と同様 の結果が得られる.よって,検算を兼ねて LOGISTICプロシジャにかけることで,豊富で有益な出力結果(順 序統計量, Hosmer‑Lemeshow検定 (LACKFITオプション)など)を利用することが可能である. 7 .最終結果と精度確認、 A. 中間変数を構成する説明変数の 図表 4:中間変数を構成する説明変数の重みパラメータと説明力 説明変数名称 推計値 p値 共分散 重みパラメータと説明カ パラメータ α , β , α~k' sRkにつ いては結果を省略し , Wjの み 図 表 4に示した.表中の「説明力 Jとは, p値だけでは判断が難しい個々の説 説明カ 0 . 0 0 0 2.8% 自分散 債務手j I 息支払/歳入 0 . 0 5 3 0.8% 総国民貯蓄率 0 . 0 7 9 0 . 0 0 0 6.7% 1 . 4% 消費者物価上昇率 0. 16 1 0 . 0 0 1 4.2% 0.8% 為替レート変化率の 3年標準偏差 0 . 1 4 4 0 . 0 0 2 2.1% 0.6% l人当たり GDPI 世界平均 0 . 1 7 9 0 . 0 0 0 26.2% 8.8% GDP/ 世界合計 0 . 0 5 5 0 . 0 0 2 6.4% 0.9% 度合を見積もったものである.中間 対 外 債 務/GDP+f '( G D P / 世界合計) 0 . 0 8 0 0 . 0 0 0 6.9% 2. 3% 変数である Z iのサンプル全体での 政府の有効性 ( W G I ) 0 . 0 9 9 0 . 0 0 0 .0% 21 5.8% 全分散 ( V a r ( z 川は, 政治的安定と暴力の不在 ( W G I ) 0 . 0 4 9 0 . 0 5 3 4.1% 0.4% V a r ( Z a= C O V ( Z i 'za 規制の質 ( W G I ) 0 . 1 0 0 0 . 0 0 0 19.6% 5 .1% 明変数が全体の結果に与える影響 =COV(Zi'L町 W叫 = 工 的 COV(Zi'Wo時 i ) , であるから,その構成割合として,的・ C O V ( Z i 'WoEj i )/Var(会)を共分散による説明カと定義した 8 また,個々 の説明変数聞の相闘がゼロと仮定すると,町・ C O V ( 会 , WoEj i ) f V a r ( Z i ) I ま吋.Var(Wo号i)/Var(会)となり,これ を自分散による説明力と定義した.共分散と自分散の差が,他変数からの影響と捉えることができる.さて, 8 この考え方は,与信ポートフォリオリスク(バリューアットリスク)計量化時における非期待損失額 ( U L :U n e x p e c t e d L o s s ) を個々の構成要素へ配賦する手法として知られる「標準偏差ベースのリスク寄与度 J と同一である. 92
結果をみると,最も説明力の高い変数は,一人当たり GDP/世界平均であり,全体の 26.2%の分散が説明され た.さらに, GDP/ 世界合計 (6.4%)を加え, GDP関連変数が基本的なモデルの骨格を形成した. WGIから は,政府の有効性 ( 21 .0%),規制の質 ( 19.6%),政治的安定と暴力の不在 ( 4. 1%)が選択され,合計で 44.7% の分散が説明された.対外債務/GDPを GDP/世界合計の平方根にて補正した指標について,木村 (2015a) で はモデ ルに取り込むことができたものの,説明力は 2.9%にとどまったのに対し,本稿の結果では 6.9%に増加 したのは,格付該当確率モデルの分析対象先数と対数尤度の加重を増加させたことが要因と考えられる. 方で, GDP成長率は有意とならず,格付上位国が低成長であることを反映してのことと考えられる. B .デフォルト確率モデルにおける各種検証 (AR値 , KS値,ダイパージェンス, HL検定) 図表 5に各種検証結果を示した.各種統計量と Hosmer ・ Lemeshow検定 (HL検定)の詳細については,山 D i v . ) は,デフォルト確率 下・三浦 (2011),森内・木村 (2009) を参照のこと.なお,ダイパージェンス ( の対数オッズに基づいて計算 図表 5:デフォルト確率モデルにおける各種統計量(左)と HL検定(右) AR値 : プ ト ス ト フ ツ プ よ る 計 統 量 2 言 KS催 統計量 0 . 6 7 3 標準誤差 0 . 0 4 8 平均値 0 . 6 7 2 0 . 5 6 8 標準偏差 0 . 0 4 7 1 .0% サン プル数 D i v . デフォルト数 実績 推計 した.ここでのブートストラ ップは,モデルの推計結果は 変更せず,ランダムサンプリ 2 5 1 0 . 0 9 0 . 1 2 2 250 0 . 1 0 0 . 3 8 1 .9 34 3 250 0 . 1 1 0 . 9 0 0 . 0 5 2 0 . 3 1 8 4 250 3 . 1 2 1 .6 7 0 . 5 5 9 0 . 4 4 1 1 . 307 5 250 3 . 1 2 2 . 5 9 2.5% 0 . 5 7 3 4 6 1 0. 1 . 363 6 250 3 . 1 2 3 . 6 4 てしまったが,前述の理由同 4 . 9 5 様と考えられる.HL検定の結 0 . 5 5 9 1 .9 1 2 ングによる統計量の変化のみ を分析対象とした. . 6 7 3であり,木村 AR値は 0 (2015a) からは 0 . 0 5 3低下し 5.0% 0 . 5 8 8 0. 4 80 1 .4 2 8 7 250 2 . 1 1 1 0 . 0 % 0 . 6 1 3 0 . 5 0 5 1 .5 5 4 8 250 3 . 1 2 6 . 7 8 果は , p値が 0 . 7 8 3 とランク 25.0% 0 . 6 4 1 0 . 5 3 3 1 .7 2 2 9 250 1 4 . 1 2 1 0 . 7 8 50.0% 0 . 6 7 2 0 . 5 6 8 1 .8 9 5 1 0 244 2 9 . 1 1 33 29. 75.0% 0 . 7 0 4 0 . 6 0 1 2 . 1 3 4 90.0% 0 . 7 3 3 0 . 6 3 7 2 . 3 6 2 4 89 2. d値 自由度 4 . 7 6 1 p値 8 別のデフォルト数の推計と実 績の差は小さいことを示した. 本作業にあたって,ブート 0 . 7 8 3 ストラップについては, 95.0% 0 . 7 4 7 0 . 6 5 1 97.5% 0 . 7 5 8 0 . 6 7 0 2 . 5 8 8 SURVEYSELECT プロシジャ 99.0% 0 . 7 8 5 0 . 6 8 7 2 . 7 8 3 を利用した.元のサンプル数 と同数まで抽出するには r SAMPRATE=1 J,本稿では利用しなかったが各国のデフォルト数と非デフォルト 数を一定に保持したければ STRATAによるデフォルトフラグ別の層化抽出を行えばデフォルト率変動による 影響を除外できる. 図表 6 :推計(行)一実績(列)集約格付マトリクス C .推計一実績格付マトリクスと一致率, 順位相関係数 図表 6に,全 6格に集約した格付にて,推 I:AAA 2:AA 3:A 4:BBB 5:BB 6 : B I:AAA 2:AA 3 : A 9 3 1 1 1 3 6 計と実績の比較をマトリクスにて示した.格 4:BBB 付機関ごとに作成されたマトリクスの各セル 5:BB の値を合算したものである.一致率(対角成 1 2 7 2 1 3 202 1 7 1 4 8 497 1 0 1 8 7 6 : B 、 l 1 9 3 1 2 2 678 3 1 6 7 2 46 2 0 3 500 276 1 7 6 7 4 6 7 ぷ E語 3霊 ロ + 1 , 0 5 0 93 5 5 2 , 030 8 5 0 1 合計 全体 1 , 0 7 6 1 , 3 3 1 496 8 3 2 706 1 , 1 9 8 , 0 8 8 1 0 2 7 2, 5 9 6 980 2, , 0 6 7 929 6 849 1 3, , 070 5, 4 0 1 1 9 2 5
分÷全体)は 3, 565+5, 4 0 1=66.0%,順位相関係数は 0 . 9 3 1であった.木村 (2015a) と比較すると,一致率が +3.7%,順位相関係数が+0.7%,それぞれ向上したが,前述の理由同様と考えられる.なお,右端は無格付先 の国も含む全体の集計結果であるが,推計格付の下位先は格付が付与されにくい(格付の需要がなし、)とい う直観と合致する結果が得られた. D.2016年推計格付(代表格付)の世界地図による確認 図表 7にアウトサンプルである 2016年の推計格付を世界地図に落とし込み確認した.この推計格付は, 格付機関 5社の格付該当確率モデルによって得られた各格付への該当確率を,確率のまま平均し,中央値に よって決定した代表格付である.地図は, GMAPプロシジャにて作成した (MAPSGF K .WORLDATTRの国 コードは変更がないか要確認のこと). ノ ' 悼集格付 c : コ AAA C コ帥 ~AA E呈罰 BBB &aI889 ‑ 圏直面..・ 司 . . . I i i 軍 司 . . . ・ ・ ・ ・ . .・ ・ ・ B & ‑・ ・ ・ ・ ・ ・ ・. ・ ・ . E3]A A ‑ llE週伽 医亙l' 8・ E 8 図表 7:2 0 1 6年世界の推計格付(代表格付) E .格付機関聞の寛雌性評価 ①格付闇値に対する Zスコアの比較 本稿では,各サンプルの格付該当確率を上から積算して 50% 点が含まれる格付を推計格付と定めている. 他方,デフォルト確率モデルと格付該当確率モデルは,共通の中間変数を用いている.この結果,各格付聞 の閥値に対応するデフォルト確率が求められ,こ O . S 札 ~.~.~ ζ 」 F ぷ'‑tーJ . S の値の高低により寛厳性を評価することとした・ :::~~ 格 付 rと格付 r+lの聞の中間変数の閥値は, z ス 0 . 2 Z [ k=αk k+P R k・Zi=0を解いて,会=ー αk k l P R k・ ア 0 . 1 . S . O これをデフォルト確率モデルの定義式に代入し, 5 0 . 0 社 平 . ( ) . I ・S . S均 Z i=α+β ・Z i=α 一( P I P R k ) a k . 右辺の各パラメ k ータを代入すれば,左辺のデフォルト確率モデル の Z スコアが計算でき,定義式からデフォルト確 率に容易に変換できる. 一 一 一 一 ー 一 一t‑ 4 . 0 ‑ 4 . S 5 2 Z ・ 6 . 0ス ヨ 均 z・ 0 . 2 . 6 . Sア ス ‑ 7 . 0 ヨ.().J ア ・ 0 . 4 . 7 . S . 1 "$ ~.,fザやザダ~~~ ~~'" ~qf ~~ ~'"ザ。 図表 8に格付闇値に対する Zスコアを示した. 格付 図表 8:格付関値に対する Zスコアの比較 94 華 . 8 . 0
ただし,単純に Zスコアを表示したのでは線が重なって比較しにくいため,閥値ごとに 5社平均の Zスコア を計算し,それと各社との差分を表示した.高格付順であるので,閥値としての Z スコア(デフォルト確率 でも増減関係は閉じ)は低いほうが厳しい評価をしていると解釈される.図表によれば, A社と B社に比較 して,明らかに C社 , 0社 , E社は厳しい評価であった.ただし, AAA格から A格にかけて差は縮小しつつ 格にかけて再度拡大するような傾向がみえた.なお,最上位格の AAA格については, C社 も , A 格から B+ と E社が厳しく, 0 社は平均に近い評価であった.ところで, 5社平均の Z スコアが直線的であるのだが, これは,非デフォルト先に対する推計用デフォルトフラグ ( δ ; ) が,格付別に設定された値であることを反 映した人工的な結果であると考えられる. R 格付機関聞の寛雌性評価 ②代表格付と推計格付の比較マトリクス 前節では,パラメータの値のみから寛厳性評 図表 9:代表(行)ー推計(列)集約格付マトリクス (A社) 価を実施したが,実際のサンプルが各格付にい I:AAA 2:AA 3:A 4:BBB 5:BB 6 : B かほど含まれるかも評価しておく必要があろう. I:AAA 260 この場合,たとえば 2つの格付機関ごとに比較 2:AA 2 行列を作成したのでは, 5社では 10枚になって しまう.さらに,格付付与先のみで比較したの 3 : A 260 1 4 1 1 2 1 4 3 230 242 4:BBB 386 5:88 1 0 5 では,その偏在によっては,比較が困難なケー 6:8 合計 スもあろう.本稿では,格付機関 5社の平均操 2 6 2 合計 1 5 3 230 4 9 1 386 418 5 2 3 1 4 3 1 , 0 8 8 1 , 2 3 1 5 6 1 1 , 0 8 8 2 , 7 8 5 作により代表格付を定義したので,これを基準 格付とし,各機関の推計格付との差異にて評価 80% した.推計格付であれば,無格付先を含み全先 6 0 " 1 0 が評価可能である. 4a 也 図表 9 に,例として A 社の代表集約格付と 2 0 " 1 0 推計集約格付のマトリクスを示した.たとえば 2:AA格は 2先 (2/143=1 . 4%),3:A格は 1 2先 ' ‑ 一 一 。% ( 12/242=5.0%) しか,ずれていない.このよう ・ 2 0 " 1 0 なずれの評価を格付機関すべてについて実施 ・紛% h 機 成 比 → ー A社 ー 咽 ー B社 ー 唾 ー c 社 ・ # ・ D社 ベ ー E社 したのが図表 10 である . A社の推計格付は 4:BBB格以上の上位格では代表格付に近いこと 図表 1 0:代表格付に対する推計集約格付の不一致率とその方向 がわかった. B社は前節からも予想されるよう , に , 2:AA格以下では緩い評価であった .C社 図表 1 1 :代表(行)一実績(列)集約格付マトリクス (A社) D社 , E社は厳しい評価であることに変わりない. I:AAA 2:AA 3:A 4:888 5:88 なお,低格付先のサンプル数が多いすなわち構 I:AAA 2 成比が高いため, 5:BBと 6:Bの一致率が高い E :AA 3 : A 社が全体としても一致率が高い (94.1%,図表省 4:BBB 略)という結果となった. 以上の比較は,推計格付,つまり推計された モデ.ルを前提にしたものである.図表 1 1のよう 1 7 7 29 1 32 2 1 36 5:B8 2 0 7 89 合計 5 1 7 30 8 7 25 5 2 40 22 1 0 74 8 1 6 24 5 5 3 1 6 3 8 1 0 7 1 4 9 に,実績格付とすると各格付機関の格付先が異なるため.比較が難くなることを再度指摘しておきたい. 95 2 0 3 78 1 0 6 1 4 7 2 3 52 6 : 8 合計 6 : B
8 .おわりに 本稿では,ソプリンを題材に,デフォルトと単一格付の同時推計によるロジットモデルの構築方法を提案 した木村 (2015a) をベースとして,デフォルトと複数格付の同時推計へと自然に拡張がなされた.推計され たパラメータにより,格付機関聞の寛厳性評価の一助となることが示された.また,木村 (2015a)では SAS/OR に含まれる NLPプロシジャを利用していたが,本稿では SAS/STATに含まれる NLMIXEDプロシジャへと移 行させた. SAS/STATは SASユーザーの大部分が契約するプロダクトである.よって,ユーザー自らの課題 に対し,本稿の内容を参考にしながら取組み可能な態勢が整えられたと言えよう.今回は取り組めなかった が,将来課題として,格付機関ごとに説明変数が異なるモデルを構築することで,各機関の格付相違の要因 が掴めれば興味深いと思われる.本稿が,ロジットモテツレ構築における実務上の要請を効率的に達成するた めの指針となり,また企業内で自らロジットモデルを構築したいと願う実務者の方々の参考になれば幸いで ある. 参考文献 [ 1 ]木村和央 ( 2 01 5 a ) . ロジットモデル構築における W e i g h to f E v i d e n c eを用いた変数変換と欠損値処理方法の 提案.2015SASユーザー総会論文集, 2 1 1・ 2 2 0 . ロ]木村和央 ο015め.ロジットモデノレ構築における W e i g h to f E v i d e n c eを用いた変数変換と欠損値処理方法の 提案.第 4回金融シンポジウム講演資料,統計数理研究所リスク解析研究センター. [ 3 ]細野健二,大重斉 ( 2 0 0 3 ) . ソプリンの特性と評価:審査の実例.第 2回金融シンポジウム講演資料,統計数 理研究所リスク解析研究センター. 金融工学とリスクマネジメント高度化」研究会 伊]森内一朗,木村和央 ( 2 0 0 9 ) .格付モデルの構築と検証. r 公開資料, h t t p :1 . 加w w . f f r ‑ p l u s . j p / m a t e r i a V pd f 7100913! k i n k o k e n . p d f ( 2 0 1 6年 6月 1 7日) . [ 5 ]山下智志 ( 2 0 0 5 ) .デフォルト確率推計モデルの相互比較と寛厳性の評価.FSAサーチ・レビュー 2,59 ・ 71 . [ 6 ]山下智志,三浦河 ( 2 0 1 1 ) .信用リスクモデルの予測精度 ‑AR値と評価指標一.朝倉書庖. [ 7 ]C r u c e s ,JuanJ .a n dT r e b e s c h ,Christoph( 2 0 1 3 ) .S o v e r e i g nD e f a u l t s :百 l eP r i c eofH a i r c u t s .Am e r i c a nEconomic 5 ( 3 ), 8 5・1 1 7 . J o u m a l :M a c r o e c o n o m i c s, [ 8 ]Yeo,I n ・KwonandJ o h n s o n ,R i c h a r d( 2 0 0 0 ) .A newf a m i l yo fpower回 n s f o r m a t i o n st oi m p r o v en o r m a l i t yo r S 戸n m e t r y .Biome 甘i k a , 8 7, 954 ・ 9 5 9 . 96
付録A. NLM 医 ED プロシジャによる最終モデルの同時推計 2015年の SASユーザー会にて, SAS/ORに含まれる NLPプロシジャの代わりに, SAS/STATに含まれる NLM1XED プロシジャに移行することで,より多くのユーザーが利用可能なプログラムになるので好ましい とし、う指摘をいただいた.検討を重ねた結果, NLM1XED プロシジャへの移行は可能であることがわかった. 検討過程で課題となったポイントは, NLP プロシジャにて利用している線形および非線形制約条件すなわち LINCONおよび NLINCONステートメントについて,当該ステートメントが存在しない NLMIXEDプロシジ ャにてどのように回避しつつ同様の効果を得るかということで、あった.結論から言えば,これら制約条件を 回避するべく上下限値制約条件すなわち BOUNDS ステートメントのみで表現可能となるよう推計すべきパ ラメータを変更し,プログラミングステートメント先頭にて本来推計したいパラメータに変換し,追加的に パラメータの検定統計量を出力する ESTIMATE ステートメントにて前述のパラメータを指定すればよい. 実際のプログラムは,説明変数の追加・変更など,試行錯誤に対応するべくマクロコーディングが多用さ れており説明には適さないため,ここでは,説明変数 (WoE) の数 3 ,格付機関数 2,格付ランク数 4を前提 とした簡易なデフォルト確率モデルと格付該当確率モデルの同時推計プログラム例を示した. NLMIXED プ ロシジャでは,説明変数 iのウエイト ( W i ) に関する線形制約を利用できないため, BWi=BxWiをパラメー EBWi,Wi=BWiIB と本来推計し タとして推計するものとし,プログラミングステートメント先頭にて, B=. たいパラメータを定義した.また,格付機関 jの格付該当確率モデルの格付 kと k ‑ 1の切片の差(町 k ) に関 する非線形制約を利用できないため, k孟2については D jkそのものをパラメータとして推計するものとし, j k = A j ( k ‑ 1 ) + 町kと本来推計したいパラメータを定義した.通常の プログラミングステートメント先頭にて, A 出力では , P i ほ MS ステートメントに記載したパラメータ以外の検定統計量は出力されないが,後段の ESTIMATEステートメントにより表示可能となるので,それを ODS出力機能 ( A d d i t i o n a 1 E s t i m a t e s ) にてフ ァイルへと格納した.なお,アウトサンプルデータへモデ、ルを適用することも,しばしば実行される.この ESTオプション, NLMIXEDプロシジ 場合のパラメータ渡しは, NLPプロシジャは先頭ステートメントのlN ャは PARMSステートメントにおける DATAオプションとなることに留意されたい. 《入力データ定義》 デフォノレトフラグ(デフォノレト先= 1,非デフォノレト先 = 0,既デフォルト等の分析対象外先=.) D F R K I RK2 Z I z2 Z 3 U 格付機関 l の格付実績(格付保有先 =1~4 のいずれか,非格付先および分析対象外先吋 格付機関 2 の格付実績(格付保有先 =1~4 のいずれか,非格付先および分析対象外先=.) 説明変数 l のW e i g h to fE v i d e n c e 説明変数 2の W e i g h to fE v i d e n c e 説明変数 3の W e i g h to f E v i d e n c e 分析対象フラグ 《出力データ定義》 デフォルト確率モデルの切片 デフォルト確率モデルの傾き W i 説明変数 i のウエイト B W i デフォルト確率モデルの傾き×説明変数 i のウエイト ( = B X W i ) 格付機関 j の格付該当確率モデルの格付 kの切片 A j k B j 格付機関 Jの格付該当確率モデ ノレの傾き D j k 格付機関 Jの格付該当確率モデルの格付 kと k . 1の切片の差 ( = A j k . A j ( k . I ) ) デフォルト確率モデノレにおける対数尤度 L O L l 格付機関 lの格付該当確率モデルにおける対数尤度 L 2 格付機関 2の格付該当確率モデ ノレにおける対数尤度 L L 対数尤度の荷重和(=O. 7 0 XL O + 0 . 1 5XLl+ 0 . 1 5XL 2を採用) Z デフォルト確率モデルの Zスコア P デフォルト確率 P K j k 格付機関 jにおける格付 kの格付該当確率 A B 97
~NLP プロシジャを利用した最終モデノレの同時推計》 ~NLM 欧 ED プロシジャを利用した最終モデルの同時推計》 "'ODSファイル出力設定'" ODSOUTPUTP a r a m e t e r E s t i m a t e s=ODSES T1; ' " ODSファイノレ出カ設定'" ODSOUTPUTP a r a m e t e r E s t i m a t e s=ODSESTI; ODSOUTPUTA d d i t i o n a l E s t i m a t e s=ODSADD1 ; ' " NLPプ ロ シ ジ ャ に よ る 推 計 柿 / PROCNLPDATA=DATAI N I OUT=DATA̲OUTIOUTEST=DATA̲EST1; /帥 NLMIXEDプ口、ンジャによる推計'*' '*パラメータ定義町 '*パラメータ定義町 PARMS A=O,B=I,WI‑W3=0. 3333,'*デフォルト推計用車/ AII=0, AI2=0.5,AI3=1,BIユ 1 , '*格付機関 l用事/ =0 , A22 =O. 5,A23=1 ,B2~ 1 ;'*格付機関 2用*' A21 PARMS 3333,,.デフォノレ卜推計用事/ A=O,BWI‑BW3=0. All= O , D12 ・ 013=0 . 5,BI= ・1 ,片格付機関 I用可 = 0,022‑D23=0.5,B2= ー1 ;,.格付機関 2用句 A21 /事上下限値制約事/ '*上下限値制約 W BOUNDS WトW3>=0 ; B>=O, BOUNDS BW3>=0, D12‑D13>=0 . 0 0 1, D22‑D23>=0 . 0 0 1 ; BWI・ ' * PROCNLMIXEDDATA=DATA IN1 ; '*線形制約:変数ウエイト合計 =1 ,.本来推計したいパラメータを定義*' LINCONWI+W2+W3=1; B=BWI+BW2+BW3; WI=BWIIB;W2=BW2'B;W3=BW31 B ; ,.非線形制約・格付モデ、ル切片は単調増加., 0I2=AI2‑AII;DI3=AI3‑AI2; 022= A22 ‑ A21 ;D23=A23 ‑ A 2 2 ; ・D1 3 >=0 . 0 01 , 022‑D23> =O. 0 01 ; NLINCONDI2 IAI2=AII+DI2;AI3=AI2+D13; IA22=A2I+D22;A23=A22+D23; / 字 率 事 事 . , . ・ e・..,事*ホ噂本*事****事牟.**事*事******事 市*****.象事.市*・,.., I '*事専命..・・・・..車市$噂$・*・*事*.*....傘.牟ホホホ*****事*事'*傘本寧傘ホ....・牟/ /***.次頁の《モデル・対数尤度定義プログラム》を挿入材料, /***事事事事寧...事..事.事事事・$傘キ事..傘傘*牟孝牟本*牟傘牟ホ.,事$事事寧$車掌".寧寧・'" I,材料次頁の《モデル・対数尤度定義プログラム》を挿入..../ LLは対数尤度荷重和) , . "対数尤度最大化 ( MAXL L ; I "傘手$掌傘寧考寧傘事事牢........寧.事$事事"牟$事傘*事.,ホキ本$掌字本傘牟牟傘傘事事・・・・" I,.対数尤度最大化 (LLは対数尤度荷重和) 事/ IMODELU‑GENERAL(LL);円 U:分 析 対 象=1,対象外=.. , /ホデータ出力関係., lD ALL;川 下 記 の DATAOUT1に中間変数等も出力事/ PREDlCTPOUT=DATA̲ OUT1; '*追加出力させたいパラメータ (OOSADOIに出力) 町 ESTIMATE'A ・ A ;ESTIMATE' B 'B ; ESTIMATE' W I 'WI;ESTIMATE'W2W2;ESTIMATE'W3W3; ESTIMATE' A I I 'A I I ;ESTIMATE' A I 2 'A12; A13; ESTIMATE' A 1 3・ ESTIMATE' Bl 'B1 ; 'A21 ;ESTIMATE'A22 ・A22 ; ESTIMATE'A2I ESTIMATE' A 2 3 'A23 ; ESTIMATE' B 2 ・ B 2 ; ・ ・ RUN; RUN: '**アウトサンプルデータへモデ、ノレを適用料/ ,*.アウトサンプルデータヘモテソレを適用料/ PROCNLPDATA=DATA別 2 TECHNIQUE=NONEMAXITER=0MAXFUNC=0 INEST=DATA ESTI OUT=DATA̲ OUT 2 ; PROCNLMIXEDDATA=DATA1 N2 TECHNIQUE=NONEMAXITER=0MAXFUNC=0 ; " パ ラ メ ー タ 定 義 ( 初 期 値 は 別ESTオプションで指定) 町 PARMSA,B,WI‑W3,AII, AI2, AI3,BI,A2I ,A22 ,A23 ,B 2 ; '*パラメータ定義(初期値は DATAオプションで指定) 町 PARMS'DATA=ODSESTI; (略) (略) PREDlCTPOUT=DATA̲ OUT 2 ; RUN; RUN 98
《モデノレ・対数尤度定義プログラム》 1 * 対数尤度ゼロクリア傘/ LO=0 ;L l=0 ;L2=0 ;LL=0 ; /市中間変数 ( Z i :変数 1の WoE) * 1 WZ=WI ZI+W2Z2+W ヂZ 3 ; ・ ・ 円デフォルト確率モデル (DF:デフォルトフラグ)町 Z=A+B*WZ;P = I / ( I+ E X P ( ‑ Z ) ) ; 1 * 対数尤度計算 * 1 I FDF^=.THENLO=DF*LOG(P)+(I‑DF)*LOG(I‑P); 1 *格付該当確率モデノレ(複数格付を配列にて対応) 町 3 ]AIIAI2AI3A21A22A23 ; ARRAYAR̲A[2, ARRAYAR̲B[2]BIB 2 ; ARRAYAR ̲ PK[2. 4 ]PKI1PKI2PKI3PKI4 PK21PK22PK23PK24 ; ARRAYAR̲L[2]L lL 2 ; AR 臥 YA R̲RK[2]RKIRK2;1 *格 付 実 績 町 1 *格付該当確率ゼロクリア (NLPでの出力目的) 町 = O ; PKI1 = 0 ;PKI2=0;PKI3=0;PKI4 PK21 = 0 ;PK22 = O ;PK23= O ;PK24= O ; DOJ=1T02;内 格 付 機 関 ル ー プ 開 始 町 DOK=1T04;片格付ランクループ開始 * 1 戸各格付の該当確率を計算 * 1 内この計算は非常に重いので,格付ランクでループせず町 内格付実績のときのみ計算しておいて (K=AR悶 q J ] ),・/ 1 * パラメータ確定後に再計算にて求める方法もある. 町 I FK=ITHENDO ・ AR̲PK , J [K]=I/(I+EXP(ー(AR̲A , J [K]+AR̲B[J]*WZ))); END ・ ELSEIFKく 4THENDO AR̲PK[J, K]=I/(I+EXP( ー( AR̲A[J, K]+AR̲B[J]*WZ))) ー1 / ( 1+EXP( ー( AR̲A[J, K‑I]+AR̲B[J]*WZ))); END; ELSEI FK=4THENDO; , J [K]=I‑I/(I+EXP(ー(AR̲A[J, K‑I]+AR̲B[J]*WZ))); AR̲PK END; * 格付ランクループ終了町 END;1 /ホ対数尤度計算・/ [ J ]^=.THENAR̲L [J ]=LOG(AR̲PK , J [AR̲RK[ J ] ] ) ; I FAR̲RK END;I* 格付機閉ループ終了 * 1 . 7, 格付 0 . 1 5づっ) 町 1 * 対数尤度の加重和(デフォルト 0 LL=0 . 7 0 * L O+0 . 1 5 *L l+0 . 1 5 * L 2 ; /・格付該当織率計算 * 1 付録 B . FMM プロシジャによる欠損値補完処理 変数 jの Zスコアを被説明変数,変数 j以外の Zスコアおよび変数 jの l年前/後の Zスコアを説明変数と した重回帰モデルを推計し,被説明変数が欠損値で、あるサンプルについて穴埋めを収束するまで繰り返した. このとき,説明変数の Zスコアの係数を正値に制約しておくことで,多重共線性に陥る危険性を低下させる ことが可能で,そのためには FMMプロシジャにおける RESTRICTステートメントを利用した. <(FMMプロシジャによる制約条件付き重回帰モデル構築(主要部分) ] > %macrofmm; %doi=1%to3 ;1 * 変数ノレープ開始町 %dop t n=0%to3 ;1 *推計ノ fターンノレープ開始町 1 * *ODSファイノレ出力設定料/ ODSOUTPUTP a r a m e t e r E s t i m a t e s=ODSEST̲&ptn.̲Z&i; / 帥 FMMプロシジャによる推計帥/ ; PROCFMMDATA=DATA別 3 1 *モ デ ル 定 義 町 MODELZ&i= 戸 l期前データの利用可 i . ̲ BEFORE%end; %if&ptn=1%then%do;Z& 1 *1期後データの利用可 & i . ̲AFTER%end; %if&ptn=2%then%do;Z 片 l期前 +1期後データの利用率/ %if&ptn=3%then%do;Z&i.̲BEFOREZ&i.̲AFTER%end; j%end;1 *i以 前 打 %doj=1%to% e v a 1 ( & i‑ 1 ) ;Zム *i以 降 * 1 %doj=% e v a l ( & i+1 )%to3 ;Z&j%end;1 1 * 対象選定①Z&iの非欠損値フラグキ/ FREQUSE̲ Z&i ; 1 * 対象選定②前回の推計パターン&p 回実行時に * 1 1 *Zスコアが上下限値にヒットしていないフラグ町 WE1GHTWGT ̲&p 加Z& i ; 門出力事/ D=PREDZ&i; OUTPUTOUT=DATA0UT3PRE /事制約条件 (RESTRICTAB?C → Aの係数 X B?C) * 1 1 *1期前データの利用*/ %if&ptn=1%then%do; & i .̲BEFORE1>=0 . 0 0 0 0 0 0 0 0 1 ; RESTRICTZ %end; 1 *1:期後データの利用 * 1 %if&ptn=2%then%do; RESTRICTZ & i .̲AFTER1>=0 . 0 0 0 0 0 0 0 1 ; %end; 円 l期前 +1期後データの利用事/ %if&p 回 =3% then%do; i.̲BEFORE1>=0 . 0 0 0 0 0 0 0 0 1 ; RESTRICTZ& & i . ̲AFTER1>=0 . 0 0 0 0 0 0 0 1 ; RESTRICTZ %end; *i以前*/ %doj=1%to%eval(&i‑ 1 ) ;1 RESTRICTZ 剣 1>=0 . 0 0 0 0 0 0 0 0 1 ; %end; *i以降車/ %doj=% e v a l ( & i+ 1 )%to3 ;1 RESTRICTZ&j1>=0 . 0 0 0 0 0 0 0 0 1 ; %end; RUN; %end;/*推計ノ fターンループ終了 * 1 %end;/*変数ノレープ終了 * 1 %mend; %晶n m; 99
ガンマ過程を用いた比例ハザードモデルによる解析 0矢 田 真 城 I, 浜 田 知 久 馬 2 e エイツーへノレスケア株式会社, 東京理科大学) 2 P r o p o r t i o n a lh a z a r dmodelu s i n ggammap r o c e s s S h i 吋oYada1andChikumaHamada2 l A 2H e a l t h c a r eC o r p o r a t i o n , 2T o 匂oU n i v e r s i t yo f S c i e n c e 要旨 比例ノ、ザードモデルは,生存時間解析において広く用いられている統計モデルである.生存時間分布(基準 ノ、ザード関数)に特定の分布を仮定することなく,回帰ノ号ラメータの推論を行うことが最大の利点である. 比例ハザード、モデ ルに対するベイズ流解析としては,大きく 2つのアプローチが存在する.ひとつは,基準 ノ、ザード関数に確率モデルを仮定せず,回帰パラメータにのみ確率モデルをあてはめ,部分尤度に基づきパ ラメータの推論を行うアプローチである.もうひとつは,回帰ノ fラメータのみならず基準ハザード関数にも 確率モデルをあてはめ,パラメータの推論を行うアプローチである.前者のアプローチに関しては, PHREG プロシジャにおいて BAYESステートメントを指定することにより実行可能となった.そこで本稿では,後者 のアプローチの Iつである,累積基準ハザード関数にガンマ過程を想定したモデルをとりあげ,解析方法に ついてまとめ, SASによる使用例を紹介する. キーワード:比例ハザードモデ、ル,ガンマ過程,基準ノ、ザード 1.はじめに ある基準の時刻からある目的の反応(観測対象とする個体に対し一度だけ非再起的に起きる事象であると する)が起きるまでの時間を解析対象とする解析手法の総称を,生存時間解析とよぶ(大橋・浜田, 1 9 9 5 ) . 生存時間解析において用いられる統計モデ、ルのひとつに, Cox( 1 9 7 2 )の比例ノ、ザードモデルがあげられる. )基準ハザード関数が未知のままでも共変量の影響を推測することができる, 2 ) 比例ハザード、モデルには, 1 生存時間の順位情報のみに基づいて推測を行うことができるため外れ値に対して頑健である, 3 )モデルが単 9 9 5 ),といったいくつかの利点がある.比例ハザー 純な場合にはログランク検定に一致する(大橋・浜田, 1 ドモデルに対しては,基準ハザード関数に特定の分布を仮定することなく,部分尤度に基づ、き共変量の回帰 パラメ}タを推定する,セミパラメトリックな方法が広く用いられている.その際,基準ノ、ザード関数は局 外パラメータとして扱われており,必要に応じて部分尤度法により求められた回帰パラメータの推定量を用 100
いて基準ノ、ザード関数を推定することができる(中村,2001 ;大橋・浜田, 1 9 9 5 ) . 一方,比例ハザードモデルに対するベイズ流アプローチとしては,回帰ノ号ラメータのみに確率モデルを考 えるアプローチと,回帰パラメータ及び基準ハザード関数に確率モデルを考えるアプローチとがある (Dey andRa o, 2 0 0 5 ).前者では,基準ハザード関数に特定の事前分布をおくことなく,回帰パラメータのみに事前 e r . 9 . 2より PHREG 分布をおき,部分尤度を用いることで回帰パラメータの事後分布を導出する. SASでは, V プロシジャにおいて BAYESステートメントを記述することにより,部分尤度を用いた回帰ノ号ラメータの事後 n s t i t u t eI n c ., 2008;黒田,2 0 1 0 ).本稿では,もうひとつのアプローチである, 分布の算出が可能となった (SASI 回帰パラメータ及び基準ハザード関数に確率モデ、ルをおき,モデルパラメータの推論を行う方法について説 明する.基準ハザード関数に想定する確率過程に関して多数の方法が提案されているが,ここではそれらの 先駆けとなった,累積基準ハザード関数にガンマ過程をあてはめるモデルをとりあげる. 2 . 比例ハザードモデ、ルに対するベイズ流解析 2 . 1 . I n t e n s i t yf u n c t i o nによる解析 以下,解析対象となる時間を生存時間とよび,対象とする事象をイベントとよぶことにする. , ; 観察打ち切りまでの時間 Cjに対し, いま i番目の被験者に対して,イベントが観察されるまでの時間 1 ,叫 =1(tl~A) として , Nj(t)=l ( t : ;t , =1 ),耳 ( t )=l ( t )とおく ( ; = 1, 2, …, n ). ここに 1 (・ ) j= jミt Uj =m i n ( tj>c1 ) ω'j はカッコの中が成り立てば 1を,そうでなければ 0をとる指示関数である . N 1 ( t )は , ;番目の被験者につい て時間 t直前までイベントが生起しなければ 0 ,イベントが生起しているなら 1をとる階段関数である.一方, Y ;( t )は i番目の被験者について時間 t直前までイベントが生起していない,つまりイベントが生起するリス クにさらされていたのであれば lを,そうでなければ Oをとる関数である.微小時間 d に対する川の増分 d N j ( t )= Nj(t+dt)‑Nj(t) は , ;番目の被験者が微小時間 d の聞にイベントが生起すればしそうでなければ 0の 2つの値しかとらない. … と表し, i番目の被験者における p個の共変量を Z(=(ZIi'Zi2 Zip)T Z(所与のもとでのハザード関数をみ ( t1Z() とおくと, ;番目の被験者に対し時間 t直前までイベントが生起しておらず ( 1 1 仰) = 0 ) リスク下にある状態 ( Y ; 例 =1) で,微小時間 d の聞にイベントが生起する ( d , N{ t ) = I ) 確率は P r ( d N 1 ( t )=1 1Y ;( t )=I , N1 ( t )=O , Z()= ん( t1 z ( ) d t ( 2 . 1 ) となる.同様に, ;番目の被験者が打ち切り疲例であれば Pr (d N j ( t )=1 1Y ;( t )=0, Nj( t )=O , z ( )=0 ( 2 . 2 ) であり,時間 t直前にイベントが生起していれば Pr ( dN ( t ) = 1 1再( t )=0, N1 ( t )=l , z ( )=0 j ( 2 . 3 ) である . , N{ t ), Y , { のはともに 0か 1の値をとるため,組み合わせとしては P r (dN j ( t )=1 1耳( t )=1 , Nj ( t )=l , z ( )も考 えられるが,当該症例において時間 t直前までにイベントが生起しており,かつリスク下にある状態はあり えない.時間 tまでに観測された利用可能なデータ F 比 例, , Y{ t ),z (をまとめて, Fーと表記するとき, (2.1)から (2.3) をまとめて Pr (d N j ( t )=1 1 , Fー)=引のん ( t1 z ( ) d t と表すことができ, E(dN j ( t )=1 1 , Fー)=耳 ( t ) A . z () d t ( t1 j ( 2. 4 ) となる(中村, 2001). ;番目の被験者に対する時間 tでの強度関数 ( i n t e n s i t yf u n c t i o n )を 101
, , 1( t ) d t= E(dN( t )= 1 , Fト) と定義するとき, ( 2. 4 ) よ り 1 , ( t ) d l=Y ;( / ) λ ,( 1 1z, ) d t よって , , 1( t )=Y ;( t ) λ( t1z , ) , となり,ハザード関数 λ( t1z,)を強度関数 I 紛に取り替えることができる. Cox ( 1 9 7 2 ) の比例ハザードモデルでは,共変量 z,をもっ被験者のハザード関数 λ ,( t1Zj)に対し ,,。 λ(tlz)=λ ( t ) e x p ( f JTz j) 。 を想定する.ここに λ( t )は基準ハザード関数であり, ( 2. 5 ) … p=(sI>s2 βp) Tは共変量ベクトノレ Zjに対する回帰パ )は ラメータベクトルである.したがって比例ハザード モデルでは強度関数以 t , 。 1( t ) d t=Y ;( t ) λ( t ) e x p (f JTz ; ) d t ( 2 . 6 ) よって , 。 1( t )=民( t ) λ( t )e x p (f JTz ; ) となる.また,共変量ベクトル z,をもっ被験者における生存関数 S ( t1z ,)は,生存関数,ハザード関数,累積 ノ、ザード関数の関係から =吋~ f~λ(tlz, )dt)= 問十 f~λo(t)exp(fJ T z,)dt) S ( tI z, )= 州 ‑A(tI Zj)) =叫州fJTz, )f~λ。ο)dt)= ト山;九州t~内} ( 2 . 7 ) となる. 2ユガンマ過程を用いたモデ、ル z番目の被験者に対する観測値( u "ω, ) と (N 刈 ,,刊の)は l対 lに対応するため, ( N , 正t ), , Y{ t ), z ; )を i番目の被験 , 2 0 0 9 ) . n人のデータを D={N( t ), Y ;( t ), z ; }7 =,と表すとき, f J と 者に対するデータとみなすことができる(服部 , A o ( t )の同時事後分布 p( , J fAo( 1 )1D)は p( , J fAo( 1 )ID)∞p(D, 1 J fAo(t))p(f J )p(Ao( 1 ) ) ( 2 . 8 ) で与えられる.ここに p(P)は pの事前分布 ,p(Ao( 1 ) )は A o ( t )に対する確率過程事前分布 ,p(D1P, A o ( t ) )はデ o n ‑ i n f o n n a t i v eであるとき,被験者の生存時聞が互い ータ D が与えられたもとでの尤度である.打ち切りが n に独立として尤度は 川 自[ F 炉 [ v ι V(οt川e 川川川 , M 刷 州 Ao 〆 0 ο 山 的 ω ( 刈 川 の 川 ゆ ) t )= 引 収 , ( 夕 ο 一1, ( 川 となる.( 2 . 9 )より,尤度は平均 1, ( t ) d tをもっポアソン分布の核, I ((t)dt)州 I)exp(ー 1, ( t ) d t )に比例していることが わかる.本稿では, K a 1 b f l e i s c h( 1 9 7 8 ) に従い,累積基準ハザード関数 Ao(t)に対する事前分布としてガンマ 過程 (gammap r o c e s s ) をとりあげる.ガンマ過程はガンマ分布に従って変化する確率過程であり,ポアソン 分布の共役事前分布がガンマ分布であることを考えると, ( 2 . 9 )において Ao(t)にガンマ過程をおくことは自然 な発想といえる. I b r a h i me ta , . l2 0 0 1 ). ガンマ過程は以下のように記述される ( ( i )弐0)=0 ( i i )Z ( I )は排反な区間において独立増分をもっ.即ち,任意の t , くらくいくらに対し ,Z( l 2 ) ‑ Z ( t , ) ,Z(ら)‑Z(ら ) , … , 102
Z(
t
n
)
‑
Z
(
t
n
‑
I
)は互いに独立である.
(
i
i
i
)
α
(
0
)
=0であり [
0,∞]で左連続な増大関数 α(
1
)
と c>Oが存在するとき,任意の t>Sに対して
Z
(
t
)‑Z
(
s
)~ Ga(
α(
t
)ー α(
s
),
c
)
である.ここに Ga(α,
β)は平均 α/β ,分散 α/β2となるガンマ分布を表す.
Z
(
t
)I
t>0
}をガンマ過程とよび,以降,確率過程 {
Z
(
t
)
It>O
}がガンマ過程に従
上記 3つの条件を満たす確率過程 {
うことを ,Z(t)~GP( α(t) ょ)と表記する.いま,心 (0) =0であり [
0,∞]で、左連続な増大関数心 (
t
)に対し, c>0
として A
o
(
t
)~GP( c
A
'
o
(
t
),
c
)であるとすれば,微小時間 d
tでの累積基準ハザード関数の増分
d
A
o
(
t
)=Ao(
l+d
t
)‑Ao(
l
)
については , d
A
'
(
t
)=A~ (
t+d
t
)‑A~ (
t
)として
o
d
A
o
(
t
)~Ga( c
d
A
‑
o
(
t
)ょ)
~_1~
となる̲ (
2.
10
)のとき d
A
o
(
t
)の平均は d
A
'
o
(
t
), 分散は dA~(t)/ cとなるため, c は dA~(t) への確信度を表す指
標であることがわかる ‑ d
A
o
(
t
)を用いれば,強度関数の増分 1
;(
t
)
d
tは(
2めより
1
;(
t
)
d
t= Y
;(t)exp(pTz;)dAo(t)
(
2
̲
1
1
)
となり,尤度 (
2
̲
8
)は d
N
;
(
t
),
Y
;(
t
),
d
A
o
(
t
)により表すことができる.
3
̲ 文献での適用例
適用例として, Gehan (
1
9
6
5
) の急性白血病データ(以下 Gehanのデータとよぶ)をとりあげる.急J性白
e
r
c
a
p
t
o
p
u
r
i
n
e(6‑MP) とプラセボ群とを比較するために行われたランダム化比較
血病の覚解維持のためにふm
1例,プラセボ群 2
1例に対するデータが表 3.1である.白血病の再発をイベントとし
試験であり, 6・MP群 2
ており,覚解状態から再発または打ち切りまでの時聞が週を単位として測定されている.
表3
̲
1 :急性白血病患者の再発までの時間(週)
プラセボ群
1
,1
,
2,
2,
3,
4,
4,
5,
5,8
,8,8,8,1
1,1
1,1
2,1
2,1
5,1
7,
22,
23
6‑MP群
6,
6,
6t,
6,
7,
9t,1
0,1
0t,1
1t,1
3,1
6,1
7t,1
9t,
20t,
22,
23,
25t,
32t,
32,
34t,
3
5t
t:打ち切り
̲1.及び 2ユで示した比例ハザード モデルをあてはめ,ベイズ流アプローチに
この Gehanのデータに対し, 2
よる推論を行うための SASプログラム例を以下に示す.このプログラム例は, DATAステップによるデータ
ハンドリングと MCMCプロシジャによるパラメータ推定の 2つのパートで構成されている.
̲
1は
, DATAステップによるデータハンドリングの一例である.大橋・浜田 (
1
9
9
5
) に倣い,
プログラム 3
),
再発または打ち切りを表す変数 WEEK,群を表す変数 GROUP(プラセボ群であれば 0,6・MP群であれば 1
打ち切りを表す変数 REMISS (打ち切りであれば 0,イベント発生であれば 1
) をもっデータセット GEHAN
を作成した̲ (
2
̲
9
)に従い, MCMCプロシジャにて尤度を記載する必要があるため, SAS/STAT9.
3(
R
)U
s
e
r
'
s
TheMCMCP
r
o
c
e
d
u
r
eの Example5
4
̲
1
4を参考に, MCMCプロシジャで使用するためのデータセット
Guide,
A GEHANを用意した̲ Gehanのデータでは,イベント発現時間は重複を除くと 1
,2,3,
4,
5,
6,
7,8,1
0,1
1,1
2,
1
3,1
5,1
6,1
7,
22,
2
3,
32の 1
8時点ある.そこでこれらイベント発現時間をもたせたデータセット PARTTITION
を用意し, 2つのデータセット GEHANと PARTTITIONから, 42名の被験者に対し,各イベント発現時点で
のリスクセットを変数 m Yに,計数過程を変数 m dNに,それぞれ入力したデータセット A GEHANを用
103
意した. プログラム 3 . 1:Gehanのデータハンドリング d a t aGEHAN; = dodrug 0, 1; doi d=1t o21;i 叩u tweekr e m i s s@ @; o u t p u t;end;end; cards; 1111212131414151518181 81811 111 11121121151171221231 616161607190100101110131161 170190200221231250320320340350 r u n ; d a t aPARTTITION; i n p u ti n t ̲ 1・i n t ̲ 1 8; cards; 1 2 3 4 5 6 7 8 10 1 1 12 13 15 16 17 22 23 35 r u n ; d a t aA̲GEHAN;s e tGEHAN; i f̲n̲eq1t h e ns e tPARTTITION; a r r a yi n t [ 1 8 ]i n t ̲ 1・i n t ̲ 1 8; 悶Y dN[18]; a r r a y Y [ 1 8 ] ;a r dok=1t o( d i m ( i n t ) ‑ 1 ); Y [ k ]=(week‑i n t [ k ]+0 . 0 0 1>=0 ); d N [ k ]=Y [ k ]*(i n t [ k + 1 ]・week・0 . 0 0 1>=0 )*r e m i s s; end; o u t p u t ; dropk; r u n ; dataA̲GEHAN;setA̲GEHAN; a r r a yY [ * ]Y :; a r r a yd N [ * ]dN:; =1t o( d i m ( y ) ); doi y ̲ v a l=y [ i ]; d n ̲ v a l=d n [ i ]; i n ti n d e x=; i o u t p u t ; 104
end keepY ー:dNー :i n t ̲ :drugi n t ̲ i n d e xi d run; dataA̲GEHAN;setA̲GEHAN;renamey ̲ v a l=m̲Ydn̲val=m̲dN;run; プログラム 3 . 2は,データセット A̲GEHANを用いて, MCMCプロシジャにより事後分布のモンテカルロ n BUGS1 .4E xamplesVolume1の" L e u k :s u r v i v a la n a l y s i s 標本を生成するための SASプログラム例である. Wi u r ni nを 1 0 0 0,B u r ni nで除外された後のモンテカルロ標本におけるサ U s i n gCoxr e g r e s s i o n "を参考にした. B ンプリング間隔を 1,最終的にサンプリングされるモンテカルロ標本のサンプノレ数を 10000個とした.回帰 6の正規分布を指定した.累積基準ハザード、関数の増分 d 0 パラメータの事前分布には平均 0,分散 1 A o ( t )の事 2 . 1 0 )を指定した. HobbsandC a r l i n( 2 0 0 8 ) に従い ,rを単位時間あたりのハザード, 前分布にはガンマ分布( d を次イベント発現までの間隔として d A " o ( t )=r d tとおき ,r=O , l . c=O.OOIと設定した. ( 2 . 9 )のとおり,尤 ;( t ) d tをもっポアソン分布を 度がポアソン分布の核に比例することから, MODELステートメントにて平均 1 . 2では d A o ( t )に対する初期パラメータの設定と事前分布の指 指定した.煩雑さを避けるため,プログラム 3 定を SASマクロ %dLpriorにより記述している. プログラム 3 . 2:比例ハザードモデルを用いたベイズ流解析 %macrod L p r i o r; n t ̲ 1 8; a r r a yi n t [ 1 8 ]i n t ̲ 1・i %doi = 1%to17; . i1; parmsm̲dLO̲& . ]=i n t [ & . i + 1 ]・i n t [ &i . ]; d L O s t a r [ &i p r i o rm̲dLO , ー & i .‑gamma(戸 dLOstar[&i . ]*c,iscale=c); %end; %mendd L p r i o r; procmcmcdata=A̲GEHAN seed=160721n b i=1000nmc=10000n t h i n=1o u t p o s t=NLOUT; c=0 . 0 0 1; = r 0 . 1; a r r a yd L O s t a r [ 1 7 ]; a r r a ym̲dLO[17]m̲dLO̲1・m̲dLO̲17; parmsb e t a0; ・6 ) ; p r i o rbeta‑normal(0.0, prec=1e %dLprior; m̲ldt=m̲y*exp(beta*drug)*m̲dLO[int̲index]; modelm̲dn‑poisson(m̲ldt); r u n ; 105
表3 . 2に,回帰パラメータ βに対する推定結果として,事後平均,事後標準偏差,事後中央値, 95% 信用区 . 2には示していないが, 95% 最高事後密度信用区間 ( h i g h e s t 間(事後分布の 2.5%点と 97.5%点)を示した.表 2 p o s t e r i o rd e n s i t yc r e d i b l ei n t e r v a l ) は[ ‑ 2 . 2 8 9 4 ・ ,0.6258]であった.データセット NLOUTに出力されたモンテカル . 2にて MCMCプロシジャのオプションとして monito r = (HR) ロ標本を用いることで,あるいはプログラム 3 と追加し, MCMCプロシジャの中で beginnodata;HR=exp(beta);endnodata;と指定することで,対応するハザー 0 . 0 8 9, 0. 4 7 6 ]を得る. ド比(プラセボ群に対する 6‑MP群のハザード比)の事後平均 0.2344,95%信用区間 [ . 2:比例ハザードモデルにおける回帰ノ号ラメータの推定結果 表3 P e r c e n t i l e s S t a n d a r d Mean コ~ ‑ 1 .5 3 6 4 τ r石干 , d e v i a t i o n Median ・ 1 .5 2 1 3 , 2 . 5 9 7 . 5 ‑ 2 . 4 2 2 3 ‑ 0 . 7 4 2 7 比例ハザードモデルにおいて,生存関数は,累積基準ハザード関数を A o ( t )として ( 2 . 7 )より t ) S ( tI z, )=叫十叫(PTz;)Ao( となる.累積基準ハザード関数 Ao(t) に GP(cA~(t) , c )をあてはめたときには,ガンマ過程の定義より,時間軸 ( 0 ,∞)を, 0=a o<a l<a 2<…<a J , . ・ <aJ=∞と , J個の区間 ( 0 , a , ] ,(a"a 2 ], …. ( a J . ・ "a J ]に分割したとき,区間(匂ー"今] での累積基準ハザード関数の増分 , )(j=I, 2 , … . , ] ) Ao( j )=Ao(a)‑Ao(a j̲ は平均 dA~(t) , 分散 d A ' o ( t ) /cをもっガンマ分布に従う.プログラム 3 . 3は,上記に従い,データセット NLOUT に出力された 10000個のモンテカルロ標本を用いて,各群の生存関数を推定する SASプログラム例である. . 3により推定された生存関数の事後平均を図 3 . 1に示した. プログラム 3 プログラム 3.3:GPを用いた比例ハザードモデルによる生存関数の推定 procs q l ; c r e a t et a b l eSURVEas , PARTTITION; s e l e c t* fromNLOUT q u i t ; dataSURVE; s e tSURVE; n t ̲ 1 8; arrayi n t [ 1 8 ]i n t ̲ 1・i arraya a [ 1 7 ]m̲dLO̲1・m̲dLO̲17; doi n t ̲ i n d e x=1t o17; t=i n t [ i n t ̲ i n d e x ]; m̲dLO=a a [ i n t ̲ i n d e x ] output end; keepI t e r a t i o ni n t ̲ i n d e xtbetam̲dLO; run; dataSURVE; s e tSURVE; b yI t e r a t i o n; 1 0 6
keepI t e r a t i o ntS̲ placeboS̲6MP; i ff i r s t . lt e r a t i o n=1thenm̲HO=0; m̲HO+m̲dLO; S̲6MP=exp(‑m̲HO)**exp(beta汁); S̲placebo=exp(‑m̲HO)**exp(beta勺); run; 生存率 ︐ ﹃ 1 .0 一 I ﹄ ‑ 一一一 :6‑MP 群 一:プラセボ群 tlL ︐ ﹃ ﹃ li‑ 0 . 8 ﹄ 0. 4 ﹃. ﹄ ﹃1l﹄l1l 可﹄ ll 0.6 吋 ﹃ l ﹄ . ︑ 司 ﹄ 1EL ・ ・ ﹃ 0 . 2 。 0 . 0 」 1 0 20 30 時間(週) 図3 . 1:Gehanのデータに対する GP‑PHモデルによる生存関数 なお,基準ハザード関数に特定の事前分布をおくことなく,部分尤度に基づき推定された回帰ノ〈ラメータ を用いて生存関数を推定する場合には,データセット GEHANを入力データセットとし, PHREGプロシジャ にて BAYESステートメントにより回帰パラメータの事前分布を指定し, BASELINEステートメントにより 各群に対する生存時聞を出力させることができる.ただし,デフォルトの設定では共変量の平均値に対する 生存時間のみが出力されるため, BASELINEステートメントのオプション COVARIATE=で予め用意した各 群を表す共変量の値をもたせたデータセットを指定する必要がある. プログラム 3.4にその一例を示した. BAYESステートメントのオプション COEFFPRIORオプションを用い,回帰パラメータの事前分布に平均 0, 6の正規分布を指定している 0 分散 1 . 2と同様, Burni nを 1000,Bumi nで除外された後のモン プログラム 3 テカルロ標本におけるサンプリング間隔を 1 ,最終的にサンプリングされるモンテカルロ標本のサンプル数 を 10000個とした. 4:部分尤度に基づく比例ノ、ザードモデルによる生存関数の推定 プログラム 3. dataP r i o r ; i n p u t̲TYPE̲$drug; cards; Mean0 var1e+6 107
r u n ; 1;o u t p u t;end;r u n; d a t aCov̲vals;dodrug=0, GEHAN; procphregdata= modelweek*remiss(O)=drug; 宵p r i o r=n o r m a l ( i n p u t=P r i o r ) bayesseed=160721coe h i n=1o u t p o s t=Post; n b i=1000nmc=10000t b a s e l i n eo u t=E s t s u r v s u r v i v a l=Surv c o v a r i a t e s=Cov̲valsInomean; r u n ; 4 . おわりに ベイズ流解析では,パラメトリックな推論がよく用いられている.パラメトリックな推論では,あてはめ る統計モデルにおける分布関数を有限次元のパラメータにより表現する.有限個のパラメータに対して事前 分布を設定し,ベイズ の定理を用いて得られる事後分布からパラメータの推論を行う.分布関数が有限個の パラメータで定式化できないとき,ノンパラメトリックな推論となる.ノンパラメトリックな推論では,通 常,確率過程を用いて分布関数を表現する.得られたデータを確率過程からのサンプルパスと捉え,あては めた確率過程からの経路によって決定される確率分布に従うと考える. Gehanのデータに対する適用例では, 時間軸をイベントが発現した時点で分割し,各区間での累積基準ハザード関数の増分がガンマ分布に従うも のとしてパラメータを推定した.このように,ノンパラメトリックとは,パラメータをおかないことではな く,無限個のパラメータをもっという意味である.想定したモデルでは無限個のパラメータで、あっても,得 られたデータは 有限"であるため,得られたデータに対して解析する擦には有限個のパラメータでよく, 有限個のパラメータにおとしこむことができれば,事後分布の計算が可能となる. K a l b f l e i s c h( 1 9 7 8 ) は,累積基準ノ、ザード関数にガンマ過程やディリクレ過程をあてはめることの問題点と して,確率 lで、累積基準ハザード関数が離散的な値をとること,隣接する区間で累積基準ハザード関数の増 y k s t r aa n dLaud ( 1 9 8 1 ) は,基準ハザード関数の増分に拡張ガンマ過 分を独立とみなすことをあげている. D 程をあてはめる方法を提案した.このことにより,上記に示した,ガンマ過程やディリクレ過程を累積基準 ノ、ザード関数にあてはめたときの問題点を回避できる.基準ハザード関数に対するモデリングとしては,本 b r a h i me ta . 1 ( 2 0 0 1 )によって紹介さ 稿で取り上げたガンマ過程を用いる以外にも多数存在し,それらについて I れている.こうした方法の多くは, 1 )基準ハザード関数に厳格なパラメトリック仮定をおかない, 2 ) 基準ハザ ード関数に対する推測がなされる, 3 ) 適当な事前分布を選ぶことにより推定された基準ハザード関数はもっ 2 0 0 5 ). ともらしい滑らかな曲線となる,といった利点を有している (DeyandRao, 本稿では,ベイズ流アプローチとして,累積基準ハザード関数に対しガンマ過程をあてはめた比例ハザー ド、モデ、ルをとりあげ, SASを用いてこのモデルをあてはめ解析を行うための具体的な方法を紹介した.比例 ノ、ザード、モデ、ルに対するベイズ流ノンパラメトリックな方法について検討する際に,本稿がその一助になれ ば幸いである. 108
参考文献 [ 1 ]Cox , D . R . ( 1 9 7 2 ) . R e g r e s s i o nm o d e l sandI if et a b l e s( w i t hD is c u s s i o n ) .J o u r n a lo l t h eRoyalS t a t i s t i c a lS o c i e t y .S e r i e s B . 3 4 : 1 8 7 ‑ 2 2 0 . [ 2 ]Dey , D . K .andRao, C .R .( 2 0 0 5 ) .Ba) 四 i a nT h i n k i n g .M o d e l i n gandC o m p u t a t i o n .E l s e v i e r , Amsterdam. 繁桝算男・ 2 0 1 1 ) .ベイズ統計分析ハンドブック.朝倉書底. 岸野洋久・大森裕浩監訳( [ 3 ]D y k s t r a, R . L .andLaud , P .W.( 19 8 1 ) .AB a y e s i a nnonparam 出 i ca p p r o a c ht o問 l i a b i l i t y .TheA n n a l s0 1 S t a t i s t i c s .9, 356・3 6 7 . [ 4 ]Gehan , E .A .( 1 9 6 5 ) .Ag e n e r a l i z e dWilcoxont e s tf o rc o m p a r i n ga r b i 位 ' l l l ' Ys i n g l e ‑ c e n s o r e ds a m p l e s .B i o m e t r i k a .5 2 : 2 0 3 ‑ 2 2 3 . , B . P .andC a r l i n, B . P .( 2 0 0 8 ) .P r a c t i c a lB a y e s i a nd e s i 伊 a nda n a l y s i sf o rd r u gandd e v i c ec l i n i c a l住i a l s . [ 5 ]Hobbs J o u r n a lB i o p h a r m a c e u t i c a lS t a t i s t i c s .1 8 : 5 4 ・ 8 0 . b r a h i m , J 丘 , Chen , M.H.,S i n h a , D .( 2 0 0 1 ) .B a y e s i a nS u r v i v a lA n a l y s i s .S p r i n g e r ‑ V e r l a g , NewY o r k . [ 6 ]I , 1 .D.( 19 7 8 ) .N o n ‑ p a r a m e t r i cB a y e s i a na n a l y s i so f s u r v i v a lt i m eda 飽 .J o u r n a l0 1 t h eRoyalS t a t i s t i c a l [ 7 ]K a l b f l e i s c h S o c i e t y :S e r i e sB .4 0 : 2 1 < ト221 . [ 8 ]SASI n s t i t u t eI n c .( 2 0 0 8 ) .S A S / S T A T I 伺)9 . 2U s e rきGuide, Cary , NC, USA:SASI n s t i t u t eI n c . 3U s e r ' sGuide , C a r y , NC, USA:SASI n s t i t u t eI n c . [ 9 ]SASI n s t i t u t eI n c .( 2 0 1 1 ) .S A S / S T A T ( R )9. [ 1 0 ] S i n h a , D .I b r a h i m , J .G.加 dChen,M.H .( 2 0 0 3 ) .AB a y e s i a n j u s t i f i c a t i o nofCox'sp a r t i a l l i k e l i h o o d .B i o m e t r i k a . ‑6 4 1 9 0 ( 3 ) :629 t .WinBUGS1 . 4, Examlpes泊 lume1 , L e u k :s u r v i v a la n a l y s i sUsingCox問 g r e s s i o n . [ 1 1]WinBUGS‑TheBUGSP r o j e c ・ b s u . c a m . a c . uk / wp‑co 脱 出' u p l o a d s/W inBUGS ̲Vol 1. p d f . A v a i l a b l ea th t t p : / / w w w . m r c [ 1 2 ]大橋靖雄・浜田知久馬(19 9 5 ) . 生存時間解析 ‑SASによる生物統計.東京大学出版. [ 1 3 ]黒田普吾 ( 2 0 1 0 ) .Cox回帰における Bayes推定と PHREGプロシジャ.日本 SASユーザー総会論文集,2 3‑ 4 4 . [ 1 4 ] 服部聡 ( 2 0 0 9 ) .生存時間解析におけるセミパラメトリック推測とその周辺.統計数理 .57( 1) : 1 1 9 ・ 1 3 8 . [ 1 5 ]中村剛 ( 2 0 0 1 ) .Cox比例ハザードモデル.朝倉書庖. 連絡先 E ‑ m a i l :yada‑s@ a 2h e a l t h c a r e . c o m 109
落 語 協 会 の 有 力 一 円 の 勢 力 分 布 を D3 おで「分かりやすく」ピジュアライズする ‑JSONプロシジャを用いて一 0坂 部 裕 美 子 (公益財団法人 統計情報研究開発センター) (1)表示させる内容について r D3. j s Jとはデータを印象的に可視化できる J a v a S c r i p tライブラリの一つで、無料でコードを使用、 改造、修正できる。 h t t p : / / d 3 j s . o r g/で、多数の利用事例が紹介されているが、この中の r C i r c l eP a c k i n g J 句 : / / b l .o c k s . o r g / m b o s t o c k l 4 0 6 3 5 3 0 )とし、う表示プログラムは、ク、、ルーフ。内の階層構造およびグルー ( h プ全体の大きさを明瞭に表示できる上に、図を見ただけでは「最上位はどれか」とし、う明確な順位 が判別できない(落語家はこの辺りのことに非常に敏感である)という利点がある。そこで、 Web デザインについては全くの初心者ながら、プログラムの指示内容を判読し、自身で集計した「落語 協会の寄席定席興行への登場回数の一門別表示Jへの書き換えを試みた。 このプログラムではJSON 形式ファイルを使用しているため、 S AS9.4から使用可能になった JSON プロシジャを用いて、集計結果DSを書き出した。 (2) 表示プログラム すべての、落語家について描画すると紛雑になるので、登場回数の動向が特徴的な「柳家小さん一 門J r 三遊亭園生一門 J r 林家彦六一門」の 3 つのみを表示させることとする。 JSONプロシ、ジャ内では、 r w r i t e" " " ; J という書き出し方に関する指示と、 DSのe x p o r t の指示しか S J を作成しておく必要がある。今回は、円の階層構造を 使えないため、事前に「書き出しやすいD 示した DSと、師匠別に所属メンバーと各々の回数をまとめた DSを作成することとし、これらを適 宜マクロで呼び出しながらファイルを書き出した。 作成したJSONファイルを読み込ませて図示したところ、総計・一門計でグラフ表示した場合よ りも情報量の多い図を描画できた。 1 9 7 0年 2 0 1 4年 1 9 9 0年 r S A Sを用いた寄席定席興行の現状分析 J ( S A Sユーザー会発 2 0 0 5年 、 p . 2 7 3 " " ")を参照頂きたい。 ※元データの集計内容については、 表論文集 1 1 0
SASに よ る 迷 路 の 自 動 生 成 0松 沢 享 (株式会社インターサイエンティフィックリサーチ) 【はじめに】 SASのデータハンドリング機能は日々進化しており、これまでSASでは面倒とされていた処理が容易 に行えるようになった。 本発表では、その進化の一例として、従来のデータステップと新機能を用いて迷路を自動生成する SASプログラムを作成したので紹介する。 I 方法】 本発表では迷路生成の入門として比較的単純なアルゴ、リズ、ムかつプログラミングが容易な棒倒し 1 ]の2 つの手法を用いる。 法と穴掘り法 [ これらの手法は配列とハッシュオブ、ジェクトを用いて実現し、迷路の描画にはSAS9.4から機能追加 された ReportWriting Interfaceを用いる。 【結果】 棒倒し法による結果を図 1に、穴掘り法による結果を図 2に示す。 図2の穴掘り法は線を細くする等の処理を加えて、より迷路らしい見た目にしている。 図2 穴掘り法による迷路の生成結果 図l 棒倒し法による迷路の生成結果 [総括】 ハッシュオブ、ジェクトやReportWritingInterface等の新たな機能を用いることで、迷路の生成を 行うプログラムを容易に作成する事が出来た。 本発表により SASのデータステップの進化と魅力を感じて頂ければ幸いである。 I 参考文献】 [ 1 ]柳 井 政 和 ( 2 0 1 4 ).プログラマのためのコード、パズル ""JavaScriptで挑むコードゴルフとア ルゴ、リズム技術評論社 113
S e r v e r 版 SASを 基 盤 に し た 「 生 物 統 計 解 析 シ ス テ ム 」 の 紹 介 0栃 揮 欣 之 、 角 元 慶 二 、 佐 々 木 和 典 、 菱 垣 晴 次 (大塚製薬株式会社徳島研究所) 概略 「生物統計解析システム Jは,個人の統計スキルに依存せずに統計解析を行えるシステムである。 各個人 PCのマウス操作より,エクセルファイルの実験データに対し,統計解析手法を選択し実行 するものとなっている。 要旨 近年,臨床試験でのデザイン上の問題や,統計方法の誤用,データの改軍といった問題が起こり, 9 9 9 改めて統計家の意識の向上を考えさせられた。この間題は非臨床試験に対しても同様であり, 1 年には, r 非臨床試験に関する統計学的提言」が日本製薬工業協会・医薬品評価委員会から発表さ れている。非臨床試験については,統計家の関与が増えつつあるものの,臨床試験に比べ統計家の 人数が少ないのが現状である。非臨床試験ではデータの種類が雑多であり,市販の統計ソフトウェ アを使う場合において,ブラックボックス的に統計処理が行われていることが問題である。特に, 9 9 2 委託試験においては,適切に統計処理が行われているかを確認する必要も増えている。我々は, 1 年より医薬品の研究所における S ASを用いた社内システムの活用事例を紹介するとともに,ブラ ックボックス的な統計処理の使用を避けるための使用上の検討も行ってきた。従来のシステムでは Cを用意する必要があり,同時使用の制限や, SASの毎年の更新作業の手 各部署に統計解析用の P 間などが生じるという問題があった。 e r v e r版 SASを導入し, r 生物統計解析システム」を構築した。「生物統計解析シ 今回,我々は S Cのマウス操作により,エクセルファイルの実 ステム Jでは,各研究員のネット環境のある個人 P 験データに対し,統計解析内容を選択して統計検定を行える。そのため,個人の統計スキルに依存 せずに統計解析を行えるシステムとして社内 350人が使用している。今回,非臨床試験,特に薬効 薬理試験等に関して,研究の質の向上をはかるための道具として, S e r v e r版 SASを基盤にした「生 物統計解析システム J を紹介する。本抄録では, r 生物統計解析システム」のシステムおよび統計 解析内容の紹介を行い,次に使用方法を説明することで、解析ツールとしての利便性がどの程度であ るかを議論したい。 117
「生物統計解析システム Jについて 統計家が開発した最新統計解析処理プログラムをリアルタイムで各研究員が利用し統計検定で きるシステムとなっている。「生物統計解析システム」では,サーバに開発した統計解析プログラ ムを導入することで,社内ネットを利用して各研究員が利用できるようになっている(図 1 )。 徳島エリア 赤穂エリア .... 画 面 図 1 社内 LAN環境について 各研究員が例えば SAS などを利用して統計解析を行うことは困難であるため,エクセルファイ ,COM ,DDE , ルの実験データを用意すれば統計解析内容を選択して統計検定を行えるように, VBA SASを利用して,エクセルファイルから SASデータセットを作成し,結果をエクセルファイルで 出力されるようなシステムを構築した(図 2 ) 。このことにより統計学やプログラミングのスキルが 高くない研究員においても統計検定が各自で行えるようになった。 ?哩@つ 実験データ( E x c e l ) 解析結果 { E x c eり 図 2 解析ワークフロー 118
生物統計解析システムでは,非臨床試験の生物統計に関する検定は一通り網羅されており(表 1 , ) 更に必要に応じて随時,新しい統計解析処理の追加対応を行うことができる。このことにより,各 研究員の様々な要望に瞬時に対応することができるシステムとなっている。 表 l 実装統計手法(抜粋) 統計解析処理の追加対応事例の具体例のーっとして, Log‑Rank検定における D u n n e t t型の多重性 調整アルゴリズムに関して説明する(図 3 ) 0D u n n e t t型の多重性調整を行うには,検定を行うデータ 戸i cS t r u c t u r e J と呼ばれる特定の形式になる必要がある。検定を行うデータが において1"F a c t o r ‑ Ana l " 1 F a c t o r ‑ A n a l y t i cS t r u c t u r eJ で あ る 場 合 は D u n n e t t型 の 多 重 性 調 整 を 行 い , そ う で な い 場 合 は D u n n e t t ‑ H s u近似を行う。ここまでが, SASを用いた Log‑Rank検定で標準的に搭載されている機能 である。しかし,データセットによっては Dunnet‑Hsu近似にでも収束した結果を得ることができ ない場合がある。そこで,我々は Dunnet‑Hsu近似でも収束した結果を得られない場合においては, S i m u l a t i o nによる近似を行って得られた結果を出力するようにしている。このように,生物統計解 析システムでは実際のデータ解析を行う上で統計解析処理機能に随時追加対応することができる。 D u n n e t t 型 ロ期限延‑Hsu近似 解語システム1 議却 t デフォルトのままではP植が欠撞笹で出力う S i m u l a t i o n 近似 Aよ ロJUST=SIMULATE" 図 3 統計解析処理の追加対応事例 ( L o g ‑ R a n k検定における D u n n e t t型の多重性調整) 119
「生物統計解析システムJの使用方法 A .S e r v e rに接続し,生物統計解析システムを起動する。 B.データの入力方法 1 . r 入力テンブレート』 をクリック C .解析手法の選択と,変数の設定 120
D .解析結果(抜粋) @旬i .. .. 阻 羽 樋 ・ ・ . , tu I ! D t 1J STRAT A . =昆~...回一一蹴 参考資料 [ 1 ]角元慶二,佐々木和典,小原直樹( 1 9 9 7 ) .研究所データ解析における SASシステム活用事例,日本 SASユーザー会論文集 ロ]角元慶二( 1 9 9 7 ) . 各種の実験デザインにおける PROCGLM,PROCMIXEDの利用,日本 SASユー ザー会論文集 [ 3 ]川崎美保,佐々木和典,小原直樹,角元慶二( 1 9 9 7 ) . SAS/AF ソフトウェアを用いた前臨床解析 システムの紹介,日本 SASユーザー会論文集 [ 4 ]佐々木和典,角元慶二,小原直樹,岡美保( 2 0 0 1 ) .SASパージョン 8 eによる非臨床統計解析シス テムの開発,日本 SASユーザー会論文集 [ 5 ] , K a k u m o t o, K . , YamanakaS ., H盟主血豆., yoshimura1.(2004)As t a t i s t i c a la n a l y s i sofa ne 能 c t i v emethod t oc o n d u c ti ns i l i c os c r e e n i n gf o ra c t i v ec o m p o u n d s .Chem‑BioI n f o r m a t i c sJ o u r n a l , 4, pp.121‑132 [ 6 ]共著:菅波秀規,角元慶二,長谷川要、他 ( 2 0 0 3 ) . SASにおける統計解析バリデーションと解 析計画書,報告書作成技術情報協会 [ 7 ] S A S社ホームページ,テクニカルサポート. Dunnett法による多重比較 121
SASで作成した統計解析帳票の柔軟な QC体制構築に向けた取り組みの事例紹介 0仲川慎太郎,吉本拓矢,吉田寛輝,久力洋,河田祐一 (中外製薬株式会社臨床開発企画部) 弊社の統計解析帳票(以下,帳票)作成業務では,データ固定後(以下,固定後)の帳票 QC作 業が帳票納品までのクリテイカルパスであり. QC 期間をできるだけ短縮することが望ましい。当 該期聞を短縮するためには,固定後迅速に帳票を作成し QCを完了させることが重要となる。一方, データ固定前は比較的作業時間に余裕があるため,従来固定後に実施していた QC作業の一部を固 定前に前倒しすることによる帳票提供までの期間の短縮可能性を考案した。具体的には,重要度と 複雑さの観点から各帳票のリスクを特定し,固定後の QC内容に緩急をつけるリスクベースアプロ ーチの有用性を検討した。また,統計解析担当者以外でも帳票を QCできれば,社内リソースを最 大限活用した柔軟な QC体制を構築可能であると考え,そのためにどのようなトレーニングが必要 になるか等も併せて検討した。 以前 .QC 作業の一部前倒しによる固定後 QC 時間の削減効果やQC の質が従来法から保持されてい 法 v s .前倒しQC るかを検討するために,弊社の新入社員を対象として単純な比較試験(従来の QC 法)を試みたが. QC 方法の差異だけでなく固体間差(ベースラインの QC 能力(訓練度) .集中力 の持続性等の差)やQC 環境等の差異といった要因も QC 時間に影響した可能性を否定できなかった。 そこで今回. fQC作業の前倒しにより帳票提供期間をどの程度削減可能かJ という課題に対して より真に近い推定値が得られるよう,上述したバイアス要因をデザイン段階で調整し,比較可能性 ‑ o u t 期間を十分に設けた2期のク を可能な限り保証できるような試験を再実施した。具体的にはwash ロスオーバー比較試験を実施した。また,ベースライン時点での QC 能力やデータ入力をミスする 確率等を個体聞でできるだけ揃えるためにトレーニングを一定期開設けたり,集中力が QC時間に 影響したりしないような工夫を施した。 本発表では. S ASで作成した帳票の QC 時間短縮効果検討にあたり,新入社員にどのような説明資 料を用意してトレーニングを実施したのか等を説明し,本実験結果も簡単に報告する。さらに,実 験終了後に実施した新入社員のアンケート結果を分析し,どのようなトレーニング、を事前に実施す 体制(具体的には統計解析担当者以外による QC 体制)を構築可能なのかといっ ればより柔軟な QC た点を考察して今後の展望を述べる。 122
区間打切りを考慮したノンパラメトリックな生存関数推定法の 推定性能を向上させる診断スケジュールの検討 0野村怜史、寒水孝司、浜田知久馬 (東京理科大学) 背景 がんの臨床試験において、無増悪生存期間という評価項目が用いられることがある。無増悪生存 期間とは試験への登録時点から死亡または増悪が認められた時点までの期間をあらわす。無増悪生 存期聞を評価項目とする場合、増悪についてはCT 検査等の画像診断によって判定するため正確な発 生時点が特定できず、ある区間で起きたことしかわからないデータ(区間打切りデータ)となる。 区間打切りデータにおいて増悪確認時点を増悪発生時点として評価してしまうと、生存時聞が過大 に評価されてしまう。しかし、従来の臨床試験では、増悪確認時点を増悪発生時点として評価を行 っており、生存時間の過大評価が起きているのが現状である。 研究目的 本研究は無増悪生存期間を評価項目とした際の生存関数の推定性能を向上させる診断スケジュ ールを提案することを目的としている。評価指標としては、生存関数の代表値として用いられる MST(MedianS u r v i v a lTime)に闘し、 MSTB i a s、MSE(MeanS q u a r e dE r r o r )、MST95% 信頼区間被覆確 率を用いた。生存関数の推定には SASのPROCEDUREのLIFETEST、ICLIFETEST[ l ,2 ]を用いた。 ICLIFETESTは区間打切りを考慮して生存関数を求めることができる。 提案方法 提案方法は、各患者を複数の診断スケジュールにそれぞれ割り当てることである。従来、診断ス ケジュールは全ての患者が同じスケジュールである。提案方法は患者全体で見た際の診断時点を増 加させることが狙いである。 匡!J I m~ I I I I n人 1 ,̲̲ j I I l1 21 31 ││I /" t 1 らら , . ~nÀ" t t り:従来の診断時点 t j s :提案する診断時点 j :診断回数 5:診断スケジュール n :患者数 t I I I ̲j I I t 12 t 22 t 32 結果・まとめ シミュレーション実験により評価したところ、提案法はICLIFETESTを用いた際に、従来法と比 較して、 MSTの推定値のB i a s やMSEを減少させ、 MSTの95% 信頼区間の被覆確率においても、従来 の診断スケジュールに比較して提案スケジュールが安定した性能を示した。よって無増悪生存期間 を評価項目とする際には、提案するスケジュールを用いICLIFETESTによる区間打切りを考慮、した 生存関数推定をすることを推奨する。 参考文献 [ 1 ]P e t o , R .E x p e r i m e n t a lS u r v i v a lC u r v e sf o rI n t e r v a l ‑ c e n s o r e dD a t a .A p p l i e dS t a t i s t i c s .1 9 7 3 ;2 2 :86 ・ 91 . [ 2 ]Sun , J .TheS t a t i s t i c a lAna l y s i so f l n t e r v a l ‑ c e n s o r e dF a i l u r eTimeD a t a .S p r i n g e r .2 0 0 6 . 123
PROCSGPLOTによる SwimmerP l o t一見やすさを求めてー 吉 田 秀 幸2、 韓 士 栄 l、 若 菜 明 1 0福 田 裕 章 1 (発表のみ) ( l M S D 株式会社、 2株式会社タクミインフォメーションテクノロジー) swimmerp l o tは、患者ごとのレスポンスやそれに至るまでの時間等を図示する手法であり、その 最大の特徴は、これらの情報を一目で把握することが可能という点である。これまで、 SASによる swimmerp l o t作成の方法はさまざまに報告されており、 SASv e r s i o n9 . 3の SGPLOTプロシジャや TEMPLATEプロシジャ及び SGRENDERプロシジャを利用した報告等もなされているが、未だ明瞭 性や情報量の点で十分とは言えず、臨床家や論文執筆者の要求に応え切れていないことが現状であ る。特に、近年「がん免疫療法Jががんの画期的な治療法として注目を集めているが、安定した効 果が長期間持続することが期待されるため、従来のがん化学療法と異なり、腫蕩縮小や増悪の遅延 によって評価されるだけでなく、患者ごとの治療継続の是非が重要な情報である。したがって、が ん治療に対するレスポンスを患者ごとに一目で把握することのできる swimmerp l o tは当該治療法に 対する臨床試験の解析において、非常に有力なツールとなると考えられるが、従来の swimmerp l o t は、患者の投与継続情報が含まれていない、あるいは含まれていたとしても明陳性に欠けるもので n n o t a t i o n機能を利用することで、複雑な色調配分や線種、 あった。一方、 SGPLOTプロシジャの a シンボ、ル等の詳細な規定が可能となるため、当該機能を用いることでより情報量の多い作図が可能 である。そこで、 a n n o t a t i o n機能を利用した SGPLOTプロシジャによる、患者の治療継続状況を含 l o t作成プログラムの開発を試みた。 む、より明瞭な swimmerp 本プログラムは、規定の様式のデータセットに対し、患者のレスポンスを示すシンボル、そのシ ンボルの説明や投与群の情報を示したレジエンドという大きく 2つの成分を含む a n n o t a t i o nデータ セットを利用し、 SGPLOTプロシジャにより swimmerp l o tの作成を行うものである。 S目 白e rを用い n n o t a t i o nを利用することにより、 u n i c o d eを用いた特殊記号を使えるなどシ てシンボルを表示せず a ンボル表示の柔軟性を高めた。また、レジエンド部分についても a n n o t a t i o n を利用することで、 SGPLOT プロシジャで自動的に付与されるレジエンド以上に詳細な説明を行うことを可能とした。 その結果、臨床家や論文執筆者が求める理想的なものに限りなく近い swimmerp l o tを作成できるプ ログラムを開発することができた。さらに、当該プログラムの簡単な説明書を作成し、インプット n n o t a t i o nデータに対する仕様を示すことによって、プログラムに精通し する規定のデータ形式や a ていない作業従事者でも容易に取り扱うことを可能とした。しかしながら、本 swimm ぽ p l o tは、が ん領域における P h a s e1又は Phase2試験を想定したものであり、症例数が数百例に及ぶ国際共同比 較試験のような規模を想定していない。ゆえに、そのような規模の大きい試験に対し、全症例の情 l o tとしてどのように表示するかについての対応が今後の課題と考えている。 報を 1つの p 1 2 4
【企画セッション】 欠測のあるデータの解析のための SASプログラムの紹介 データ発生・ DIA マクロとプロシジャの進展 (1)セッションの概要 0土居正明 1.2 (1日本製薬工業協会医薬品評価委員会 データサイエンス部会 タスクフォース 4 欠測のあるデータの解析検討チーム, 2東レ株式会社) 欠測のあるデータの解析に対する背景と,これまで、に SASユーザー総会で行った製薬協欠測チーム の企画セッションの内容を概説した上で,本セッションの課題と概要を説明する. 125
【企画セッション】 欠 測 の あ る デ ー タ の 解 析 の た め の SASプ ロ グ ラ ム の 紹 介 データ発生・ DIA マクロとプロシジャの進展 ( 2 ) シミュレーションデータ発生方法 0横 山 雄 一 円 大 浦 智 紀 lJ, 土 居 正 明 1, 4 e 日本製薬工業協会医薬品評価委員会データサイエンス部会タスクフォース 4 欠測のあるデータの解析検討チーム, 3日本イーライリリー株式会社, 2 持田製薬株式会社, 4東レ株式会社) 応答変数が経時的に測定される臨床試験において,データの欠測はよく起こる.欠測のあるデー タに対しては,様々な解析手法があり,試験や解析の目的に合わせた使い分けが必要となる.その ため,臨床試験の計画段階において,試験及び薬剤の特徴を捉えたシミュレーションデータを発生 させ,目的に合わせた検討を行うことは有用である.本発表では,文献データから,欠測のある連 続量経時データを発生させる方法について, SASプログラムとともに紹介する. 126
[企画セッション】 欠 測 の あ る デ ー タ の 解 析 の た め の SASプ ロ グ ラ ム の 紹 介 データ発生・ DIAマ ク ロ と プ ロ シ ジ ャ の 進 展 (3)MNARの仮定の下で、の S e l e c t i o nModellこ基づく解析 0黒 田 晋 吾 1,2 ( 1日本製薬工業協会医薬品評価委員会データサイエンス部会タスクフォース 4 欠測のあるデータの解析検討チーム、 2武田薬品工業株式会社) DIAマクロ f % S e l e c t i o n ̲ M o d e I 2 J を利用することによって、 D i g g l eandKenward( 1 9 9 4 )により提案さ e l e c t i o n Modelに 基 づ く 解 析 が 実 行 可 能 で あ る 。 本 発 表 で は 、 れた MNARの 仮 定 の 下 で の S f % S e l e c t i o nModel2J で使用されている解析手法を解説し、二変量正規分布に従う欠測のあるデー タを例として SAS/IML ⑧を利用した実装方法を示すとともに、マクロの利用方法及びマクロを利用 する際の留意点も紹介する。また、 SASのMCMCプロ、ンジャを利用して Bayes流の方法により同様 の解析を実行する方法についてもあわせて紹介する。 127
【企画セッション】 欠測のあるデータの解析のための S ASプ ロ グ ラ ム の 紹 介 データ発生・ DIA マクロとプロシジャの進展 ( 4 )PattemM i x t u r eModelとM u l t i p l eIm p u t a t i o nに基づく解析 1( D e l t aa 司 j u s t m e n tとT i p p i n gP o i n t A n a l y s i s ) O大 浦 智 紀 1,2 e 日本製薬工業協会医薬品評価委員会データサイエンス部会タスクフォース 4 欠測のあるデータの解析検討チーム、 2日本イーライリリー株式会社) D e ! t aa d j u s t m e n tお よ び T i p p i n gP o i n t Ana ! y s i sを行うための DIAマ ク ロ で あ る % d e ! t a ̲ p mmおよ び% d e ! t a ̲a n d ̲t i p( m i s s i n g d a t a . o r g .uk で、公開されている PMMD e ! t aT i p p i n gP o i n ta n dCBIm a c r o s に含 まれる)の背景となる考え方およびマクロのパラメータの設定について解説を行う.またシミュレ ーションデータへの適用結果も示す. 128
【企画セッション】 欠測のあるデータの解析のための SASプログラムの紹介 データ発生・ DIA マクロとプロシジャの進展 p u t a t i o nに基づく解析2( R e f e r e n c e ・b asedi m p u t a t i o n ) ( 5 )PattemMixtureModelとM u l t i p l eIm 0藤 原 正 和 1,2 e 日本製薬工業協会医薬品評価委員会データサイエンス部会タスクフォース 4 欠測のあるデータの解析検討チーム、 2塩野義製薬株式会社) 副 l A ,% p a r t l B,%p 制 2A ,%p 紅白B, %p art3)を利用することによっ DIA マクロである F i v em a c r o s(%p て実装可能なR e f e r e n c e ‑ b a s e di m p u t a t i o nである, CIR( C o p yI n c r e m e n t仕omR e f e r e n c e ),J2R( J u m pt o R e f e r e n c e ),及びCR( C o p yR e f e r e n c e )について詳細を説明する.また,補完後に実施される D e l t a m e t h o d sについても説明する.その後, F i v em a c r o s内の引数の意味合いとシミュレーションデータへ の適用例を紹介する. 129
【企画セッション】 欠 測 の あ る デ ー タ の 解 析 の た め の SASプ ロ グ ラ ム の 紹 介 データ発生・ DIA マクロとプロシジャの進展 ( 6 )MIプ ロ シ ジ ャ で 実 行 可 能 な PattemM i x t u r eModelとM u l t i p l eI m p u t a t i o nに 基 づ く 解 析 0渡 遺 大 丞 1,2 e 日本製薬工業協会医薬品評価委員会データサイエンス部会タスクフォース 4 欠測のあるデータの解析検討チーム、 2サノフィ株式会社) 欠測のあるデータの解析を行う際、 「応答変数の分布が異なるであろう部分集団 J (以後「パター ン」と呼ぶ)ごとに分布を想定し、その複数のパターンが混在した状況を扱うモデルに、 P a t t e m ‑ M i x u t u r eModel( P MM)がある。 PMMとして、確率モデルに含まれている推定不可能なパラ メータに対して、何らかの制約条件を加えて、 M u l t i p l eIm p u t a t i o n (MI)の解析を利用して行う方法 があり、 M i s s i n gNotAtRandom (MNAR) に基づく解析として利用されている。また SASVe r 9 . 4 か r o cMIでMNARステートメントが使用可能となり、①CCMV、 NCMV等の制約条件を用いた解析、 らP o n t r o I I e di m p u t a t i o n や③d e I t a ‑ a d j u s t m e n tに基づく解析が実行可能となった。本発表は応答変数が単 ②c ステートメント使用時の留意点を示し、シミュレーションデータを使 調な欠測である場合の MNAR 用した解析結果を提示する。 130
【企画セッション】 欠測のあるデータの解析のための SASプログラムの紹介 データ発生・ DIA マクロとプロシジャの進展 ( 7 )セッションのまとめと質疑応答 0大江基貴1・ 1 土居正明 1.3 (1日本製薬工業協会医薬品評価委員会データサイエンス部会 タスクフォース 4 欠測のあるデータの解析検討チーム, 2株式会社大塚製薬工場, 3東レ株式会社) セッションのまとめと質疑応答を行う. 131
SAS での NetworkMeta‑ An a l y s i s の実施例 頻度論に基づくアプローチ 0舟 尾 暢 男 、 黒 田 晋 吾 武田薬品工業株式会社日本開発センター生物統計室 C o n d u c t i n gNetworkMeta‑ An a l y s i sUsingSAS NobuoFunao, S h i n g oKuroda , L t d . TakedaP h a n n a c e u t i c a lCompany 要旨 SASによる NetworkMeta‑ An a l y s i sの実施方法として、均質性 (homogeneity) や一致性 ( c o n s i s t e n c y ) の評価、各薬剤の Rru 虫i ngの算出方法を含めて紹介する。 キーワード:NetworkMeta‑ An a l y s i s、均質性( h o m o g e n e i t y )、一致性( c o n s i s t e n c y )、R a n k i n g、頻度論、ベイズ 1 . はじめに M e t a ‑ A n a l y s i sを実施することで、複数の試験を統合した上で薬剤の効果を比較することが出来るが、通常の M e t a ‑ Ana l y s i sで比較することが出来る薬剤は 2種類のみである。近年、複数の試験を統合した上で 3種類以 上の薬剤間比較を行うことが出来る手法として NetworkM e t a ‑An a l y s i sが提案されており、この方法では、直 接比較の結果と間接比較の結果を統合したうえで薬剤間比較を行い、また、直接比較を実施していない薬剤 e t a ‑ A n a l y s i s の組についても間接的な薬剤間比較(間接比較)の結果を得られる点が特徴的である。 NetworkM はベイズの枠組みで解析が実施されることが多いが、最近では頻度論の枠組みでの解析手法もKrah n( 2 0日) 等により提案されている。 本稿では、頻度論の枠組みでの解析手法による NetworkM e t a ‑ An a l y s i sの実施方法として、 SASを利用した薬 剤間差の推定量の算出方法、均質性 ( h o m o g e n e i t y )や一致性 ( c o n s i 蜘 : n c y )の評価方法、及び各薬剤のRanki ng の算出方法について紹介する。参考までに、 B a y e s i a nNetworkM e t a ‑ An a l y s i sの結果との比較も行う。 2 . NetworkM e t a ‑ A n a l y s i sとは 通常の M e t a ‑ A n a l y s i sでは、複数の試験を統合した上で 2種類の薬剤効果を比較するが、 NetworkM e t a ‑ Ana l y s i s では、複数の試験を統合した上で 3種類以上の薬剤効果を比較することが出来る。 NetworkM e t a ‑ A n a l y s i sを e t a ‑ A n a l y s i sと同様であり、例えば下記の手順で解析を行うこととなる。本稿では、下記 行う手順は通常の M I . を SASで行う方法を紹介する。 ③の1. ~ I 132
①研究の背景と目的、試験の選択基準、解析手法や感度分析の方法を事前規定する (統合する試験は通常、無作為化試験とする) ②統合する試験を選定し、バイアスが入るリスクの評価(割付手法、盲検性の維持、評価項目の欠測の取 り扱い、公表バイアス等の評価)を行う(通常、独立した 2名以上の評価者を設定) ③ NetworkM e t a ‑ A n a l y s i s を実施する I . 試験結果を統合し、薬剤聞の比較を行う I I . 均質性 ( h o m o g e n e i t y)や一致性 ( c o n s i s t e n c y ) の評価を行う I II.感度分析、部分集団解析、メタ回帰等を行う I V . 必要に応じて追加解析や個々の試験の再評価を行う ④結果をまとめ、報告する e t a ‑ A n a l y s i sを適用することで、薬剤間の「直接比較」に加え、薬剤聞の直接的な比較結果が この NetworkM データに含まれていない場合でも、薬剤聞の「間接比較」が出来るのが特徴である。また、薬剤聞の「直接 比較 J と「間接比較 Jの結果を用いることで、エピデンスの質が強化されるらさらに、統合する試験は、薬 剤数が 3以上のもの ( m u l t i ‑ a r ms t u d y ) があってもよく、 右の様な「パス図」を用いて Networkの状態を表すことが 出来る。直線は薬剤聞の「直接比較」があることを示し、 直線の太さで「直接比較がある試験数 Jや「薬剤間差の標 ・ ・ ・ 準誤差の逆数」等を表すことが出来る。 直接比較:薬剤 Avs. 薬剤 B、薬剤J I Av s . 薬剤J IC等 間接比較.薬剤J IB vs. 薬剤Ij c 直接比較+間接比較:薬剤 Av s . 薬剤 D 等 . 1 パス図の例 図2 e t a ‑ A n a l y s i s の結果の解釈においては、一致 具体的な手法の説明の前に、下記の概念を定義する。 NetworkM 性 ( c o n s i s t e n c y ) の成立の有無が特に注目される点であることに留意する。 均質性 C h o m o ! ! e n e i t v ) 一 同ーの比較を行った試験(主同ーのデザイン)聞での結果が類似していること h e t e r o g e n e i t y ) 一 反意語は異質性 ( 類 似 性 (t r a n s i t i v i t v、 s i m i l a r i t v とも呼ぶ) 一 間接比較により、薬剤間差が適切に推定可能であること NetworkM e t a ‑ A n a l y s i sを行う際は常に気にすべき問題 ・ 間接比較の妥当性、つまり NetworkMeta‑Analysisの結果の妥当性に直結する ー 効果修飾因子 ( e f f e c tm o d i f i 町)の分布が試験問で類似している 一 間接比較の結果の妥当性についてはデータからの確認が難しいことがあるため、あらかじめ試験 選定時に留意する必要がある 1 この点が N e t w o r kM e t a ‑ A n a l y s i sを適用するメリットであるものの、このメリットを享受するためには類似性に関する 強い仮定が必要であることに留意する。 133
一致性 ( c o n s i s t e n c v ) 一 直接比較の結果と間接比較の結果が一致していること 一 一致性(∞n s i s t e n c y ) は「直接比較」と「間接比較Jの結果がある(ループがある)時にのみ確 認可能 一 反意語は不一致性 (inconsistency) 3 . データセット r S e n n 2 0 1 3 J S e n ne ta . l( 2 0日)で用いられている糖尿病治療薬に関する臨床試験データ及び本データに関するパス図を紹 . l( 2 0 1 3 )を参照)。試験数は 2 6で全て無作為化試験、うち m u l t i ‑ a r ms t u d y( 3群での 介する(詳細は S e n ne ta 比較試験)は l試験となっている。解析対象となるデータは Appendix2に示す。 薬剤は以下の 1 0種類 一 1:呈主主bose、2:匙単luorex、3:metformin、4:盟 国t o l、5:I 基盤l i t a z o n e、6:盟逗g l i t a z o n e、 7:豆 島g l i p t i n、8・ 盟 ! f o n y l u r e aa l o n e、9:~且agliptin、 10 :叫盤e b o (以下、先頭 4文字にて略記) . 変数は以下の 5変数 ‑ STUDLAB:試験ラベル ‑ TREA T1:薬剤 1 ‑ T旭 川2:薬剤 2 ‑ TE:HbAlc変化量(%)の薬剤間差 (TREA T l‑TREAT2) ‑ SETE:TEの標準誤差 metf 吋1 d 1 rOSl 図3 . 1 s i t a r Se 2 0 1 3 J のパス図(太線:m u l t i ‑ a r m試験を含むパス) n n 134
表3 . 1は、データセット I S e n n 2 0 1 3 J のうち、計算 例を紹介するために 7レコード ( 5試験)のみ抽出 したデータである。なお、表 3 . 1の ID=5の行は、 m e t f 分散共分散行列の計算にのみ使用する。また、抽出 したデータセットに関するパス図は右図の様にな p l a c り 、 I m e t fと p l a cの比較試験」は 3試験、 m u l t i ‑ a r m の試験が I試験となっている。 図3 . 2I S e n n20I 3J ( 7レコード抽出)のパス図 4 . 頻度論に基づく N e t w o r kM e t a ‑ A n a l y s i s 4 .1.固定効果モデル まず、以下の一般化線形モデルを考える。 y=Xonet+E (E[ ε ]= O .C O V [ E ]= V) ISenn2013 ( 7レコード抽出)Jに適用する場合は以下となる。このとき、 multi‑armstudy(Willms1999) に関する V sについては、対比較聞の共分散を適切に考慮する必要がある点、に留意する。 n e t= ( • o 6m時 p l a o6a 間 一 • p l a o6 S u l f ‑ P l a c ) ' ( p l a cを参照薬剤とする) .v Vs) V =diag(Vv … 4• 試験 s=1 .…. 5、デザイン d=1 .… . 4 、 Sd:デザイン dの試験の集合 Vs 。。 。 。 。。 。 o 。,v= 。 。 。 。 ,x= 。 。。。 。 。。。。 。。。。 o 。 m e t fa c a rs u l f ‑0.37 円 ‑0.80 y= I‑1.90 0.014 1 0 . 0 2 1 1 0 4 ‑0. 40 Y ‑ 1 .20 ‑ 1 .00 1 0 ‑1 YS 0.020 1 0 0.191 1 0 1 NetworkE s t i m a t e( jnet を算出する手順は I ‑ s t e pでの推定と 2・s t e pでの推定の 2つがある。 1 ・s t e oでの推定 ‑ NetworkE s t i m a t e :( j n e t= ( X ' V ‑1X)→X'V‑1y=( ‑ 1 .6 4 .ー 0 . 8 8 . ‑1 .27)' 135
2 ‑ s t e oでの推定 (j~iT =( L s 向 V Y ) ‑ 1 Z S 6 d V J 1 Y s,vitr=cw(Bf)=(Z 正S d V J 1 ) ‑ 1 e t+E D i r e c tE抑 制. e :( jd i T=(êt iγ ,… , êt iγ ,(j~iT')' = Xa 8n a ( E [ Ea l=0 ,C o v [ E a l=Va ,Va=diag(VldiT ,..., V3diT, V~iT)) NetworkE s t i m a t e :( j n e t=(X ' V ; ; l X ) ‑ lX a ' V ; ; l( jd i T=( ‑ 1 .64 ,‑0 . 8 8 ,‑1 .2 7 ) ' a a 。 ‑ 0 . 3 7¥o t " 1 ‑0.80 I 01 0 0 0 i r= 1‑1 9 d .761 川 町 Xa = 1 1 0 0I ‑ 1 .20 ‑ 1 .0 0 t w 高 。。。 。。 0.014 10 0 o1 0 o 10.0181 。。 。。。 3 白 。。 0.116 0.116 0.218 いずれの手順でも、 HbAlc変化量(%)に関する f m e t fと p l a cの薬剤間差Jf a c a rと p l a cの薬剤間差 Jf s u l f とp l a cの薬剤間差Jはそれぞれ‑1.64%、 0.88%、一1.27%と推定される。 4 . 2 .変量効果モデル 試験聞の均質性 ( h o m o g e n e i t y)を仮定しない変量効果モデ、ルにて解析を行う場合は、以下の一般化線形モデ ルを考えればよい。すなわち、固定効果モデルに、変量効果 b を追加すればよし。 e t+bs+E Ys= Xs 8n s , 1‑21 11 E [ E l=0 ,C o v [ E s l=Vs'E[bsl=0 ,Cov[bs l= 2 12 s . ) ; ‑ . 1 2 f Se n n 2 0 1 3( 7レコード抽出)Jに適用する場合は以下となる。 1 ,…ムデザイン d= 1 , … A、Sd:デザイン d の試験の集合 試験 S = 例えば、 τ は D e r S i m o n i a na n dL a i r dの方法にて算出(, = 0 . 5 8 3 ) COV(Y)=Vτ 。 0.014 。。。。。 0.021 0.020 。。。。 。。。。 0 . 1 9 1 0 1 +r2 1 1 0 . 1 4 1 0.116 0.116 0.218 1 V J 1 01‑21 V..= 。。。。 。。 。 。 。 。。。 。 。。。。。 。 。。。。 。。 。。。 。。。 。 。。。 。 。。。。 1 歪 以降は V を V τ に置き換えて、固定効果モデルと同様の計算を行えばよい。 , m u l t i ‑ a r mの試験の変量効果の分散共分散行列の非対角成分は 2 / 2 とする。そうすることで I D = 5( a c a rv s .m e t f )の変 量効果の分散も, 2 となる。 2 136
4ふ均質性と一致性の評価 NetworkE s t i m a t e( i n e t が得られた後は、下記指標により均質性 ( h o m o g e n e i t y)と一致性 ( c o n s i s t e n c y ) が評 価出来る。以下、 D はデザインの数とする。 Q n e t=(y̲x( i n e t ) ' V ‑ 1 ( y̲x( in e t ) ・ 0 t=Qhet+Q c 恥 憎 ̲ Q h e t :デザイン内の異質性 ( h e t e r o g e n e i t y)を評価するための指標 ( w i t h i n ‑ d e s i g n s0s t a t i s t i c) = キ Q M t = Z 2 = 1 Q 2 e t, Q 2 e t = Z s E S d ( Y s一旬ir)'V;l(ys̲(i~ir) ̲ Q i n c : デザイン聞の異質性=直接比較と間接比較の不一致性 ( i n c o n s i s t e n c y ) を評価するため の指標 ( b e t w e e n ‑ d e s i g n s0s t a t i s t i c ) = キ Q i n c= ( ( i d i r̲xa( i n e t ) ' V ; : ; ‑ l (( id t r̲xa( i n e t ) =キ Qtm=ZE=1QT.QT=(PT-xJmE〕'V言l((i~ir ̲xd( i n e t ) 4 . 4 . Pスコアによる各薬剤の Ranking B a y e s i a nNetworkM e t a ‑ A n a l y s i sでは S u r f a c eUndert h eC u m u l a t i v eRAnking (SUCRA、S a l a n t iG,AdesAE ,阻d n g )を行うが、頻度論に基づく手法においても ( i n e tと I o a n n i d i sJPA( 2 0 1 1 ) )等により薬剤聞の順位付け(Ra止i C o v (( i n e t )から f pスコア」という指標を算出して各薬剤の R a n k i n gを計算することが出来る。なお、この P スコアは SUCRAに対応するものとなる ( R u c k e rGa n dS c h w a r z e rG( 2 0 1 5 ) )。例えば、 m e t fに関する Pスコア は以下の様に算出すればよい。 … .Pmetf.T‑l)を算出する (T:薬剤数) 1 . m e t f以外の全ての薬剤との薬剤間差に関する片側 p値 ( Pme t f . l ' 2 . P スコア Pm 古L t (1‑P m e t f .i ) を計算する e t f= 他の薬剤についても P スコアを算出し、この大小関係により R a n k i n gを行う ( pスコアが大きい方が良し、)。 4 . 5 .SASを用いた解析例 以上の解析を SASで実行する例として、固定効果モデルに関する i m lプロシジャでの解析例を紹介する。 プログラム 4 . 1 f Se 2 0 1 3 J( 7レコード抽出)に対する解析 n n p r o ci m l y= ー (0 .37,‑ 0 . 8 .‑ 1 . 9,‑ 0.4,ー1.2,ー1}; X= ( 1 0‑ 1,0 1O . 100, 100, 10~ 0 1O } V= (0.0140185600000, 00.020506240000, 000.0199939600O . 000 . 1 9 0 5 3 2 2 500, 0000 . 1 4 1 2 2 5 6 40 . 1 1 5 5 6 4 4 2, 00000 . 1 1 5 5 6 4 4 20 . 2 1 7 9 9 5 6 1 } o o n v ( t ( X )*i n v ( V ) *X ) *t ( X ) *i n v ( V )* y; t h e t a ̲ n e t =i n v ( t ( X )*i n v ( V ) *X ); v ̲ t h e t a ̲ n e t= i r e s u l t l =t h e t a ̲ n e t1 1 (theta̲net‑probit(0.975)#sqrt(vecdiag(v̲theta̲net))) 1 1(theta̲net+probit(0.975)#sqrt(vecdiag(v̲theta̲net))) =j ( 5, 1 ,0 ) ;V a= j ( 5 . 5,0 ) ;X a=X [ ( l 2356 } . ]; t h e t a ̲ d i r ] s u m( in v( V[ 1,1])本 y [1])非 V [ l .1 ] ;V a [ l,1 ] V [ l .1 ]; t h e t a ̲ di r[ 1,1 t h e t a ̲ d i r [ 2 . 1 ] s u m ( i n v ( v [ 2,2 ] ) *y [ 2 ] ) 非V [ 2 . 2 ] ;V a [ 2, 2 ] V [ 2,2 ]; ] =s u m ( i n v ( V [ ( 341 .( 3,4 } ] ) *y [ ( 34 } ] ) /s u m ( v e c d i a g ( i n v ( v [ ( 341 .( 34 } ] ) ) ) t h e t a ̲ d i r [ 3,1 3 ] =l / s u m ( v e c d i a g ( i n v ( V [( 341 .( 34 }] ) ) ); V a [ 3, .1 ] =y [ ( 56 } ] ;V a [ ( 451 .( 45 } ] =V [ ( 56 1 .(56}] ; t h e t a ̲ d i r [ ( 451 = = = = 137
t
h
e
t
a
̲
n
e
t
̲
a =i
n
v
(
t
(
X
a
) *i
n
v
(
V
a
) *X
a
) *t
(
X
a
) *i
n
v
(
V
a
) *t
h
e
t
a
̲
d
i
r;
v
̲
t
h
e
t
a
̲
n
e
t
̲
a= i
n
v
(
t
(
X
a
)*i
n
v
(
V
a
) *X
a
)
t
h
e
t
a
̲
n
e
t
̲
a
‑
p
r
o
b
i
t
(
0
.
9
7
5
)恥 q
r
t
(
v
e
c
d
i
a
g
(
v
̲
t
h
e
t
a
̲
n
e
t
̲
a
)
)
)
r
e
s
u
l
t
2
=t
h
e
t
a
̲
n
e
t
̲
aI(
I
I(theta̲net̲a+probit(0.975)#sqrt(vecdiag(v̲theta̲net̲a)))
Q
̲
n
e
t=t
(
y‑X*t
h
e
t
a
̲
n
e
t
) *i
n
v
(
V
) *(
y
‑
X*t
h
e
t
a
̲
n
e
t
)
一
。i
n
c=t
(
t
h
e
t
a
一
d
.i
r̲X
a*t
h
e
t
a
̲
n
e
t
̲
a
) *i
n
v(
V
a
)*(
t
h
e
t
a
̲
di
r̲X
a*t
h
e
t
a
̲
n
e
t
̲
a
)
Q
̲
h
e
t=Q
̲
n
e
t̲Q
̲
i
n
c;
C
C=‑
1
#
i(
3
)
;C
C
[,1
] =1
; E=C
C*t
h
e
t
a
̲
n
e
t
; z=j
(
1,3
,O
)
d
oi
=
1t
o3
c =CC[i,];
z
[
i
] =s
q
r
t
(
t
(
c*t
h
e
t
a
̲
n
e
t
) *i
n
v
(
c*v
̲
t
h
e
t
a
̲
n
e
t*t
(
c
)
)*(
c*t
h
e
t
a
̲
n
e
t
)
)
0
)t
h
e
nz
[
i
]=
ー1*z[
i
]
i
f(
E
[
i
]<
e
n
d
p
̲
m
e
t
f=1
‑
(
p
r
o
b
n
o
r
m
(
z
)
) ;p
s
c
o
r
e
̲
m
e
t
f=p
̲
m
e
t
f
[
:
];
t
i
t
l
e"
T
r
e
a
t
m
e
n
te
s
t
i
m
a
t
e(
F
i
x
e
de
f
f
e
c
tm
o
d
e
l
)
";
p
r
i
n
tr
e
s
u
l
t
1r
e
s
u
l
t
2, Q
̲
n
e
tQ
̲
h
e
tQ
̲
i
n
cp
s
c
o
r
e
̲
m
e
t
f;
q
u
i
t;
実行結果は以下の通り。行列回s
u
l
t
lは l
‑
s
t
e
pで計算した 8net の推定値 (l列目)とその両側 95%
信頼区間
(2‑3列目)、行列 r
e
s
u
l
t2は 2
・s
t
e
pで計算した 8net に関する推定結果となっている。また、変数 Q̲
n
e
t、Qー
h
e
t
及 び 色 町 は そ れ ぞ れ Qnet 、Qhet 及び Qinc 、変数 p
s
c
o
r
e
̲m
e
t
fは m
e
t
fの Pスコアとなっている。
.
1
出力 4
r
Senn
2
0
1
3
J(
7レコード抽出)に対する解析結果
T
r
e
a
t
m
e
n
te
s
t
i
m
a
t
e(
F
i
x
e
de
f
f
e
c
tm
o
d
e
l
)
r
e
s
u
l
t
1
r
e
s
u
l
t
2
ー1
.
6
4
2
9
3‑
1
.
8
8
2
3
8
4‑
1
.
4
0
3
4
7
6
‑
1
.
6
4
2
9
3‑
1
.
8
8
2
3
8
4‑
1
.
4
0
3
4
7
6
‑
0.
8
8
0
1
3
1‑
1
.
1
4
1
5
3
2‑
0
.
6
1
8
7
3 ‑
0
.
8
8
0
1
3
1‑
1
.
1
4
1
5
3
2 ‑
0
.
6
1
8
7
3
‑
1
.
2
7
2
9
3‑
1
.
6
0
6
3
8
1‑
0
.
9
3
9
4
7
8
‑
1
.
2
7
2
9
3‑
1
.
6
0
6
3
8
1‑
0
.
9
3
9
4
7
8
Q
̲
n
e
t
Q
̲
h
e
t
Q
̲
i
n
c
p
s
c
o
r
e
̲
m
e
t
f
1
5
.
0
0
0
4
6
6 1
0
.
6
8
7
5
0
5 4
.
3
1
2
9
6
0
8 0
.
9
9
9
7
0
2
3
i
n
g
l
edesignを用いた不一致性の原因調査とヒートマップ
4ふ Detachingas
均質性 (
h
o
m
o
g
e
n
e
i
t
y)と一致性 (
c
o
n
s
i
s
t
e
n
c
y
) を評価した際、 Qinc が大きく、不一致性(in
c
o
n
s
i
s
t
e
n
c
y
) が示
i
n
c
o
n
s
i
s
t
e
n
c
y
) が生じている原因を調べる必要がある。ここではKrahn (
2
0
1
3
)の
唆された場合、不一致性 (
r
D
e
t
a
c
h
i
n
gas
i
n
g
l
ed
e
s
i
g
n
Jの方法を用いて、各デザイン dの影響を計算するために Q を再計算した後、「デ
d
向 c
hした)ときのデザイン d
'の
ザイン dを除いた (
1
. 8間 =(
8
n
e
t
'
,8~iT-ind')'
8~iT-ind
Q
3
Cの変化Jを計算する。
とする
デザイン d に関する f デザイン d の薬剤数一lJ個の新たなパラメータ
(デザイン dにおける直接比較と間接比較の結果の差を意味する)
2
. モデル (
Jd
i
T=(X
{
d
)
)
8
e
;
f+E (
E
[
E
]=0,C
O
V
[
E
]=Va) を考える
a,l
l
{
d
):デザイン dの当該対比較が 1
、それ以外は 0 となっているベクトル又は行列
3
. デザイン dを除いたときのモデルの不一致性 (
i
n
c
o
n
s
i
s
t
e
n
c
y
) は以下の統計量で表現出来る
Qjzf=Rid)vfR(d)(R(d}=Bdtr‑(Xa,
1
{
d
l
)
B
g
f
)
138
4
.
f
デザイン dを除いたときのデザイン d
'の QFCの変化」を以下で定義する
Q33=Q;
ヂ ー QFL)
,
Fet)
QFc=(821r‑Xdanet)'V2(81F‑xd
JJ?R内 )
QFL)=Ri,
一
(
R
内 )Z811r‑(XJ
似
}
)
ノ
?
;
;
)
(
X
,
l{d})d' :(
X
,
l{d))のうちデザイン d
'の部分を取り出した行列
a
a
i
π c=
L~'=l Q~r:c となる
ちなみに、 Q
Qinc の値が大きい場合、すなわち不一致性
(
i
n
c
o
n
s
i
s
t
e
n
c
y
) が示唆された場合、 Q32を利用し、例えば下図
c
o
n
s
i
s
t
e
n
c
y
) の原因なのかを調査することが出来る。
のヒートマップを用いて、どのデザインが不一致性(in
本稿はグレースケールであるため分かりにくいが、実際のヒートマップは「寒色系」と「暖色系」による図
示となる。
書
富
~
M
5
円
量
~
a
a
c
:
a
国 r
:
m
e
t
f
p
l
a
c
:
m
e
t
f̲pl
関
p
l
a
c
:
a
c
a
r
口
p
l
a
c
:
m
e
t
f
書
a
~
l
i
a
飴
LI
口
p
l
a
c
:
a
c
a
r
̲
pl
a
c
:
a
c
a
r
:
m
e
t
f I 口
お
a
結
日
口
口
口
ロ
2
.
5
2
.
0
1
.5
1
.0
臼
0
.
5
図4
.
1f
S
e
n
n20
1
3
J(
7レコード抽出)に関するヒートマップ
圏の大きさ
s
t
i
m
a
t
e hdtrの n
ハ ッ ト 行 列 H=Xa(Xa'V;;lXa)-lX~V;;l にて計算され、各デザインの direct e
e
t
w
o
r
k
e
t
w
o
r
ke
s
t
i
m
a
t
eが「直接比較」と「間接比較」をどのように
e
s
t
i
m
a
t
eへの寄与の度合いを表す。すなわち、 n
組み合わせて推定されているかを表現する。
n
e
t=
d
i
r
Ho
x
a
o
対角成分のセルの色
各デザインの QFC を表す (Q~r:ゐ =0 であるため暖色系しか発生しない)
非対角成分のセルの色
・ 暖色系 :Q33〉 O;列のデザイン d を除いたときの行のデザイン d' に関する QFC が減る
(色の濃さ=度合い、 i
飽n
t
e
v
i
d
e
n
ω であることを示す)
n
c
o
n
s
i
s
'に関する Q F が増す
寒色系 :Q112〈 O;列のデザイン d を除いたときの行のデザイン d
此i
(色の濃さ=度合い、 s
u
p
p
o
v
ee
v
i
d
e
n
c
eであることを示す)
139
図4 . 1では、 m u l t i ‑ a r m試験における r m e t f v s .p l a c J の結果に関して Q Fが大きく(暖色で色が濃い)、不一 n c o n s i s t e n c y ) が示唆される。次に、園の大きさを見ると、 r m e t f v s .p l a c Jの n e t w o r ke s t i m a t eに対する 致性(i d i r e c te s t i m a t eの寄与が大きいのは、 r m e t f v s .p l a c J が含まれる 3試験だが、特に 2・紅m 試験の寄与が大きい。 この 2 つの情報を組み合わせると、 rme ぜv s .p l a c J が含まれる 3試験問の何らかの差異によって不一致性 ( i n c o n s i s t e n c y ) が生じた示唆されることから、これらの試験に関してさらなる調査を行う必要がある。ヒー 2 0 1 3 ) を参照されたい。 トマップの見方の詳細はKr油n ( 5 . SASでの NetworkM e t a ‑ A n a l y s i sの実施 さて、 NetworkM e t a ‑ Ana l y s i sを実行する SASプログラムの構築を試みる。まず、固定効果モデルと変量効果 n e t の推定値とその分散、 Qnet 、Qhet 及び Qinc 、各薬剤の r モデルによる o 叩 k i n g等を計算する i m l プロ シジャによるプログラムを作成した (SASプレミアムラウンジの本ユーザー総会サイトにて公開予定)。しか し、この段階でプログラムが約 500 行となり、 Qhet 及び Qinc の分解を行おうとすると行数が 2~3 倍に膨 れる恐れがあり、ここでプログラム作成を打ち切った。ところで、フリーで使用することが出来る統計ソフ n e 加 e t a J パッケージがあり、本パッケージの関数を用いることで頻度論による Network ト rRJ には r M e t a ‑ An a l y s i sを実行することが出来る。本項では SASから R を呼び出して NetworkM e t a ‑ A n a l y s i sを実行す る方法を紹介する。 差壬豆重量 ①以下のサイトより R をダウンロードし、インストールする ( V e r . 3 . 2 . 5 を想定) h位。・//食O.VZ.vamal ! : a t a ‑ u . a c .i % 岨b / c ran/bi n l w i n d o 咽s/b a s e / ② R を「管理者権限」で起動した後、以下の命令を実行する i n s 包 I l. p a c k a g e s ( " n e 加氾句", d ep= T ) ③ C ドライブに作業フォルダを準備する(本稿では C ドライブの直下に r t e m p J フォルダを作成) ④ Appendix2で紹介するマクロ r%MYNETMETAJ を定義し、実行する。 プログラム 5 . 1 マクロ r%MYNETMETAJ の引数 物n a c r oMYNETMETA(dataset = =M O, sm l e v e l = 0.95, reference= = s e q s m a1 1 = good, path =C : / t e m p ) パスの表示 解析結果等 SASから R を起動 II1II1雪恒明冒 output.pdf j g l = l = 臨E結果のデータセット %MYNETMETA 140
表5 . 1 マクロ i%MYNETMETAJ の引数 機能 引離名 『 ι d a t a s e t SASデータセット名を指定(変数名は TE、SETE、TREA T 1 、 TREAT2、STUDLABで固定) sm TEの指標を指定 (RD: R i s kD i f f e r e n c e、RR:R i s kR a t i o、OR:OddsRa t i o、M D: MeanD i f f e r e n c e、 SMD:S t a n d a r d i z e dMeanD i f f e r e n ω 、IRR:I n c i d e n c eR a t eR a t i o、IRD:I n c i d e n c eR a t eD i f f e r e n c e 等) 1 e v e 1 信頼係数を指定 r e f e r e n c e 参照薬剤を指定する場合に指定(例:r e f e r e n ce = p 1 a c ) s e q 薬剤の順番を指定 s m a l l 指標について、小さい方が改善 ( g o o d ) 又は悪化 ( b a d ) のいずれかを指定 p a t h 作業ディレクトリを指定(出力結果の o u t p u . t pdfや中間ファイルの格納場所) データセット i Se nn2013̲char (Appendix2のプログラム A.2参照)J に対して、マクロ f%MYNETMETAJ を用いて NetworkM e t a ‑ A n a 1 y s i sを実行する場合は以下の様にすればよい。 . 2 プログラム 5 i S e n n20 1 3 ̲ c h a r J に対する NetworkM e t a ‑ A n a 1 y s i sの実行例① 昔前NETMETA(dataset=Senn2013̲char, sm =M D, l e v e l =0 . 9 5 ) また、引数 r e f e r e n c eに参照薬剤を指定し(以下では p 1 a cを指定)、引数 s e qに薬剤の順番を指定する場合は 以下の様にすればよい3。 3 プログラム 5. i S e nn20 1 3 ̲ c h a r J に対する NetworkM e t a ‑ An a 1 y s i sの実行例② 唱MYNETMETA(dataset =Senn2013̲char, sm =M D, l e v e l =0.95, reference=plac, seq =唱s t r ( ' p l a c ', ' a c a r ', ' b e n f ', ' m e t f ', ' m i g l ', ' p i o g '・ ,r o s i ', ' s i t a ', ,s uI f ', 'vi I d ') ) 実行結果として、作業フォルダ(例えば i C : ¥t e m p J ) に解析結果となる o u t p u t . pdfが出力される。まず、 pdf o ファイルの 1 . . . . . . 2頁にて固定効果モデルと変量効果モデルによる薬剤l 間差の推定結果 (NetworkE s t i m a t e : net) に関する F o r e s tP 1 0 tが示される。なお、両モデルの推定結果のうち点推定値は同様であるが、信頼区聞は変 量効果モデルの方が広くなっている。 3 引数 s e qに順番を指定する際、 %s 位。中で指定する内容を途中で改行しないこと(エラーとなる)。 141
F i x e dE f f e c t目 。d e l T r e a t m e n t p l a c a c a r b e n f m e t f m i g l p i o g r o s l s i t a s u l f v iI d モ チ ー司・‑ ー 画 ー 伝? ‑ ‑ ; 砕 ー ー ‑ ‑ ← ー ー 4 ‑ 0. 5 9 5 % ‑ C I T r e a t m e n t 0 . 0 0 ‑ 0 . 8 3[ ー 1 .0 4 :‑ 0. 6 1 ] [1 . 1 5 :‑ 0. 6 6 ] ‑ 0 . 9 1ー ‑ 1 .1 1[ ‑ 1 . 2 3 :ー 1 .0 0 ] ‑ 0 . 9 4[ ー 1 .1 9 :‑ 0. 7 0 ] ‑ 1 .0 7ー [1 . 2 2 :‑ 0. 9 2 ] ‑ 1 . 2 0ー [1 . 3 0 :ー 1 .1 1 ] ‑ 0 .5 7[ ‑ 0 .8 2 :‑ 0 .3 2 ] ‑ 0 . 4 4ー [0 . 6 2 :‑ 0 . 2 6 ] ‑ 0 . 7 0司 [0 . 9 5 :‑ 0. 4 5 ] ー ‑ ; t 少 ー ー ‑ーーー ・園田 MD p l a c a c a r b e n f m e t f m i g l p i o g r o s i s i t a s u l f R a n d o mE f f e c t sM o d e l ー ー ー ー 膏 ト ー ー ー ー ー ー ー 硲 , 一 一 ー ー壱トー ー ‑ ‑ ‑ f 骨 ー ー 一 一 一 一 面 一 一 一 → ヨ ー v iI d 。 ‑ 1 .5 ‑ 1‑ 0 . 50 0 . 5 0 . 5 図5 . 1 固定効果モデルの解析結果 聞D 9 5 % ‑ C I 0 . 0 0 ‑ 0. 8 4[ ー 1 .3 2 :‑ 0 .3 6 ] ‑ 0 . 7 3[ ー 1 .2 9 :‑ 0 .1 7 ] ‑ 1 .1 3[ ー 1 .4 3 :‑ 0. 8 2 ] ‑ 0 . 9 5[ ー 1 .4 0 :‑ 0 .5 0 ] ‑ 1 .1 3[ ー 1 .5 6 :‑ 0 . 7 0 ] ‑ 1 . 2 3[ ー 1 .4 8 :‑ 0 .9 8 ] ‑ 0 . 5 7[ ‑ 1 .2 6 : 0 . 1 2 ] ‑ 0 . 4 2[ ‑ 0. 8 9 : 0 . 0 6 ] ‑ 0. 7 0[ ー 1 .3 9 :‑ 0 .0 1 ] 1 .5 図 5.2 変量効果モデルの解析結果 次に、 pdf ファイルの 3~4 頁にて固定効果モデルと変量効果モデルに関するパス図が示される。パスの線の 太さは、各モデ、ノレにて算出した「薬剤間差の推定値の標準誤差の逆数」を表している。 F i x e dE f f e c tModel RandomE f f e c tModel p l 0 g 図5 . 4 変量効果モデルに関するパス図 図 5.3 固定効果モデルに関するパス図 最後に、 pdf ファイルの 5~6 頁にて、固定効果モデルと変量効果モテツレにおいて、不一致性 (inconsistency) を評価するためのヒートマップが示される。固定効果モデルではいくつかのデザインにおいて不一致性 ( i n c o n s i s t e n c y ) が示唆されているが、変量効果モデルではその度合いが薄れていることが伺える。 142
ωO﹄
h
p︼
一
F一ヨ ω
一 FaE
一
一
==ω
回
︒ ‑a o
m
w一
且
ぷニ
t
1 ヨ
1
.0
回
0.8
j
一一一一
"
ロ
ι
一
M
L
II
0
.
6
0
.
4
0
.
2
0
.
0
‑
0
.
2
:
ー
ロ=.
~~~nY~~
U
一Aau
一Mnu
m
一一一けム一
九一一一
一一白
一戸川︑一キ
広
コ
[I:J・
ーロロ
ロ ロ 巴
ローロ
ロー
E↓~~:~~Yt
‑ωO﹄
一 O町一且
一
国
Eコ込
f
placmetfJlaC212fj招
回
︒ ‑a H
F
H
@量
‑
m
w
O﹄一回︒ =H
2‑
ー で
I'
t
[ZJ
脱fJ7231
﹄L
w
O伺
・ 0・‑R
量
一 om一
且
FH@
L
F
H
F
ω邑・﹄a
﹄里高・︒倒一且
占
ιι
口︒ロ
iii
M
F刷引日I
Jj
Ili‑‑G
回岡田守圏ご回国一日
回国国回二一 J 一
固品目十一回国一
Z I E J十一則
開国岡
'
EE一む量
雇
一 O咽‑a
ι
=
m
w
ω い﹄畑山遍
﹄
一=
o
m
w・
oe一向﹁﹄岡0・
一 0・一且
﹄e
LFHωe・
・
﹄a
w
O悶‑O
回一且
ι==ω ・﹄ω0
倒
的w
量HO咽‑a
a
w
‑︒
LFUZE‑﹄
伺
一 alLFH@
o・‑且l﹄
0・一且
m
w・
邑・﹄moE・
国O
L
F
U
F
m
w
‑
m
w︒﹄・回O‑且
︒・ h・
L
F
H鍵E
‑ωO﹄ O個‑a
ω
‑
L
E
@邑・︒伺一且
Mau‑a・︒町一且
・LFUF@邑
回
︒ ‑a
LF‑2m ωO ﹄
一
・
・Lze邑
L
F一ヨ ω
aLTnssis‑‑E
内
uuMUT‑E u
a
h
‑
a
H
Vu
sh
'
u
u
F
u
mmsau
se‑nvnv m
R W戸h
W
F
‑
‑
‑
n
︐s
817SIr
‑‑E
t
‑
・a
・
・・
f
‑
f
o
e
‑
F
r
r
o
︐
角
・
・
・
t
i
‑
‑
0
a
a
a
・
︐
.
e
o
l
f
e
e
‑
a
a
!
日
p
u
w
F
U
nv内
M
F
a&L
F
u
‑
‑匂
a切 削 剛
a
a
l
m刷 ︐
Em刷n
v
n
M
F
R
M
F
m刷nva切an‑‑anv
~<:l
plac醐 リ laci;:;jail
tT
P
l
a
c
:聞e
r
o
s
l:
S
U
I
T
R
a
n
d
o
mE
f
f
e
c
tM
o
d
e
l
図5
.
6 変量効果モデルに関するヒートマップ
図5
.
5 固定効果モデルに関するヒートマップ
他にも、 SAS上に以下のデータセットが生成される。
T E FIXED、T E R A N D O M :薬剤間差の推定値(前者:固定効果モデル、後者:変量効果モデル、以下同様)
T E FIXED L C L、T E R A N D O M L C L :薬剤間差の推定値の信頼下限
T E FIXED U C L、T E R A N D O M U C L :薬剤間差の推定値の信頼上限
Ql̲STATISTICS、Q2̲STATISTICS :Q
統計量とその分解結果 (Qhet:homogeneity/ Qinc:consistency)
Q1̲WITHINDESIGNS、Q2̲
WITHINDESIGNS :Q
het の分解結果
within‑designsQ statistic)
備
i
詰
応
一配
B町
ET W既
E
E悶
N
D悶
E
釘
SI
倒G
N 止:
S Q芯
2 ;の結果
Q 1̲
BETWEENDESIGNS、Q 2
(Design‑specificdecompositionof
(
但
B伽
e
twe釘
er
俳
ac制
h
甘
1
ingofs
討ing1edesigns)
de匂
t
R A N K FIXED、R A N K R A N D O M :Network内における各薬剤の Pスコア
Qs
t
a
ti
s
ti
c
st
oa
s
s
o
s
sh
o
m
o
g
o
n
oi
t
yノ c
o
n
s
l
s
t
o
n
c
y(
R
a
n
d
o
m
)
Qs
t
a
ti
s
ti
c
st
oa
s
s
e
s
sh
血
。0
9
9
n
9
it
yノ c
o
n
si
s
t
e
n
c
y
励。 1
6
1n
e
t
w
o
r
k
伺I
t
h
i
nd
e
s
i
g
n
s
8
0
t
l
f
e
e
nd
e
si
g
n
s
Q
d千
p
v
a
l
9続琵53(抑5
7
舗
7
4
.455:揖 1
2
2
.
5
3
0
2
7
1
2
7
1
8
1
1
7
7
.
8
7
1
4
8
1
E
‑
1
3
1
.7
鋭l43E
‑
1
1
0白泡ぽ野'
0
1d2
蝿
陥。 1
0n
o
t
w
o
r
k
山
U
ω
制市抑制
制
m
,
d
c
d
r
:
p
lc
d
c
d
r
:s
u
l
f
m・ tf:p~og
.
.
t子 p
l
a
c
m
e
t
f
:
r
o
s
l
m
e
t
f
:
s
u
l千
p
i
o
g
:
p
l
a
c
p~09:roSI
p
l
a
c
:
r
o
s
l
r
o
s
l:
s
u
l
f
a
c
a
r
:
m
e
t
f
:
p
l
a
c
p
v
a
l
1
8
1
1
7
0
.
5
1
師.
9
0
1
9
4
7
0.259
製封均企2
1
0念999377
時8
司
d
e
s
i9
n
Q
d千
p
v
a
l
a
c
a
r
:
p
l
a
c
a
c
a
r
:s
u
l千
b
e
n
f
:
p
l
a
c
.
.
t千 P
!
o
g
m
e
t
f
:p
l
a
c
m
e
t
f
:
r
o
s
i
m
e
t
f
:s
u
l
f
1
1
1
9
1:
p
J
a
c
p
l
o
g
:p
l
a
c
p
i
o
g
:
r
o
s
i
:
r
o
s
i
p
1c
p
l
a
c
:
s
l
t
a
p
l
a
c
:
Y
l
l
d
r
o
s
i
:
s
u
l千
a
c
a
r
:
mU:plac
o
o
0
尚
尚
7
.
1
5
9
0
4
6
1
2
5
企
0
.
0
6
0
8
1
7
7
6
3
2
1
2
.鎗 伺2
8
5
3
7
3
o
o
2
o
0
0
0
0
・
・
Q
d千
p
v
a
l
2
2
.
4
4
4
4
6
2
9
7
2
2
2
.
5
1
7
1崎 匙 時
1
7路 樹 持 制6
1
7
3
3
1
22田智5
割泣曾箆捻
2
2
.
5
制措.95lO5
7.51a
1
7剖 @ 制2419
2
2
.
4
l
措置5
岨拍
曲'
7
1
α
2
0
2
1
6
.
2
6
.
7
7
1
6
5
6
9
3
伺
制d2
7
6
5
1
2
2
.
3
6
6
6
6
6
6
6
6
6
6
5
0
5
l
5
7
71
0
.
0
0
10
臼2
8
0
.
0
0
0
9
7
0刷珂措2
1
9
2
2
5
0
.
0
0
1
1
7
6
2
4
6
1
田'
7
4
1
4
0
6
0
.
0
0
0
.
2
7
5
9!到位
。国)841
7
6
1
5
7
O由X陣念9
2
4
8
7
ち8
1
0
1
0
.
0
1
2
2
5
1
6
6
0
.3d2岬 1
∞
岨24241
0
.
0
。。
1初 宿771528
o
2
.
5
7
7
1
1
2
6
3
9
3
o
o
o
0
1
0.1913
制lO2d523
713
尚
0.02788899
臼 愈 鈴 H捻
O 帥 5鈎 伺7
0
α克 1
揖
。
舗
お
F
舗
0
0
0
2
4
1鈎 1
1出 68
陥
N
A
5
0.7'制脚959ち441~玲
陥
陥
陥
剛
8
o
t
w
o
e
n
‑
d
e
si
g
n
sQ s
t
a
tI
s
tI
ca
千t
e
rdetaching0子 singlodesigns <Random)
Beho&n‑dosi
9
n
sQ s
t
a
tI
s
ti
ca
千t
o
rd
e
t
a
c
hi
n
go
fsI
n
9
1
ed
&
sI
g
n
s
d
e
s
i
g
n
d千
e
s
i
g
n
sQ s
t
a
t
i
s
t
i
c(
R
an
d
o
m
)
D
esi
g
n
‑
s
p
e
c
i
f
iCd
e
c
o
m
p
o
sI
tl
o
no
fw
i
t
hI
nd
側幅一掛川間
怨剖関前日閣
掛制時制附
tSC671
・
0000
z
s'AHVAV‑E‑AHV 内4 A H
A
H
VH
︽
V 内4 U
内 U
内E
JH
内V
︽V
A
U
一
一
︒
制
加
︒
明
︒
︒
一
四
Q00
側側断糊
a 位ι ι a
MHHHHH引 時 咽 出 前 館 副 町
計 山 戸 陥 陥 0 陥6 0剛0 陥 陥0 陥 陥 尚 尚
刷
叩諦山同制
九四割計﹃
Mm
・
!
o
'
Ii
t
h
i
nd
o
s
i
g
n
s
Bt
w
e
e
nd
o
si
9
n
s
Q
謁 1
9
1
6
.
3
6
7
7
0
⑤尉控室 1
7
13.53
伺 1
3
2持 制 泣1
d
e
S
i
9
n
acar:pl~c
f
d
c
a
r・ 剖 l
o
t
f
:
P
i
o
g
.th.l.c
m
o
t
f
:
r
o
s
i
固.
t
f
'
s
u
l
f
p
i
o
g
:
p
l
a
c
p
i
o
g
:‑
r
O
S
i
p
l
a
c
:
r
o
S
i
f
r
O
S
i
:剖 1
a
c
a
r
:
m
e
t
f
:
p
l
a
c
悶
園
出力 5
.
1 固定効果モデルでの Q統計量と分解結果
Q
d千
p
v
a
l
2伺 8
4
4
2
鎗4
5
2
.823594~蝿7
2.O791制 65
2
.
7
4
1
0
4
@
1
7
3
7
2加 持β 刷 07
1
.1
1
6
2
7
7
1
4
5
9
6
6
6
6
6
6
6
6
6
6
5
0純 白 百7
1
0
7
0.8
割高③蝿 1
7
2
0
.
8
'
刊誌l5034d2
̲
0
.
8
4
0
5
7
5
1
7
8
0.8
鐙2
983412
0蝿 0813
倒 1
6
0.8737
両 開5
0
.
8
2
9
4
2
1
5
1
6
2
0
.
8
9
1
7
3
1
0
8
5
1
0
.
9
9
1
3
5
7
5
1伺
0
.
7
4
0
6
2
5
0
7
揖
2.~67鵠77
2.83
鵠 1
4
7
舗'
2
?~出神力505
0 念録。宕剖783
2.7
鍔8
82
拍 1
4
.
2 変量効果モデルでの Q統計量と分解結果
出力 5
143
内 a c a r b e n千 田e t千 m i g l p i o g p l a c r o s i s i t a s u l千 v i l d 内 内 坤咽 司 AVA41 AMJ1 ・AU hu ・ 守'ヲ'Ed 内 dEOAMJ OEJ A 坤EJ aOヲ'a4Adq''A Av ﹄ nuhuhuhuhurohuhuhuhu 伺 Age‑‑a千1d F千 千T 1& a n & L gnuauS4I c s e lm l‑ ‑ Di・ u‑ ﹁ssv a b m p‑ p 6 1宮2675974 vEdda dEJEan ︒ a4 A 5 8 6 1 6 E 4 4 59 2 5 1 1 4 5 2 2 6 6 ︒ qV44 au 4 OA︒ d a ・且守︐ 4 EO hUA044hu'AA3A4 1︐ 6 9 642 ﹃2067︒︒︒︒ ︒ ︒︐ ﹃ ﹃ ︐ 向 ︒ ︽︒ ︒ ︒ ︒ ︒ R a n k treatments i n network ( F i x e d e千千 e c tm o d e l )R a n kt r e a t冊目 n t si nn e t w o r k( R a n d o m e千千 e c tm o d e l ) x x 出力 5. 3 固定効果モデルでの各薬剤の Pスコア 0 . 5 2 0 2 6 4 4 1 5 3 0.4358170235 0 . 7 8 1 7 7 6 5 3 1 6 0.6136555282 0.7745697307 0 . 0 1 3 8 9 5 0 5 3 8 0 . 8 9 3 3 6 8 1 8 1 3 0 . 3 3 3 0 9 9 2 0 6 4 0 . 2 1 0 3 0 7 6 5 9 7 0 . 4 2 3 2 4 6 6 6 9 5 出力 5. 4 変量効果モデルでの各薬剤の Pスコア ところで、手持ちのデータが r Senn2013̲charJの様な薬剤間差に関する形式 ( c o n t r a s t ‑ b a s e dformat) で はなく、各薬剤の推定値に関する形式 (arm‑basedf o r m a t ) である場合は、事前にデータの変換を行う必要 がある。本稿では、各薬剤の推定値に関する形式 (arm‑basedformat) のデータを薬剤間差に関する形式 ( c o n t r a s t ‑ b a s e df o r m a t ) に変換するマクロ r%MYCONVERTJ の定義を Appendix2にて紹介する。頁数 の制限のため、引数等の詳細な説明はユーザー会当日の発表にて紹介する 40 6 .B a y e s i a nNetworkM e t a ‑ A n a l y s i sの結果との比較 本総会では既に、 SASを用いた B a y e s i a nNetworkM e t a ‑ An a l y s i sの方法が提案されている(福井他 ( 2 0 1 4 )。 ) Ana l y s i sの解析結果と頻度論に基づく NetworkM e t a ‑ Ana l y s i sの解析 よって本稿では、 B a y e s i a nNetworkM e t a ‑ 結果を比較するにとどめる。 6 . 1 .固定効果モデル まず、固定効果モデルに関する Bay 官s i a nNetworkM氾怯Ana l y s i sを実施する。 . パラメータと事前分布 ,10000) ( i=1 , … ,9) ̲ 91‑ N(O ~ 91:a c 紅と p l a cの薬剤間差、・・・、偽 : v i l dとp l a c薬剤間差 ~ 910:便宜上 0とおき、 p l 閣の効果を表す(推定は行わない) 主主主 ‑ 2・ 制 御d y : YIj -N(9i ーめ, σ'I~) ( i, j=1 , ・ . ., 10; O'i~: Y l jの分散) …仮 ) ベ(21)((J ア )/2)) ゅ/2(4+ d y : 解析対象となるデータ r S 印 刷 は Appendix2にて、解析を行う SASプログラムは以下に示す。 プログラム 6 . 1 B a y e s i a nNetworkM e t a ‑ Ana l y s i s {固定効果モデル) o d sg r a p h i c so n = acd i a g n o s t i c s = a l lp l o t s = a l l procmcmcdata=Senn nbi=5000nmc=500000t h i n = 1 0 s e e d = 7 7 7missing moni tor=( t h e t a ) 4 データ r p 釘' k i n s o n Jの出典:D i a sS , S u t t o nAJ, A d e sAEa n dW e l t o nNJ( 2 0 1 3 ) 。 144
array t e [ 2 ]t e 1 te2 ; arrayt h e t a [ 9 ]; ] array s [ 2,2 arraym u [ 2 ]m u 1 mu2 parms t h e t a :0 o r m a l( 0,v a r = 1 0 0 0 0 ) prior t h e t a :~ n i f studlab=3then do d oi = l to 9 i ft r e a t 1 ̲ 1 = i thenmu1̲1=theta[i] i ft r e a t 2 ̲ 1 = i thenmu2̲1=theta[i] i ftreat1̲2=i thenmu1̲2=theta[i] i ft r e a t 2 ̲ 2 = i thenmu2̲2=theta[i] end i f treat1̲1=10 thenmu1̲1=0 i ftreat2 1 = 1 0thenmu2 1 = 0 i ft r e a t 1 2=10thenm u 1 2=0 i ftreat22=10thenmu2 2=0 1 ̲ 1叩 u 2 ̲ 1 ;mu[ 2 ]司n u 1 ̲ 2 寸n u 2 ̲ 2; mu[1]=mu s [ 1,1 ] = v 1 ;s[2,2]=v2 ;s [ 1,2]=(v1+v2‑v3)/2 ;s [ 2,1 ]= s [ l,2 ] ) 11 =1 pdfmvn( t e,mu,s end elsedo d oi = l to9 i ft r e a t 1 ̲ 1 = i thenmu1̲1=theta[i] i ft r e a t 2 ̲ 1 = i thenmu2̲1=theta[i] end i ft r e a t 11 = 1 0thenm u 1 1=0 i ftreat2 1 = 1 0thenmu2 1 = 0 u 1 ̲ 1 ‑ m u 2 ̲ 1 mu[ 1 ]ヰ n 1 1 = l p d f n o r m ( t e [ 1 ],m u [ 1 ],s q r t ( v 1 ) ) end m o d e lg e n e r a l( 1 1 ) r u n ods graphics off 結果は以下となり、頻度論での解析結果と B a y e s i a nNetworkM e t a ‑ A n a l y s i sの結果は同様である。 The MCMC Pr口cedure c t M o d e l F i x e dE仔e T開 a 首n e n t E 哲 ← ー 。0.5 出力 6 . 1 固定効果モデルの解析結果(頻度論) ﹃ ‑ 1 ‑ 0. 5 ‑0.8265 ‑0.9052 ‑1.1153 ‑0.9431 ‑ 1 .0680 ‑1.2023 ‑0.5686 ‑0.4411 ‑0.7011 QVEJ4 £AH‑ a叫令リVF044 ‑ ー ‑ < 些 ー ー ー theta1 theta2 theta3 theta4 theta5 theta6 theta7 theta8 theta9 95χHPD Interval ︐ ︒ ー ー ー → ・ ー ー ー 門e an 3令009Si3 509 VRd令v︒ qJ司444AU 012︒ 122S69 4込 Parameter 111111GOO ‑ ‑一一‑‑‑‑‑ 一 C 訂fHdpgi‑‑f 自 苫 剖 el O S 陸 出 回 刷出回以 mm.仰 向 副 凱 凶 ̲ ̲ , , ̲ ̲ ー吾ト Posterior Summaries and Intervals 95%‑ C1 0 . 0 0 ‑ 0 . 8 3[ ‑ 1 . 0 4 ;‑ 0 . 6 1 ) 心9 1[ ‑ 1 . 1 5 ;‑ 0. 6 6 ) ‑ 1 . 1 1[ ‑ 1. 23 ; ‑ 1 . 0 0 ) ‑ 0 . 9 4[ ‑ 1 . 1 9 ;‑ 0 . 7 0 ) ・1 . 0 7卜1 . 2 2 ;‑ 0 . 9 2 ] . 3 0 ;‑ 1 . 1 1 ] ‑ 1 . 2 0ト1 ‑ 0 . 5 7・[0 . 8 2 ;心 3 2 ] 4 4[ 心6 2 ;‑ 0 . 2 6 ] ‑ 0. ‑ 0 . 7 0[ ‑ 0 . 9 5 ;心 4 5 ] ー ‑ ‑ ¥ ! ← ー ー 信 MD ‑0.6112 ‑0.6545 ‑0.9971 ‑0.6930 ‑0.9203 ‑ 1 .1070 ‑0.3200 ‑0.2609 ‑0.4548 出力 6 . 2 固定効果モデルの解析結果(ベイズ) 145
6 . 2 .変量効果モデル 次に、変量効果モデルに関する B a y 官s i a nN e t w o r kM e t a ‑ Ana l y s i sを実施する。 パラメータと事前分布 ‑ 8 (O,1 0 0 0 0 )( i= 1 , … ,9 ) i‑ N ~ 8 c a rと p l a cの薬剤間差、・・・、 8 i l dと p l a cの薬剤j間差 1 :a 9 :v ~ 8 便宜上 0とおき、 p l a cの効果を表す(推定は行わない) 10 : ‑ Vh‑i 伊m ma(1 .0 . 0 0 0 0 0 1 ) ・ 圭芝生 一 2 ‑ a r ms t u d y :Y i j‑N(8 J ; ]+Vh) ( i, j=1 , … ,1 0σ ;i ] :Y i jの分散) i一 角,( 、 fI8;‑8;J ¥ ¥ 1 .II IV" ‑ 3 ‑ a r ms t u d v :1 ~:J J ‑N1 18 ¥Yik) . . ¥¥ J' J k}' ̲ i一θ σ a σ (] i+ σ品 . ‑J ( j t )/ 2 ¥+. V. (~_ 1 t2 ) ‑K4+σ品‑(JM/2 (J i k ' ) Yh¥1/2 1) I = ( T 解析対象となるデータ r S e n n Jは A p p e n d i x 2にて、解析を行う SASプログラムは以下に示す。 . 2 B a y e s i a nN e t w o r kM e t a ‑ Ana l y s i s (変量効果モデル、下線部は固定効果モデルとの相違部分) プログラム 6 o d sg r a p h i c so n p r o cm c m cd a t a = S e n nn b i = 1 0 0 0 0n m c = 5 0 0 0 0 0 0t h i n = 5 0s e e d = 7 7 7m i s s i n g = a cd i a g n o s t i c s = a 11p l o t s = a l l s t a t s ( o e r c e n t = α . 59 7 . 5 ) ) = a l1m o n i t o r = ( t h e t av a rhs ω a r r a yt e [ 2 ]t e 1t e 2 a r r a yt h e t a [ 9 ]; ]; a r r a ys [ 2,2 a r r a yg臼.幻 a r r a ym u臼]m u 1m u 2 a r r a ザ d e l t a [ 2 ]d e l t a ld e l t a 2; p a r m st h e t a :0 p a r m sv a r̲ h1 ; o r m a l( 0 .v a r = 1 0 0 0 0 ) p r i o rt h e t a : n p r i o rv a r ̲ h i g a m m a ( l . s c a l e = O . O O O O O l ) 剛 N i fs t u d l a b = 3t h e nd o; d oi = lt o9 i ft r e a t 1 ̲ 1 = it h e nm u 1 ̲ 1 = t h e t a [ i ] i ft r e a t 2 ̲ 1 = it h e nm u 2 ̲ 1 = t h e t a [ i ] i ft r e a t 1 ̲ 2 = it h e nm u 1 ̲ 2 = t h e t a [ i ] i ft r e a t 2 ̲ 2 = it h e nm u 2 ̲ 2 = t h e t a [ i ] e n d i ft r e a t 11 = 1 0t h e nm u 11 = 0 i ft r e a t 21 = 1 0t h e nm u 21 = 0 i ft r e a t 12 = 1 0t h e nm u 12 = 0 =0 i ft r e a t 22 = 1 0t h e nm u 22 m u [1 ] 司n u 1 ̲ 1寸n u 2 ̲ 1 ;m u[ 2 ]司n u 1 ̲ 2 叩 u 2 ̲ 2; s [1 .1]司 1 ;s[ 2 . 2 ]司 2 ;s [ 1 . 2 ] = ( v l + v 2 ‑ v 3 ) / 2 ;s [ 2 . 1 ] = s [ 1 . 2 ] E[1 .1 ]= v a r ̲ h ;g [ 2 .2 ] = g [1 .1 ] ;g [ l .幻=va r ̲ h / 2 ;g [ 2 . 1 ] = g [ 1 . 2 ] v n ( m u .e : )s u b i e c t = ̲ o b s r a n d o md e l t a m l 1 = l o d f m v n ( t e . d e l t a . s ) e n d N 146
e l s ed o; d oi = lt o9 i ft r e a t 1 ̲ 1 = i thenm u 1 ̲ 1 = t h e t a [ i J i ft r e a t 2 ̲ 1 = i thenm u 2 ̲ 1 = t h e t a [ i J e n d i ft r e a t 11 = 1 0thenm u 11 = 0 i ftreat2 1 = 1 0thenmu2 1 = 0 m u [ l J = m u 1 ̲ 1 ‑ m u 2 ̲ 1 vt=sart( v l ) o r m a l( m u [ l J . v = v a r ̲ h )s u b j e c t = ̲ o b s randomdelta3 n l1 = l p d f n o r m ( t e [ l J . d e l t a 3 . v t ) e n d 陶 ﹄ ﹄ )i; l aMEnu vive‑ a ( t fSl 'l H aMau‑eo 一 n ‑ v ︐ ︑ ‑ ・c'E ou E 一 一 ・ 一 ρMen‑‑VB gb4L一 ﹄ H vLnv t l n当 Au‑‑ ' g b nu.du mMeo nHCU Hujnu r'nu 結果は以下となり、固定効果モテ守ルと同様、頻度論での解析結果と B a y e s i a nNetworkM e t a ‑ A n a l y s i sの結果は 同様である。 The MC 門CP rocedure T陪 a 旬、 e n t RandomE宵e c t sM o d e l C 町 ぜ 百 Mgi‑‑r V・W‑nuqn習 い 出 川 山 川 U 2 M M d 同川 a mm .仰m ・一割凱叫 H刊 割 以 一 一 一 些 一 一 ー一一一ー週一一一一ー ー 一 旬 併 ー ー ー ー‑長ーーー一 一一一侍←一一 ‑ ー + ャ ー 一「 MD Posterior Summaries 95%‑ C1 0 . 0 0 ・ 0 . 8 4・[1 . 3 2 ;・ 0 . 3 6 ] Parameter 43 ;ー0 . 8 2 ] ‑ 1 . 1 3[ ‑ 1. 40 ;‑ 0 . 5 0 ] ‑ 0 . 9 5[ ‑ 1. ‑ 1 . 1 3[ ‑ 1 . 5 6 ;‑ 0 . 7 0 ] ・ 1 . 2 3・[1 . 4 8 ;・ 0 . 9 8 ] ‑ 0 . 5 7[ ‑ 1 . 2 6 ;0 . 1 2 ] ・ 0 . 42・[0 . 8 9 ;0 . 0 6 ] ・ 0 . 7 0・[1 . 3 9 ;・ 0 . 0 1 ] thetal theta2 theta3 theta4 theta5 theta6 theta7 theta8 theta9 var h s d ・ 0 . 7 3[ ‑ 1 . 2 9 ;‑ 0 . 1 7 ] ‑ 1 . 5‑ 1 ・0 . 5 0 0 . 5 1 1 . 5 出力 6 . 3 変量効果モデ、ルの解析結果(頻度論) Mean ー0 .8417 ‑0.7436 ‑1.1300 ‑0.9522 ‑1.1303 ‑1.2314 ‑0.5717 ‑0.4169 ‑0 6997 0.0997 0.3081 目 Perc自 n ti l e s 2.5 97.5 ‑1.3152 ‑ 1 .2 8 5 1 ‑ 1 .4189 ‑ 1 .3 宮9 6 ‑1.5504 ‑1.4746 ‑1.2613 ‑0.8756 ‑1.3754 0.0383 0.1958 ‑0.3694 ‑0.1872 ‑0.8312 ‑0.4996 ‑0.7066 ‑0.9863 0.1051 0.0501 ‑0.0104 0.2187 0.4677 出力 6. 4 変量効果モデ、ルの解析結果(ベイズ) 7 . まとめ 本稿では、頻度論の枠組みでの解析手法による NetworkMetaA n a l y s i sの実施方法として、 SASを利用した薬 司 剤間差の推定量の算出方法、均質性 ( h o m o g e n e i t y )や一致性 ( c o n s i s t e n c y )の評価方法、及び各薬剤l のR a n k i n g の算出方法を紹介した。本稿では平均値の差に関するデータに対して解析を行ったが、本稿で紹介した SAS マクロを用いることで、リスク差やリスク比、発現率の差や比に関するデータについても解析を行うことが a y e s i a nNetworkM e t a ‑ A n a l y s i sの結果との比較を行い、薬剤間差の推定結果が同様で 出来る。参考までに、 B a y e s i a nNetworkM e t a ‑ A n a l y s i sは WinBUGSにて実施されることが多いが、 あることも示した。ちなみに、 B WinBUGS のプログラムの性質上、汎用的なプログラムを作成することが難しい。 R では B a y e s i a nNetwork M e t a ‑ A n a l y s i sを行う汎用関数が含まれるパッケージ I g e m t c J があり、これを用いることで大抵のデータ形式 に対して簡単に B a y e s i a nNetworkM e t a ‑ A n a l y s i sを行うことが出来る。本稿で紹介した方法によりパッケージ 147
r g e m t c J と SASを簡単に組み合わせることが可能で、 SASでも B a y e s i a nNetworkM e t a ‑An a l y s i sを簡単に実 施することが出来ることを申し添える。 連絡先 n o b u o . f u n a o( a ) ,t a k e d a . ∞m 参考文献 C a l d w e l lD M( 2 0 1 4 ) Ano v e r v i e wo fc o n d u c t i n gs y s t e m a t i cr e v i e w sw i t hn e t w o r km e t a ‑ a n a l y s i s .S y s t e m a t i cReviews, 3 :1 0 9 . S u t t o nAJ , AdesAEandWeltonNJ( 2 0 1 3 ) D i a sS, E v i d e n c es y n t h e s i sf o rd e c i s i o nmaking2 :Ag e n e r a l i z e dl i n e a rm o d e l i n gframeworkf o rp a i r w i s ea n d n e t w o r km e t a ‑ a n a l y s i so f r a n d o m i z e dc o n t r o l l e dt r i a l s .M e d i c a lD e c i s i o nMaking, 3 3, 607 ・ 6 1 7 . H i g g i n sJPT , JacksonD,B a r r e t tJK , LuG, e t .a l .( 2 0 1 2 ) C o n s i s t e n c yandi n c o n s i s t e n c yi nn e t w o r km e t a ‑ a n a l y s i s :c o n c e p t sa n dm o d e l sf o rm u l t i ‑ a r ms t u d i e s . R e s e a r c hS y n t h e s i sMethods, 3 ( 2 ), 9 8 ‑ 1 1 0 . HuttonB, S a l a n t iG,C a l d w e l lD M, ChaimaniA, e t .a l .( 2 0 1 5 ) ThePRISMAe x t e n s i o ns t a t e m e n tf o rr e p o r t i n go fs y s t e m a t i cr e v i e w si n c o r p o r a t i n gn e t w o r k m e t a ‑ a n a l y s e so f h e a l t hc 訂 ei n t e r v e n t i o n s :c h e c k l i s ta n de x p l a n a t i o n s . Ann a l sof I n t e m a lM e d i c i n e,1 6 2 ( 1 1 ) : 7 7 7 ・ 7 8 4 . Kr ahnU, BinderH andKonigJ( 2 0 1 3 ) Ag r a p h i c a lt o o lf o rl o c a t i n gi n c o n s i s t e n c yi nn e t w o r km e t aa n a l y s e s . BMCM e d i c a lR e s e a r c hMethodology,1 3 : 3 5 . M i l l sEJ , ThorlundK andI o a n n i d i sJP( 2 0 1 3 ) D e m y s t i ち/ i n gt r i a ln e t w o r k sa n dn e t w o r km e t a ‑ a n a l y s i s .B M J .M ayl4;3 4 6 :f 29 1 4 . DerSimonianRandLairdN( 1 9 8 6 ) 甘o l l e dC l i n i c a lT r i a l s7 : 1 7 7・1 8 8 . M e t a ‑ a n a l y s i si nc l i n i c a lt r i a l s .Con RuckerG, SchwarzerG, Kr ahnUandKonigJ( 2 0 1 4 ) N e t m e t a :n e t w o r km e t a ‑ a n a l y s i sw i t hR .Rp a c k a g e( v e r s i o n0ふ 0 ) . RuckerG andSchwarzerG ( 2 0 1 5 ) R a n k i n gt r e a t m e n t si n企e q u e n t i s tn e t w o r km e t a ‑ a n a l y s i sw o r k sw i t h o u tr e s a m p l i n gm e t h o d s . ,1 5 : 5 8 . BMCM e d i c a lR e s e a r c hMethodology S a l a n t iG, AdesAE, andI o a n n i d i sJPA( 2 0 1 1 ) u l t i p l e ‑ t r e a t m e n tm e t a ‑ a n a l y s i s : G r a p h i c a lm e t h o d sa n dn u m e r i c a ls u m m a r i e sf o rp r e s e n t i n gr e s u l t s合omm a no v e r v i e wa n dt u t o r i a . lJ o u m a lo f C l i n i c a lE p i d e m i o l o g y64,1 6 3・1 71 . SennS, G a v i n iF, MagrezD,andScheenA( 2 0 1 3 ) I s s u e si np e r f o r m 血gan e t w o r km e t a ‑ a n a l y s i s .S t a t i s t i c a lMethodsi nM e d i c a lR e s e a r c h, 22( 2 ),1 6 9 ・1 8 9 . 福井伸行,乙黒俊也,磯崎充宏 σ014) ネットワークメタアナリシスによる無作為化比較試験の統合 .SASユーザー総会 以上 148
Appendix1
. Q統計量の自由度
2 分布
均質性 (homogeneity) や一致性 (consistency) を評価する際に算出した Q問 tや Q
h
e
t、 Q!nC等は全て x
2分布の自由度を示す。
に従う。以下に各 Q統計量が従う x
表A
.
l 各 Q統計量の自由度
統計量
自由度
Q
n
e
t
L~=l L
s
esiN
)一 (T‑1
)
s‑ 1
Q
h
e
t
Z
3
=
1
(
Q
3
e
tの自由度)
L
sesiNs‑1)一(Nd‑ 1)
Q~et
Q
i
n
c
L~=l(Nd ‑ 1
)一 (T‑1
)
Q
j
2
;
(
Q
i
n
cの自由度)一 (N
)
d‑ 1
T:ネットワーク内の薬剤数、 Ns:試験 sの薬剤数、 Nd :デザイン dの薬剤数
Appendix2
. 本文に掲載していないが引用したプログラム
Ruckeret
.al
. (2014) による R パッケージ I
netmetaJ は
、 License は GPL・2+ (プログラムの調査及び改変、
公衆への頒布が可)に従っており、本稿中のマクロ I%MYNETMETAJ 及び i%MYCONVERTJ は本ノ号ッケ
ージ中の関数を参考に作成した。よって、本稿中のマクロのLicense も GPL‑2+ とする。
プログラム A
.
l マクロ I%MYNETMETAJ
協m
acroMYNETMETA(dataset= .sm=M
D
. l
e
v
e
l
=0
.
9
5
. reference=. seq= , small=good,path=C
:
/
t
e
m
p
)
options noxwait xsync
引e
tRexepath='C:半ProgramFi1
e
s
¥
(
R
平R
‑3.2.5
平b
in
平i
3
8
6
判.e
x
e
'
世l
e
tdatapath=
品path./data.csv
引e
tpdfpathヰ path./output.pdf
首l
e
ttextpath=
品path./output.txt :
目l
e
tprgpath=
品 path./program.R
*R
.exe のパスを指定!!
options validvarname=upcase
proc export data=&dataset. o
u
t
f
il
e
=
"
品d
atapath."dbms=csv replace
options validvarname=v7
r
u
n
filenamexxx "&prgpath."
data nu1
1
f
il
ex
x
x
…&
p
a
t
h
.
options(width=1000)" :
put "
1i
brary(
n
e
t
m
e
t
a
)
: setwd(
e
a
d
.csvC
d
a
t
a
.c
s
v
', head=
T)"
put "dく‑ r
put
n
e
t
m
e
t
a
(
d
$
T
E
. d$SETE, d$TR日T
1
.d
$
T
R
E
A
T
2
.d
$
S
T
U
D
L
A
B
. sm= "
&
s
m
."","
put " 1
eve1
=&1
eve1
,
. 1
eve1
.comb=品level
.
. comb.fixed=TRUE, comb.random
=TRUE," :
put" reference.group=""&reference."
"
, s
e
q
=
c
(
&
s
e
q
.
), warn=FALSE)"
put "
d
1 く‑ decomp.design(x)"
put "d2<
‑netmeta:::decomp.tau(x, tau=x$tau)"
x, sma1
1=""&sma1.
1"づ"
put "
r
2く‑ netrank(
put "pdfCo
u
t
p
u
t
.pdf
'
.p
a
p
e
r
=
'a
4
')"
e
f
e
r
e
n
c
e
."づ"
put "forest(x, pooled='fixed'. reference.group=…品 r
put "forest(x, p
o
o
l
e
d
=
'r
a
n
d
o
m
', reference.group=""
品r
e
f
e
r
e
n
c
e
."")"
h
i
c
k
n
e
s
s
=
's
e
.f
i
x
e
d
'
)
: titleCFixed EffectModel')"
put "netgraph(x, t
put "
n
e
t
g
r
a
p
h
(
x
.t
h
i
c
k
n
e
s
s
=
's
e
.r
a
n
d
o
m
'
)
:t
i
t
l
e
(
'RandomEffect Model')"
a
n
d
o
m
=
F
)
: mtextCFi
x
e
dE
ffectMode1
', 1, 1
,c
e
x
=
l
.8
)"
put "netheat(
x, r
put etheat(x,rando
m
=T,tau=x$tau):mtextCRandomEffectModel',1,l,cex=1.8)" :
‑x$TE.fixed: x$pva1
.randomく‑ x$pva1
.fi
xed"
put "
d
e
v
.off0: x
$
T
E
.random<
put "
r
1 く‑ netrank(
x, sma1
1=""&sma11
."
"
)
"
p
u
t r
i
t
e
.
c
s
v
(
x
$
T
E
.f
i
x
e
d
.
'
T
E
f
i
x
e
d
.
c
s
v
', quote=F)"
、
く
‑
つ
"
川
、
、
149
、 、 、 、 、 、 、 、 、 、 put rite.csv(x$lower fi x e d . • TEfi xedLCL .csv'. quote=F)" i t e . c s v ( x $ u p p e r .f i x e d . 'TEfixedUC L .csv'. quote=F)" ; put r i t e . c s v ( x $ T E .r a n d o m . •T E r a n d o m . c s v '.quote=F)" put r put r i t e . c s v ( x $ l o w e r .r a n d o m . • TErandomLC L .csv'.quote=F)" s v ' . quote=F)" put " w r i t e . c s v ( x $ u p p e r .r a n d o m . 'TErandomUCL c put " w r i t e . c s v ( d l $ O . d e c o m p . . 0 1 s t a t i s t i c s . c s v '.quote=F)" put "write.csv(dl$O.het.design. . 0 1 w i t h i n d e s i g n s . c s v '.quote=F)" i t e . c s v ( d l $ O .i n c . d e t a c h . •0 1 b e t w e e n d e s i g n s . c s v '.quote=F)" put r i t e . c s v ( d 2 $ 0 . d e c o m p . ' 0 2 s t a t i s t i c s . c s v ' . quote=F)" put r i t e . c s v ( d 2 $ 0 . h e t . d e s i g n .' 0 2 w i t h i n d e s i g n s . c s v ' . quote=F)" ; put r put ri t e .csv( d 2 $ 0 .i n c .d e t a c h . • 02betweendesi g n s .c s v ' . quote=F)" put ri t e .csv( r l$ P s c o r e . • rankfi x e d .c s v ' . quote= F ) " put r i t e . c s v ( r 2 $ P s c o r e . •r a n k r a n d o m . c s v ' . quote=F)" r u n x" & R e x e p a t h . ‑‑no‑restore‑no‑save <…品 p r g p a t h .' x" " " & p d f p a t h .' 目 目 proc i m p o r t out=TE̲FIXED datafile="&path./TEfixed.csv" w =2 ;run dbms=csv replace g e t n a m e s = y e s ; dataro proc i m p o r t out=TE̲FIXED̲LCLd a t a f il e = " & p a t h . / 半T E fixedLCしcsv" dbms=csv replace g e t n a m e s = y e s ; dataro w = 2 r u n ¥TEfi xedUCL .csv" proc i m p o r t out=TE̲FIXED̲UCLd a t a f il e = " & p a t h . / dbms=csv r e p l a c e g e t n a m e s = y e s ; dataro w = 2 r u n proc i m p o r tout=TE̲RANDOMdatafile="&path./TErandom.csv" w = 2 r u n dbms=csv r e p l a c e g e t n a m e s = y e s ; dataro L .csv" proc i m p o r tout=TE̲RANDOM̲LCLdatafile="&path./TErandomLC dbms=csv replace g e t n a m e s = y e s ; dataro w = 2 r u n e=" 品p a t h ./TErandomUCL .csv" proc i m p o r t out=TE陥 NDOM̲UCLdatafi1 dbms=csv replace ; g e t n a m e s = y e s ; dataro w = 2 r u n ̲ S T A T IS T ICSdatafi1 e = " & p a t h ./ 0 1stati s ti c s .csv" proc i mportout=01 dbms=csv replace g e t n a m e s = y e s ; dataro w = 2 ;r u n proc i m p o r tout=Ol̲WITHINDESIGNSd a t a f ile="&path./Olwithindesigns.csv" dbms=csv replace g e t n a m e s = y e s ; dataro w = 2 r u n 品p ath./Olbetweendesigns.csv" proc i m p o r tout=Ol̲BETWEENDESIGNSdatafile=" dbms=csv replace g e t n a m e s = y e s ; dataro w =2 run proc i m p o r tout=02̲STA T lST lCSdatafile="&path./02statistics.csv" dbms=csv replace g e t n a m e s = y e s ; dataro w =2 run proc i m p o r tout=02̲WITHINDESIGNS datafile="&path./02withindesigns.csv" dbms=csv replace g e t n a m e s = y e s ; dataro w = 2 r u n proc i m p o r tout=02̲BETWEENDESIGNSdatafile="&path./02betweendesigns.csv" dbms=csv r e p l a c e g e t n a m e s = y e s ; dataro w =2 run proc i m p o r t out=RANK̲FIXEDd a t a f il e = " 品p ath./rankfixed.csv" w = 2 r u n dbms=csv replace g e t n a m e s = y e s ; dataro 品p ath./rankrandom.csv" proc i m p o r tout=RANK̲RANDOMd a t a f il e = " w = 2 r u n dbms=csv replace g e t n a m e s = y e s ; dataro title "Treatment estimate ( F i x e d effectmodel)" procprintdata=TE̲FIXED n o o b s run; title " L o w e r confidence l i m i t( F i x e d effectmodel)" procprintdata=TE̲FIXED̲LCLnoobs ;r u n title " U p p e r confidence l i m i t( F i x e deffectmodel)" procprintdata=TE̲FIXED̲UCLnoobs ;r u n ti t1 e "Treatmentestimate ( R a n d o meffectmode1 ) " procprintdata=TE̲RANDOMnoobs r u n title " L o w e r confidence l i m i t( R a n d o meffectmodel)" proc printdata=TE̲RANDOM̲LCLnoobs ;r u n ti t1 e" U p p e r confi dence 1i mi t( R a n d o meffectmode1 ) " procprintdata=TE̲RANDOM̲UCLnoobs ;r u n; title " 0 statistics toassess homogeneity/ consistency" proc print data=Ol̲STATISTICS noobs ;r u n; title "Design‑specificdecomposition o fwithin‑designs 0 statistic" proc print data=Ol̲WITHINDESIGNSnoobs run; title "Between‑designs 0 statistica f t e r detachingofs i n g l e designs" ; proc print data=Ol̲BETWEENDESIGNS noobs run; title " 0 statisticstoassess homogeneity/ consistency ( R a n d o m ) " ; procprintdata=02̲STATISTICS noobs r u n 150
t
i
t
l
e"
D
e
s
i
g
n
‑
s
p
e
c
i
f
i
cd
e
c
o
m
p
o
s
i
t
i
o
no
fw
i
t
h
i
n
‑
d
e
s
i
g
n
sQs
t
a
t
i
s
t
i
c(
R
a
n
d
o
m
)
";
p
r
o
cp
r
i
n
td
a
t
a
=
Q
2
̲
W
I
T
H
I
N
D
E
S
I
G
N
Sn
o
o
b
s r
u
n
;
t
i
t
l
e"
B
e
t
w
e
e
n
‑
d
e
s
i
g
n
sQs
t
a
t
i
s
t
i
ca
f
t
e
rd
e
t
a
c
h
i
n
go
fs
i
n
g
l
ed
e
s
i
g
n
s(
R
a
n
d
o
m
)
"
;
p
r
o
cp
r
i
n
td
a
t
a
=
Q
2
̲
B
E
T
W
E
E
N
D
E
S
I
G
N
Sn
o
o
b
s r
u
n
ti
t1
e"
R
a
n
kt
r
e
a
t
m
e
n
t
si
nn
e
t
w
o
r
k(
Fi
x
e
de
f
f
e
c
tm
o
d
e1)"
p
r
o
cp
r
i
n
td
a
t
a
=
R
A
N
K
̲
F
I
X
E
Dn
o
o
b
s r
u
n
t
i
t
l
e"
R
a
n
kt
r
e
a
t
m
e
n
t
si
nn
e
t
w
o
r
k(
R
a
n
d
o
me
f
f
e
c
tm
o
d
e
l
)
"
p
r
o
cp
r
i
n
td
a
t
a
=
R
A
N
K
̲
R
A
N
D
O
Mn
o
o
b
s ;r
u
n t
i
t
l
e
知n
e
n
d
プログラムA.2 データセット f
S
e
n
n
2
0
1
3c
h
a
r
J
d
a
t
aS
e
n
n
2
0
1
3c
h
a
r
l
e
n
g
t
hS
T
U
D
L
A
B$
1
0
0
.
i
n
p
u
tT
ES
E
T
ET
R
E
A
T
1 $T
R
E
A
T
2$S
T
U
D
L
A
B$;
c
a
r
d
s
一1
.
9
00
.
1
4
1
4m
e
t
fp
l
a
c
D
e
F
r
o
n
z
o
1
9
9
5
0
.
8
20
.
0
9
9
2m
e
t
fp
l
a
c
L
e
w
i
n
2
0
0
7
W
iI
I
m
s
1
9
9
9
‑
0
.
2
00
.
3
5
7
9m
e
t
fa
c
a
r
一1
.
3
40
.
1
4
3
5r
o
s
i p
l
a
c
D
a
v
i
d
s
o
n
2
0
0
7
o
l
f
f
e
n
b
u
t
t
e
l
1
9
9
9
一
1
.1
00
.
1
1
4
1 r
o
s
i p
l
a
c W
K
i
p
n
e
s
2
0
0
1
一1
.
3
00
.
1
2
6
8p
i
o
gp
l
a
c
K
e
r
e
n
y
i
2
0
0
4
‑
0
.
7
70
.
1
0
7
8r
o
s
i p
l
a
c
0
.
1
60
.
0
8
4
9p
i
o
gm
e
t
f
H
a
n
e
f
e
l
d
2
0
0
4
0
.
1
00
.
1
8
3
1 p
i
o
gr
o
s
i
D
e
r
o
s
a
2
0
0
4
B
a
k
s
i
2
0
0
4
一1
.
3
00
.
1
0
1
4r
o
s
i p
l
a
c
R
o
s
e
n
s
t
o
c
k
2
0
0
8
ー1
.
0
90
.
2
2
6
3r
o
s
i p
l
a
c
ー1
.
5
00
.
1
6
2
4r
o
s
i p
l
a
c
Z
h
u
2
0
0
3
Y
a
n
g
2
0
0
3
‑
0
.
1
40
.
2
2
3
9r
o
s
i m
e
t
f
一1
.
2
00
.
1
4
3
6r
o
s
i s
u
l
fV
o
n
g
t
h
a
v
a
r
a
v
a
t
2
0
0
2
O
y
a
m
a
2
0
0
8
‑
0
.
4
00
.
1
5
4
9a
c
a
rs
u
l
f
C
o
s
t
a
1
9
9
7
ー0
.
8
00
.
1
4
3
2a
c
a
rp
l
a
c
H
e
r
m
a
n
s
e
n
2
0
0
7
‑
0
.
5
70
.
1
2
9
1 s
i
t
ap
l
a
c
G
a
r
b
e
r
2
0
0
8
‑
0
.
7
00
.
1
2
7
3v
iI
dp
l
a
c
‑
0
.
3
70
.
1
1
8
4m
e
t
fs
u
l
f
A
l
e
x
1
9
9
8
‑
0
.
7
40
.
1
8
3
9m
i
g
l p
l
a
c
J
o
h
n
s
t
o
n
1
9
9
4
J
o
h
n
s
t
o
n
1
9
9
8
a
一1
.
4
1 0
.
2
2
3
5m
i
g
l p
l
a
c
K
i
m
2
0
0
7
0
.
0
00
.
2
3
3
9r
o
s
i m
e
t
f
‑
0
.
6
80
.
2
8
2
8m
i
g
l p
l
a
c
J
o
h
n
s
t
o
n
1
9
9
8
b
‑
0
.
4
00
.
4
3
5
6m
e
t
fp
l
a
cG
o
n
z
a
l
e
z
‑
O
r
t
i
z
2
0
0
4
ー0
.
2
30
.
3
4
6
7b
e
n
fp
l
a
c
S
t
u
c
c
i
1
9
9
6
M
o
u
li
n
2
0
0
6
一1
.
0
1 0
.
1
3
6
6b
e
n
fp
l
a
c
ー1
.
2
00
.
3
7
5
8m
e
t
fp
l
a
c
W
iI
I
m
s
1
9
9
9
一1
.
0
00
.
4
6
6
9a
c
a
rp
l
a
c
W
iI
I
m
s
1
9
9
9
r
u
n;
プログラム A.3 マクロ f%MYCONVERTJ
知n
a
c
r
oM
Y
C
O
N
V
E
R
T
(
d
a
t
a
s
e
t=,
s
t
u
d
l
a
b=
t
r
e
a
t
e
v
e
n
t
n
m
e
a
n
s
d
T
E
s
e
T
E
t
i
m
e
s
m
p
a
t
h =C
:
/
t
e
m
p
)
o
p
t
i
o
n
sn
o
x
w
a
i
tx
s
y
n
c
別e
tR
e
x
e
p
a
t
h
=
'
C
:平P
r
o
g
r
a
mFi
1
es~R平R-3.2.5半bin~R.exe'
弛l
e
td
a
t
a
p
a
t
h
=
品p
a
t
h
.
/
d
a
t
a
.
c
s
v
拡l
e
tp
r
g
p
a
t
h=
品p
a
t
h
.
/
p
r
o
g
r
a
m
.
R
*R.exeのパスを指定!!
151
proc exportd a t a = & d a t a s e t .o u t f il e = " & d a t a p a t h . " dbms=csv r e p l a c e r u n 品p r g p a t h ." fiI ename xxx " data n u l l fi l ex x x; p u t" 1i brary( n e t m e t a ) ;s e t w d( 川' & p a t h ." " ) "; p u t" d一 <r e a d .csv( 'd a t a .c s v ' . head= T )" p u t 1く‑p a i r w i s e ( d a t a = d . studlab=&studlab.." ; 略i f& e v e n t .n 日明then唱d o ;p u t v e n t = 1i s t品 (e v e n t . ) ." 唱e n d 唱i f& n . n e首then%do ;p u t 川 =I i s t( & n .). " ; 略e n d 弘i f伽l e a n . ne首then刷。 put"mean=I i s t( 伽l e a n . ) ." 私 自n d; 略i f& s d . n e首then明d o p u t d=I i s t( & s d .). " ; 略e n d 首i f& T E . n e略then首do ;put "TE=I i s t品 (T E . ) . " ; 唱e n d 首i f& s e T E . ne百then略do put e T E = 1i s t( & s e T E . ) ." ;%end ; 日i f& t i m e . n e首then拡d o ;put " t i m e = 1i s t品 (t i m e . ) ." ;弛e n d 略i f& s m . n e唱then首do p u t "sm= …品s m . " "" 明e n d p u t" t r e a t = 1i s t ( , 品t r e a t .) ) "; $ S E T E< ‑pl$seTE; pl$TREATl く‑pl$treatl" p u t l p u t 1 $ T R E A T 2 p l $ t r e a t 2 ; pl$STUDLAB p l $ s t u d l a b "; put 2 く‑ p l [ . c ( ' T E ' .' S E T E ' .' T R E A T l・ .' T R E A T 2 ' .' S T U D L A B・ ) ] "; put " w r i t e . c s v ( p 2 . .r e s u l t . c s v ' .q u o t e = F .r o w . n a m e s = F ) " r u n 、 、 、 、 、 、 、 < ‑ < ‑ & p r g p a t h ." "" ; x" & R e x e p a t h . ‑no‑restore‑no‑save <川' a t h . / r e s u l t . c s v " proc i m p o r tout=&dataset.̲CONTRASTd a t a f il e = "品p dbms=csv r e p l a c e g e t n a m e s = y e s ; dataro w =2 run t i t l e """&dataset.̲CONTRAST ( C o n t r a s t ‑ b a s e d ) " " C o n v e r t e d from""&dataset""" proc printdata=&dataset.̲CONTRAST run; t i t l e" " title2 蜘n e n d 尻 u ︐ . F F 内 ﹄ u Tt e e u 品︑凶' 目‑ 152 γl 守 nu ‑ ι J 世MYCONVERT(dataset= P a r k i n s o n . s t u dI a b= S T U D Y . t r ( G r o u p l .G r o u p 2 .G r o u p 3 ) . treat =首 s =唱s t r ( T E 1 .T E 2 .T E 3 ) . T E seTE =首s t r ( s e T E 1 .s e T E 2 .s e T E 3 ) ) E ﹁ 内 nu ι ﹁ E nv H U onU VEan nu‑ eo‑ a a・ ︐ n TE‑AHv a u・ 内 L ﹄ qL‑ ﹁F T E E ︐ nι 1 ︾ 一‑‑‑一一一 冒 rE d 内 nvnvnuuRUAUnw TIF34Enn Eu‑‑EU4l ou‑‑ ‑ n‑ ︐A F04EE ' 内' H VH V 内 内︐ι ︽ 世︒ ・ n ' ' ‑ m〆﹄ a 内 FU 内 T E ‑ nu n守a n守FU ‑ FE ︽ ・ ψ e n v A 守R 守n U 1 B r h u a a uuRU t uaaTntrDqda441 内 内 u ・・ rnunununun・u nunu nu ゐ nununU7'aqnunv ‑ ︐﹄ ﹁ nL 0 nvrDnt D 内 9 ﹄ 内t EHu ・‑‑‑‑‑ nuonunununvnunvnU AUr 41nu .︐命 山守 ︒ 骨 内 tnunuaa﹃qOAunu nHVInt7'ndnt7'ntRu onuvI‑‑‑‑‑ SHUnU4IAUnunUAUnt‑‑ nTIHU‑‑‑‑‑‑‑ ‑a'n九日曹守︐. Lunoa' AU2M4A rhH 1 噌 411 n a‑E L&LS P ujロ nHnuvv'4E・ 内 ‑ ︐ mu an守Fu 内n nv Gao‑nHaa ︐ ﹃ a EE‑‑EEnu み‑ e a ‑ m u r u n
t n u z ‑ ‑ 内︐ L ふL キ 曹 ﹃ ︽ 内 ︽ EnL J 内 aa守ranO F ヨ nU 官tntqdaqranO ' 6nudnU41ntqdaaTron口 内 dqd 守 non 守 n 唱 内 9‑9‑nt 内 正 414141414141414tel‑‑nLnL 4 qd d 内 内 DonorD'orDracoeuponDP041 唱 l t ﹃n d ud d ロa a守 内dntnt d 内a aマP 内 41 u守a nunu'lnUAUAUAuqdeonunUAUqonononUAU UnOAUAU dnunUAU Ununu 1 1111111111111111111 目 PO る 0 . 1 4 1 4 0 . 0 9 9 2 0 . 3 5 7 9 0 . 1 4 3 5 0 . 1 1 4 1 0 . 1 2 6 8 0 . 1 0 7 8 0 . 0 8 4 9 O .1 8 3 1 0 . 1 0 1 4 0 . 2 2 6 3 0 . 1 6 2 4 0 . 2 2 3 9 0 . 1 4 3 6 0 . 1 5 4 9 0 . 1 4 3 2 0 . 1 2 9 1 0 . 1 2 7 3 0 . 1 1 8 4 8 3 9 01 0 . 2 2 3 5 0 . 2 3 3 9 0 . 2 8 2 8 0 . 4 3 5 6 0 . 3 4 6 7 0 . 1 3 6 6 0 . 3 7 5 8 0 . 4 6 6 9 au+L 112u AUρν Huv' ﹄ ︐ q ζι+L +LaG‑' e a a h ν agv' r+LSl +LLU a u 'ESl'l &L+LJu eaaaHu sh‑ag&L ‑v'VEeo BF﹂ 吋 ︐ ︐ 土 +L+L l‑3 劃 AU‑‑'F 41N 一 ︑ 句 TI L l d n ‑ d e a・ n一日 S 3 刀 E一以 E U M 一 ・‑‑‑‑‑‑‑一一一‑‑‑‑‑‑‑一一‑‑‑‑‑‑・' 酢 ・︒ = ‑ょ n T E ‑ n u q L n u 凋品Tnunυ7'aunununanunT 品 nununuマ 'nu 守 ︐ 凋 斗 ''nuoonvqd'Enυnu fl‑nH L 品 n B R u n t 司u 1・司U7'1・41 司unvrnu‑‑ntaaτ 白uRU7'qu7'auTnuRuan守ntnvntnU ‑ a h w L み ea 1414lnU41nunUAUnU u ︽ nU41 U ︽ nunUAU4l'141 EP‑poumJU41nUAU4141 咽tnunUAU 咽 v ‑nvv r‑anoa A J 一ふa ‑ ‑ E Z P ? ' n u n H セ一・白川 、 = タ 、 = 、 = ︺ ア プログラム A. 4 p r o cf o r m a t c a r " v a l u et r e a t f 1 e nf " 2 3= " m e t f " 4=" m i g l " 5 i o g " 6=" r o s i " 7=" s i t a " " 8=" s u lf 9 " v iI d " 1 0=" p l a c "; v a l u es t u d l a b f1=" D e F r o n z o 1 9 9 5 " 2=" L e w i n 2 0 0 T 3=" W iI l m s 1 9 9 9 " 4=" D a v i d s o n 2 0 0 T 5=" W o l f f e n b u t t e I 1 9 9 9 " " 6=" K i p n e s 2 0 01 7=" K e r e n y i 2 0 0 4 " 8=" H a n e f e l d 2 0 0 4 " 9=" D e r o s a 2 0 0 4 " 1 0=" B a k s i 2 0 0 4 " 1 1 =" R o s e n s t o c k 2 0 0 8 " 1 2=" Z h u 2 0 0 3 " 1 3=" Y a n g 2 0 0 3 " 1 4=" V o n g t h a v a r a v a t 2 0 0 2 " 1 5=" O y a m a 2 0 0 8 " 1 6=" C o s t a 1 9 9 T 1 7=" H e r m a n s e n 2 0 0 T 1 8=" G a r b e r 2 0 0 8 " 1 9=" A l e x 1 9 9 8 " 2 0=" J o h n s t o n 1 9 9 4 " 2 1 =" J o h n s t o n 1 9 9 8 a " " Ki m200T 2 2= 2 3=" J o h n s t o n 1 9 9 8 b " 2 4=" G o n z a l e z ‑ O r t i z 2 0 0 4 " 2 5=" S t u c c i 1 9 9 6 " 2 6=" M o uI i n 2 0 0 6 " r u n プログラム A . 5 データセット r s叩 n20日」→ r s 印 刷 の 作 成 (mcmcプロシジャ適用のための前処理) p r o cs o r td a t a = S e n n 2 0 1 3 b ys t u d l a b ; r u n ; 唱ed a t a = S e n n 2 0 1 3o u t = T E ( r e n a m e = ( c o I 1 = T 日 ∞1 2 = T E 2c o I 3 = T E 3 )d r o p = ̲ n a m e ̲ ) p r o ct r a n s p o b ys t u d l a b ; v a rT E r u n; p r o ct r a n s p o s ed a t a = S e n n 2 0 1 3o u t = s e T E ( r e n a m e = ( c o I 1 = s e T E 1c o l 2 = s e T E 2c o I 3 = s e T E 3 )d r o p = ̲ n a m e ̲ ) b ys t u d l a b v a rs e T E r u n p r o ct r a n s p o s ed a t a = S e n n 2 0 1 3o u t = t r e a t 1( r e n a m e = ( c o I 1 = t r e a t 1 ̲ 1c o I 2 = t r e a t 1 ̲ 2c o I 3 = t r e a t 1 ̲ 3 )d r o p = ̲ n a m e ̲ ) b ys t u d l a b v a rt r e a t 1 r u n ∞11=treat2̲1 coI2=treat2̲2coI3=treat2̲3) drop=̲name̲) p r o ct r a n s p o s ed a t a = S e n n 2 0 1 3o u t = t r e a t 2 ( r e n a m e = ( b ys t u d l a b ; v a rt r e a t 2 r u n ; d a t aS e n n m e r g eT Es e T Et r e a t 1t r e a t 2 b y s t u d l a b ; v 1 =s e T E 1 * * 2 v 2=s e T E 2 * * 2; v 3=s e T E 3 * * 2 r u n 153
ナニワデータサイエンス研究会 第1 回ダイジェスト版 0高 浪 洋 平 12、 北 西 由 武 13、藤原正和 13、坂井絵理 13、 黒 田 晋 吾 12、舟尾暢男 12 e ナニワデータサイエンス研究会、 武田薬品工業株式会社、 塩野義製薬株式会社) 2 3 2016 年3月に「ナニワデータサイエンス研究会」なる関西発の研究会が発足し、第 1 回目の研究会が 大阪にて開催された。本セッションではそのダイジェスト版をお送りする。なお、最新情報に応じ て、内容を一部アップデートする。 第一部:CDISCセッション 「もしも,日米で申請電子データ提出するとしたら…」高浪洋平(武田薬品工業) 「もしも,とある開発品目 Xを申請電子データ提出するとしたら…」坂井絵理(塩野義製薬) 第二部:統計解析セッション 「もしも,この機に統計担当者がNASレポートを振り返ったら…(前編) J藤原正和(塩野義製 薬) 「もしも,この機に統計担当者がNASレポートを振り返ったら…(後編) J黒田晋吾(武田薬品 工業) 第三部:グラフ頂上決戦 「もしも, SASのs g p l o tとRのg即 l o t2を比較したら…」舟尾暢男(武田薬品工業) 「もしも, V i s u a lAn a l y t i c s 、 でOpe nD a t aを眺めてみたら… j 北西由武(塩野義製薬) 154
S a l e sAn a l y t i c sの可能'性 一医薬品営業を例としてー 武藤猛 MarkeTechC o n s u l t i n g代表 Ont h eP o s s i b i l i t yofS a l e sA n a l y t i c sw i t hA p p l i c a t i o n st oP h a r m a c e u t i c a lS a l e s T a k e s h iMuto MarkeTechC o n s u l t i n g P r e s i d e n t, 要旨 S a l e sAnal 戸i c s (SA) という用語から、一般に用いられている SFA (営業支援システム)のための分 析ツールという枠を越えて「営業分析学」という広い意味で再定義することによりその可能性を引き出 す方法論を提案する。本来、営業にはデータを用いて科学的な意思決定を行う「サイエンス」的な側面 と、営業担当者のスキルに依存した「アート」的側面とが存在する。 SA が実践的かっ科学的であるた めには、データ分析のプロセスの中に、「アート J的側面をし、かに取り込むかがポイントとなる。本論 文では「売上げアップの公式」をベースにした営業分析学を説明する。このモデ、ルは、成果(売上高、 生産性、顧客満足度など)を生み出す要因を、①ターゲティング、②デ、ィテーリング回数、および③デ ィテーリングの質、の 3つに集約するものである。 3つの要因のうちターゲテイングとデ、イテーリング 回数とは容易に数量化でき、「サイエンス」化が比較的容易である。一方テ守イテーリングの質には「ア ート J的な要素が多く、その数量的な扱いには慎重なステップが必要である。本論文では、医薬品営業 に対する営業分析学的アプローチの事例を 3つ紹介する。医薬品営業を取り巻く環境は、従来の医療施 設や医師を独立に扱うアプローチから、地域医療ネットワークを前提にしたアプローチへと大きく変貌 しつつある。本論文で提案した営業分析学は、今後重要となる営業の「チーム力」など、従来のデータ 分析では無視されがちの「アート」的側面の数量的アプローチなども取り込むことで、顧客(医師など 医療従事者)のニーズと同時に営業現場のニーズにも応えうるのではなし、かと考えている。 a l e sAna l y t i c s、 SFA、医薬品営業、事例による検証 キーワード:営業分析学、 S 1 .S a l e sAna l 戸i c s:I Tツールから営業分析学へ 1.1本論文の目的 営業・マーケティングは、企業経営の重要分野の一つである。このうちの営業については属人的な要素が 多く、マーケテイングに較べると学術的な研究が少ない。企業における営業分野の I T活用に関しては、 SFA ( S a l e sF o r c eAutomation=営業支援システム)の導入が盛んである。最近はその SFAのデータ分析ツールと a l e s A n a l戸i c s( S A )が 、 I Tベンダーにより喧伝されている。ところが A n a l戸i c sという言葉は本来「分 して S 155
析学」という意味を持っている。本論文では、 SAから SFAのための分析ツールという枠を越えて「営業分 析学」という広い意味で再定義することによりその可能性を引き出す方法論を提案する。医療用医薬品営業 を例として、営業分析学の具体的な方法論を説明し、また 3つの事例を紹介する。これらの事例から、 SAの 可能性を一層引き出すための課題を述べる。なお、本論文が対象とする営業は、営業担当者が個別に顧客と 面談する「対面営業Jである。対面営業の例は、本論文が対象とする医療用医薬品営業(営業担当者は MR= M e d i c a lR e p r e s e n t a t i v e、つまり医薬情報担当者と呼ばれる)の他に、生産財営業や高額消費財(乗用車、住宅、 金融商品など)営業などが該当する。 1 . 2 営業における「サイエンス j 対「アート」 営業にはデータを用いて科学的な意思決定を行う「サイエンス J的な側面と、営業担当者のスキルに依存 した「アート」的側面とが存在する。サイエンス的側面は、営業活動を量的に計画・評価するものであり、 S a l e sF o r c eE f f e c t i v e n e s s ) と呼ばれてきた。一方、アート的側面は、商談の現場におけるコミ 従来から SFE C ュニケーションカやスキル、心理学などの質的側面を指す。サイエンス的側面は専ら企業側の視点であるの に対して、アート的側面は企業に加えて顧客の視点を含むことに留意が必要である。これら両側面の関係を 図表 lに示す。 図表 1 営業における『サイエンス」対「アート」 主として 量曲側面 {企重倒の鶴点} S a l 回 F o 町抽 E fI8c偏四国田 コミュニケーション (SFE)とも呼ばれる 力・心理学などの 宣飽側面 {企裳 + 11 盛の観点} 「営業は科学であるか ?J という設問に対して、古くから「営業は科学であるはずがない」という意見と、 それに対して「営業にも科学的アプローチが成り立つJ という意見との対立がある。これらの意見の相違は アートまたはサイエンスのどの側面を重視するかの違いによるものである。著者は、両者の意見をともに噂 重し、第三の道を切り拓くことが重要だと考えている。 1 .3 営業の科学に関する先行研究 前述のように、マーケティングに比較すると営業に関する学術的研究は圧倒的に少ない。この理由は、営 業に関する詳細情報には企業秘密的要素が多く、外部からのアクセスが困難なことが一因と考えられる。日 本においては営業の全体モデルに関する研究がいくつか発表されている (1トベ数は少ないが事例研究も行わ れている{針。営業活動の数量的研究となると非常に限られている (7ト(10)0 ビジネス誌の特集号では何回か営業 が取り上げられている (11ト(15L 欧米でも、営業に関する研究書は少ない。ここでは、研究と実践(コンサルティング)を両立させている Z o l t n e r s ‑ S i n h aによる一連の著書を挙げておく (16ト{19L 特に r T h ePowero fS a l e sAn a l 戸i c s J と題した近著(19)は 、 r S a l e sAn a l y t i c s J を題した現在のところほとんど唯一の本であり、その狙いは本論文の趣旨に近い。 1 . 4 SFAの分析ツールとしての SAの功罪 SFAは多くの I Tベンダーが販売しているが、その基本的な機構は、営業担当者が顧客情報、営業プロセス 情報(訪問顧客名、日時、面会者、面談内容など)、および商談情報(顧客要件、商談規模、商品名、競合、 156
提案書・見積提出期限など)を毎日データベース(クラウド上の場合も多し、)に記録し、それを集計・分析 可能とするものである。これらの集計・分析結果は、営業担当者が自己管理に活用したり、営業マネジャー により管理業務や営業担当者へのアド、パイスに活用されたりしている。 F Aベンダーから公表されている導入事例 3 3件を著者が分析したところ、認識された導入効果(複 ある S 数カウント)のうち 86%は効率 ( E f f i c i e n c y ) 向上効果、 14%は効果 ( E 能c t i v e n e s s ) 向上効果であった。前者 の代表例は「データ入力作業が効率化された」や「社内の情報共有」など、後者の例は「顧客満足度向上」 と「売上高・成約率向上」である。 F Aおよびその分析ツールである SAに関して、一般的な導入効果としては営業活動の効率 このように、 S 化につながることが挙げられる。一方限界としては、収集対象データは企業の視点に立った数量化が容易な データがほとんどであり、顧客の反応に関する質的データは限られていることや、「成果モデ、ル」が組み込ま れていないので、成果をもたらす要因分析が困難なことなどが挙げられる。 1 .5 営業への科学的アプローチとしての SAへ 以上述べたように、 S FAの分析ツールとしての SAにはメリットも多いが、限界もある。そこで SAを IT ツールとし、う枠に留めず、「サイエンス(データに基づく科学 ) J と「アート(技能・スキル)Jの共働を目指 l y t i c sの原義)として捉えることを提案したい。このようなアプローチを本論文で す科学的分析方法論(Ana Aの定義を図表 2に示す。また、実装する場合のイメ は「営業分析学J と名付ける。営業分析学としての S ージを図表 3に示す。 a l e sAna l y t i c sの定義(提案) 図表 2 営業分析学としての S ①成果(例:売上、顧客満足度向上)と要因(例・営業活動)との聞の因果関係 をモデル化する(特に、成果と宜飽亙盟の関係を重視する) ②実証的であること(実デー告の活用) ③体系的であること(統計解析など確立された方法論に基づく) ④実践的であること(営業現場ですぐに適用できる) ⑤I T 活用と親和性があること(既存の I T を活用できる) 図表3 営業分析学としての S a l e sA n a l y t i c sのイメージ i 亘書国孟 7 1 ‑ i 電i!i:弟ー必要皇制 [ 紺周 争タペース 157 ! ?雷雲会問とL て の $,車険制 l
図表 3に示したように、営業分析学の方法論は次のように要約できる:①観察(データや営業現場)と課 題認識、②課題解決のための仮説創出、③数理的モデル構築、④仮説検証(および数理的モデル改良)、⑤現 場における実践、⑤結果検証とフィード、パック。入力データは S F Aだけではなく、アンケートなど質的デー F Aデータは、上記方法論の①および②において、現状を的確に把握 タを含む多様なデータが対象となる。 S するために重要な役割を果たす。なお対面営業の場合は、顧客に紐づけられない「ビッグデータ」は、現在 A Sや JMPなど、データ加工や多様なモデル作成 のところ活用方法が限定される。分析インフラとしては、 S とその検証に適した汎用統計解析ソフトウェアが適している。 2 . 医薬品営業における定式化 2. 1 医薬品営業は SAの研究と実践に適している 医療用医薬品は国民医療の重要な一環を担っている。また各製薬企業の MRは、自社医薬品に関する情報 (効能や副作用)を医師を始めとする医療従事者に提供するとともに、自社医薬品の普及のための宣伝活動 Aの研究と実践に適している:①安全な薬物療法の を行っている。医薬品営業は、次のような理由により、 S 推進および営業生産性向上が一貫した経営課題であること(質と量の両立)、②MRはこの二つの課題に深く 関わっていること、③製薬業界はグローパル化が進み「データに基づく経営Jが普及していること、④研究 開発分野で統計解析が普及していてデータ分析リテラシーが高いこと、⑤社内・社外で入手可能な営業関連 データが豊富であること、@営業生産性向上が業界全体の重要な課題となっていること。 そこで本論文では、以下、医薬品営業を対象にした、営業への科学的アプローチについて論じる。 2 . 2 医薬品営業における成果達成のための因果関係モデル 図表 2に示したように、 SAにおいて最も重要なのは、成果(売上高、営業生産性や顧客満足度など)と要 因(営業活動)との聞の因果関係をモデル化することである。特に質的要因もモデ.ルに取り込むことが重要 である。営業の因果関係モデ、ルについては、 Z o l t n e r s ‑ S i n h aが「営業生産性ドライパーモデ、ル」と呼ばれる、 営業活動における要因を網羅したモデルを提案している (16MIst また、ボーター・へンリーは、システム工 学的アプローチで営業における因果関係モデルを提案している (12)。これらはいずれも示唆に富む優れたモデ ルであるが、大規模かっ複雑で、営業現場で使い易いとは言えない。 そこで著者は従来から、要因を絞り込んだ因果関係モデルを「売上アップの公式」として提案している (20)。 これは、成果に対して即効性が大きい 3要因にフォーカスして因果関係をモデル化したものである。これを 図表 4に示す。 図表 4 要因を絞り込んだ因果関係モデル:売上アップの公式 間= 売上高、生産性、 顧客満足度など 販車ポテンシャル のN, , ¥ f . . 客I ご × 最適な顛産で × 質の高いメッセージ を届ける 、ーーーー‑y‑‑‑‑J 158
図表 4 は、現在の製品構成を前提としている。このモデ、ルは、成果(売上高、営業生産性、顧客満足度な ど)を生み出す要因を、①ターゲティング、②ディテーリング回数、および③ディテーリングの質、の 3つ に集約するものである。このモデルは「販売ポテンシヤルの高い顧客に、最適な頻度で、質の高いメッセー ジを届ける」ことにより成果を最大化できることを主張している。 3つの要因のうちターゲティングとディ テーリング回数とは容易に数量化でき、「サイエンス」的取扱いが比較的容易である。一方デ、ィテーリングの 質には「アート J 的な要素が多く、その数量的な扱いには慎重なステップが必要である。 図表 4の「公式Jは、「数式j ではなく、「売上を決定する要因は 3つに集約される J という意味である。 この公式は、 MR活動に関して、多くの薬効領域で検証済みである(検証例は後述)。図表 4のモデルは、営 業分析学の課題である、営業の量的側面と質的側面の両方を簡潔にモデ、ルに取り込んでいる。公式の対象は、 対面営業だけでなく、 eデ ィテーリング、やエリアマーケティングにも適用できる汎用性を備えている。 図表 4の 3つの要因のうちの量的要因であるターゲティングとディテーリング回数をまとめて扱うために、 著者は図表 5に示す「顧客バリューマトリックス (CVM)J を提唱している。 図表 5 顧客バリューマトリックス (CVM) レ . 出'・7臨白血書iJ'畠中する HPa( 量も1I'1l!な厨署セヴメントである 重要顧客セグメントに対する営業戦略例 一方、図表 4の 3つの要因のうちの質的要因であるディテーリングの質については、図表 6に示す測定方 法がある。 図表 6 fMR 活動の質」の測定方法 顧客の視点から 評価 医師満足度調査によるMR 営業日報分析(テキストマイニング) MR 活動の 質の測定 MR アンケート調査(営業カ診断) 社内の視点から チームカ(営業マネジャー)評価 上司同行訪問時の観察 実践項目チェックシート活用 159
iMR活動の質」について最も重要なことは、一般的な「質」の定義を求めるのではなく、自社に最も相
応しい iMR活動の質」の定義を確立することである。このためには、 M Rアンケート調査が有用である。
3
. 医薬品営業における検証事例
3
.
1 売上アップの公式の検証
第 Iの検証事例として、あるスベシャリティ領域(特定診療科の医師が処方する医薬品)に関する医師ア
ンケートを用いて、図表 4の売上アップの公式の検証を行った事例を紹介する (2OL これは 2
0
1
1年 1
0月実施
したもので、 N
=900、製薬企業数は 1
1である。アンケート結果から、図表 5に示した CVMを作成した。売
H
P
)3セグメント
上アップの公式の第一の要因であるターゲティング精度として、 CVMの高ポテンシャル (
への集中度を用いた。第二の要因であるディテーリング回数は、製薬企業毎の回数をそのまま用いた。第三
の要因であるディテーリングの質は、医師から見た M Rの総合的満足度を用いた。図表 4の目的変数である
「成果Jについては、処方患者数およびディテーリング生産性(処方患者数÷ディテーリング回数)の 2種
類を採用した。
検証結果を図表 7に示す。目的変数が処方患者数およびデ、ィテーリング生産性いずれの場合も、三つの要
因はいずれも目的変数と有意な正の相闘がある。したがって、売上アップの公式が検証された。ただし、デ
ィテーリングの質に関しては、他の二つの要因に比べて相関係数が小さい。これは、「質」の数量化に課題が
あることを示唆している。
図表 7 r
売上アップの公式」の検証結果
!@売主j高j機措醐:},=担金""持>t~:'l;精度)},fØ侍~(';'P7"":'I)f~.~園草野望割合千二言頑諸子
.
. 書ーザテインタ積度対価方患者舷
.
3
5
.
0
0
0
‑
"
.
.
.
.
担
"
脚
ー
方
"
.
醐
叫
血
隊
デ
ィ
テ
ー
リ
ン
ゲ
固
敵
対
処
方
鼠
者
扱
組 閣
.
諸 鵬
現 騎0
0
処"
.
.
.
y=8
8
9
5
4
x・
28511
R
'=
0
.
0
3
6
8
2m
醐
Z1S醐
JLrJ
止
て
1
0
5
B
9
O
閣O
時.
。
..
0
.
40
0
.
"
0
.
4
2
0
.
4
4
"
.
聞
0
.
.
.
.
0
.
4
6
.
組 曲
y=33田 5
x・
10014
;
:
?
三
醐
.
,
。
。 z∞ 400 ∞
,
N=
l1
タ
ー
ザ
テ
イ
ン
タ
輔
鹿
対
処
方
血
者
数
.
醐
払
醐
民間
醐
e2g
m
B
a
2m
.
醐
5
脚
。
0
∞1
.
2
∞
2
.
5
0
,
'
y=11789x.28573
R
'=0
.
1
0
7
6
ユィて
.・
3∞
N=11
4
∞
3
.
5
0
i
;
1
長青瓦菊玩i
生産陸宮副幹併や繍度:
j
議 訴 手i
長手
刷
タ
ー
苧
子
ィ
ン
デ
精
度
対
子
千
テ
ー
リ
ン
タ
生
産
性
T 1
s.G.
.
II~ 101
m
J
f
1
0,0~
m
一
手
主
.
車
1
.
.
.
. 1
0
.0
̲
̲
̲
.
,
.
.
.
.
$ 目 ・
N=l1
。
。
.
.
. 0." 0.42 0.44 0." 絹
'
セ
グ
メ
ン
ド
、
の
簿
中
庭
]
タ
ー
ゲ
テ
ィ
シ
グ
繍.(HP
IT 1
1;T2S.0~
•
5
.
120j ‑
R
:
;
;
o
・
1 m ‑ T
'
J
ー
g
生
一
,
・・------・~
I
I
I
刷
位
鹿
性
5
.
i
唾型
.
壁
土
漣
竺g
竺
雪
竺
空
竺
ご
竺
?
竺
空
管
竺
竺
塑
空
空
一
醐
副
デ
イ
テ
ー
リ :PJ固
致
封
デ
イ
テ
ー
リ
ン
ザ
生
産
性
5
弁イ
.
VEOB2U+25
日.
9
" ・
,
.
。 蹄
" 4∞ 6
デ
イ
テ
ー
リ
ン
グ
回
数
開制)()
.
N=l1
1
,
0
(
拍
1
.
2
1
珂
1
0
.
0
1
叫
ー
一
‑
・
・
.
•
•
3
.
0
0
ヨ珂
,.,・
,
.
,
2邸3
.
y=4~~叩7x ・1.1055
グ
ン羽 0
皇
生 15.01
佳
ロ
l
N=l1
の
.
合
野
田
〈
賓
〉
MR
∞
3
.
2 M Rアンケートによる「質J の把握
M Rアンケートを用いて iMR活動の質」を把握し、営業活動の改善に活用した事例を紹介する (21)。全体
の流れは、準備(ヒアリング、アンケート原案作成、アンケート最終案作成)、アンケート実施、分析(基本
集計、問題構造の把握、営業力の分析)のように進めた。このうち営業力の分析の詳細を図表 8に示す。
160
図表 8に示すように、因子分析により M R活動の基本要素である「営業力」を抽出し、それを成果(ここ では売上高)とリンクさせることで「インパクトカ」として指標化する。インパクトカとは、 M R別達成売 上高を最も良く説明する M Rの総合力であり、目的変数として売上高、説明変数として営業力を用いた重回 帰分析により求めたものを偏差値化した指標である。この事例では、「医師の信頼獲得J、「営業所マネジメン ト」など 7つの要因を偏差値化した。一例として、 M Rのインパクトカと売上高との関係を図表 9に示す。 アンケート分析の結果は、 M R教育の改善や M Rの個別指導に活かす他、ハイパフォーマーの行動要因を MR アンケートによる『質」の数量化 i 曹勃] f [間劇 f 伊 豆 圏一一 一 事 一 一 有 一 ! 一 瞬 一 一 一 一 B 十静岡附 劃一空主的 図一 rMR活動チェツクシート」として要約し M R自身の自己管理に活用することができる。 J 鰐趨鈴; ・ 岨 儲 器S E 望F 3 2 5 ・' " 1, 1 131211 Q 4 01 & 館A ' まに損足している II ! I4 I3 I2 II 。 . . 1 凶苛置碕.",,,.盤を禽@るため盈霞泊怠ご怠昆..""ぽ臥下 に.自由に昆λ して〈売さい. 図表 9 インパクト力と売上高との関係 MR のインパクトカ (MR活動の質)と売よ高との闘係の例 400 ‑ • • • . 300 250 売 上 200 高 150 100 • 50 。 。 10 20 30 . . 40 50 60 MR 活動の賀(インパヲトカの偏差値} 1 6 1 70 80 90
3. 3 営業日報のテキストマイニングによる M Rの 「 質Jの 把 握 SFAには日報としてテキストデータで医師との面談内容を報告する機能がある。営業日報のテキストデー タは、 MR活動に対する医師など医療従事者の反応を質的に把握するための有力な手段である。ここでは営 2 2 ) 。 業日報のテキストマイニングによる M Rの『質」の把握の事例を紹介する ( テキストマイニングの対象は、ある製薬企業の半年分の営業日報のテキストデータの中で、医師と納入高 000件である。これをテキストマイニングツール (Vex 削 i n e r使用)で の対応可能な日報データ(開業医) 20, キーワードおよびクラスター分析した。この結果、営業活動はその内容により 1 4個のクラスターに分類され た。ここではそのクラスターを更に 6つの営業ステップ(顧客ニーズ把握、製品紹介、ディテーリング、ク ロジング、フォローアップ、および人間関係構築・維持)にグループ分けし、各営業ステップの件数を説明 変数に、納入高を目的変数にして重回帰分析を行った。結果を図表 1 0に示す。 図表 10 営業日報のテキストマイニング結果 ‑ある製品に関する営業プロセス別データの霊園婦分析結果(営業所別データ半年分) ・目的変数=納入高、説明変数=テキストマイニングの結果抽出された営業ステップ (GR1‑GR6) ①分析の要約 R 2 乗 自由度調整陪乗 図表 1 0によれば、納入高には幅広い営業ステップ(ディテーリング、クロージング、フォローアップ、お よび人間関係構築・維持)が有意な影響を及ぼしている。このことは従来から rMR活動の質」を代表する と考えられてきたディテーリングの質はもちろんであるが、人間関係構築・維持も含めて rMR活動の質J を幅広く捉えることの重要性を示している。この結果は、医師が MRを評価する際には、製品や疾患に関す る知識だけでなく、人間性も同程度に重視するという調査結果聞とも整合している。 4 . まとめ:S a l e sAn a l 戸i c s の可能性 4 . 1 S a l e sAn a l y t i c s( S A )活用のための今後の課題 残念なことではあるが、最近医薬品営業における不祥事が何件か報道された。売上至上主義の営業活動は、 顧客に迷惑を掛け、かつ不正の温床ともなる。顧客・企業・営業担当者が「三方良し J となる営業活動のた めには、数量データ(売上、シェア等)だけを目標とするのでなく、質的データにも着目することが重要で ある。「あるべき営業活動の質j は、各社独自に決める必要がある。このようにして定めた独自な「質Jの追 及により、売上至上主義からの脱却が可能になると同時に、顧客からの評価の向上により成果にも繋がるこ 162
とが期待される。質的データの取り扱いには、実地の営業活動の観察や営業担当者のインタビューに基づく モデル化とその数量化など、一般論に囚われない創造的な方法論と分析が必要である。 SAを営業分析学とし て幅広く捉えることは、このような方法論の確立に有効と考えられる。 今後の課題として、営業における「アート」を「サイエンス j の視点から把握するには、「営業活動の質」 を多角的に研究する(心理学、コミュニケーション学を含め)ことが必要である。地域医療ネットワークの 時代を迎えて今後は、営業担当者だけでなく、営業マネジャーの役割がキーとなる。特に、「チーム力 Jが営 業業績に及ぼす影響の研究が重要となる。そのためには営業アンケートとその多変量解析や、営業日報のテ キストマイニングが分析手法として考えられる。 一方、「サイエンス j で得られた知見を「アート」の分野で活かすためには、従来からの数量データの分析 に加えて、科学的根拠に基づいて営業教育を再構築する必要がある。単に製品知識だけでなく、顧客(医療 チーム)との信頼関係構築のためのスキル向上を含めるべきである。営業現場で取り入れやすい分析結果の 例としては、分析で得られた結果を、営業所単位で少数の実践項目に絞ったり、「営業活動チェックリスト」 に落し、活用することが考えられる。 4. 2 まとめ:S a l e sAn a l y t i c sを成功させるために S a l e sAna l y t i c sを成功させるための要因としては、次の 5点が考えられる。(1) r 営業を科学化する」ことへ の経営者の強し、持続的な意志、 ( 2 )分析スタッフ養成とデータ収集・分析用 I Tインフラの整備、 ( 3 )自社の「営 4 )市場・顧客・営業活動に関する多種多様なデータの蒐集とデータベース化、 ( 5 )効 業一成果モデ.ル」構築、 ( 果的な営業教育・コーチングと投資効果の測定。 1 )営業における「アート」の側面の重要性を忘れない(fサ 一方、留意事項として、次の 4点を挙げたい。 ( イエンス」の側面を強調しすぎると、顧客も営業現場も疲弊する)、 ( 2 )自社の優秀な営業担当者をよく観察す 3 )営業現場が考慮、すべき指標の数は最小 る(自社の営業活動における「センターヒ。ン Jの把握とその活用)、 ( 3つ以内を目標とする)、 ( 4 ) I Tは万能ではなく、その機能が営業現場から事離すると投資は無駄に 限にする ( なる(営業管理だけを主要目的とする I T投資は現場の慈、意的なデータ入力を誘発し、ほとんどの場合投資は 失敗する)。 参考文献 (1)石井淳蔵・嶋口充輝:営業の本質一伝統と革新の相克、有斐閣(1 9 9 5 ) ( 2 )石井淳蔵:営業が変わる一顧客関係のマネジメント、岩波書庖 ( 2 0 0 4 ) 1 9 9 9 ) ( 3 ) 田村正紀:機動営業力一スピード時代の市場戦略、日本経済新聞社 ( 2 0 0 5 ) ( 4 )高嶋克義.営業改革のビジョンー失敗例から導く成功のカギ、光文社 ( ( 5 )松尾睦・早川勝夫:営業のプロセス改革と人材育成一日本ベーリンガーインゲルハイムの事例、神戸大学 大学院経営学研究科 D i s c u s s i o nP a p e rS e r i e s( 2 0 1 0 ) ( 6 ) 松尾睦・早川│勝夫・高嶋克義:改善志向の営業プロセス管理一日本ベーリンガーインゲ、ルハイムの事例、 1 9号 ( 2 0 1 1) 季刊マーケティング、ジャーナル 1 9 9 8 ) ( 7 ) 日経産業消費研究所:営業の革新一混迷の時代に求められる「強さ j の研究、日本経済新聞社(1 1 9 9 8 ) ( 8 )松尾睦:営業組織における文化的特性と業績、流通研究 l巻 l号 ( o. l7N o .2 ( 2 0 0 4 ) ( 9 )清宮政宏:営業管理様式と営業成果の因果関係に関する研究、流通研究、 V ( 10 )細井謙一・竹村正明:営業生産性尺度の開発、広島経済大学研究双書第 27冊、広島経済大学地域経済 163
研究所 ( 2 0 0 6 ) 2 0 0 6年 6月号) ( 1 1 )一橋大学ビジネスレビュー:営業を科学する、東洋経済新報社 ( ( 1 2 ) ダイヤモンド・ハーバード・ビジネス編集部:営業力のプロフエツショナル、ダイヤモンド社 ( 2 0 0 4年 1月号) ( 13 ) ダイヤモンド・ハーバード・ビジネス編集部:一流の営業力、ダイヤモンド社 ( 2 0 0 5年 1月号) ) ダイヤモンド・ハーバード・ビジネス編集部:最強の営業力、ダイヤモンド社 ( 2 0 0 6年 1 0月号) ( 14 ( 1 5 ) ダイヤモンド・ハーバード・ビジネス編集部:強い営業、ダイヤモンド社 ( 2 0 1 2年 1 2月号) ( 1 6 )An d r i sA .Z o l t n e r s, P r a b h a k a n tS i n h a, e ta l . :TheC omp1eteGuidet oA c c e 1 e r a t i n gS a 1 e sF o r c eP e r f o r m a n c e, AMACOM( 2 0 0 1 ) ( 17 )And r i sA .Z o l t n e r s, P r a b h a k a n tS i n h a, e ta l . :S a 1 e sF o r c eD e s i g nf o rS 回 t e g i cAdvantage, P a 1 g r a v e( 2 0 0 4 ) sA .Z o l t n e r s, P r a b h a k a n tS i n h a , e ta l . :B u i l d i n gaWinningS a 1 e sF o r c e, AMACOM( 2 0 0 9 ) ( 1 8 )An合i sA .Z o l t n e r s, P r a b h 球a n tS i n h a , e ta l . :ThePowero fS a 1 e sAn a l 戸i c s, ZSA s s o c i a t e s, I n c .( 2 0 1 4 ) ( 1 9 )An合i ( 2 0 )武 藤 猛 :MRの生産性に関する考察、 SASユーザ総会 ( 2 0 1 2 ) 2 0 1 3 ) ( 2 1 )武 藤 猛 :MRアンケートによる製薬企業の営業力診断、 SASユーザ総会 ( 2 0 1 2 ) ( 2 2 )武 藤 猛 :MRの生産性アップと最適配置戦略、アンドテック社 ( M o n t h 1 yミクス J2 0 1 1年 4月号 ' " " ' 2 0 1 4年 4月号の記事「薬剤部長から評価される『印象派 M R s . ( 2 3 )月刊誌 r の特徴 J ( 計 33回)における各薬剤部長の発言を、著者がテキストマイニングして集計した結果(複数カウ ント)による。 164
JMPC l i n i c a lを用いたセントラルモニタリングの経験 ' " " ' R B Mを 推 進 す る た め に 0福 升 悠 一 1、 近 藤 秀 宣 1、樋口天裕 l、小幡智憲 l、 畑 山 知 慶2、 林 行 和3 e エイツーヘルスケア株式会社開発戦略本部セントラルモニタリング部、 2ェイツーヘルスケア株式会社開発戦略本部生物統計部、 3ェイツーヘルスケア株式会社開発戦略本部) 【背景 1RBM とは、限られたリソースで臨床試験の品質を効果的に効率よく担保するモニタリン グ手法である。これまでのモニタリングでは、 CRA個人の力量に依存しており、出口管理的な SDV を中心として定期的な施設訪問が行われてきた。 RBM におけるセントラルモニタリングでは、施 設横断的にモニタリングを行うことでリスクを早期に発見することが可能である。リスクを事前に 把握することで、ターゲットを絞った適切な指示をモニターに出すことが出来るが、そのためには、 データの集約的なレビューが必要である。我々はデータの集約的レビューを実施するツールとして JMPC l i n i c a lの使用が有益であると考えている。 l i n i c a l の利用方法を紹介し、有用性を議論する。 【目的】セントラルモニタリングにおける1MPC 【方法 1 1MPC l i n i c a l に標準搭載されているサンプル試験データを用いて、 JMPC l i n i c a l によるセ ントラルモニタリングでの実践方法を紹介する。その有用性を考察するサンプル試験は、腎排他型 の薬剤の臨床試験である。そのため、重度な腎機能障害患者を除外するエントリー基準があると仮 定する。この場合、被験者の安全性を確保するために定められている除外基準に抵触しそうな被験 者を集中的に登録することは試験の運用上好ましくないと考えられる。そこで、本発表で例示する セントラノレモニタリングでは、重度な腎機能障害患者を集中的に登録している施設を検出すること を目的として、スクリーニング 時点の臨床検査値に基づいて偏った登録傾向のある施設の検出を試 みることとした。 【結果】施設別および測定項目(クレアチニン、 BUN) 別にスクリーニング期の測定値を箱ひげ図 で示した。これにより施設問で腎機能に関するそれぞれの測定値の分布をビジュアルに確認するこ とが出来た。さらに、クレアチニンと BUNの値を同時に見て、施設別にどのような差異があるかを 検討するために、クレアチニンおよひ~UNの散布図を作成し、施設 D で色分けした。1MP C l i n i c a l のフィルタリング機能を用いることで、特定の施設のみをハイライトで表示させることが出来る。 この機能を用いることで、全被験者の中での特定の施設の患者の値の分布をより容易に検討するこ とが出来る。ここまでの検討で、ある施設は、他の施設と比較するとクレアチニンおよび BUN が 高い傾向にある被験者を多く登録する傾向があったことが確認された。実際の RBMでは、ここまで の検討によって、施設スタッフの薬剤特性・プロトコル理解度の確認指示、重度な腎機能障害に対 する判断基準の確認指示、スクリーニング期の測定値がチェックされるプロセスの確認指示等のモ ニタリングアクションを検討することが出来たと考えられる。 【考察】 JMPC l i n i c a lを利用すると、プログラムを行わずに多種多様な KRIを容易に可視化すること が可能となる。また、関心のある対象について、容易にその対象の関連情報を調べることが可能で あることから、スピーディに適切なモニタリング指示が発行できるようになる。 【結論】1M PC l i n i c a l を実際に利用した結果、1M PC l i n i c a lの導入はセントラルモニタリングを効率 的に運用するのに有益と考えられた。 165
SAS XML Mapperを用いた Define.xmlのメタ情報の有効活用及び業務効率化の取り組み 0林 三 男 、 山 本 繁 (大日本住友製薬株式会社開発本部データサイエンス部生物統計グループ) 0月より医薬品の承認申請時に CDISC 標準に準拠した電子データ提出が開始され 本邦では、 2016年 1 S D T M、A D a M )、データガイド ( S D R G,A D R G )、定義ファイル る。解析業務では、データセット ( ( d e f i n e .x m l )を規制当局の要求通りに作成することが求められ、データセット ( S D T M、A D a M ) 及び d e f i n e . x m lに 関 し て バ リ デ ー シ ョ ン ル ー ル が 公 表 さ れ て い る 。 現 在 、 複 数 の ベ ン ダ ー か ら d e f i n e . x m lを作成するツールやバリデーションルールに基づいたチェックを行うツールが提供さ れている。これらは多機能・高機能なツールである一方で、 チェックができなし、」、 「バリデーションノレール以外の ad‑hoc i d e f i n e . x m lのメタ情報から解析用データセット(または SASコード)が 生成されなしリなど、発展途上の側面もあると考える。 本発表では、 SAS社の XMLMapperを用いた d e f i n e . x m lのメタ情報を SASデータセットとして取り込む ことで、 define.xmlの メ タ 情 報 と デ ー タ セ ッ ト の 一 貫 性 を 取 る た め の ad‑hocチェックや、 d e f i n e . x m lのメタ情報を活用して解析用データセットの作成をセミオートメーション化するため の可能性を探り、 define.xmlのメタ情報の有効活用及び業務効率化の実現に向けた取り組みを紹介 する。 166
申 請 時 電 子 デ ー タ の Lengthに ま つ わ る 実 務 上 の 問 題 点 と 対 処 法 B u s i n e s sI s s u e sf o rV a r i a b l eLengthandaS o l u t i o n onE l e c t r o n i cSubmissionofStudyData O片 山 雅 仁 、 平 野 勝 也 、 鈴 木 ゆ ら (塩野義製薬株式会社解析センター) 2016年 1 0月から開始される PMDAへの申請時電子データ提出に向けて,申請時電子データのバリ デーションルールが 2015年 1 1月に PMDAより公開された.その中に, SDTMデータセットの変数の L e n g t hについて,規定した変数の L e n g t hが実際に SDTMへ格納された値のL e n g t hより大きいことを指 摘し,データセットの容量を抑えるためのルールがある. PMDA およびFDAで利用されているバリ デーションツールの P i n n a c l e 2 1で、パリデートすると,このルールに関して PMDA 版で、はWarningメッ 版ではE r r o rメッセージが出力される.このルール自体はFDAのS t u d yD a t aT e c h n i c a l セージが, FDA ConformanceGuideやバリデーションルールにも掲載されて既に周知されている. しかしながら, Warningあるいは E r r o rメッセージへの対応が実務者にとっては非常に悩ましい問題になり得るにも かかわらず,これらの問題への対処法が十分に議論されているとはいえない. 上記L e n g t h問題への一つの対処法として,実際の Rawデータの値の L e n g t hに応じて, SDTMデータ セットの作成仕様書で、変数の L e n g t hを試験途中 l こ定義しなおすことが考えられる.しかし,データ ベ ー ス 固 定 前 に ‑J!L e n g t hを定義した後, Rawデータがそれ以上の L e n g t hになった場合,定義した L e n g t hを超えたデ、ータを欠落させる懸念が生じる.加えて, ADaMの作成時に Rawデータの状況に 応じて異なる L e n g t hのSDTMを扱うことになり, ADaM作成のタスクにも影響を及ぼすことになる. 他方,データベース固定後に Rawデータを確認して L e n g t hを再定義することも考えられるが,厳し いスケジュールの中,スピードと正確性が要求される場面でプログラム修正を伴う仕様変更は,ス ケジュール遅延や解析結果の信頼性を低下させるリスクが高い.さらに,仕様書に定義された変数 の基本情報を D e f i r 泥 沼n lに 反 映 さ せ る こ と が 多 い と 思 う が , 仕 様 書 内 の 調 整 済 み の L e n g t hを D e f i n e . x m lに反映させる必要があり,成果物の整合性を確保しようとすると手聞がかかる.また, 併合解析でL e n g t hが異なる複数のデータセットを結合する際にデータを欠落させる懸念, SASのロ グに WARNINGのメッセージが出力されることなど, CSR 作成時だけでなく将来の併合時までを考 慮、に入れて対処するとなれば, SDTMおよびAD 品4 担当者の負担が相当大きくなることが予想され る. 本発表では, L e n g t hの制約に関する実務上の問題を解決する方法として,①通常通りに, SDTM および、ADaMの仕様書に定義した L e n g t hで 、 ,s a s 7 b d a t 形式のデータセットを作成し, ADaMおよびTLF 作成でそれを用いる,②申請資料として提出する XPTファイルおよび D e f i n e氾 n lについては, s a s 7 b d a t形式のデータセットと中身が同ーの L e n g t h調整済みの XPTファイルと L e n g t h調整済みの D e f i n e . x m lを用意する方法を提案する.この手順を採用することにより, ( 1 )仕様書と s a s 7 b d a t 形式の データセットの整合性, XPTファイルと D e f i n e . x m lの整合性を確保しつつも, ( 2 )前者と後者を切り 離して考えることで作成・バリデーション手順はシンプルになり, ( 3 ) L e n g t h 調整前の s a s 7 b d a t形式 のデータセットを利用することで後工程への影響はなくなり, ( 4 ) L e n g t h調整後の XPTファイルと D e f i n e . x m lでバリデーションすることでL e n g t h関連の大量の Warnin g / Eηorが検出されなくなる. s a s 7 b d a t 形式のデータセットから L e n g t h調整済みの XPTファイルを作成する部分については,簡単 なSASプログラムを紹介する. 167
欠測を含む順序カテゴリカル経時データの解析‑ M Iプロシジャの有用性・ 。 藤 原 正 和 l、 駒 寄 弘2 e 塩野義製薬株式会社、 マルホ株式会社) 2 順序カテゴリカル経時データに欠測値が含まれる場合, MIプロシジャによる補完が可能である. 本講演では欠測を含む経時的な順序カテゴリカルデータの発生方法に加えて, MIプロシジャで実装 可能な補完方法 ( S e q u e n t i a lr e g r e s s i o n,MCMC,FCS) の理論を紹介して,シミュレーションデータ を用いた性能評価を行う. なお,経時的なカテゴリカルデータの発生方法はLee( 1 9 9 7 ),及びIb r a h i m( 2 0 1 1 ) によって提案さ れた方法を紹介する. 文献 Lee ,A. J .( 1 9 9 7 ) . Some s i m p l em e t h o d sf o rg e n e r a t i n gc o r r e l a t e dc a t e g o r i c a lv a r i a t e s . C o m p u t a t i o n a ls t a t i s t i c s&dαt aa n a l y s i s ,2 6 ( 2 ),1 3 3 ‑ 1 4 8 . • Donneau,A .F ., Mauer,M.,M o l e n b e r g h s,G .,a n dA l b e r t ,A .( 2 0 1 5 ) .A s i m u l a t i o ns t u d yc o m p a r i n g n m u l t i p l ei m p u t a t i o nm e t h o d sf o ri n c o m p l e t el o n g i t u d i n a lo r d i n a ld a t a . Communications i α ,t i o nandC o m p u t a t i o n, 4 4 ( 5 ), 1 3 1 1 ‑ 1 3 3 8 . S t a t i s t i c s ‑ S i m u l . I b r a h i m, N.A .,a n dS u l i a d i,S .( 2 0 1 1 ) .G e n e r a t i n gc o r r e l a t e dd i s c r e t eo r d i n a ld a t au s i n gRa n dSAS IML .Computerm e t h o d sandprogramsi nb i o m e d i c i n e ,1 0 4 ( 3 ), e I 2 2 ‑ e I 3 2 . 日本製薬工業協会医薬品評価委員会データサイエンス部会欠測のあるデータの解析チー ム ( 2 0 1 6 ) .欠測のある連続量経時データに対する統計手法について(V e rl .O ), h t t o : / / w w w . i o m a . o r . i o / i n f o r m a t i o n l e v a l u a t i o n l a l l o t m e n t ! s t a t i s t i c s . h t m l ・ 藤原正和,高橋文博 (2015).2015年度計量生物セミナー,臨床試験における estimand と 感度分析,欠測のあるデータに対する解析手法の基礎‑‑‑ ( 2 ) 主解析の検討‑‑‑ 168
ADa Ml TLF経 験 者 が SDTMを 作 成 で き る ま で の サ ク セ ス ス ト ー リ ー As u c c e s ss t o r yf o rachievementofSDTMprogramands p e c i f i c a t i o n byprogrammings k i l lofADa Ml TLF 0小 林 千 鶴 l, 神 谷 亜 香 里 l, 坂 本 佳 代 子2, 勘 場 大 l, 江 川 広 明 l, 角 谷 伸 一 l e 塩野義製薬株式会社解析センター, 株式会社エス・シー・エー) 2 PMDAへの承認申請用 CDISC 標準電子データ提出を見据えて,弊社では全ての臨床試験のプログ ラミング、業務を Raw →SDTM →ADaM →TLFの流れで、作成することを目指し, 2013年に SDTM作成体 制の再構築を行った.さらには SASプログラミングでの SDTM作成を可能にするため, 2014 年度は, SDTMマッピング仕様書(以下, SDTM仕様書)を改良し,それを効果的に運用することでより効 率的に SDTMを作成することができるようになった.これにより, SASプログラミングの知識を有 してはいるが, SDTMの作成が未経験であるプログラミング担当者が SDTMの作成に取り組むこと が容易になった. SDTM作成がより身近になったことから ADaM /TLF の作成しか経験のなかった著者は, SDTM 仕 様書の作成ができるようになることを最終の目標として,まずは SDTMの内容の理解を深めること を優先し, SDTM 仕様書を利用して SDTMプログラミングに挑戦した.この仕様書は, iSDTMお よびtR awデータを知らなし、プログラマでも SDTMを作成できる J をコンセプトに作成されているこ ともあり, SDTMプログラムの作成は予想よりも容易にできた. SDTMプログラムはADaMプログ ラムよりも複雑な変換処理がないこともその一因と考えられた. SDTMの内容を理解できたことから,次に SDTM仕様書作成にも取り組んだ. SDTMプログラム 作成時には,プログラミングを容易にする SDTM 仕様書に大きく助けられたが,今度はその仕様書 を作成する立場となった.しかし, SDTMプログラム作成時とは異なり,非常に大きな困難に直面 した.とくに, ADaM データ作成時に利用しないドメイン(例えば, T r i a lD e s i g nシリーズのドメイ ンなど)についてその仕様書の作成は非常に難しいもので、あった. SDTMIG やガイダンス等を参照 しそれに従いながら作成することが求められるが,その経験が浅い著者は, SDTMの知識および経 験をもっメンバーと議論し,取扱いを理解して仕様書の作成に努めた.一方, SDTMは , Raw デー タの状況も考慮して作成することも必要であるため, D M 担当者との連携は不可欠である. SDTM の作成にあたっては関係者と連携を密にとることが重要であると認識した. ところで,著者は今回の SDTM 作成の経験を通して, ADaM/TLF 経験者の観点から,解析時に利 用しやすし、 SDTMを意識して SDTM 仕様書を作成した. SDTMの情報は,どのように帳票に出力さ れるか,そのためにどのような ADaMが作成されるかを確認した. D M担当者には,どのような想 定で取得されているデータなのかを確認した. SDTM,ADaM,TLF を効率よく作成するには,各 IG やガイダンスなどを理解することが重要であるが,関係者と議論し解決していくことも重要であ ることを認識した. 最後に,弊社の取り組みとして, SDTMプログラミングおよび仕様書作成を効率よく実施できる ことを意識して,疑問点とその解決方法をまとめた iSDTM 仕様書作成の虎の巻」を作成し,知識 経験を共有できるようにしている.また, SDTM,ADaM,TLFを効率よく作成するため, SASマク ロ化の検討も行っている. 本発表では, SDTM 作成の経験はないが, ADaM/TLF プログラミングスキルのある著者が, SDTM およびその仕様書作成ができるまでの道のりを紹介する. 169
欠 測 を 含 む 順 序 カ テ ゴ リ カ ル 経 時 デ ー タ の 解 析‑GEEプ口、ンジャの有用性ー 駒 寄 弘 I、 藤 原 正 和2 O ('"ルホ株式会社、 2塩野義製薬株式会社) 順序カテゴリカル経時デ、ータの解析手法として、これまでは GENMODプロシジャ、 CATMODプロシ ジャ、 GLIMMIX プロシジャが主に使われてきた。近年、 SAS STAT14.lより、 GEE プロシジャに d i s t = m u l t i n o m i a lオプションが追加され、 GEEプロシジャによる実行も可能となった。本プロシジャでは L iangandZeger( 19 8 6 )及び P r e n t i c e (1 9 8 8 )の GEE法に加え、相関パラメータの推定の際、 a l t e m a t i n gl o g i s t i c H e a g e r t ya n dZe g e r , 1 9 9 6 )。 r e g r e s s i o n ( A L R )法を使用している点が特徴である ( 本発表では GEEプロシジャ及び CATMODプロシジャでの順序カテゴリカル経時データの解析仕様を紹 介すると共に、シミュレーションデータを用いて性能評価を行う。 文献 H e a g e r t y, P .J ., &Z e g e r ,S .L .( 1 9 9 6 ) .M a r g i n a lr e g r e s s i o nm o d e l sf o rc l u s t e r e do r d i n a lm e a s u r e m e n t s . J o u r n a lo f t h eAmericanS t a t i s t i c a lA s s o c i a t i o n, 9 1 ( 4 3 5 ),1 0 2 4 ・1 0 3 6 . L iang , K .Y ., &Z e g e r , S .L .( 1 9 8 6 ) .L o n g i t u d i n a ld a t aa n a l y s i su s i n gg e n e r a l i z e di In e a rm o d e l s . B i o m e t r i k a, 7 3 ( 1 ),1 3・2 2 . R .L .( 1 9 8 8 ) .C o r r e l a t e db i n a r yr e g r e s s i o nw i t hc o v a r i a t e ss p e c i f i ct oe a c hb i n a r yo b s e r v a t i o n . P r e n t i c e, 1 0 3 3 ‑ 1 0 4 8 . B i o m e t r i c s, 170
Multi‑RegionalClinicalTrialの 生 存 時 間 解 析 に お け る 地 域 ご と の イ ベ ン ト 発 現 数 の 予 測 0淀 康 秀 l、 浜 田 知 久 馬 2 ('大日本住友製薬株式会社、 2東京理科大学) I C H ‑ E 1 7ガイドラインで取り扱われる M u l t i ‑ R巴g i o n a lC l i n i c a lT r i a l( M R C T ) は数年前まで国際共 R C Tでは多くの国(地域) 同治験あるいは多地域共同治験として日本でも多くの検討がされてきた。 M が治験に参加するが、被験者の登録状況は必ずしも均一的にはならない。仮にアメリカ、カナダ、 イギリス、日本の 4ヵ国で試験を計画しでも、全ての国で被験者の登録が一斉にスタートするとは 考えにくい。更に登録速度の違いや、特定地域で目標とする被験者数が設定されているケースもあ 0 0 名は登録させるといった非競合的な被験者登録など)。 り得る(例えば日本人だけで 1 本発表では、有効性評価項目が T i m e ‑ t oE v e n t( O v e r a l lS u r v i v a lなど)である抗がん剤開発を目 的とした M R C Tを想定し、特定のイベント発現数が観察された時点で中間解析を実施することも考え る。この中間解析は開発プロジェクトの中でも大きな関心事であり、その実施時期はある程度の確 度をもって予想しておくことが求められる。そこで地域ごとの登録状況の違いを考慮、した経時的な イベント発現数を予測するシミュレーションプログラムを S A Sで作成した。地域ごとの登録速度、 登録開始時期をシミュレーション条件として設定し、競合的/非競合的な被験者登録も地域単位で 設定可能とした。シミュレーション結果は地域ごとのイベント発現数をグラフ及び表形式で出力さ せた。 S A Sユーザー総会ではシミュレーション結果として地域間の登録状況を考慮した場合と考慮、しなか った場合の中間解析時期の予測結果の違い、中間解析時の地域ごとのイベント発現数、シミュレー ションプログラムの今後の拡張等について発表する。 17 1
用量設定試験における MCP‑Mod の 3 つの実行例 多重比較と用量反応関係のモデリング 0加 藤 雅 章 、 清 水 康 平 、 佐 々 木 英 麿 、 舟 尾 暢 男 武田薬品工業株式会社日本開発センタ一生物統計室 ThreeExamplesofConductingMCP ・Modi nD o s e ‑ F i n d i n gS t u d i e s MasafumiKatou, KouheiShimizu , EmmaS a s a k i, NobuoFunao , L t d . TakedaP h a r m a c e u t i c a lCompany 要旨 「多重比較法」と「用量一反応モデルを用いた解析Jを組み合わせた手法 rMCP‑ModJ を SASで実行する 3 つの方法 (EAST6 . 3PROCsf o rSAS、SAS&R 、SASのみ)を紹介する。 . 3PROCs キーワード:用量設定試験、多重比較法、用量一反応モデルを用いた解析、最適な対比係数、 EAST6 forSAS、R 1 . はじめに rMCP‑Mod ( M u l t i p l eC加 l p a r i s o nP r o c e d u r e‑M o d e l l i n g )Jは、主に第 2相試験における有効性評価に適用さ れ、「多重比較法」と「用量一反応モデルを用いた解析」を組み合わせた手法である。本手法を用いることで、 多重性を調整した上で目的とする適応に対する薬剤の用量一反応関係を明らかにすることが出来、第 3相(検 証的)試験で用いる適切な用量 ( T a r g e tD o s e ) を選択することも出来る。また、内部補完により、第 2相試 ・M odを SASで実行す 験で設定していない用量に関する推定も実施することが可能となる。本稿では、 MCP 3PROCsf o rSASの mcpmodプロシジャを用いる方法、 SASと R を組み合わせ るための 3つの方法 (EAST6. る方法、 SASのみを用いる方法)を紹介する。 2 . MCP・Modとは ICH‑E8ガイドライン「臨床試験の一般指針」では、第 2相試験に関する以下の記述がある(一部改変)。 第 2相の重要な目的は、第 3相で行われる試験の用法・用量を決定することである。第 2相の 初期的試験では、用量反応の初期的推測のために、用量の漸増デザインがしばしば用いられる。 それに続く試験では、並行用量反応デザイン(第 3相で実施されることもある)を用いて目的 とする適応に対する用量一反応関係が確認されることとなる。 有効性評価に論点を絞ると、上記ガイドラインにおける第 2相試験の目的は以下となる。 薬剤の有効性を示すとともに、有効な用量を明らかにする 目的とする適応に対する薬剤の用量一反応関係を明らかにする 第 3相(検証的)試験で用いる適切な用量を選択する M i x e dM o d e l sf o rR e p e a t e dM e a s u r e s ) と多重比 最近の第 2相試験では、共分散分析 (ANCOVA) や MMRM ( 較法を組み合わせる手法がよく用いられるが、これらの解析では通常、投与量を質的変数として解析が行わ れるため、試験で設定した用量に関する推測しか行えないこととなる。また、用量問の情報を用いる目的で、 172
用量一反応モデル(例えば E m a xモデル)を用いて解析を行う場合、通常、事前に lつのモデ ルを選択するこ ととなり、推測の妥当性は「適切なモデルを選択するかどうかJ に依存することとなる。 さて、 MCP‑Modは B r e t ze t .a . l( 2 0 0 5 ) により提案された手法で、「多重比較法」と「用量一反応モデルを用 いた解析」を組み合わせたものとなっている。本手法を用いることで、以下が達成出来る。 多重性を調整した上で、目的とする適応に対する薬剤の用量一反応関係を明らかにする 第 3相試験で用いる適切な用量 ( T a r g e tD o s e ) を選択することが出来、内部補完により、試験で設定し ていない用量に関する推定も実施可能 まず、応答変数(連続量)を Y i j 、用量を di、用量的の例数を問、用量の数を k とする。 i= 1, …, k (d1 をプラセボとする) j=1 , … , ni (被験者) =L~=1ni n ( 試験全体の例数) 次に、以下の一元配置分散分析モデルを考える。 Y l j=μd i+ E i j = ある用量一反応モデル f( ・)について、用量的の平均応答を μd i f(dl , 8 ) とし、 E l j‑N(O, (12 ) を誤差項 とする。ここで、多くのパラメトリックな用量一反応モデル f(d , 8 ) は以下の様に表現出来る。なお、用量 ・)の代わりに基準化された用量一反応モデル[D(・) 一各モデルに対する最適な対比係数を算出する際は、 f( . 1の用量一反応モデルを考える。 を用いても良いことに留意する。本稿では表 2 f(d, 8 )=9 9dO(d, 8 * ) 0+ 。 o 位置パラメータ 91 :尺度ノ号ラメータ [ D(d, 8 * ):基準化された用量一反応モデル ( 8 * が決まればモデル曲線の形が決まる) 表2 . 1 用量一反応モデル E o+Emaxdj(EDso+d ) 戸(d, O . ) dj(EDso+d ) E o+8log(d+c ) l o g ( d+c ) E o+8d d f(d , 8) モデル E m a x L i n e a r l o g ‑ d o s e L in e a r E x p o n e n t i a l o+E1叫 E a s t :E m 、E a s t以外:ゐ + E1{ e x p(~) ‑1} E お: t叫 m 、E副 以 外 : 叫 m Q u a d r a t i c E o+P1d+P2d2 d+ │ P F 2 1 │d2 L o g i s t i c ι+Emaxj{1+ 回p(EDS~-d)} 1小+叫町一~)} (~f(1-~f (~r(1-~f Be taM od S i g m o i dE m a x E o+Emax B ω'2)(~)-.(1 ー E o+Emaxdhj(EDsOh+dh ) ー1 dh j ( E D s O h+dh ) c=0 . 0 1xmaxdose,D = 1 .2xmaxdose,B(8 1)ゐ )=(81+82)81+82j(δ'1818282) 173
3
. MCP
・Modを行う手順
さて、 MCP・Modにて解析を行う手順は以下の通りである。
①候補となる用量反応モデルをいくつか設定する
o
n
t
r
a
s
tc
o
e任i
c
i
e
n
t
s
) を計算する
② 最 適 な 対 比 係 数 (optimumc
③有意な用量一反応関係があるかどうかを検定する
④③の結果が有意であれば、最適なモデルを選択する
a
r
g
e
tDose の推定等を行う
⑤用量一反応関係の推定や T
①候補となる用量一反応モデルをいくつか設定する
…
まず、候補となる用量一反応モデルの数を M とし、ん (
d
.Om)
. .M を考える。ここで、実際に解析
.m =1
を行う際は [
DC
d
.O;") を用い、パラメータ o;" にて形状が決まる点に留意する。後で、各モデルについて、
次項で定義する対比係数 Cmi を用いた以下の統計量にて検定を行うこととなる。
tm=
生竺 Yi • m =,1....M
l
.L
}
=
lC
.
主d
n
i
S
=玄~lL;:l (Yij一九 )
2j(n‑k) ,九 =
n
f
1
2
;
1
Y
i
j
す
ム
S2
@最適な対比係数 (ODtimu
m
.contrast∞e箇 .
c
i
e
n
t
s
) を計算する
各モデルに対して検出力が最大となるような対比係数 C耐を計算する。 まず、 m 番目のモデ、ルに関する平
均応答を以下とする。
ωL,…, μ:!.k)=(
成 (dvØ;"). … .[~(dk.Ø;"))
m 番目のモデルに関する最適な対比係数 Cmi は以下に比例することとなる。また、下記で対比係数を計算
した後、
L
}
=
lC~í =1 になるよう調整すると後々都合が良い。
n
iC
,
u
:
!
.
i一戸).i= 1
..
.
..
k
;
円三J
J
t
n
t
@有意な用量一反応聞係があるかどうかを検定する
Max‑t統計量 t
m
悶
=max{t1 • … .tM } に基づいて有意性を判定する。
帰無仮説 H
o
:μd,
= … =μ:dk の下で、検定統計量 (t1 • … .t M ) は自由度 π -k 、以下の相関行列をもっ
多変量 t 分布に従う。
P
i
j=
ι
z ajdn
1C C
l
a
;
L~=l C nlL~=l CMnl
t
m
町
> U1̲α(多変量 t分布から求めた 1
00(1ー α)%棄却点)ならば、有意であると判定する。
@@の結果が有意であれば、最適なモデルを選択する
rAICが最も小さいモデルJ又は r
t統計最が最も大きいモデル」のいずれかの基準を用いて最適なモデル
174
を選択する 1。 ⑤ 用 量 一 反 応 関 係 の 推 定 や 百 四etDoseの推定等を行う 最適なモデルについてパラメータ推定を行い、モデルを同定する。また、推定後のモデルについて、以下の 基準により T a r g e tDoseの推定を行う。 aを「プラセボに対して臨床的に意味のある差J とすると、 TD (TargetDose) は以下のとおり。 ~ TD min{dε ( d d, , ] :f(d)>f(d1)+L I } i l= 1, なお、本稿では TD ( T a r g e tD o s e ) に注目することとするが、 p を「最大効果に対して何%以上の効果を 期待するかを示す割合J として、 ED ( E f f e c t i v eD o s e ) を推定することも可能。 ~ EDp=min{ dE( dvd, , ] :f(d)>f(d1)+p(maXdE 4 . 準備:データセット rbiomJ の紹介と候補モデル B r e t ze t .a . l( 2 0 0 5 ) にて用いられたサンプルデータ f b i o m( b i o m e t r i c sd o s er e s p o n s ed a t a )Jを紹介する。変数 は r s u b j e c t I D(被験者番号)Jr d o s e(用量) Jr r e s p(応答変数、連続量)J、用量は 0 . 0 0(プラセボ)、 0 . 0 5、0 . 2 0、 0 . 6 0、1.00の 5用量、レコード数は各用量 20,計 1 0 0レコードとなっている。 表4 . 1 データセット f b i o m J の抜粋 rωp 2 3 d o s e 0 . 0 0 0 . 0 0 0 . 0 0 0 . 3 5 4 6 2 1 6 4 4 0 . 1 3 6 5 2 8 0 1 4 ‑ 0 . 0 1 7 2 2 1 2 7 3 1 0 0 1 .00 0 . 9 4 8 3 3 5 8 7 1 鎌田 s l l b j e 1 データセット f b i o m J の要約統計量を表 4 . 2に、平均値のグラフを図 4 . 1にて紹介する。 表4 . 2 データセット f b i o m J の要約統計量 用量 0 . 0 0 0 . 0 5 0 . 2 0 0 . 6 0 1 .00 例数 20 平均 0 . 3 4 20 20 46 0. 0 . 8 1 20 20 0 . 9 3 0 . 9 5 標準偏差 0 . 5 2 0. 49 0 . 7 4 0 . 7 6 0 . 9 5 最小値 45 ‑ 0. ‑ 0 . 3 6 ‑ 0 . 5 2 最大値 1 .56 1 .5 3 0 . 0 6 2. 45 2 . 9 2 ‑ 1 . 11 2 . 5 6 次項以降では、本データセットに対して MCP‑Modを適用し、薬剤の有効性を示し、薬剤の用量一反応関係 を明らかにするとともに、第 3相試験で用いる適切な用量 ( T a r g e tD o s e ) を選択することを考える。候補と なる用量一反応モデ、ルは図 4 . 2に示すとおり以下の 6つ ( Em副 (EDs . 2 )、L i n e a rl o g ‑ d o s e、L i n e a r、E x p o n e n t i a l o=0 (δ=1.1 3) 、 Quadratic(,~2 , =一0 . 7 3 ト Logistic (EDs . 5, s c=0.13)) とする。 o= 0 ¥ I s , 1 I 1 AICの値に基づいて、有意となったモデ、ルに関する重み付け平均をとり、結果を統合するという方法もある。 175
2 . 0 1. 5 : i I ' t 叩 @ 』 0 . 5 0 . 8 一 差 一 四一川一 一時一 i一回一 由一刊一 。 郎 : 。 E a 0 . 0 b i o m J の平均値のグラフ 図 4. 1 データセット i . 3PROCs( 3 2 ・b i t )f o rSASによる解析 5 . 実行例①:EAST6 まず、 C y t e l社(Yi: w W . c v t e L∞mL ) が開発したソフトウェア i E a s t J にて提供されている mcpmodプロシジャを 用いる方法を紹介する。 E a s tでは、 SASユーザーが臨床試験の計画と解析を行うためのプロシジャを iEAST 加 。n i t o r J と imcpmodJ の 2つのプ口、ンジャがある。本プロシ PROCsJ という形で提供しており、現在 i e a s ジャは E a s tがインストールされていない SASでは実行できない点に留意されたい。 0 . 0 0 . 2 0 . 4 0 . 6 0 . 8 1 .0 wE 一也古口冨 同 F﹄ 冊 目 1 .0 0 . 8 0 . 6 0 . 4 0 . 2 。 。 0 . 0 0 . 0 0 . 6 0 . 8 1 . 0 . 2 0 . 4 0 . 8 1 . 0 0 . 2 0 . 4 0 . 6 0 D o s e 図 4. 2 候補となる用量反応モデル 176
まず、 mcpmodプロシジャのコードは以下の通り。 . 1 m叩 modプロシジャの実行 プログラム 5 procmcpmod data=biomout=̲overalIcompmethod=pval alpha=0.025 direction=increasing response resp; dose dose modeldoses 0 0.05 0.20.6 1 e m a x : m o d e l emaxs(0.2) Ii n l o g : m o d e l Iin̲ldoses Ii n e a r : m o d e l Ii n e a r s e x p n . m o d e l expns(1.13) (0 . 7 3 ) q u a d : modeIquads一 o d e l logits(0.5.0.13) l o g i t : m d eI t a = O .5 ) d o s e s e l td ( s e l m o d e l aic dossumry out=̲dossumry optcont out=̲optcont cormat r u n out=cormat 次に、 mcpmodプロシジャで出てくるステートメントとオプションを概説する。 PROCMCPMODステートメント I 指定が単墾1 DATA:使用するデータセットを指定 ALPHA:棄却限界値又は調整済み p値の算出に使用する有意水準を指定 [指定が年童] COMPMETHOD ー モデルの選択に使う手法を指定(以下の 2通りから選択可能) PVAL:調整済み p値が有意なモデルが選択される(デフォルトは "PVAL") CRITV:指定された棄却限界値に基づいてモデルが選択される(棄却限界値を 自動的に計算させるか、自ら指定することが可能) DIRECTION ‑ 棄 却 限 界 域 を 指 定 ("INCREASING"又 は "DECREASING"の 方 向 を 選 択 、 デ フ ォ ル ト は "INCREASING") RESPONSEステートメント [指定が坐墾】 応答変数を指定 DOSEステートメント I 指定が必墾] 用量の変数を指定 MODELDOSESステートメント [指定が単盆1 目的用量 ( T a r g e tD o s e ) を推定するにあたって候補となる用量のリスト プラセボは 0で表示、その他の用量は昇順に番号を振られていなければならない 177
MODELSPECIFICATIONステートメント 【指定が単室】 モデルを指定(フルモデル又は標準化されたモデル、最小 1個、最大 20個のモデルが指定可能) 一 形 :r生 全 盛 :MODEL生主芝生(&パラメータ )J 例: e m a x :modele m a x s ( 0 . 2 ); 一 生全盤は好きなラベルをつけてよい 一 生主芝生と&パラメータは下表の rSAS コードJを参照 ・ . 1 モデノレと SASコードの対応表 表5 SASコーJ: r(d , 8 ' ) モデル E . n . x L in e a rl o g ‑ d o s e L i n e a r d j ( E D s o+d ) EmaxS(ED50) l o g ( d+c ) L in LdoseS d L in e a r S E x p o n e n t i a l 叫 お Q u a d r a t i c d+ l P P 2 1 │d2 QuadS( b e 包2 / l b e t a l l ) L o g i s t i c 1j{1+ 叫些~ ‑d)} L o g i t S(ED50, d e l t a ) taM od Be Bωz)(;)61(1‑i)ゐ Beta̲ModS( d e l 飽1 , d e l 包2 ) d h j ( E D s O h+dh ) S i g m o i dE m a x ExpnS( d e l t a ) SigEmaxS(ED50 , h ) 2) c= 0 . 0 1xmaxdose ,D = 1 .2xmaxdose,8(8 )= ( δ ' 1+δ2)61+62j(8/18/ 1 18 2 DOSESELステートメント 【指定が単墾】 T a r g e tDose等の推定に用いる基準を指定 ‑ DOSESEL= TD(DELTA=XYZ ) プラセボと比較して企の目的効果が得られる用量 一 DOSESEL声ED(P=X.XX, Y.YY , Z . Z Z ) プラセボと比較したときの最大効果のうち (IOOXp) %の効果が得られる用量 ・ ・ SELMODELステートメント I 指定が隼童】 モデル選択の方法を指定(指定しない場合は全通りの結果が出力される) ‑ AlC:AIC が最小のモデルが選択される ‑ MAXT: t統計量が最大のモデルが選択される ‑ AVGAIC:: 有意となったモデルの重み付け平均値を計算し使用する ・ さて、 mcpmodプロシジャを実行すると、様々な解析結果が表示される。まず、 MCP‑Modを行う事前情報「デ ータセットに関する要約統計量Jr 最適な対比係数Jr 対比係数聞の相関行列」が表示されるが、ここでは「最 適な対比係数」のみを紹介する。 178
実行結果 5 . 1 最適な対比係数 O P T IM A LC O N T 陥S TC O E F F I C I E N T S L 1NLOG D o s e E M A X 0 . 0 0 0 0 一0 . 6 4 3 1 一0 . 7 2 7 8 0 . 3 6 1 5 ‑ 0 . 2 4 7 0 0 . 0 5 0 0 ‑ 0 . 0 6 1 0 O .0 8 9 1 0 . 2 0 0 0 0 . 4 1 3 1 O .3 7 5 2 0 . 6 0 0 0 0 . 5 1 0 5 1 . 0 0 0 0 O .5 3 0 5 L 1NEAR ‑ 0 . 4 3 6 7 ‑ 0 . 3 7 7 6 ー0 . 2 0 0 6 0 . 2 7 1 4 O .7 4 3 5 E X P N Q U A D 一O .3 9 3 9 ー0 . 5 7 8 5 ‑ 0 . 3 5 6 2 ーO .2 3 2 5 0 . 1 9 0 2 O .7 9 2 3 ‑ 0. 4 0 9 8 0 . 0 1 9 5 O .6 0 2 1 O .3 6 6 8 L O G I T ‑ 0 .3 8 3 9 ‑ 0 . 3 7 3 2 ‑ 0 .3 0 5 3 O .3 6 4 2 O .6 9 8 2 次に、 MCP ・ Mod の実行結果のうち、 MCP (多重比較)部分の結果を紹介する。本結果は「有意な用量一反 応関係があるかどうかの検定結果 j となっており、モテ手ルご、とに多変量 t分布から求めた片側 p 値及び調整 IP値が出力されている。ここでは、調整済み p値がすべて 0 . 0 2 5 より小さいため、ど、のモデルも「有 済み片仮J 意な用量反応関係が検出された」とし、次のステップ (Mod部分)へ進むことが可能となっている。 . 2 多重比較結果 実行結果 5 M U L T I P L EC O N T R A S TT E S T t ‑ S t a t E M A X L 1NLOG L 1NEAR E X P N Q U A D L O G I T 3 . 4 6 4 1 3 . 4 1 0 6 2 . 9 7 1 5 2 .7 7 8 0 3 .3 8 7 7 2 .8 4 0 4 R a w p ‑ v a l u e 0 . 0 0 0 4 0 . 0 0 0 5 0 . 0 0 1 9 0 . 0 0 3 3 0 . 0 0 0 5 O .0 0 2 8 A d j p ‑ v a l u e 0 . 0 0 0 8 0 . 0 0 1 1 0 . 0 0 4 1 0 . 0 0 7 3 0 . 0 0 1 2 0 . 0 0 5 9 今回の解析では、モテ守ル選択の方法として AIC ( A I C が最小のモデルを選択)を指定しているので、最適な モデルとして AICが最も小さい f L in e a rl o g ‑ d o s e J モデ、ルが選択されている。 . 3 モデ、ル選択結果 実行結果 5 M O D E LS E L E C T IO N M o d e lf a m iI y E m a x L i n L o g L i n e a r E x p o n e n t i a l Q u a d r a t i c L o g i s t i c A I C 2 1 9 . 1 7 8 5 2 1 7 . 6 5 4 3 2 2 0 . 5 3 8 9 2 2 3 . 1 7 0 7 2 1 9 . 7 5 9 5 2 2 0 . 8 6 9 1 S e l e c t e dM o d e l :l i n l o g mcpmod プロシジャでは、モデ、ル選択の結果によらず全てのモデ、ルに対してパラメータ推定が行われるが、 ここでは簡単のため最適なモデルとして選択された f L i n e a rl o g o d o s e J モデ、ルの推定結果のみ紹介する。結 果は ff(d, 6 )=0 . 9 7 4 9+0.14581og(d+0 . 0 1 ) J と推定されている。 179
実行結果 5 . 4 r L i ne 町 l o g ‑ d 加 e J モデルに対するパラメータ推定結果 O O S ER E S P O N S EM O O E LF I T T I N G F i t t e dM o d e l2 : M o d e lf a m iI y :L i且盟 P a r a m e t e rE s t i m a t e s : S t d .E r r o r E s t i m a t e 0 . 1 0 6 5 O .9 7 4 9 E O 0 . 0 4 2 2 O .1 4 5 8 O e l t a R e s i d u a l s : 1 Q M e d i a n M i n ‑ 0 . 4 0 5 8 0 . 1 4 3 3 ‑ 2 . 0 2 1 6 R e s i d u a ls t a n d a r de r r o r :0 . 7 0 4 1 O e g r e e so ff r e e d o m :9 8 3 Q 0 . 4 3 0 2 M a x 2 . 0 8 9 4 最後に、 T 釘. g e tD o s eの推定結果を紹介する。本結果では、モデル選択の結果によらず全てのモデルにおいて T a r g e tDoseの推定値が計算され、指定した企ごとに推定値のリストを出力する。最適なモデルとして選択 L i n e a rl o g ‑ d o s e J モデルについては、 T a r g e t D o s eが 0 . 2 9 8 8と推定されている。 された r . 5 T a r g e tD o s eの推定結果 実行結果 5 O O S EE S T lM A T I O N T a b l e1 :F o rO e l t a= 0 . 5 0 0 0 M o d e lf a m iI y E s t i m a t e dT O( c o n t ) E M a x 0 . 2 8 8 6 L in L o g 0 . 2 9 8 8 L i n e a r 0 . 8 9 5 1 E x p o n e n t i a l 0 . 9 4 0 2 Q u a d r a t i c 0 . 3 8 7 1 L o g i s t i c 0 . 2 2 5 5 E s t i m a t e dT O( d i s c ) 0 . 6 0 0 0 0 . 6 0 0 0 1 .0 0 0 0 1 .0 0 0 0 0 . 6 0 0 0 0 . 6 0 0 0 6 . 鎖T 例②:SASと Rを組み合わせた解析 前項で紹介した m cpmodプロシジャは、 E a s tがインストールされていない SASでは実行できない。ところで、 R J には r D o s e F i n d i n g J パッケージがあり、本パッケージの関 フリーで使用することが出来る統計ソフト r 数を用いることで MCP ・ Modを実行することが出来る。本項では SASから Rを呼び出して MCP ・ Modを実行 し 、 4‑5項と同じ解析を行う方法を紹介する。 蓋王旦豊盤 1 . 以下のサイトより Rをダウンロードし、インストールする(鳩r . 3 . 2 . 5を想定) h 仕n : / / 食n . v z . v a m a : e a t a ・ u . a c .i n / n u b / c r a n l b i n l w i n d o w s / b a s e / 1 1 . Rを「管理者権限」で起動した後、以下の命令を実行する i n 施 s s t 凶 a l l . 伊 p a c はk 昭 a g e 叫 s 咲 ( 唱o s 鈴 s e F i 凶 n 凶d i 均 n 略 泡 I . g , " ヘω d 崎 : p = 司 T 町) I I I .C ドライブに作業フォルダを準備する(本稿では C ドライブの直下に r t e m p J フォルダを作成) I V .A p p e n d i xで紹介するマクロ r%MYMCPMODJ を定義する。 180
ヨワ一 数一 の 一 D一 O一 一 一 DA ﹁ν M一 M一 Y一 M一 % 一 h ノ一 ロ‑ マ 一 ro一 ム 一 プ一 m '凶c︐白川比旺 ‑E叫 叫旺 a 一フ一比 dy‑‑HUO lAA'l ・H U n n n u ‑ ‑ n n n ︐ y‑41MNn raHnUMNTITInunUT10 ロ一=================== ' U E︐ 唱 旬﹁ ・ E E叫 ' e o ‑ ‑ ' ρu v︐ ・ ・ EI‑‑4Lea‑‑JenHOU SElaaevJGjOVEn s‑‑zlvvs0 AoauvT ar eaurEenvaenbCMmmlnH L み aU4LalaU 00.nuvA60F94LnuFjnuaa‑‑anME‑‑EeO B ‑ a L み ooaoeavyJOl‑eBISTroeHV'l J0mmJqrJGnb4Lanvsea‑ocJqnunHnva nU nU M m nr nU M師 VI M m n u vf n u n a m m w吻刈 ・ ・ ・ Q L キ euv 表 6. 1 マクロ I%MYMCPMODJ の引数 引数名 d o s e s models maxEff d o s e v a l r e s p v a l d a t a s e t addCovars p l a c A d j s e l M o d e l a l p h a c r i t V doseType D e l t a p pVal a l t e m a t i v e 機能 用量をカンマ区切りで指定 「モプ二ル名=パラメータ値 J の組み合わせをカンマ区切りで指定 (モデル名及びパラメータ値に関しては、表 6 . 2を参照) パラメータが 2個ある場合は c (パラメータ 1 ,パラメータ 2 )の形式で指定 プフセボに対する最大効果 lならば応答変数が正の反応、司 lならば応答変数が負の反応を示すことを仮定 用量を表す変数名を指定 応答変数を表す変数名を指定 SASァ ータセット名を指定 共変量を追加する場合は I‑変数名」の形で指定 プラセボ調整後のデータを使用する場合は TRUEを指定 モダル選択時の指標(AlC、maxT、aveAlC) を指定 有意水準を指定 棄却限界値を指定 最適な用量を選択する際の指標 (TD、ED) を指定 「プラセボと比較して&の目的効果が得られる用量」を決める際の A 「プラセボと比較した時の最大効果のうち (IOOXp) %の効果が得られる用量J を決める際 のp p 値を計算する場合は TRUE、しない場合は FALSEを指定 片側検定 ( o n e ) 又は両側検定 ( t w o ) を指定 表 6. 2 引数 modelsに指定するパラメータ l i n l o g 戸(d, θつ dj(EDso+d ) l o g ( d+c ) NULL l i n e a r d トlULL モデル名 e町l a x 181 パラメータ値 EDso
f
'(d,
θつ
モデル名
パラメ}タ値
e
x
p
o
n
e
n
t
i
a
l
叫~) ‑1
8
q
u
a
d
r
a
t
i
c
d+ l
F
P
z
1
│d2
δ(
=s
2/I
s
d)
l
o
g
i
s
t
i
c
1
/
{
1+叫EDS~ ‑d)}
b
e
t
a
M
o
d
(~f(l-~f
dh
/
(
E
D
s
oh+d
h
)
s
i
g
E
m
a
x
c
(
E
Ds
O)
o,
C(Oh(
2
)
c
(
E
Ds
h
)
o,
,
c=0
.
0
1xm
a
x
d
o
s
e,D = 1
.2xm
a
x
d
o
s
e,B(δ1>δ
2
)=(δ1+δ2)8
+
82
/(δ181δ/2)
マクロ %MYMCPMODの実行
データセット f
b
i
o
m
J に対してマクロ f%MYMCPMODJ を実行し、 MCP
・
Modによる解析を行うえ
プログラム 6
.
2 マクロ f%MYMCPMODJ の実行
略M
Y
M
C
P
M
O
D
(
d
o
s
e
s
m
o
d
e
l
s
=目s
t
r
(
O, 0
.
0
5
. Q2, 0
.
6, 1
),
=首 s
t
r(
e
m
a
x
=
O
.2, I
i
nI
o
g
=
N
U
L
L, I
i
n
e
a
r
=
N
U
L
L
. exponenti
aI
=
1
.1
3
.q
u
a
d
r
a
ti
c
=
一0
.
7
3,
l
o
g
i
s
t
i
c
=
c
(
0
.
5,0
.
1
3
)
),
d
o
s
e
v
a
l
=d
o
s
e,
=r
e
s
p,
r
e
s
p
v
a
l
=b
i
o
m,
d
a
t
a
s
e
t
I
C,
s
e
l
M
o
d
e
l =A
=0
.
0
2
5,
a
l
p
h
a
d
o
s
e
T
y
p
e =
T
D
=0
.
5
D
e
l
t
a
=T
R
U
E
p
V
a
l
a
l
t
e
r
n
a
t
i
v
e=o
n
e
結果は前項の m
cpmodプロシジャのものと同様であることと頁数の制限のため出力の詳述は行わないが、ま
ず作業フォルダ(例えば f
C
:
¥t
e
m
p
J
) に解析結果となる f
o
u
t
p
u
t
.t
x
t
J が出力される。
.
1 o
u
t
p
u
t
.
t
x
tの中身(抜粋)
実行結果 6
M
C
P
M
o
d
*
*
*
*
*
*
*
本
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
M
C
Pp
a
r
t
*
*
*
*
*
*
*
*
*
*
*
キ
*
*
*
*
*
キ
キ
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
M
u
l
t
i
p
l
eC
o
n
t
r
a
s
tT
e
s
t
2 引数
s
e
qに順番を指定する際、%柑o中で指定する内容を途中で改行しないこと(エラーとなる)。
182
c a斗 内d r a a斗 no ‑‑En白 守Inunun3 内 po +Lqdndqd d e u ‑BEAUAUnUAUnu gb 一一一 n u 守 'l 一 一 I coonunBnL マ ia7'41 l 噌 AUF0 内 4LFDa斗 nUFO J a u rnununUAUnU Jau u‑‑ H u nH Elaa守 nontnunt aqvFD d 内n uunud iE d 司 内 n4417' d +L ・・・ nnununununU ρu‑ 一 一 n H n u n v V A a u v ' ''nnU4EE4Ea 内u 屯 守 a斗 aqd7'nU t e a斗 ηdntη 正 守I n H ︽ lnunUAunU U EI‑‑‑ ssnU t 守 AHFDAU o n t a斗 のE7'4l 守 ηLAU d 内 rD 'l t n H iznununUAUAU X d 内 4141ηdnu a a・RvnD41 J 内 ︽ a 斗 E smnonJ U J V ︐a 4EL u snunununuhu au‑‑ V E LrD キ nHAuntFU n u nununununU 唱 l C o n t r a s tC o r r e l a t i o n : i n l o gI i n e a re x p o n e n t i a lq u a d r a t i cl o g i s t i c e m a xI e m a x 1 . 0 0 0 0 . 9 8 9 0 . 9 1 2 0 . 8 6 7 0 . 9 6 5 0 . 8 8 4 I i n l o g 0 . 9 8 9 1 . 0 0 0 0 . 8 7 5 0 . 8 3 0 0 . 9 3 7 0 . 8 3 7 I i n e a r 0 . 9 1 2 0 . 8 7 5 1 . 0 0 0 0 . 9 9 4 0 . 8 4 0 0 . 9 8 8 e x p o n e n t i a l0 . 8 6 7 0.830 0 . 9 9 4 1 . 0 0 0 0 . 7 7 4 0 . 9 7 8 q u a d r a t i c 0 . 9 6 5 0 . 9 3 7 0 . 8 4 0 0 . 7 7 4 1 . 0 0 0 0 . 8 4 4 l o g i s t i c 0 . 8 8 4 0 . 8 3 7 0 . 9 8 8 0 . 9 7 8 0 . 8 4 4 1 . 0 0 0 M u l t i p l eC o n t r a s tT e s t t ‑ S t a t a d j ‑ p . 0 0 1 e m a x 3 . 4 6 4く 0 I i n l o g 3 . 4 1 1< 0 . 0 0 1 q u a d r a t i c 3.3880.00131 I i n e a r 2.9720.00382 l o g i s t i c 2.8400.00612 e x p o n e n t i a l 2.7780.00709 . 0 2 5, o n e ‑ s i d e d ) C r i t i c a lv a l u e :2 . 2 7 6( a l p h a=0 (以下略) また、作業フォルダ(例えば I C : ¥t e m p J )に l o u t p u. tp d 白が出力され、 MCP‑Modの候補としたモデルと、 これらのモデルに対してパラメータ推定を行い、モデ、ルの当てはめを行った結果が表示される。 a00.20.40.60.8 1 .0 0.00.20.40.60.8 1 .0 e X D O n e n t 凹 a d r a t i l 02'i s t i 1 . 2 。 1 .0 0 . 8 0 . 6 420 000 伺 @ 昌 一 ω F a ω ω ﹄ m w 旬︒孟 I i n l o l l 制帽】t i n e a 0 . 8 0 . 6 0 . 4 0 . 2 一 ー ー 0.00,20.40.60.8 1 .0 一 一 一 ‑I0.0 0.00.20.40.60.8 1 .0 0.00.20.40.60.8 1 .0 Dose 0.00.20.40.60.8 1 .0 dose 図6 . 2 当てはめ結果 図6 . 1 候補となるモデル 183
ところで、各モデルのパラメータ(例えば E m a xモデルのパラメータ EDs = 0 . 2 ) の決め方については言及しな o O . 2 m gならば最 かったが、実際の試験デザインを検討する際、値を特定するのは結構大変である。 R では r 大効果の 30% の効果が期待出来る」等の事前情報から、モデルのパラメータを推定する関数があるので、 SAS でもこの機能を使えるようにするため、下記のマクロ r%MYGUESSJ を定義した。書式例は以下の通り。 Y G U E S S ( d = 0 . 3, p = 0 . 8, m o d e l = e m a x, M a x d = l ) 同M ー 用量 0 . 3 で 80%の効果が得られると仮定したときの E m a xモデ、ル 目M Y G U E S S ( d = % s t r ( 0 . 2, 0 . 5 ), p = % s t r ( 0 . 6, 0 . 9 5 ), m o d e l = l o g i s t i c ); 一 用量 0 . 2で 60%、用量 0 . 5 で 95%の効果が得られると仮定したときの L o g i s t i cモデル 目M Y G U E S S ( d = 0 . 5, p = 0 . 5,m o d e l = b e t a M o d, d M a x = 0 . 8, s c a l = 1 . 2, M a x d = l ) ー 用量 0 .5で 50%の効果が得られると仮定したときの B e t a M o dモデル 唱M Y G U E S S ( d = % s t r ( 0 . 2, 0 . 5 ), p = % s t r ( 0 . 6, 0 . 9 5 ), m o d e l = s i g E m a x ); ー 用量 0 . 2で 60%、用量 0 . 5 で 95%の効果が得られると仮定したときの S i g m o i dEm 阻モデル % M Y G U E S S ( d = 0 . 7, p = l, m o d e l = q u a d r a t i c ) 一 用量 0 . 7で 100%の効果が得られると仮定したときの Q u a d r a t i cモデル 首M Y G U E S S ( d = 0 . 8, p = 0 . 5, m o d e l = e x p o n e n t i a l, M a x d = l ) 一 用量 0 . 8で 50%の効果が得られると仮定したときの E x p o n e n t i a 1モデル さらに、各モデ ルの検出力を求めるマクロ r%MYPOWERJ と例数設計を行うマクロ r%MYSAMPLEJ の定 ppendixにて紹介する。頁数の制限のため、引数の説明及び実行例はユーザー会当日の発表 義も合わせて A にて紹介する。 7 . 実行例③:SASによる解析 Menone t .a . l( 2 0 1 5 ) では、普通の SASにて MCP‑Modを行う方法が紹介されており、最適な対比係数を求め % o p t c o n t Jが紹介されている。これを用いて g l i m m i xプロシジャ等で MCP‑Modが実行出来るのだ るマクロ r が、本マクロでは使用出来るモデルが前述の 2つの方法と比較して若干少なくなることと、実際の解析で用 いた分散共分散行列を使った対比の計算が出来ない。そこで本項では、最適な対比係数を求める新たなマク Jを定義した上で、 Menone t .a . l( 2 0 1 5 ) で紹介されているものと同様の方法にて、 4 ロ r%MYCONTRAST ~5 項と同じ解析を実施する。 MCP・Mod を実行することにする。まず、マクロ r%MYCONTRAST Jの引数 は以下の通り 30 プログラム 7 . 1 マクロ f%MYCONTRASTJの引数 明m a c r oM Y C O N T R A S T( m o d e1 s = % s t r' (e m a x '' 1i n e a r '' 1i nl o g '' e x p o n e n t i a l '' q u a d r a t i c '' I o g i s t i c ' ' b e t a M o d '' s i g E m a x ' ), p a r a m s = % s t r ( 0 . 3 . O .7., 0 . 31 . 3, 0 . 5 2 . 0 ), d o s e s= % s t r( 0 .0 00 . 0 50 . 2 00 . 6 01 . 0 0 ), w = % s t r( 1 ) , S = 0 ) 3% s t r O中で指定する値について、途中で改行しないこと(エラーとなる)。 184 ‑ 0 .8 5. , O .3O .1 ,
表7
.
1 "?クロ i%MYMCPMODJ の引数
引数名
model
p
a
r
a
m
s
d
o
s
e
s
w
S
機能
モデルをスペース区切りで設定(詳細は次表)
各モァ ルのパフメータをカンマ区切りで指定(詳細は次表)
用量をスペース区切りで指定
各用量の例数比(重み)を不等例数にする場合は、スペース区切りで指定
(指定は任意;例:w=%柑(
21112
))
実際の解析で用いた分散共分散行列を用いる場合は、フJータセットを予め準備した上で、
データセット名を指定(指定は任意)
表7
.
2 引数 m
o
d
e
l
sと引数 p
a
r
a
m
sに指定するパラメータ
models に指定するバラメ}タ
•f
'C
d
,
e
.
)
'
e
m
a
x
'
d
j
(
E
D
s
o+d
)
'
l
i
n
l
o
g
'
l
o
g
(
d+c
)
'
I
i
n
e
a
r
'
d
叫
ゆ
'
e
x
p
o
n
e
n
t
i
a
l
'
params に指定するパラメータ
ED50
d
e
l
t
a
‑1
'
q
u
a
d
r
a
t
i
c
'
b
e
t
a
2/I
b
e
t
a1
d+ │
F
P
z
1
│d2
'
I
o
g
i
s
t
i
c
'
1
I{
1+ 叫EDS~ ‑d
)
}
お
(1Dz
'
b
e
t
a
M
o
d
'
d
h
j
(
E
D
s
O
h+dh
)
'
s
i
g
E
m
a
x
'
ED50
d
e
l
t
a
d
e
l
t
a1 d
e
l
t
a
2
ED50 h
2
c=0
.
0
1xmaxdose
,D=1
.2xmaxdose
,8
(
0
1
10
2
)=(
δ
.
1+0
2lh+8
j(0/'0/2
)、 i. J は欠測を表す
まず、マクロ i%MYCONTRASTJ を下記の通り実行すると、文字列マクロ変数 i
&
c
t
r
J に最適な対比係数が
格納される。
.
2 マクロ i%MYCONTRASTJ の実行
プログラム 7
百MYCONTRAST(
mode1
s=%str(
'e
m
a
x
' '
1i
nl
o
g
''
1i
n
e
a
r
' 'exponenti
al
' 'quadrati
c
' '
1o
g
is
ti
c
',
)
params=
略s
t
r(
0
.2,
. ..,
..,
1
.1
3 ., ー0.73 .
,
0.50
.
1
3
),
doses =
弘s
tr(O.OO0.050.200.60 1
.
0
0
)
)
次に、 glimmix プロシジャにて MCP‑Modのうち MCP (多重比較)部分を実施することが出来る。
プログラム 7
.
3 glimmix プロシジャによる MCP‑Modの実施
data n
u
l
l
ca11execute (
"
procg
li
m
m
i
x data=biom
class dose
185
m o d e lr e s p=d o s e /n o i n ts o l u t i o nc o v b e s t i m a t e品c t r . /a d j u s t = s i m u l a t e ( n s a m p = 1 0 0 0 0 0 0s e e d = l )u p p e r t a il e d; r u n r u n 上記の実行結果を、マクロ r%MYCONTRASTJ の実行結果(最適な対比係数)と共に紹介する。 . 1 マクロ r%MYCONTRASTJと g l i m m i xプロシジャの実行結果 実行結果 7 S A S システム c e m a x l i n l o g I i n e a re x p o n e n t i a lq u a d r a t i c l o g i s t i c 0 ‑ 0 . 6 4 3 1 1 5‑ 0 . 7 2 7 7 7 1‑ 0 . 4 3 6 6 5 6 0 . 0 5‑ 0 . 3 6 1 4 5 9‑ 0 . 2 4 7 0 2 9‑ 0 . 3 7 7 6 4 8 0 . 2 0 . 0 6 1 0 2 5 5 0 . 0 8 9 0 9 6‑ 0 . 2 0 0 6 2 6 0 . 6 0 . 4 1 3 0 9 5 5 0 . 3 7 5 2 0 5 6 0 . 2 7 1 4 3 4 9 10 . 5 3 0 4 5 2 10 . 5 1 0 4 9 8 50 . 7 4 3 4 9 5 5 ‑ 0 . 3 9 3 8 8 2‑ 0 . 5 7 8 4 9 4‑ 0 . 3 8 3 9 0 8 ‑ 0 . 3 5 6 1 6 6‑ 0 . 4 0 9 8 3 1‑ 0 . 3 7 3 1 6 6 ‑ 0 . 2 3 2 4 6 6 0 . 0 1 9 4 8 3 3‑ 0 . 3 0 5 3 3 6 0 . 1 9 0 1 7 9 4 0 . 6 0 2 0 5 5 9 0 . 3 6 4 2 1 4 7 0 . 7 9 2 3 3 4 6 0 . 3 6 6 7 8 6 2 0 . 6 9 8 1 9 6 6 G L I M M I Xプロシジャ ラベ J レ 1e m a x 2I i n l o g 3I i n e a r 4e x p o n e n t i a l 5q u a d r a t i c 6l o g i s t i c 推定値 0 . 5 5 1 8 O .5 4 3 3 0 . 4 7 3 3 0 . 4 4 2 5 0 . 5 3 9 6 0 . 4 5 2 4 推定値 多重度の調整 S i m u l a t e d t値 標準誤差 自由度 0 . 1 5 9 3 0 . 1 5 9 3 0 . 1 5 9 3 0 . 1 5 9 3 0 . 1 5 9 3 0 . 1 5 9 3 9 5 9 5 9 5 9 5 9 5 9 5 3 . 4 6 3 . 4 1 2 .9 7 2 .7 8 3 .3 9 2 .8 4 P r> t 0 . 0 0 0 4 0 . 0 0 0 5 0 . 0 0 1 9 0 . 0 0 3 3 0 . 0 0 0 5 0 . 0 0 2 8 調整済 P 0 . 0 0 0 9 0 . 0 0 1 1 0 . 0 0 4 1 0 . 0 0 7 1 0 . 0 0 1 2 0 . 0 0 6 0 この後、 Mod (各モデルのパラメータや T a r g e t D o s eの推定等)部分の解析を叫mixedプロシジャ等で実施 L i n e a r1 o g ‑ d o s e J モデルのパラメータ推定は以下 することが出来、例えば最適なモデルとして選択された r のコードで実行出来るが、これ以降の詳細な解説は M enone t .a l .( 2 0 1 5 ) に譲る。 プログラム 7 . 4 n l m i x e dプロシジャによる r L i n e a r1 o g ‑ d o s e J モデルのパラメータ推定 t i t l e" L i n e a rl o g ‑ d o s em o d e l " p r o cn l m i x e dd a t a = b i o m p a r m sE O = O . O lD e l t a = O . O lS D = 1 . 0; M u=E O+D e l t a キI o g( d o s e + O .01 ) m o d e lr e叩 州 n o r m aI ( M u, S D 林 2 ); r u n 8 . まとめ 本稿では、 MCP‑Modを実行するために r EAST6 . 3PROCs( 3 2 ‑ b i t )f o rSASを用いる方法Jr S A Sと Rを組み合 わせる方法 Jr S A Sのみで実行する方法Jの 3つの方法を紹介した。 l番目の方法はデータセットのみを指定 186
するだけで燦々な解析結果を出力することが出来る。 2番目の方法は、外部ソフト (R) を呼び出す必要があ る煩雑さはあるが、グラフ出力が自動で得られ、かっ事前に設定する用量 反応モテ守ルのパラメータ推定や 例数設計を行うことが出来る。 3番目の方法は、普通の SASのみで解析を行える簡便さがあり、かっ本稿で 提案したマクロを適用することで、 l番目や 2番目の方法と同じ数の用量一反応モデルを使用することが出 来る。場面に応じてこれらの方法を使い分けるのが良い。 ちなみに、 MCP ・ Modを適用する際は、下記の点に留意する必要があることを最後に申し添える。 前項までの流れで、解析を行った場合、対照群(例:プラセボ群)との対比較の結果は得られない。特に、 rMCP ・ Modにて有意となる j 検出カを計算する際、「対比較にて有意となる」ことを考慮、せずに計算す ることとなる。 本手法を適用する際、経験則として実薬群は 4~7 群、用量幅は 10 倍以上が望ましい。 設定する用量一反応モデルの数は 3~7 個が望ましい。 連絡先 m a s a f u m i . k a t o u( a )t a k e d a . c o m 参考文献 F .B r e t z , J .C .P i n h e i r o , andM.B r a n s o n .( 2 0 0 5 ) , " C o m b i n i n gm u l t i p 1 ec o m p a r i s o n sa n dm o d e l i n gt e c h n i q u e si nd o s e ‑ r e s p o n s es t u d i e s ", Biome 仕i c s , 6 1, 7 3 8 ‑ 7 4 8 . T .Hothorn , andP .W e s t f a l l( 2 0 1 0 ), F .B r e t z, " M u 1 t i p 1 eC o m p a r i s o n sU s i n gRヘChapmana n dH a 1l / CRCP r e s s . P i n h e i r o , J .C ., Bornkamp , B . , andB r e t z , F .( 2 0 0 6 ) , D e s i g na n da n a l y s i sofd o s ef i n d i n gs t u d i e sc o m b i n i n gm u 1 t i p l ec o m p a r i s o n sa n dm o d e l i n gp r o c e d u r e s, Jouma1o f B i o p h a r r n a c e u t i c a lS t a t i s t i c s,1 6, 6 3 9 ‑ 6 5 6 . EMA( 2 0 1 4 ), " Q u a l i f i c a t i o nO p i n i o nofMCP ・ Moda sa ne f f i c i e n ts t a t i s t i c a 1m e t h o d o l o g yf o rm o d e l ‑ b a s e dd e s i g nanda n a 1 y s i s o fP h a s eI Id o s ef i n d i n gs t u d i e su n d e rmodelu n c e r t a i n t y " . i chardC .Zink( 2 0 1 5 ) , SandeepM.MenonandR "ModemA p p r o a c h e st oC l i n i c a lT r i a 1 sU s i n gSAS:C 1 a s s i c a l, A d a p t i v e, a n dB a y e s i a nM e t h o d s ", SASI n s t i t u t e . ICH ・E8ガイドライン 臨床試験の一般指針 EAST6 . 3PROCsf o rSASU s e r s MCPMod1 .1ユーザーマニュアル B j o e r nBornkamp , J o s eP i n h e i r o , FrankB r e t z( 2 0 1 5 ) , R :D o s e F i n d i n gパッケージ・ユーザーマニュアル 以上 187
Appendix本文に掲載していないが引用したプログラム プログラム A.l データセット fbiomJ d a t ab i o m i n p u ts u b j e c t l Dd o s er e s p c a r d s 10 . 0 5 13 5 3 8 0 0 9 7 9 2 0 . 0 5 0 . 1 5 4 9 8 0 2 3 9 3 0 . 0 5 ‑ 0 . 0 7 0 8 3 8 0 3 7 4 0 . 0 5 0 . 5 8 3 7 4 0 9 0 9 5 0 . 0 5 0 . 9 6 2 5 9 8 5 2 7 6 0 . 0 5 0 . 3 8 1 3 8 8 8 7 6 70 . 0 5 ‑ 0 . 0 0 4 6 9 5 9 9 1 8 0 . 0 5 0 . 5 1 9 3 0 4 9 3 5 9 0 . 0 5 ‑ 0 . 3 6 3 3 2 2 1 3 1 0 0 . 0 5 0 . 3 3 8 9 0 3 3 3 6 1 1 0 . 0 5 0 . 1 4 5 6 2 0 7 1 7 1 2 0 . 0 5 0 . 4 4 2 8 0 3 4 0 6 1 3 0 . 0 5 ‑ 0 . 0 2 1 9 4 9 6 6 4 1 4 0 . 0 5 0 . 3 7 2 5 9 8 2 4 1 5 0 . 0 5 1 . 5 2 8 9 7 6 0 7 2 1 6 0 . 0 5 0 . 1 4 9 4 7 1 2 9 8 1 7 0 . 0 5 0 . 3 7 4 0 6 3 3 6 2 1 8 0 . 0 5 1 . 0 1 1 6 7 8 2 1 9 0 . 0 5 0 . 2 8 1 3 0 6 2 6 7 2 0 0 . 0 5 0 . 9 9 4 6 5 6 1 5 5 2 1 0 . 2 1 .198081819 2 2 0 . 2 1 . 5 6 7 6 8 3 9 4 2 3 0 . 2 ‑ 0 . 1 5 5 6 0 7 2 7 9 . 2 0 6 5 8 7 7 7 2 4 0 . 2 0 2 5 0 . 2 1 .853465242 2 6 0 . 2 0 . 9 9 5 6 8 2 8 7 3 . 4 5 2 2 3 4 1 5 7 2 7 0 . 2 2 0 . 5 2 0 3 9 8 8 7 2 8 0 . 2 ‑ . 0 4 8 8 5 6 2 3 7 2 9 0 . 2 0 3 0 0 . 2 0 . 6 3 3 1 2 8 0 1 4 3 1 0 . 2 0 . 5 2 8 4 1 3 2 3 8 . 4 2 2 9 0 2 0 2 3 3 2 0 . 2 0 目 3 3 0 . 2 3 4 0 . 2 3 5 0 . 2 3 6 0 . 2 3 7 0 . 2 3 8 0 . 2 3 9 0 . 2 4 0 0 . 2 4 1 0 . 6 4 2 0 . 6 4 3 0 . 6 4 4 0 . 6 4 5 0 . 6 4 6 0 . 6 4 7 0 . 6 4 8 0 . 6 4 9 0 . 6 5 0 0 . 6 5 1 0 . 6 5 2 0 . 6 5 3 0 . 6 5 4 0 . 6 5 5 0 . 6 5 6 0 . 6 5 7 0 . 6 5 8 0 . 6 5 9 0 . 6 6 0 0 . 6 6 1 1 6 2 1 6 3 1 6 4 1 6 5 1 6 6 1 6 7 1 1 .2 3 3 3 2 5 8 2 5 1 . 8 6 7 8 2 5 7 0 4 1 . 0 5 7 8 3 5 0 5 7 0 . 3 4 5 3 4 8 9 4 0 . 4 0 4 8 5 1 3 7 1 0 . 4 8 4 2 0 3 3 1 0 . 5 7 1 1 9 9 8 7 8 1 .010696185 1 . 1 7 2 2 2 1 0 0 4 0 . 6 6 7 5 5 8 1 0 2 1 .777681617 0 . 3 0 9 7 3 5 7 9 5 0 . 0 5 6 4 6 1 9 1 0 . 9 0 0 0 6 5 6 8 7 O .7 3 8 3 0 2 9 4 9 0 . 2 2 7 8 7 9 0 4 9 1 . 3 8 5 1 0 6 0 6 6 0 . 9 1 2 3 9 0 5 8 2 0 . 2 9 9 3 0 0 1 2 6 0 . 2 7 8 9 1 7 3 0 4 0 . 2 7 0 0 4 3 8 0 7 0 . 5 6 9 6 2 5 1 7 3 1 . 6 0 4 3 2 8 0 0 6 1 .5 7 6 9 4 4 5 3 1 2 . 9 2 4 5 0 8 9 6 2 O .1 7 1 5 3 2 3 7 6 2 . 1 6 0 5 2 3 7 3 8 0 . 6 8 5 6 1 1 7 4 4 2 . 2 4 8 4 4 5 8 4 1 2 .1 7 3 6 8 8 7 9 9 1 .254509265 1 .8 6 4 6 2 6 6 0 3 ‑ 1 .113082058 1 .1 9 8 4 1 5 0 9 1 1 .97485829 6 8 1 6 9 1 7 0 1 7 1 1 721 7 3 1 7 4 1 7 5 1 7 6 1 771 7 8 1 7 9 1 8 0 1 8 1 0 8 2 0 8 3 0 8 4 0 8 5 0 8 6 0 8 7 0 8 8 0 8 9 0 9 0 0 9 1 0 9 2 0 9 3 0 9 4 0 9 5 0 9 6 0 9 7 0 9 8 0 9 9 0 1 0 0 0 0 . 6 2 5 3 3 4 1 5 1 .330258137 0 . 1 4 9 4 5 4 6 8 9 0 . 8 8 7 1 3 9 9 9 6 0 . 5 6 3 0 6 4 0 8 8 0 . 7 3 0 8 6 3 1 2 6 ‑ 0 .7 7 1 4 7 3 8 6 1 0 . 4 9 4 7 7 8 3 5 8 0 . 3 0 3 1 1 0 2 5 1 0 . 4 2 5 2 3 1 3 3 1 2 . 5 5 7 7 7 3 7 8 4 1 .12889658 0 . 9 4 8 3 3 5 8 7 1 0 . 3 5 4 6 2 1 6 4 4 0 . 1 3 6 5 2 8 0 1 4 ‑ 0 . 0 1 7 2 2 1 2 7 3 0 . 3 6 7 4 8 3 5 6 3 0 . 3 9 5 1 2 7 6 1 8 0 . 3 5 7 9 6 5 9 1 1 0 . 3 1 2 9 3 6 4 5 9 ー0 . 0 4 4 9 1 5 9 0 2 0 . 6 2 3 0 9 1 3 8 7 0 . 0 3 9 5 1 2 1 8 ‑ 0 . 3 0 8 4 0 3 5 7 ‑ 0 . 4 5 2 9 6 4 3 0 5 ‑ 0 . 2 0 1 7 0 9 2 3 6 1 .560869091 0 . 5 6 1 2 8 6 2 9 3 0 . 3 3 6 2 4 1 1 3 7 ‑ 0 . 1 5 9 3 7 5 0 6 8 0 . 9 9 2 6 0 4 7 2 8 0 . 8 0 6 9 8 7 0 0 8 1 .237442253 r u n プログラム A.2 データセット fbiomJ の要約統計量と平均値のグラフ ods output summary=out proc means data=biom nonobs nmean stddev minmax class dose var resp , run ; ods output close proc sgplot data=biom vbar dose / response=resp Iimitstat=stddev limits=upper stat 司l e a n; run プログラム A.3 SASと R を組み合わせて MCP‑Modを行うマクロ f%MYMCPMODJ Bornkampe t .a . I (2015) による Rパッケージ rDoseFindingJ は 、 License は GPL‑3 (プログラムの調査及び 改変、公衆への頒布が可)に従っており、本稿中のマクロは本パッケージ中の関数を参考に作成した。 4" " ' A . 6も同様とする。 よって、本稿中のマクロの License も GPL・3 とする。以下のプログラム A. 188
蜘n a c r oMYMCPMOD(doses models = , maxEff =1 d o s e v a l = r e s p v a l = dataset = S = NULL, type =n o r m a1 , addCovars =‑1 p l a c A d j = FALSE, s e l M o d e l =AIC, alpha =0 . 0 2 5, d f = NUL L . c ri t V = TRUE, doseType =T D, Delta = 0.5, p =0.8, p V a l = TRUE, alternative= one.sided, datapath =' C : / t e m p / d a t a . c s v ', pdfpath = "C:/temp/output.pdf ぺ outtextpath= " C : / t e m p / o u t p u t .t x t ", programpath= "C:/temp/program.R勺 o p t i o n s noxwait xsync ト ‑ Rの実行ファイルのパス; 首l e tR e x e p a t h = ' C :半ProgramFi1 e s 平R 平R ‑ 3 . 2 . 5 平b i n ¥i 3 8 6 ¥R .e x e ' procexportdata= 品d a t a s e t .o u t f il e = 品d a t a p a t h . dbms=csv r e p l a c e r u n f il e n a m eaaa& p r o g r a m p a t h . data̲null̲ ; f il ea a a p u t "library(DoseFinding)" ; r e a d . c s v ( 品d a t a p a t h .,head= T)" put " d o d e1 s< ‑Mods(伽lode1S.,doses=c(&doses.,) maxEff=&maxEff.)" ; p u t百l t .s e e d( 7 77 ) "; p u t e MCPMod(&doseva. 1, &respval . , d ,m odels, S= 品. s, " : p u t" r e s u l t s put" t y p e = " " & t y p e ." " , addCovars= 品a d d C o v a r s .," put" p lacAdj=&p1 acAdj . , s e1 ModeI = " " & s e1 Mode. 1" , put" a l p h a = & a l p h a ., df= 品d f ., c r i t V = & c r i t V ., " ; put" d o s e T y p e = " " & d o s e T y p e ." " , D e l t a = & D e l t a ., p = & p ., pVal=&pVa1 ., " put" a l t e r n a t i v e = " " & a l t e r n a t i v e ." , n a . a c t i o n = n a . o m i t ) " put i n k ( f il e = " 品o u t t e x t p a t h ." ) "; p u t" s u醐 ary(results)" ; p u t inkO" ; " 品p d f p a t h ." , paper='a4')" ; p u t df( put " p l o t ( m o d e l s, maxEff= 伽l a xE ff .) "; l o t D a t a = '町l e a n s C I ') "; put " p l o t ( r e s u l t s, p p u t "dev.offO" ; r u n < ‑ 、 <‑ 、 、 、 x" & R e x e p a t h . ‑no‑restore‑‑no‑saveく " & p r o g r a m p a t h ."" x" " & p d f p a t h ." " x" n o t e p a d "&outtextpath."" ; 知n e n d 189
プログラム A.4 各モデルのパラメータ設定を行うマクロ r%MYGUESSJ 百 macroMYGUESS(d = P m o d e l l e s s = TRUE, l o c a l = FALSE dMax = NULL, Maxd = NULL s c a l = NULL, outtextpath = "C:/temp/output.txt", progr 悶a 叩 m n 叩 I 問 path= "C:/te 叩 mp/program.R" options noxwait xsync . * ‑ ‑ ‑Rの実行ファイルのパス; 首l e tRexepath='C:¥Program Fi1 es ¥R半R ‑ 3 .2 .5 半b in ¥i386平R .e x e ' 、 、 190 VA f il e n a m e aaa &programpath data n u l l f il e aaa : put " 1i brary( D o s e Fi ndi n g )" 品d o s e s . ), maxEff= 品 maxEff.)" : put "models く‑Mods(&models., doses=c( put " s e t .seed( 7 7 7 ) ": put ontMatく 一 o ptContr(models, w=c( 品n .))" : put i n k ( f il e = " & o u t t e x t p a t h .")" a a Rの実行ファイルのパス M m ト‑‑ 首l e tRexepath='C:平ProgramFi1 es ¥R半R‑3.2.5平bin平i386半R .e x e ' VA si gma = NULL, alternative = one placAdj = FALSE, critV = TRUE outtextpath = "C:/temp/output.txt", programpath = "C:/temp/program.R") options noxwait xsync JG =0.025, n a a = oo 明macroMYPOWER(doses models maxEff alpha JG プログラム A.5 SASと R を組み合わせて検出力の計算や例数設計を行うマクロ キーー検出力の計算を行うマクロ; ‑ ‑Mm J唱 <" 品programpa 廿 th .' a u Fu n u a u n u n u Fb e A M a u o白 c u ‑ 一aeuo a u n u j q ' 伽 a u v m ︐ ︐ ︐ MH j0 ‑ 一 n u ︑ ︑ ︑ ︑ ︑ ・ z ︐ . E'' ・s w f ︑ g = a 一 hH nv ︐ ︑ +L ea ︐ ︐ ︑ . ︐ ・ Haa ︐ . J pc gb+ι=H LHnxnv J L 品 i ' e aAU+L'tt nHnH4L .1a m川 ‑E‑Hu‑pu a rro Jus v ρ u w O 也 o a o h u oo=cal v ' n H u a u = g u・ ' nvrt'1AUC E e oavs ・ a ︑ n u w rF+1 ゐL J ︑ t e a ・'aa ︐ P0 ・ rb Rs ‑k ・ . a︐ a l a L︑ One︐ j on ︐ ・ EE‑ea‑‑E・ A‑‑' E HUV ρhwHuau'leugbaucu mnHMMMMmH nu‑auvohu L L nal る 品 &L‑‑4L・ ' aBea‑‑EHUHUHu.nuHU 11 キ L Z l n v n v n v x nド n H auauHu fd Mr ︐ ︐ . 、 x" 品Rexepath 一 no‑restore一 一no 一save x otepad " 品outtextpa 廿 th ." 唱 愉 伽 m f 町 伽 目 l e n d
p u t" ( x( ‑p o w M C T ( c o n t M a t, a l p h a = & a l p h a ., a l t M o d e l s = m o d e l s, n = c ( & n . ), s i郡l a = & s i伊 l a . p u t" p1 a c A d j = & p1 a c A d j ., a l t e r n a t i v e = " " & a l t e r n a t i v e ." " , d f = N U L L, c r i t V = & c r i t V . ) ) ": p u t" c a t ( ' l t l n ' ) : y( ‑m e a n ( x ) :n a m e s ( y )( ー ' M e a nP o w e r ':y " p u t inkO" : r u n I " 、 x" & R e x e p a t h . ‑no‑restore‑no ‑save("&programpath.' x" n o t e p a d" & o u t t e x t p a t h . " ": 首 m e n d ト一例数設計を行うマクロ 伽l a c r oM Y S A M P L E ( d o s e s = m o d e l s = , m a x E f f =1 u p p e r N = 1 0 w e r N =, p o w e r =0 . 8, s i g m a =1 , a l R a t i o = a l p h a =0 . 0 2 5, a l t e r n a t i v e=o n e, N t y p e =t o t a1 , s u m F c t =m e a n, o u t t e x t p a t h=" C :/ t e m p / o u t p u t .t x t ", p r o g r a m p a t h=" C : / t e m p / p r o g r a m . R " ): o p t i o n sn o x w a i tx s y n c ト ‑ Rの実行ファイルのパス; 首l e tR e x e p a t h = ' C :平P r o g r a mFi 1 e s 平R 半R ‑ 3 . 2 . 5 半b i n 平i 3 8 6 平R .e x e ' f il e n a m ea a a& p r o g r a m p a t h . d a t a n u l l f il ea a a p u t" 1i b r a r y ( D o s e F i n d i n g ) ": p u t" m o d e l s( ‑M o d s ( 品m o d e l s ., d o s e s = c ( 品d o s e s . ), m a xE ff= 伽l a x E f f . γ, p u t e t .s e e d( 7 77 ) ": ー o p t C o n t r ( m o d e l s, w =c(&aIRatio.))" : p u t" c o n t M a t( n k( fi 1 e = "& o u t t e x t p a t h .づ" p u t i p u t a m p S i z e M C T ( u p p e r N = 品u p p e r N ., 1 o w e r N = &1 o w e r N ., c o n t M a t = c o n t M a t, a1 t M o d e1 s = m o d e1 s," p u t" p o w e r = & p o w e r ., s i郡 l a = & s i郡 l a ., a l p h a = & a l p h a ., a l t e r n a t i v e = " " & a l t e r n a t i v e ." " , p u t可0 1 = 0 . 0 0 1, a I R a t i o = c ( & a I R a t i o . ), N t y p e = " " & N t y p e ." " , v e r b o s e = F A L S E, s u m F c t = & s u m F c t . ) ": p u t inkO" : r u n 、 、 、 、 x" & R e x e p a t h . ‑no‑restore‑no‑save(" & p r o g r a m p a t h . "" x" n o t e p a d" & o u t t e x t p a t h ." " 目 略n e n d プログラム A.6 最適な対比係数を求めるマクロ r%MYCONTRASTJ 伽閣c r oM YI N T R A S T( m o d eI s = % s t r('師a x '' 1i n e a r '' 1i n l o g ' ,以p o n e n t i a l '' q u a d r a t i c '' I o g i s t i c '' b e t a M o d '' s i g E m ax ' ) . p a r a m s = % s t r( 0 .3, . .. , •.• O .7., ー0 . 8 5 O .3O .1 , O .31 .3 ,O .52 .0 ), d o s e s= % s t r( 0 .0 0O .0 5O .2 0O .6 01 .0 0 ), w = % s t r( 1 ) , S = 0 ) p r o ci m l f l a g=0; 略i f& 8 .‑ =0略t h e n弘d o ∞ 目 191
f l a g=1 u s ew o r k . & S r e a da l1i n t oS; cl o s ew o r k .& S . 首e n d m o d e l s =( & m o d e l s . ) p a r a m s =( & p a r a m s . ) w =( & w . ); d o s e s =( & d o s e s . ) s c a l e =1 . 2*m a x ( d o s e s ) o f f =0 . 0 1 *m a x ( d o s e s ) n M o d e1 s=n c o1 ( m o d e1 s ) n D o s e s =n c o1 ( d o s e s ) m u =r e p e a t ( O, n D o s e s, n M o d e l s ) c =r e p e a t ( O, n D o s e s, n M o d e l s ) d oj = 1t on M o d e l s d oi = 1t on D o s e s ]=d o s e s [ i ] / ( p a r a m s [ j,1 ]+ d o s e s [ i ] ) i f( m o d e l s [ j ] = 'e m a x ' ) t h e nm u [ i,j i n e a r ' ) t h e nm u [ i,j ]=d o s e s [ i ] i f( m o d e l s[j]='1 i n l o g ' ) t h e nm u [ i,j ]=l o g ( d o s e s [ i ] + o f f ); i f( m o d e l s[j]='1 i f( m o d e l s [ j ] = ' e x p o n e n t i a l ' )t h e nm u [ i,j ]=e x p ( d o s e s [ i ] / p a r a m s [ j,1 ] )一1; ]=d o s e s [ i ] + p a r a m s [ j,1 ]存( d o s e s[ i ]僻 2 ); i f( m o d e l s [ j ] = ' q u a d r a t i c ' ) t h e nm u [ i,j o g i s t i c ' ) t h e nm u [ i,j ]=1 / ( 1 + e x p ( ( p a r a m s [ j,1 ]‑ d o s e s [ i ] ) / p a r a m s[ j ,2 ] ) ); i f( m o d e l s[j]='l m a x ' ) t h e n i f( m o d e l s [ j ] = ' s i gE ,j ]=d o s e s[ i ] 槻p a r a m s [ j,2 ] / ( ( p a r a m s [ j,1 ]柑 p a r a m s [ j,2 ] ) + ( d o s e s [ i ]彬 p a r a m s[ j ,2 ] ) ); m u[ i i f( m o d e l s [ j ] = ' b e t a M o d ' ) t h e nd o ] + p a r a m s [ j,2 ] )糊 ( p a r釧 s[ j ,1 ] + p a r a m s[ j ,2 ] )/ m a x D e n s=( p a r a m s [ j,1 j ,1 ] 彬p a r a m s[ j ,1 ] ) 非( p a r a m s[ j,2 ]柑 p a r a m s [ j,2 ] ) ); ( ( p a r a m s[ t m p d o s e=d o s e s [ i ] / s c a l e; ] =m a x D e n s 非( t m p d o s e 榊p a r a m s [ j,1])非 ( 1 ‑ t m p d o s e )槻 p a r a m s [ j,2 ]; m u [ i,j e n d e n d e n d i f ( f l ag=1) t h e nS i n v=i n v ( S ) e l s ei f( n c o l ( w ) = 1 )t h e nS i n v=i ( n c o l( d o s e s ) ); e l s e S i n v=i ( n c o l( w ) )伽 d oj = 1t on M o d e l s; a u x =Si n v. [+ ] u x )/ s u m( a u x ); m n =s u m ( m u [ .j ]非 a v a l =S i n v*( m u [ . j ]ー r e p e a t ( m n,n D o s e s,1 ) ) D o s e s,1 ); v a l 2 =v a l ‑r e p e a t ( s u m ( v a l ),n c [,j ]=v a I 2 / s q r t ( s u m ( v a l柑 2 )) e n d M o d e1 s ,1 ); q u 1=r e p e a t(川ぺ n q u 2=r e p e a t( 川 d o s e ", n M o d e l s, 1 ); u 1,c a t x ( ", " t ( 1: n M o d e l s ),t ( m o d e l s ) ) ) t x 1=c a t x ( " ", q … , t x 1,q u 2 ) t x 2=c a t x( x 2, r o w c a t( c h a r( t( c ) )+ "" ) ) t x 3=c a t x ( "ぺ t ] c t r=t x 3[ 1,1 d oi = 2t on M o d e1 s c t r=c t r+, " "+t x 3[ i .1 ] ;e n d ; d o s e s=c h a r ( d o s e s ) o d eI s m a t t r i bcr o w n a m e = d o s e sc o l n a m e司n p ri n tc o p t i o n sn o q u o t e l e n m a x 首g l o b a lc t r; 、t rぺ c t r ) c a1 s y m p u t x( q u i t; 時m e n d 目 192
指数分布に従うデータへの層別ログランク検定の検出力の検討 。小松邦岳(株式会社アスクレップ) (臨床評価研究会基礎解析分科会) Im p a c tofpoweroft h es 回.t i f i e dLog‑Rankt e s tf o rs u r v i v a lda 句 b a s e done x p o n e n t i a ld i s 甘i b u t i o n . Kuni . t a k eKomatsu (ASKLEPI nc . ) Thea s s o c i a t i o nofc l i n i c a le v a l u a t i o n 要旨 層別生存時間解析とは、生存時間解析で比較する群の中に生存関数に違いのある因子が認められた場合、 その因子で層別し個別に生存時間解析を実施、それぞれの結果を併合する手法である。層別を行わなかった 場合に起こる検出力の低下を、層別を行うことにより防ぐことができるが、状況によっては層別を行うこと により逆に検出力が低下してしまう。 この演題は、さまざまな指数分布に従った乱数を用いたシミュレーションによって、層別を行った場合と 行わなかった場合の検出力の違いを示すことを目的とする。 キーワード:層別生存時間解析、層別ログランク検定、検出力 1 はじめに ログランク検定は、症例が不均一ではないことを仮定しており、症例が不均一な場合には検出力が低下す る[1]。症例が不均ーとは予後に影響のある因子、すなわち生存関数に影響を与える因子が症例ごとに異なっ て存在していることである。ある因子が生存関数に影響を与えているとき、その因子で層別を行ったログラ ンク検定により、層聞の生存関数の違いを認めたうえでの解析結果を得ることができ、層別を行わなかった 場合と比べ、検出力の低下を抑止できる [1]。ただし、層聞には治療効果が一様であること、つまり治療効果 と層別因子聞に交互作用がないことが前提となる [2]。ではどのような場合にどの程度検出力は変化するのだ ろうか。 指数分布に従った乱数を用いて作成した生存時間データのパラメータをさまざまに変化させ、層別を行わ ないログランク検定、層別を行ったログランク検定のシミュレーションを実施し、検出力の違いを検討した。 なお、以降本稿中では層別を行わないログランク検定を「単純ログランク検定」、層別を行うログランク検 定を「層別ログランク検定」と呼称する。また、シミュレーションデータは全て 2群 、 2層とした。 193
2層別ログランク検定について 層別ログランク検定の実施方法を以下に紹介する。なお、ログランク検定そのものについてはここでは触れ ない。 2 . 1 層別ログランク検定の計算方法 手順としては、それぞれの層ごとにスコア統計量 uおよびその分散成分 V を求め、それを元にして併合し た統計量 ( x2値)を算出する。併合した統計量は自由度[層の数ー 1 Jのx2分布に従うことを利用し統計的仮 説検定を行う。 層ごとのスコア統計量 u およびその分散成分 V は、層で分割したデータからそれぞれに算出すればよい。 2群の場合の各層における算出方法は以下のとおりである [310 スコア統計量: 的 = 玄 (dij一句) e i j :イベント数の期待値 d i j スコア統計量の分散成分: i j ) n i ( n i‑da n i‑n 〆 民=す ( n i‑1) n i2( J 時点 iにおけるイベント数 n i j :時点 iにおける j群のリスク集合の大きさ n i :時点 iにおける群を併合したリスク集合の大きさ 十 S個の層ごとに算出したスコア統計量 uおよび V から、併合した統計量 ( x2t ) は以下のように求める [2]。 , ~S 、2 I J' ~S 、 X2t=~ム k=l Uk ) HムkJj │X2t:併合した統計量 Uk :層ごとに算出したスコア統計量 u イ │九:層ごとに算出したスコア統計量の分散成分 V X 2t この統計量 ( Jの ) を自由度[層の数・ 1 t乗分布の任意の%点と比較することにより、有意か否かを得 ることができる。 2. 2SASprogram 1 i f e t e s tプロシジャによる層別ログランク検定実施のプログラム例を以下の通り提示する [4][5]。 e t e s tプロシジャによる層別ログランク検定例 SASp r o g r a If m 2 ユ 1:i : : y井:$; i f e t e s td p r o c1 a t a = λ力テ、ータゼ' t i m e 時間変数 打ち切り変執打ち切り{直h l t a層 別 変 数 /g r o u p =群男'f/;変数二 も国 r u n ; 3 シミュレーション方法 3 . 1 概要・手順 指数分布に従った生存時間データの乱数データセットを 4つ生成し、縦結合をした lつのデータセットに ついて単純ログランク検定および層別ログランク検定を実施する。これを繰り返し、検出力の算出および検 討を行う。 4つの乱数データセットは群聞の差、層別の差を考慮しハザードなどのパラメータを変化させる。結合した 乱数データに対して単純ログランク検定と層別ログランク検定を実施し、それぞれの検定結果で有意差の有 194
無を確認する。これを、乱数データセットを変えながら複数回繰り返したときに有意となった割合が検出力 となる。検討のため、検出力の比(単純ログランク検定の検出力÷層別ログランク検定の検出力)も合わせて 算出する。特に断りが無い限りシミュレーションの回数は l万回とした。 なお、データおよびシミュレーションは特定の疾息や状況を仮定していないことを断っておく。 3 . 2 指数分布に従う乱数列の生成方法 指数分布に従う生存時間データを、以下の方法で生成した [1]。 指数分布に従う生存関数はS ( t )=exp[ーλ t ]と表され、これをイベント発現までの期間 tについて解くと以下 の数式が得られる。 l o g ( S ( t ) ) t=一一iL一 ( 式3 . 2 . 1 ) {: 生存時間 S ( t ) :生存関数 λ :ハザード 式 3 ユ 1 に対して、 λ に任意の値、 S(t) に O~l の値をとる一様乱数を与えることにより、指数分布モデルに 従ったシミュレーションデータとなるイベント発現時期 tを得た。 3.3指数分布に従う乱数列の生成方法 (SASプログラム) 乱数列発生の SASプログラム例を以下に示す。このプログラムでは、任意の時点(マクロパラメータ :CNS) 以降は全てその時点で打ち切りとしている。 SASpro 伊m3. 3 :指数分布に従う生存時間シミュレーションデータ作成 SASプログラム例 %macroDATAGEN(LAMBDA= , N= , CNS=); doI=1to&N; ST=r a n d ( " u n i f o r m " ) ; ベ TIME=( ( ‑ 1 ) log(ST)))/(&LAMBDA); CENSOR=O; ittTIME>&CNS)thend o ; CENSOR=I; TIME=&CNS; e n d ; o u t p u t ; e n d ; ‑マクロパラメータ LAMBDA =ハザード (λ) を設定。 N =生成するレコード数を設定。 CNS=打ち切り時点を設定。 %mendDATAGEN; 3.4層別生存時間解析のシミュレーションデータセットの生成方法 指数分布に従う乱数を 4種類生成し、それぞれを群・層とした 1つのデータセットとして縦結合する。基 . 5の通り定め、そこから様々に乱数発生のパラメータを変化させ、それぞれの場 本となるデータセットを 3 合での検出力をシミュレーションにより導出、検討する。 195
3 . 5基本となる乱数データセット 基本となる乱数データセットは以下のように定めた。 層A 層B 群 1 例数:N1 A=75 例数:N1 B=75 ノ、ザード : λ 1 A = 0 . 6 群 2 例数:N2A =75 ハザード : λ 1 B = 0 . 9 例数:N2 B=75 ‑ 2 A=O . 8 4 ハザード:^ ノ、ザード : λ ' 2 B =1 .2 6 観察期間:t=4で打ち切り。 このデータセットは以下のような特徴を持たせている。 ・ ・ 層 A、B による層別ログランク検定の検出力が約 0 . 8となる。(10万回のシミュレーションによ る検出力計算を 1 0回繰り返した結果、検出力の平均±標準偏差は 0 . 8 0 9 2 土0 . 0 0 1 5 0) ・ ・ ・ 群、層において症例数が同数である。 各群に共通で層 A、層 B聞のハザードの比が1.5倍 。 各層に共通で群 l 、群 2聞のハザードの比が1. 4倍 。 このデータセットと同じ分布に従う生存曲線について、 I層あたり 1 0万症例としてシミュレー ションした結果のグラフを、理論曲線に換えて示す(打ち切りはしない)。群ごと、層ごとに 示した。また、二重対数変換したプロットも合わせて示した。 図4 . 1 . 1基本となるデータの生存曲線(群.1l1 J ) 国4 .1 .2基本となるデータの生存曲線:二重対数変換(群別) 2 。 ‑ 2 t = 4で打ち切り 0 . 6 0. 5 0 . 4 0 . 3 0 . 2 0 . 1 0 . 0 0 ‑ 9 ‑ 1 0 ‑ 1 1 2 3 ‑ 1 2 ‑ 1 3 ‑ 1 4 ‑ 1 0 1 2 ‑ 4 ‑ 8 ‑ 6 4 。2 ‑ 2 L o g ( t ) 一 一 群1 一 一 群1 一 ‑ I 抱 ー ー 群2 図4 .1 .3基本となるデータの生存曲線(層別} ︐グ 図4 .1 .4基本となるデータの生存曲線:二重対数変換{層別) d心 / d心f 1 1 avauaunuao A321S 。 /hJ 言4 E2 ︐ ︐ ︐y t = 4で打ち切り ‑ 1 0 4 2 ・ 8 6 同 4 L o g ( t ) 一 一 層A 一 ー 暦B 一 一 層A 196 一 ー 層B ‑ 2 。 2
4 シミュレーション結果 4 . 0シミュレーションを行った検討項目 シミュレーションによって、以下の内容を検討した。 4 .1.症例数の変化に伴う検出力の検討 4ユ観察期間の変化に伴う検出力の検討 4 . 3層聞のハザードの変化に伴う検出力の検討 4. 4. 1 層間の例数がアンバランスな時の検出力の検討(層内ではバランス) 4. 4. 2層間の例数がアンバランスな時の検出力の検討(層内でアンバランス) 4 . 5 .層聞の一様性が仮定できないときの検出力の検討 4 . 1症例数の変化に伴う検出力の検討 l層あたりの症例数を変化させ、検出力の推移を確認した。その際、各群・層の症例数は同数とした。 【データの説明】 層B 層A 群 l 例 数 :N1 A 群2 例 数 :N1 B ノ、ザード : λI A = 0 . 6 ノ、ザード :λIB=0.9 例 数 :N2 A 例 数 :N2 B ハザード:入2A=0.84 ノ、ザード : λ ' 2 B =1 .26 ド 4で打ち切り。 N1 0, 25, 50, 75,100,1 2 5, 150, 200 2 A=N2 B=5,1 A=N1 B=N 【シミュレーション結果と検討】 . 1 . 1に示した。全体の傾向として、例数が増えるほど検出力が向上した。 結果を図 4 症例数が 25~125 の間で層別ログランク検定よりも単純ログランク検定の検出力が低かった。それ以外の症 例数では、検出力が過大 ( 1に近し、)または検出力が過小 ( 0に近い)の場合となり、検出力の違いは確認で きなかった。 このデータでは双方の検出力が桔抗していたため、さらに λIB=1 .2、入2B=1 .68とした場合の検出力について も示す(図 4 . 1 . 2 )。 こちらについても、同様の傾向が見られたが、層別を行った場合と行わない場合の検出力の違いについては . 3 5なのに対し、層別 より顕著となった。 l層あたりの症例数が 25の場合には層別を行った場合の検出力が 0 を行わない検出力は 0. 31であり、検出力の比は 0.87倍と低下している。層別を行った場合の検出力が約 0 . 8 となる I層当たりの症例数が 75の場合でも、層別を行わない検出力は 0.74となり、 0 . 9 2倍となった。 図4 .1 .2症例数の変化による検出力の検討 ( λ 1 8 =1 .2 、λ 2 8 =1 .6 8 ) 図4 .1.1症例数の変化による検出力の検討 1 .0 1 .4 0 . 8 1 .2 宍0 . 6 召 集0 . 4 1 .0 ;:l一一一一---flI'Z竺r==~-j:; 霊 宍 06l一 一 吃 一 法 0 . 8 3 ‑‑‑1トー検出力・層別ログランク F 干 0 . 2 ト百ム向醐ーーー一一品ー検出力 単純ログランク-~ 0 . 6 ‑‑‑ー検出力の比 0 . 0 ・・ ・ ・・ 10. 4 o 25 50 75 100 125 150 175 200 1 群1 層あたりのサンプル数 a E f ‑ ‑ ー ー 司 ーーー‑‑‑‑ーーーー目白‑‑‑‑‑̲ 同 司 ー ー 開 市 町 ‑‑‑1トー検出力層別ログランク 0 . 2 トョ仏ーーーーー 一 一s ‑検出力・単純ログランク 一『炉ー検出力の比 集 召0 . 4 0 . 0 197 o 25 喜 1 .0 と 士 0.83 1 f 0 . 6 0. 4 5 0 7 5 1 0 0 1 2 5 1 5 0 1 7 5 2 0 0 1 層あたりのサンプル数
4 . 2観察期間の変化に伴う検出力の検討 観察期間を変化させ、検出力の推移を確認した。 【データの説明】 層B 層A 群 l 例数:N1 A=75 例数:N1 B=75 ノ、ザード : λ l A = 0 . 6 ノ、ザード : λ l s = 0 . 9 群 2 例数:N2 A=75 例数:N2 B=75 ノ、ザード:^ ‑ 2 A= 0 . 8 4 ノ、ザード:入' 2 B =1 .2 6 観察期間:t =1 , 2 ム4ム6, 7 , 8 , 9 , 1 0で打ち切り。および打ち 切りなし。 【シミュレーション結果と検討】 図4 . 2 . 1観察期間の変化による検出力の検討 l~ 0 . 8 宍 医芳子fUJ 二土日 0 . 6 A クク ・:の ンン 一 フ ‑ フ ググ ロロ 別純 層単比 出出出 検検検 QO カカカ A υ n ︒ 士 一 司 祭 0 . 4 聞が非常に短い場合において検出力が低下する様子が 見られる。観察期間=4以降において、検出力は一定し L2 LO 慾│た E E I 0.8~1 2 層別を行った場合と行わない場合の検出力の比較に I 0 . 6R = ついては、層別を行わないことによる検出力の低下が 見られたが、検出力の比は観察期間の設定を問わず約 Q4 1 結果を図 4 ユlに示した。全体の傾向として、観察期 │ L4 3 4 5 6 7 8 9打ち切りなし I 0 . 9 3倍で一定であった。 観察期間 4 . 3 層間のハザードの変化に伴う検出力の検討 層 Bのハザードを変化させ、検出力の推移を確認した。 【データの説明】 層A 層B 群 l 例数:N1 A=75 例数:N ls=75 ノ、ザード : λ l A = 0 . 6 群 2 例数:N2 A=75 ノ、ザード : λ l B下記 例数:N2 B=75 ノ、ザード:入2 A = 0 . 8 4 ノ、ザード : λ 2 B下記 観察期間:同で打ち切り O.~__.~ __.~__.~ I λ l B, ^ 2 B一λ l A 、^ 2 Aの l倍 , 1 . 1倍,1.2倍,…,1.9倍 ,2 . 0倍 一一一一」 層 Bのハザードを変化した時の層ごとの生存曲線について、 l層あたり 1 0万症例としてシミュレーショ ンした結果のグラフを、理論曲線に換えて図 4. 3. 1および図 4 . 3 . 2に示す。 【シミュレーション結果と検討1 結果を図 4 . 3 . 3に示した。層間のハザードの比が増加するにつれて、単純ログランク検定の検出力は低下し . 8 を維持した。このことより、層間で、のハザードの比が大きくなれ た。一方、層別ログランク検定では約 0 ばなるほど、層別ログランク検定を実施する意義が明確となることが示唆された。 198
図4 . 3 . 2層ごとの生存曲線:二重対数変換 図4 . 3 . 1層ごとの生存曲線 2 0 2 ( ー 宕 4 g p ‑ 6 . . J ( 制 ) 回 伊 ‑ 8 千ー 1 0 。 2 ‑ 1 2 ‑ 1 4 ‑ 1 8 ・ 1 6 ・ 1 4 ・ 1 2 ・ 1 0 ・ 8 ‑ 6 4 3 ‑ 4 ‑ 2 0 2 L o g ( t ) ーー層A 一 一 一 層B : λ B = : 入A xl . l 一一層B:W=λAxl .3 層B :W= 入A xl .5 暦B :W =A A x1 .7 一一層B:W=AAxI .9 ー一層B λB=λ A xl .O ー←一層B :W=λAxl .2 層B :W=λAxl . 4 ー ー 暗A 層B:W=λAxl . l ‑←一層 B :丸B=λAxl .3 一 一 層 B:W=λAxl .5 一一一層 B :W=:λAxl .7 一 一 層B :迎 =λAxl .9 一一層B:W , =λ A xl . 6 .8 一一層B : W = : λ A xl 一一層B : W = λ A x 2 . 0 図4 . 3 . 3層間のハザードの変化による検出力の検討 0 . 8 R 0 . 6 官 一一層B:W= 入A xl . 6 ‑一層B : W = : λ A xl .8 ‑ 一 麿B : W = : λ A x 2 . 0 しかしながら、層間のハザードの比が1.3倍までの lA 1~ 層B :W=λAxl .O 層B :W=AAxI .2 層B :W=λAxl .4 検出力は措抗しており、層間のハザードの違いがわ I1.2 Iずかであれば層別を行うことの意義は低いことも示 ζニ--~~ 1宰 │ 唆された。 ー喰~ ‑ ' ' 1 せ │ また、 xl .O、 xl.lにおける検出力の比はそれぞれ 一 ‑‑ -~ 0 . 8 と│ 一骨ー検出力層別ログランク │ I1 .00337、1 . 0 0 0 6 2となり、ごくわずかではあるが層別 . 6 I ~ ~ー・ ‑‑Eトー検出力.単純ログランク 斗 0 一唾ー検出力の比 I Iを行フ検定の検出力が低下した。 召 集 OA い V.V OA 0 . 0 x1 .0X1 .1 x1 .2x 1 .3 x1 .4x 1 .5x 1 .6 x1 .7x 1 .8 x1 .9x 2 . 0 I ' I . A ) 層間のハザードの比 ( λ B 4. 4. 1 層間の例数がアンバランスな時の検出力の検討(層内で、はバランス) 各群の層 A +層 Bの症例数を 1 5 0から変化させず、層 A層 Bの症例数の割合を変化し、検出力の推移を確 認した。ここでは、群 l群 2それぞれにおける層 A層 Bの症例数の割合は等しく保つ。 【データの説明】 群 1 群2 層A 層B 例 数 :N1 A=下記の通り増加 例数:N1 B=下記の通り減少 ノ、ザード : λ l A = 0 . 6 0 . 9 ノ、ザード . λ 1s= 例数:N2 A=下記の通り増加 例数:N2 B=下記の通り減少 ノ、ザード : λ ' 2 A = 0 . 8 .26 ノ、ザード : λ ' 2 B =1 観察期間:t =4で打ち切り。 (Nl A : Nl B, N2 5 :1 4 5, 5 :1 4 5) , (1 0 :1 4 0, 1 0 :1 4 0 ), ( 2 5 :1 2 5, 2 5 :1 2 5 ), ( 5 0 :1 00, 5 0 :1 0 0 ), A:N 2 B):( ( 7 5 : 7 5, 7 5 : 7 5 ), ( 10 0 : 5 0, 1 0 0 : 5 0 ), ( 1 2 5 : 2 5, 1 2 5 : 2 5 )兵1 4 0 :1 0, 1 4 0 : 10 ), ( 1 4 5 : 5, 1 4 5 : 5 ) 【シミュレーション結果と検討】 結果を図 4.4.1.1に示す。検出力はほぼ一定を保ったが、これは λA:λ2A=λlB:λ2Bと設定しているためと考 えられる。例えば λlA:λ2A<λlB.λ2Bと設定していれば層 Bの例数が多いほど検出力は向上するはずである。 = 1 .4とし、その他は先ほどの検証から変更しないシミュレーションを行 本件についても検討を行うため、 λ 2日 199
った。 シミュレーション結果を図 4. 4 . 1 .2に示す。A.zBを増加したことにより全体的に検出力は向上している。 A . .4とした場合、層 Bの症例数が多い (=N1 =1 Aが少なし、)ほど検出力が高く、層 Bの症例数が少ないほど 2 B 検出力が低くなる傾向となった。単純ログランク検定の検出力と層別ログランク検定の検出力の違いについ ては、全体的に層別ログランク検定の検出力が高い状態を維持したが、層の例数が均等に近いほど検出力の 差は広がった。 図 4.4.1.1サンプル数がアンバランスな時の検出力 1 .0 0.8 1 .4 s=o自主亘書 ト~喝 ーーー一・+ 1 .2 ー ‑ R0 . 6 喜 宍 0.6 0 . 2 0 . 0 一一一一一ーー‑‑‑‑‑‑‑‑一一一一一一 t 0.8~ I ‑‑ー検出力:層別ログランク R = ‑‑‑ーーーーー一寸トー検出力:単純ログランクー+ 0 . 6 一吋F ー検出力の比 0 . 4 。 25 5 0 7 5 1 0 0 N1 Aのサンプノレ数 1 2 5 図4 . 4 . 1 .2サンプル数がアンバランスな時の検出力 ( i . ,B =1 .4 ) 0 . 8 ‑‑ , f i‑‑‑一二一一::,s.=弓=司ー十1. 0 電 餐0 . 4 1 .0 1 .4 1 .2 品 目 『 ド‑ι芯 ーー幽嗣工 ‑ ‑ ‑ ‑ i t e ‑ ‑ ‑ ‑ l a ‑ ‑ t 也 召 集0 . 4 霊 1 .0 法 0.83 F 干 ‑‑‑1トー検出力・層別ログランク . 6 0 . 2 トーーーーーーーーー→トー検出力 単純ログランク・~ 0 l ‑‑‑.tr‑ー検出力の比 │ 0 . 0・ ・ 目 ・ ・ ・ ・ 0 . 4 1 5 0 o 2 5 5 0 7 5 1 0 0 N1 Aのサンプノレ数 1 2 5 1 5 0 4. 4. 2層聞の例数がアンバランスな時の検出力の検討(層内でアンバランス) 各群の層 A+層 Bの症例数を 1 5 0から変化させず、層 A層 Bの症例数の割合を変化し、検出力の推移を確 認した。ここでは、群 lは層 A を徐々に増加、群 2は層 Bを徐々に増加させていく。なお、検出力の違いが 大きく出たため、ここでは検出力の比の算出は行わなかった。 【データの説明】 群l 群2 層A 層B 例数:N1 A=下記の通り増加 例数:N1 B=下記の通り減少 ノ、ザード : λ I A = 0 . 6 ノ、ザード : λ I B = 0 . 9 例数:N2 A=下記の通り減少 例数:N2 B=下記の通り増加 0 . 8 4 . ノ、ザード:A 2 A= ノ、ザード:A . zB=1 .26 観察期間:t ヰで打ち切り。 (NI A : NI B, N2 N2 ):( 5 :1 4 5, 1 4 5 : 5 ), ( 1 0 :1 4 0, 1 4 0 : 1 0 ), ( 2 5 :1 2 5, 1 2 5 : 2 5 ), ( 5 0 : 1 0 0, 1 0 0 : 5 0 ), A: B ( 7 5 : 7 5, 7 5 : 7 5 ), ( 10 0 : 5 0, 5 0 :1 0 0 ), ( 1 2 5 : 2 5, 2 5 : 1 2 5 ), ( 1 4 0 :1 0, 1 0 :1 4 0 ), ( 1 4 5 : 5, 5 : 1 4 5 ) 【シミュレーション結果と検討】 結果を図 4.4ユ 1~こ示す。単純ログランク検定では、 N 1A および N2B が増加するほど検出力が向上した。これ は λIA:λ2B>λ2A:λIBのため、 λAI と λ2Bの症例数が増えるほど群聞でのハザードの比が大きくなり、検出 力が向上したためと思われる。対して層別ログランク検定では、層 A、層 B ごとに統計量を算出するため、 例数がアンバランスな状態での統計量算出となってしまい、検出力低下を招いた [1]。 症例数のアンバランスが l層のみ発生する場合でも検討した。 NIA=NIB=N2B=75 で固定し、 N2 Aのみ { 5, 1 0, 2 5, 50, 7 5, 1 2 5, 1 4 0, 1 4 5 }と変化させた。シミュレーション結果を図 4. 4. 2 . 2に示す。 A . z A<λ2Bのため、単純ロ グランク検定では N2 Aが多いほ Aが少ないほどハザードに群間差が生じることとなり検出力が高い。逆に N2 200
どハザードに群間差は小さくなるため検出力は減少した。 一方、層別ログランク検定では、層 Aのアンバランスおよび例数過小のため、 N2Aが少数の時に検出力が低 下した。その後、 N2Aの増加に合わせて検出力は向上した。 . 4 . 2 . 1層聞の例数がアンバランスな時の検出力 図4 1 .0 図4 . 4 . 2 . 2層聞の例数がアンバランスな時の検出力 ( N . .のみ変化) 1 .0 0 . 8 0 . 8 宍0 . 6 宍0 . 6 召 集0 . 4 召 集0 . 4 ←ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー ‑‑‑1トー検出力:層別ログランク一、ー 0 . 2 0 . 0 。 ‑‑‑Dーー検出力:単純ログランク 25 50 75 100 NlA層あたりのサンプル数 125 150 0 . 2 トーーー‑‑‑‑‑̲. ‑一一検出力・層別ログランクーー ‑‑‑Dー検出力:単純ログランク 0 . 0 25 50 75 100 125 150 N2A層あたりのサンプル数 。 4 . 5層間の一様性が仮定できないときの検出力の検討 生存時間データを層別するにあたって、層間で治療効果が一様(同じ)であることが求められる叱ここで は層間の治療効果の一様性が仮定できないデータでの検出力について検討する。なお、治療効果が一様でな いとは、層別因子と治療との聞に交E作用があるということであり、この場合は交互作用について検討する 必要がある。 層間の一様性を検定するプログラム以下の通り提示する [6J。本稿では、 phregプロシジャを用い、層聞の交互作 用について検定を行った。 SASprogram4 ふ 1:p h r e gプロシジャによる層間の一様性を検定プログラム例 procphregdata=λカデータ 7 : ? : y件多; t 九おも群' g f j 変数層部変数 I r ef = f i r s tparam=ref; mode 九時掲変動打ち切り変数民打ち切り甑=翻波数 ltype3(sc 闘い 群別変按層別変数 Ir も国l t a 層別変数二 τun; 【データの説明】 乱数データをそれぞれ 1 0万通り作成、それぞれに層間の一様性の検定を実施し、有意 ( p < 0 . 0 5 ) となった データのみを対象として単純ログランク検定および層別ログランク検定を行い、検出力を算出・検討した。 なお、層聞の一様性の検定で優位になったということは、一様性があるとは言えないということである。 .2、九'28= 1 .68とした結 4 . 1で示したデータと同様の乱数を使用して検討を行った。また、 4.1と同様、 λ18= 1 果も示す。 10万通りのデータ中、層間の一様性の検定で有意となったデータセット数を表 4 . 5に示した。 【シミュレーション結果と検討】 結果を図 4ふ lおよび図 4. 5. 2に示す。全体的な推移は図 4 .1.1および図 4 .1 .2と同様である。しかし、図 4 . 5 . 1 では l層あたりの例数が 50症例未満の場合において、単純ログランク検定の検出力が層別ログランク検定の 検出力を上回り、逆に層の例数が 50症例以上の場合においては層別ログランク検定の検出力が単純ログラン 201
ク検定を上回っていた。図 4.5.2では 25症例以上にて層別ログランク検定の検出力が単純ログランク検定の
検出力を上回っており、図 4
.
5
.
1の場合と比べてより少ない症例数が閥値となった。このことより、層間の一
様性の検定で有意となった場合も、層聞のハザードの差が大きいほど、また症例数が多いほど層別ログラン
ク検定の検出力が単純ログランクを上回ることが示唆された。なお、検出力が上回っていたとしても、交互
作用に関する検討を放棄してよい理由にはならないと考えている。交E作用が認められた場合は、検出力と
は全く別件として、交互作用に関する検討を行うべきと考える。
<表 4
.
5 一様性の検定で有意となったデータセット数>
層あたり
有意になったデータセット数
層あたり
有意になったデータセット数
の例数
λ
1
.
;
(
)
.
9、
1
.
.
.
=1
.2
6 λ
.2
、
1
.
.
.
=1
.6
8
1
.
=1
2
2
の例数
λ
1
8
=
0
.
9、λ
.
2
.
=1
.2
6 λ
1
.
=1
.2、
λ
.
2
.
=1
.6
8
5
7,
9
4
3
7,
9
4
1
1
0
0
0
7
9
5,
5,
0
8
9
1
0
6
0
5
6,
6,
6
0
2
1
2
5
2
0
3
5,
5,
2
0
8
2
5
7
2
6
5,
5
,
7
2
5
1
5
0
0
8
2
5,
5,
0
8
9
5
0
5,
3
0
0
5
,
3
0
9
2
0
0
4,
9
6
1
4,
9
8
8
7
5
,
1
3
3
5
5,
1
3
6
図4
.
5
.
1層間の一様性が仮定できないときの検出力
(症例数の変化)
1
.0 ・
一ー=一一一←二1.4
1
.0
0
.
8
1
.2
0
.
8
‑
R0.6
1
.0
図4
.
5
.
2症例数の変化による検出力の検討
(
λ
1
8
=1
.2、h坦=1
.6
8
)
1
.4
1
.2
霊 ‑R0.6
召
法
集 0
.
4
083
霊
1
.0
法
召
集0
.
4
‑‑‑トー検出力:層別ログランク
‑‑11‑ー検出カ.層別ログランク
083
f
‑一一ー一一世‑‑検出力・単純ログランク四‑l 0.6
0
.
2 トr
0
.
2 ト‑./ー"ー凶ーーー幽‑‑eトー検出力:単純ログランク.‑
1 0.6
一寸r‑‑検出力の比
一‑.!r‑ー検出力の比
0
.
0
o
0.
4
25
50
75
0
.
0
100 125 150 175 200
1層あたりのサンプル数
o
0.
4
25
50
75
100 125 150 175 200
1層あたりのサンプル数
5 まとめ
本稿ではシミュレーションにより、以下の内容が示唆された。
・多くの場合、層間のハザードの差が大きいとき、層別ログランク検定を行うことにより検出力の低下
を抑制する
0
・症例数のアンバランスが生じた場合や、層間の一様性が仮定できない場合において、層別ログランク
検定を行うとかえって検出力が低下する場合がある。
・層別ログランク検定を行うにあたっては、症例数が均一であることや、特に例数や層間のハザードの
比が小さいときにおいては層間の一様性に留意する必要があることが示された。
最後に、本稿で示したシミュレーションデータが今後のシミュレーション実験や症例数設計の際に役立て
ば幸いである。
202
参考文献 凹赤津宏平・柳川霧著.サパイパルデータの解析一生存時間とイベントヒストリデーター.近代科学社 [ 2 ]大橋靖雄・浜田知久馬著.生存時閥解析 SASによる生物統計.東京大学出版会 β]監修/浜田知久馬,執筆ソ臨床評価研究会 ( A ' 但)基礎解析分科会.実用 SAS生物統計ハンドブック [SAS8.2 および SAS9.1対応].サイエンテイスト社 [ 4 ]張方紅. SASによる生存時間解析の実務. SASユーザー総会論文集 2012167 ・1 8 4 [ 5 ]SASI n s t i t u t eI n c . SAS/STAT(R)9 . 2U s e r 匂G u i d e, S e c o n dE d i t i o n, TheLIFETESTP r o c e d u r e . 仕o : / / s u o o o 氏s a s . c om! d o c u r n e n t a t i o n / c d l l 釘 J ! s t a t ul l : /63033IHTMUdefaul t 1 v i e w e r . h t m # l i f e t e s tt o c . h t m h [ 6 ] 浜田知久馬・中西豊支・松岡伸篤. SASV9の TPHREGを用いたメタアナリシス. SASユーザー総会論 9 1 文集 2004165・1 203
PPK 解析時の潜在的なデータ不備が推定値に与える影響の検討 0川崎勝己、碇新里、新城博子 (株式会社ベル・メデイカルソリューションズ) 【背景・目的 1 2015年 1 2月に母集団薬物動態・薬力学解析ガイドライン(案)が発出され、母集団薬物動態 (PPK) 解析は、今後の承認申請時又は添付文書への情報提供における活用について大きな期待が寄せられ ている。それに伴いPPK 解析に用いる入力データの品質の高さが求められている。 PPK 解析用データセットは、複雑なデータハンドリングを伴うことが多く、 SASのプログラミン グを用いてデータ加工をすることが標準的と思われる。解析対象として、 1 0 試験以上の複数試験の データベースを統合し作成することも少なくない。対象となる試験の中には過去に実施されたレガ シーな試験も含まれている場合もあり、さらに海外試験となる場合、データベース構造が標準化さ れていない、データベース定義書が十分に揃っていない等といったデータ加工に様々なハードルが 存在する場面にぶつかることもある。複雑なデータベース構造から必要な情報を取得するため、イ 解析用データセットを作成することも多く、データ上からは検 レギュラーな処理を施しながら PPK 出しにくい不備が存在する可能性を否定できないことがある。また、服薬アドヒアランスや食事の 時聞が明らかとならない、データベースの設計上の不備が存在することもある。本検討では、その ような不備を「潜在的なデータ不備j とし、意図的にデータ不備を内包したデータセットをシミュ レーションによって作成し、母集団推定値にどのような影響を与えるのか検討した。 【方法】 シミュレーションの設定として、薬剤情報は 1日1回、投与量30mgめ経口投与製剤で、あり、 PPK 解析のモデノレは 1 次吸収過程のある 1 ‑コンパートメントモデルとした。薬物動態パラメータとして 全身クリアランスが 10L/h、分布容積が200L、吸収速度定数カ~ 1 .5/hとなるシミュレーション濃度デ ータを発生させた。シミュレーションは、 I 症例につき 5点の採血ポイントの血中濃度を 40症例分 1000セット発生させた。また、潜在的なデータ不備は以下の3ケースを想定した。初回投与時の採 C a s e1)、定常状態時の採血データを初回投与時の採血 血データを定常状態時の採血とした場合 ( とした場合 ( C a s e2 ) 、Case1とCase2を同じ割合で混在させた場合 ( C a s e3 ) の3つのケースで、各 ケースともに不備の割合を変えた (0%、10%、20%、30%、40%とした5パターン)データを作成し、 それぞれのパターンで 1000回ずつPPK 解析を実施することにより、薬物動態パラメータの推定値及 びその個体間変動に与える影響を検討した。 [結果 I Case 1 及びCase2では、潜在的なデータ不備の割合を高めることにより、各薬物動態パラメータ の推定値に一定の傾向を伴ったバイアスが見られたが、 Case3では推定値に大きな偏りは見られな かった。また、全てのケースでパラメータの個体間変動に傾向を持ったバイアスが見られた。 以上のことから、 PPK 解析用データセットに潜在的なデータ不備がある場合、 PPK 解析で得られ た推定値には、何らかのバイアスが含まれる可能性があることをシミュレーションにより示した。 今回は、単純な構造モデ、ルを用いたシミュレーションであったが、潜在的なデータ不備を抽出する 効果的な診断方法の検討を今後の課題としたい。 204
ポアソン分布に従うと仮定された総ケース数が 固定された条件の下で、の r a t er a t i oの条件付き信頼区間 伊藤要二 (アストラゼ、ネカ株式会社バイオメトリックス部) C o n f i d e n c ei n t e r v a lo fr a t er a t i oc o n d i t i o n i n gon t h et o t a lnumberofc a s e swhichf o l l o w saP o i s s o nd i s t r i b u t i o n t oh Y o h j iI A s t r aZ e n e c aK .K . B i o m e t r i c sD e p a r t m e n t, 要旨 2つの処理の比較試験においてケースの数が P o i s s o n分布に従うと仮定した場合の、両処理の総ケ ース数が固定された条件の下での r a t er a t i oの e x a c tな条件付きの信頼区間を紹介し、それを SASで 計算する方法について示す。また、それに対応する統計的検定やサンプルサイズ、計算の方法につい ても解説する。これらの方法は SASではサポートされていないが、 SASの関数を用いて容易に計 算できることを示す。さらに、この e x a c tな条件付き信頼区聞を修正することにより、それとは異 なる r a t er a t i oの信頼区間を提案し、被覆確率について比較評価を行い、他の方法に比べてその方法 が優れていることを示す。 キーワード:例数設計、 C l o p p e r ‑ P e a r s o n信頼区間、 W i l s o nスコア信頼区間、被覆確率 1.序文 臨床試験やコホート調査においては、観察された人・年 ( p e r s o n ‑ y e a r s )に対して、注目するイベン トの発現したケースの数の比を e v e n tr a t eとし、その比である r a t er a t i oを用いて群間比較を行うこ v e n tr a t eが時点によらず一定であるとし、う前提が成り立つ場合には、 とがしばしばある。その際に、 e o i s s o n分布に従うという仮定を置き、その仮定の下に群間比較のための統計的推測 ケースの数は P a t er a t i oの信頼区間の計算方法としてよく用いられる方法の 1っと がなされる。そのような場合の r して、総ケース数が与えられたという条件の下での r a t er a t i oの e x a c tな条件付き信頼区聞がある。 a t er a t i oの e x a c tな条件付き信頼区間について紹介し、それを SASを用い 本論文の目的は、この r てどのように計算するかを示すことである。さらに、それに対応する統計的検定、またそのための 205
サンプルサイズ、の計算方法についても紹介する。また、最後に、この e x a c tな条件付き信頼区間を 修正し、より優れていると考えられる方法を提案し、他の方法との比較評価を行う。 2 .R a t er a t i oの e x a c tな条件付き信頼区間 表 lに示したような 2群比較の臨床試験を想定し、人・年(Y J及び Y 2 )が観察され、対象となる C イベントが発現した被験者、すなわち「ケース」の例数 ( 2) が得られるものとする。また、 J及び C 各群における年当たりイベントの発現率の真値がん及び Aであると仮定する。 表1. 2群比較臨床試験における想定 群 観察された 人・年 ケース数 年当たりの 発現率の真値 期待 ケース数 群 1(試験群) Y J CJ ム ~YJ 群 2( 対照群) Y 2 C2 ん ~Y2 Y t o t a J= Y J+Y 2 Ct +C 側 =C J 2 計 ム九 +~Y2 各群のケース数は発現率~及びんの Poisson 分布に従うものと仮定すると、各群のケース数が CJ 及び C2である確率は CJ! . .EJ 一(~Y2y2e-仙 P(C 2 =c21~) 一 ︑ ・ , ︑ l ' s (~YJY'e-A,y, P(C=c, I~) 一 一一一ーで一 , C2! と表される。ここで両群のケース数の総和 C蜘 I=C C,剛の 凶 = J+C 2が与えられたものとみなし、 C t o 条件下での C Jの条件付き分布を導くと、 t o t a J( = ( i ~Y, P ( C, =C]ICt Ct醐 ,,~,~)ー 1 C. u ̲ . 1^ ‑ ‑ , ‑ '~ o t a l= r (1-~ム-1 11 1 • ‑ ‑ , ‑ '~ 1叫 lc, Jl λ尚 +~Y2) l ~Y] +~Y2) I ( 2 ) が得られる ( P r 可b o r o w s k i&W i l e n s k i,1940)。式(2) はまさに成功確率 ~YJ /(~YI +~Y2) 、試行回数 C何 回lの二項分布となっている。このように、 2つの P o i s s o n分布の総ケース数が固定された場合に各 群のケース数の条件付き分布が二項分布になるという点がこの方法論の重要な部分であるが、ここ での冗長な数式の展開を避けるために、その誘導については付録に記した。 2 )の二項分布における成功確率を 式( p , =. ~y, , ~y, +~Y2 と表すこととする。この P Jについて実際のデータから推定される値をムと表すとすると、。l は C, p, =一一ー‑ , +c2 C として得られる。これより次式が導かれる。 206
s ̲̲̲ ̲ ̲ l ! j 1‑p , ( 3 ) C2 , /, ところで、 R a t er a t i oの推定値は、各群の e v e n tr a t e、 c y及 び C2/Y2の比として、次式によって 得られる。 F Cl /Yl Y2Cl =ー=一・‑ c 2/Y2 y c 2 , この式の最後の c , / c 3 )を代入して、 r a t er a t i o推定値は 2の部分に式( r =主主̲̲fi̲ ( 4 ) y,l ‑p , と変形することができる。 ここで、確率引のなんらかの信頼区間が得られれば、その信頼限界を式 ( 4 )のムに代入すること ♂e a r s o n信頼区間(二 により、 r a t er a t i oの信頼区聞を計算することができる。例えば、ここで C l o p p e r 項分布に基づく e x a c tな信頼区間)を用いることにより、 r a t er a t i oの e x a c tな信頼区聞を得ることが , l o p p e r ‑ P e a r s o nの信頼限界は できる。 F分布を用いて pの C ( c, + l )F ; ̲ α1 2( 2 c, +2, 2c2) c, ^ F ; (2c2+2, 2c, )' p, . c P . u P r c+ c, + I )F ;ーα12(2c, +2, 2c2) 2 ( , ム p ' . C P . ' o w e r‑ c + (c2+1 ) 戸 で与えられる。ここで、 F ; ‑ α12(m , n )は自由度 m, nの F分布の( 1 ‑aJ 2 ) xl OO%点を表す。この信頼限界 を式 ( 4 )の Aに代入して、下記のような rateratioの exactな信頼区間を得る: .~ V. ‑ .~ Y 2 p'.CP.upper Y 2 p'.CP.'ower ・^ ,一 u p p e r ‑ y ,11‑ P, . C p . u p p e r y,1‑ p'.CP.'ower ̲ . ̲ ̲ ̲ ̲ ̲ ̲ 勺ow 町 一 ~ ( B r e s l o w& Day ,1987,S e c t i o n3, 4 .p . 9 5 ) 3 . R a t er a t i oの e x a c tな条件付き信頼区間のための数値例及び SASプログラム 下の表 2の数値例を用いて r a t er a t i oの e x a c tな条件付き信頼区間を求める。この数値例では、観 :1であることを想定している。 察された人・年は群 lが群 2の約 2倍となっており、割付け比が 2 表 2 数値例 群 観察された 人・年 観察された ケース数 群l y , =720.2 c , =8 群2 Y 2=3 6 2 . 5 c 1 2=1 この数値例を用いて r a t er a t i oの e x a c tな条件付き信頼区間を計算するための SASプログラムをプロ グラム lに示す。ここで変数 cplower及 び cpupperは C l o p p e r ‑ P e a r s o n信頼区間の信頼限界を表す。 なお、 C l o p p e r ‑ P e a r s o n信頼区間は FREQプロシジャでも計算可能であるが、ここではプログラムを 簡潔にするために、データステップにおいて FINV関数を用いて計算している。 207
プログラム 1 . R a t er a t i oの e x a c tな信頼区間の計算のための SASプログラム及びその出力 d a t ae x m p l ; i n p u ty 1c 1y 2c 2 ; d a t aIi n e s ; 7 2 0 . 2 83 6 2 . 5 1 1 r u n ; d a t ae x 1 ; s e te x m p l ; p 1 = c1 /( c 1 + c 2 ); c p l o w e r = c 1 / ( c 1 + ( c 2 + 1 ) * f i n v ( 0 . 9 7 5,2 * c 2 + 2,2 * c 1 ) ); * c 1 + 2,2 * c 2 ) / ( c 2 + ( c 1 + 1 )本f i n v ( 0 . 9 7 5,2 * c 1 + 2,2 * c 2 ) ); c p u p p e r = ( c 1 + 1 ) * f i n v ( 0 . 9 7 5,2 / ( l ‑ p1 ); r r = y 2 / y 1叩 l l o w e r = y 2 / y 1寧c p l o w e r / ( l ‑ c p l o w e r ); u p p e r = y 2 / y 1 * c p u p p e r / ( 1 ‑ c p u p p e r ); k e e pr rl o w e ru p p e r : r u n ; p r o cp r i n tn o o b s ; r u n ; 出力 r r 0 . 3 6 6 0 6 l o w e r 0 . 1 2 7 8 2 u p p e r 0 . 9 9 9 1 6 この数値例における r a t er a t i oの両側 95% 信頼区間の上限は 0 . 9 9 9 1 6であり、 Iをぎりぎり下回って 水準でかろうじて有意に優れていることを示している。 おり、群 2に比べて群 2が 5% 4 .総ケース数が与えられた条件の下での exactな検定 次に、この e x a c tな条件付き信頼区間に対応する統計的検定を考える。 帰無仮説 Ho: ム=もの下での群 l のケース数の条件付き分布は、式(2) に~=んを代入することに よって得られ、次のような次の二項分布となる。 ( i r r l ‑ ‑r Y 1 ̲~ ¥ ‑ 1C叫 ̲ ̲̲ 1111̲̲/ ‑ P(C 1Y ̲1 / ̲11 1=cllCt 制 =c刷 , Ho: 人=~)一 1 'U~ 1 ¥ . . C1 ) ¥ Y I+Y2) . ¥ Y J+Y2) 岨 1 ( 5 ) これに基づいて帰無仮説 H o:ム=みに対するこ項検定 ( b i n o m i a lt e s t )を構築することができる。その ためには、帰無仮説の下で、実際に観測された CJないしそれよりも極端な値を得る確率を合計すれば 5 )の二項分布の CJまでの累積分布を用いて片側 p値を計算することができる よく、この場合は、式( ( C h a n&B o h i d a r ,1 9 9 8 ) 。すなわち、 値 = 計 ) ( 百 七 日1 ‑ I t ) C M K 片側J p 208
前出の数値例を用いて二項検定を行うための SASプログラムをプログラム 2に示す。といって も、これはプログラムと言うほどのものではなく、本質的な部分は二項分布の累積分布関数である i C D F ( ' B I N O M I A L ', c 1,y1/(y1+y2), c1+c2)Jだけであり、これにより片側 p値 one̲sided̲pを計算し ている。このように、たったの 1行で p値を計算できてしまうのは興味深い。 . 二項検定のための SASプログラム及びその出力 プログラム 2 data e x 2 ; set exmpl; ̲ p=CDF('BINOMIAL',cl,yl/(yl+y2),cl+c2); one̲sided keep one̲sided̲p; r u n ; proc print n o o b s ; r u n, 斗一 oa B‑ 一n 一 Juno‑ 凋斗一 e 一 jqnt :lnu‑ eo‑‑ ‑nu 力一隅一 出﹁H│L この数値例における片側 p値は 0 . 0 2 4 8 9 4であり、片側 2.5% 水準でぎりぎりで有意差があることを 示している。このことは、上で求めた 95% 信頼区間の上限 0 . 9 9 9 1 6がぎりぎり 1を下回っていたこ とと対応している。 5 . 検出力及びサンプルサイズ計算 これまでと同様、ケース数は P o i s s o n分布に従うと仮定し、 2群の総ケース数が与えられた条件 の下での統計的検定を考える。その際の条件設定を表 3にまとめている。 表3 . サンプルサイズ計算のための臨床試験の想定 帰無仮説 Ho:~ =ゐ= λ 対立仮説 Hl:~ =r~ の下で の下で 割付け 被験者数 人・年 群l nl=伽2 苅=ゆn t 2 ム t λYl=λ伽2 。 / 期待ケース数 群2 n 2 Y 2=~t ι /( 1+ゆ) λY 2=λn t 1 2 ~Y2 = え2~t 言 十 n (1+仰向 t o 1= ( 1 +砂) n t 2 ( 1 + 砂λ )n t 2 (1+俳)~ni 群 回 発現率 期待ケース数 割合* (1+ゆ) ~Yl =r~Øn2t 割合* O r/(1+併) 1 1( 1+ or) o :割付け比 , r:rateratio, t:追跡期間(全ての被験者で等しいと仮定) *:総ケース数に対して各群のケース数が占める割合を示す。 群 1の群 2に対する割付け比をゆ、全ての被験者の追跡期間が tであるとした場合、表 3に示す ように、帰無仮説 Ho:~ =んの下では、総ケース数に対して群 lのケース数が占める割合は砂/( 1+砂) 209
となるものと期待され、よって、総ケース数が与えられた条件の下では、群 lのケース数 C1は確率
(
1
+仰の二項布分に従うと想定される。一方、対立仮説 H1:,
A =r~ (
rは r
a
t
er
a
t
i
oを表す)の下
砂/
では、総ケース数に対して群 Iのケース数が占める割合は ψ/(1+俳)となるものと期待され、よっ
て
、 C1は確率。'
Y
!(I+俳)の二項分布に従うと想定される。これらをまとめると次のようになる。
Vo
oi
̲
1c,印刷 1一一 Y
'
(
,1一一一│
帰無仮説 H
o:
,
A =みの下: P(C
c
l
lC
,
削=
c
刷
,
Ho:ム=ゐ)一 1<0<811
11
1=
~ c
¥)+oJ ~ 1+ゆj
1)
剛
y
'
1
1
c
'
o
同I
I
(o
( Or Y
'
叫
ー,
r ,
1
対立仮説 H1:
,
A =r
もの下: P(C
c
J
IC, 凶J
=C,剛 , HJ: ム =r~) =
1 .U~. 1
1一 一 11
一一一│
J=
~ c
¥1+Or) ~ 1十
件r)
1 )
C
これら 2つの式の右辺の違いは r
a
t
er
a
t
i
oの rが入っているか、いなし、かだけである。これらに基づ
き、下記に示すようにサンプルサイズの計算を行うことができる (
C
h
a
n& B
o
h
i
d
a
r
,1
9
9
8
)
。
まず、片側検定を考え、第 1種の過誤の確率が α/2以下となるようにするために、帰無仮説
Ho:
,
A =みの下で群 1 のケース数が CJ以下である確率が α /2以下となるような CJの最大値を求め、
それを c
r
i
t
i
c
a
lv
a
l
u
e(
Cv)とする。それは C
'
o
t
a
J
'こ依存するため、
LI
十'1
c
'
o
凶I( oY
,
(一一一│
oy‑k 壬~ α̲̲/'"2,c
̲ ̲ (
{
¥,
.
1
I) 1
_<~taJ 1一 一 I11
,E {
0
,
1
,
2,
…
}
ト
…
1
"
"
,
,
Cv(
C
t
n
t
a
l)
=m皿 ~C,
v
,
Cv(Co
凶)と記すこととすると、
│ │合点 k )¥l+OJ ~
1+利
.• .
'
I
検出力は、対立仮説 HJ:
,
A =r~ の下での二項分布の Cv までの累積分布
= 宮(C,~~
Power(c
,
o
t
a
l
)
)
(
剖(
l
‑
f
i
j
M
‑
k
によって計算できる。必要な総ケース数は、上式の検出力が 1
‑
β 以上になるような c
加 担Iの中から最
小値を選べばよい。すなわち、
仏 =rnin{ωω叫 注 1‑β, ぃ 仰
この必要な総ケース数
J
}
c
L
lを得るために必要な割付け被験者数 n
L
lは、表 3 の最下行にある
(1+俳)~ni と cいとが等しいと置くことから導かれる次式により求めることができる。
d.=(l+
‑ 併)C~凶
'
o
t
a
l (
1+O
r)~t
このサンプルサイズ計算のための SASプログラムをプログラム 3に示す。ここでは、割付け比
(
a
l
l
o
c
r
a
t
i
o
)を 2、凶er
a
t
i
o(
r
r
)を 2、対照群における l年当たりのイベント発現率 (
e
v
e
n
t
r
a
t
e
2
)を
0
.
0
6、追跡期間 (
t
)を一律に l年、片側有意水準を 2.5%、検出力 90%と設定している。 8行自の DO
/レープでは、検出力 (
p
o
w
e
r
)が 90%を超えるまで(その条件判定に UNTIL句を使用)総ケース数
(
c
t
o
t
a
l
)を lずつ増加させている。 9行目の DOループで、は(ループの中味は空で、あるが)、帰無仮説
の下での第 1種の過誤の確率が α/2=0.025を超えるまで群 1のケース数 (
c
1
)を lずつ増加させてゆ
き、次に、 1
1行目で 1を号│し、て c
r
i
t
i
c
a
lv
a
l
u
e(
c
v
)としている。 1
2行目では、対立仮説の下でのこ項
vまでの累積分布関数を計算し、検出力としている。 1
4行目では、計算された必要な総ケ
分布の c
c
t
o
t
a1
)から、必要な被験者数 (
n
t
o
t
a1
)を計算している。
ース数 (
210
プログラム 3 . サンプルサイズ計算のための SASプログラム及びその出力 d a t ae x 3 : 2 a l l o c r a t i o = 2 : 3 r r = O . 3 : 4 e v e n t r a t e 2 = O . 0 6 : 5 t = l : 6 p 1 ̲ O = a l l o c r a t i o / ( 1 + a ll o c r a t i o ) : 7 p 1 ̲ 1 = a l l o c r a t i o 牢r r / ( l + a ll o c r a t i o * r r ): 8 d oc t o t a l = lt o9 9 9u n t iI ( p o w e r ) O . 9 ) : 9 d oc 1 = Ot oc t o t a lu n t iI ( C D F ( ' B I N O M I A L ',c 1,p 1 ̲ O,c t o t a l ) ) O . 0 2 5 ) : 1 0 e n d : 1 1 c v = c 1 ‑ 1: 1 2 p o 岬e r = C D F ( ' B I N O M I A L ',c v,p 1 ̲ 1,c t o t a l ) : 1 3 e n d : 1 4 n t o t a l = c e iI ( ( l + a l1 0 c r a t i o ) * c t o t a l / ( 1 + a ll o c r a t i o 申r r ) / e v e n t r a t e 2 / t ): 1 5 k e e pc vn t o t a lc t o t a lp o w e r : 1 6 r u n : 1 7 1 8p r o cp r i n tn o o b s : 1 9 r u n : ︐‑ aan nH 4Lqu nwnU +L41 作 ・ FU4E nHV 内︐﹄ u v n u v VE enud w 2 n u 0nB n v a M 内 内 4L d ・0 d l 4J‑‑+L 一 ︐ 一 G 出 ﹁ 6 . Wi 1s o nスコア信頼区間を用いた則er a t i oの信頼区間の提案 割合の信頼区間として C l o 仰e r ‑ P e a r s o n信頼区間は保守的であり、それに比べ、平均的な被覆確率 ( c o v e r a g ep r o b a b i l i t y )がより名義的信頼水準に近いとし、う意味で、 W i l s o nスコア信頼区間の方が優 ewcombe( 1 9 9 8 )及び A g r e s t i& C o u l( 1 9 9 8 )によって示されている。このことから、 れていることが N l o p p e r ‑ P e a r s o n信頼区間ではなく、代りに W i l s o nスコア信頼区聞を用 割合同の信頼区間として、 C a t i oの信頼区聞が得られるものと考えられる。 いることにより、より優れた m句 r W i l s o nスコア信頼区間の下限及び上限は ι 台' 1 .W i l s o n ,l o w e r 'P I, Wi 胤抑=(2ctoaIPI+心 2土ZI‑aI2, J 1 2+ 4 c ,叫 PI(I‑PI))/2 ( 句 + ι/2) で与えられる。ここで Z I ̲ a / 2は標準正規分布の ( 1 ‑a/2 ) x l 0 0 %点を表す。これら信頼限界を式( 4 )の Aに a t er a t i oの信頼限界を得る。 代入し、次のような新たな r 全 F Y 2 一一・ 'W iI由民1 0 川 崎 一 ^ P I, W i l s o n ,l o w 町 三 , Y I l‑PI川 出n, 1 側冒 ^ Y 2 竺一一・ "WihonAPRTー F A P I川 iso,nupper 1 ~ Y I l‑PI川 l 印 刷 酔T この信頼区間を計算するための SASプログラムをプログラム 4に示す。これはプログラム 1の C l o p p e r ‑ P e a r s o n信頼区間の部分を W i l s o nスコア信頼区間で置き換えただけのものである。 211
プログラム 4 .W i l s o nスコア信頼区聞を用いたRa t er a t i oの信頼区間のための SASプログラム d a t ae x 4 ; s e te x m p1; p1=01/( 0 1 + 0 2 ); o t o t a l = 0 1 + 0 2 ; z = p r o b i t ( 0 . 9 7 5 ); 柵 r =位向t o t a l叩 1 + z 林 2 ‑ z * s q r t ( z * * 2 + 4 柁 t otal*p1*(1‑p1)))/2/(ototal+z 紳 2 ); w iI s o n l o w i1 s o n u p p e r =( 2 * o t o t a1 叩1 + z本* 2 + z * s q r t ( z * * 2 + 4 * o t o t a l * p 1 * ( 1 ‑ p 1 ) ) ) / 2 / ( o t o t a l + z本* 2 ); r r = y 2 / y 1叩1j( 1 ‑ p1 ) ; 1 0 明e r = y 2 / y 1キw iI s o n l o w e r / ( 1 ‑ w iI s o n l o w e r ) ; u p p e r = y 2 / y 1 * w iI s o n u p p e r / ( 1 ‑ w iI s o n u p p e r ); k e e pr r1 0 明e ru p p e r ; r u n ; p r o op r i n tn o o b s : r u n . 出力 r r 0.36606 l o w e r 0 . 1 5 1 5 5 u p p e r 0.88418 予想通り、 W i l s o nスコア信頼区聞を用いた場合のほうが、より保守的と考えられる C l o p p e r ‑ P e a r s o n 信頼区間を用いた場合よりも r a t er a t i oの信頼区間の幅が狭くなっている。 x a c tな信頼区間と比較評価するために、モンテカル この新たに提案した信頼区間の被覆確率を e n c o n d i t i o n a lな信頼区間と ロ・シミュレーションを行った。その際の参考とするために、漸近的な u も比較をおこなった。その信頼区間は 1 . (C1/YlI . 1 1 1 e X P llOg lーァー│土 Zト 1 2 . 1一 + 一 │ 1 . ¥c Y 2) Vc 2I 1 c 2 1 で与えられる(例えば、 Rothman& G r e e n l a n d, 2 0 0 8, p . 2 9 5参照)。 l/ Y 2を 1に固定した。そして各群の人・年を 1 0 0 問題を簡単にするため、 2群聞の人・年の比 Y 0刻みで変化させた。 2群の総ケース数の期待値が把握できるようにするために、 2 " " ' 1 0 0 0まで 1 群の平均的な年当たりの発現率を固定することとし、ここではそれを 0 . 0 5に設定した。その上で、 a t er a t i oに対して 2群の発現率の平均が 0 . 0 5になるように各群の発現率を決定した。 種々の r シミュレーションの 1試行においては、各群独立にケース数を P o i s s o n乱数を用いて発生させ(SAS 関数 RANPOIを使用)、 3種類の 95%信頼区間を計算し、それらが設定した真の r a t er a t i oを含むか どうかを判定した。それを 1 0 0 0 0回反復し、各信頼区聞が真の r a t er a t i oを含む確率、すなわち被覆 確率を計算した。ただし、期待ケース数が少ない場合には、生成されたケース数 C1ないしらがゼロ になることがあるが、その場合は被覆確率の計算から除外した。 被覆確率は r a t er a t i oの値に左右されるため、 lつの r a t er a t i oの値についての被覆確率を評価する a t er a t i oの値についての被覆確率の平均を取ることとした。このように複数の のではなく、種々の r パラメタ値についての平均被覆確率を用いる方法は Newcombe( 1 9 9 8 )や A g r e s t i& C o u l( 1 9 9 8 )が用い 212
E x a c tc o n d i t i o n a lC I M e t h o d s 一一‑ ー・圃・・As y m p t o t i cu n c o n d i t i o n a lC I ーーーーー C o n d i t i o n a lC Iu s i n gW i l s o ns c o r eC I 0.99 峰崎山 •• き 0.97 、 、、 》 ¥ 酬し」 旬 . a ¥ ︑︑ ︑ ︑ r o . ︑︑ 4コ ¥ ¥ ︑ b ︑ 0.98 " ‑ 、 ー ー 、 " ' ‑ . . ̲ ‑ ̲ ー 一 世 " v ' ・ 』 回 目 、J 、 . . / ' " ー h p 園 ︑ ︑ 司 喝 ︑ ︐ ︑ ︑ ︐ ︐ ︐ ︑ ︐ ︐ ︑ h a e ︑ ﹃ h 0 ‑ ﹃ 0 ︐ ‑ ‑ ︐ ︐ ︐ ︑ ‑ ‑ ︑ ︑︑ ω 0> 巴 0.96 ω 〉 0.95 0.94 100 200 300 400 500 600 700 800 900 1000 P e r s o n ‑ y e a r si ne a c hg r o u p 図1 .R a t er a t i oについて 3種類の信頼区間の平均被覆確率 2群の年当たりの平均発現率を 0 . 0 5に固定 0. 25 ' ‑ , . . ‑4の範囲の種々の r a t er a t i oの被覆確率を平均 た方法と類似したものである。ここで用いた r a t er a t i oの範囲としては、現実の研究でも起こりそう . 2 5 . . . . . . . . . . . 4の範囲を想定し、この範囲を対数スケール上で 40等分し、評価すべき r a t er a t i oの値を な0 決定した。このようにして種々の人・年に対する平均被覆確率を評価した結果を図 1に示す。 この図から、どのような人・年の場合についても、 Exactな信頼区間は他の 2つに比べて保守的 であることがわかる。一方、 Wilsonスコア信頼区聞を用いた信頼区間の被覆確率は名義的信頼水準 である 95%を下回ることなく、常に他の 2つよりも名義的信頼水準に近い値となっている。このこ とは、被覆確率の観点からは、 3つの信頼区間の中で、は、この方法が最も優れたものであることを 示している。一方、漸近的な u n c o n d i t i o n a lな信頼区間は他の 2つの中間的な被覆確率を示している。 このように Wilsonスコア信頼区間を用いた r a t er a t lOの信頼区間は望ましい性質を有するが、 1 つ問題がある。それは、この方法に対応した統計的検定法やサンプルサイズ計算の方法が存在しな いことである。そのため、実際の臨床試験や調査でこの方法を用いる際には、これらの点について 何らかの工夫をする必要があるかもしれない。 まとめ 本論文では、 2つの群のケース数が P o i s s o n分布に従うと仮定した場合の、 2群の総ケース数が固 定された条件の下での e x a c tな条件付きの r a t er a t i oの信頼区間の計算方法について述べた。また、 x a c t な条件付き それに対応する統計的検定やサンフ。ルサイズ、計算方法につでも述べた。さらに、 e のr a t er a t i oの信頼区間で用いていた C l o p p e r ‑ P e a r s o n信頼区間を Wilsonスコア信頼区間で置き換え ることにより、被覆確率の観点から、より優れていると考えられる信頼区間を得た。これらの計算 213
方法はいずれも SASではサポートされているものではない。しかし、それらは SASのデータステ
ップを用いて容易に計算できることを示した。
引用文献
1
) A
g
r
e
s
t
i,A
.,C
o
u
l
l
,B
.A
.
, Approximate i
sb
e
批.
e
rt
h
a
ne
x
a
c
tf
o
ri
n
t
e
r
v
a
le
s
t
i
m
a
t
i
o
no
fb
i
n
o
m
i
a
l
p
r
o
p
o
r
t
i
o
n
s
.TheAm
e
r
i
c
a
nS
t
a
t
i
s
t
i
c
i
a
n
,
5
2
:1
1
9
・1
2
6,1
9
9
8
.
,
N
.E
.,
Day
,
N
.E
.,
S
t
a
t
i
s
t
i
c
a
lm
e
t
h
o
d
si
nc
a
n
c
e
rr
e
s
e
a
r
c
h
.拘 l
u
m
e1
1
.Thed
e
s
i
g
nanda
n
a
l
y
s
i
so
f
2
) B
r
e
s
l
o
w
c
o
h
o
r
ts
t
u
d
i
e
s
.I
n
t
e
m
a
t
i
o
n
a
lAgencyf
o
rR
e
s
e
a
r
c
honC
a
n
c
e
r
,1
9
8
7
.
,1
.S
.,
.
F Bohidar
,N.R
.
, E
x
a
c
tpowera
n
ds
a
m
p
l
es
i
z
ef
o
rv
a
c
c
i
n
ee
伍c
a
c
ys
t
u
d
i
e
s
.Commun.
3
) Chan
2
7
:1
3
0
5
‑
1
3
2
2,1
9
9
8
.
S
t
a
t
i
s
t
.
‑
T
h
e
o
r
yM
e
t
h
.,
4
) Newcombe,R
.G
.,T
w
o
‑
s
i
d
e
dc
o
n
f
i
d
e
n
c
ei
n
t
e
r
v
a
l
sf
o
rt
h
es
i
n
g
l
ep
r
o
p
o
r
t
i
o
n‑c
o
m
p
a
r
i
s
o
no
fs
e
v
e
n
S
t
a
t
i
s
t
.Med.,1
7
:8
5
7
・8
72,
1
9
9
8
.
m
e
t
h
o
d
s,
5
) P
r
z
y
b
o
r
o
w
s
k
i,
,
.
JW
i
l
e
n
s
k
i
,H
.,
H
o
m
o
g
e
n
e
i
t
yo
fR
e
s
u
l
t
si
nT
e
s
t
i
n
gS
a
m
p
l
e
s企omP
o
i
s
s
o
nS
e
r
i
e
s
:With
a
nA
p
p
l
i
c
a
t
i
o
nt
oT
e
s
t
i
n
gC
l
o
v
e
rS
e
e
df
o
rDodder
,
B
i
o
m
e
t
r
i
k
a3
1
:3
1
3
‑
3
2
3,1
9
4
0
.J
,Greenland,S
.,L
a
s
h
,T
.L
.
, Modeme
p
i
d
e
m
i
o
l
o
g
y
.3
r
de
d
.,L
i
p
p
i
n
c
o
t
tWi
1
1
i
a
m
s&
6
) Rothman,K
W
i
l
k
i
n
s,
2
0
0
8
.
付録. 2つの独立な P
o
i
s
s
o
n分布する変数の和を固定した場合の条件付き分布
2つの独立に P
o
i
s
s
o
n分布する変数 C,及び C2があり、その確率関数が式(1)で与えられているもの
,
+C
o
i
s
s
o
n分布に従い、そ
とする。よく知られているように、 2つの変数の和 Cto凶 =C
2もやはり P
れが Ctota'となる確率は次式で与えられる。
P
(
C,
o
t
a
'=
Cw凶 I~ ,~)
λ
(l
Y
'+~Y2Y'凶 e叫y,+ゐy,)
.
,
,
ν
t
o
ω
1・
,,
ここで C,及び Cto阻 = C+C
2の同時分布が
'e‑,Ay,(
λ
2
Y
2
Y
'
t
o
t
n
l
‑ e一ゐh
一 ( ~Y, y
P(C
,=C,'~ω=Cto凶 I ~,~) =P(C
,
=c
,
I
~).P(C2 =c,o凶ー c, I~)=
CI
(
c
,
)
!
凶
ーc
t
o
c
,
!
となることを用いて、 C削 =c
附 lの条件の下での C
,の条件付き分布は次式のようになる。
λ
(l
Y
'
)
'
"e
‑
,
Ay,(
λ
2
Y
2
)
C
I
OI
‑
C
Ie
‑仙
I
a
,
P(C=
c
,
I
C,o凶 =c,岨"~,~)ー
P
'
(
C
,
=c"C
,
o
凶 =c
阻凶│んみ)
,
!
(
c
阻凶一 c
,
)
!
λ
(l
Y
'+~Y2Y"""e-(州+机}
.
,
C
,
・
"0
阻1
c
蜘
,
!
,
(λly, Y'(~YJ刷イl
c!
(
c
凶 ,
‑c
,
)
! (~y, +~Y2)'"叫
f
]~ι-'
Y(
I
‑ ~Yt i
l,A~y, +~Y2) l ~y, +λ2Y2)
一r
C
,
o
t
a
'
c
剛ー I
,
このように成功確率 ~y, /
(
人 y +~Y2) の二項分布が導かれる (Przyborowski & W
i
l
e
n
s
k
i,1
9
4
0
)
。
214
川Pス ク リ プ ト 言 語 ( JSL) を 用 い た 前 臨 床 に お け る 割 付 け 手 法 の ア ド イ ン 開 発 0原茂恵美子、佐藤拓哉、篠津和夫、佐藤耕一 (株式会社タクミインフォメーションテクノロジー) 探索的なデータ分析ができるソフトフェア ] M Pでは、プログラムを書くことなく、マウス操作に よりさまざまな統計解析を行うことができる。しかし、前臨床試験で必要な個体の割付け(群分け) に関する手法は、]MPには搭載されていない。そのため、 I M Pスクリプト言語(以下、 ] S L ) を用い M Pの既存手法と同様に簡単なマウス操作により割付け結果を得ることが出来るアドイン「多 て 、 I 変数によるブロック化割付け Jを開発し、アドインとして実装したので、その内容を報告する。 ブロック化割付けとは、実験の白的となる測定項目に影響を与える事前情報項目(調整項目)の 分布が各群均質になるよう、積極的にバランスをとって個体を割付ける方法である。本手法では、 複数の調整項目の平均値と分散が、各群で均質になるよう割付けを行っている。群分けアルゴ、リズ ムは「谷本学校毒性質問箱第3号 J (株)サイエンテイスト杜 ( 2 0 0 0 )の「実験動物の群分けアルゴ、リ p . 2 )を引用した。 ズムとプログラム」芳賀敏郎 ( X C E Lあるいは] M Pのデータテープ、ルで、用意する。本手法を ] M Pのメニュ 本手法の入力データは、 E ーパーから起動し、入力データを読み込み、割付けのパラメータを設定し、解析実行ボタンをクリ ックすることにより、解析が行われ、データテープソレに割付け結果が出力される。これらは全て、 マウス操作あるいはキーボード入力で行われる。 本手法の開発は、解析部分とインターフェース部分にわけで行った。解析部分は]SLによるプロ グラミングで作成し、インターフェース部分はアプリケーションヒ、、ルダーを使用した。アプリケー ションピルダーは、簡単なマウス操作によりインターフェース機能を作成することができ、 ]SLが 自動生成される。また、自動生成される ]SLに、エラーチェックロジックをプログラミングで追加 することにより、入力データあるいはパラメータの設定に不整合がある場合や、解析が実行されな いなどのエラー処理機能を実装することができた。解析部分とインターフェース部分を別々に作成 した後、解析] S Lとインターフェース ] S Lを結合し、アドインビルダーを用いて I M Pアドインを作成 する。作成した I M Pアドインにより、川Pの既存手法のように、メニューパーから手法を選択し、実 行することができるようになる。また、既存手法では、手法名にカーソルを合わせるとその手法に 関する説明が表示されるが、今回開発したアドインビルダーにおいてもヒントが表示されるように 設定した。 今回の開発により、 ]SL、アプリケーションビルダーおよびアドインビルダーを用いることで、 川 Pに搭載されていない手法を実装でき、ユーザーはスクリプトやプログラミングを意識すること なく、既存の手法と同様のマウス操作でI M Pに搭載されていない「多変数によるブロック化割付け」 を解析することが可能となった。 今回、前臨床試験の割付けに関するアドイン開発の事例を紹介したが、 W i 1 l i a m s型多重比較など、 一般的に前臨床試験において頻繁に使用されるが I M P Iこ搭載されていない手法は、他にも存在する ため、同様に、アドイン開発することにより利用範囲が拡がることになる。また、他の分野におい ても、必要な手法が ] M Pに搭載されていない場合には、今回紹介したように、 I M Pアドインを使用す ることにより、 I M Pを効果的、有効的に利用されることが示唆された。 215
KaplanMeierプロット・ F o r e s tプロット作成の応用 圃 グラフ出力範囲内・範囲外への数値出力 0魚 住 龍 史 l 吉 田 早 織 2 平 井 隆 幸 2 浜 田 知 久 馬 3 l京都大学大学院医学研究科医学統計生物情報学 2日 本 化 薬 株 式 会 社 医 薬 開 発 本 部 解 析 チ ー ム 東京理科大学工学部情報工学科 3 Advancementi nb o t hKaplan‑Meierandf o r e s tp l o t s :q u a n t i 旬t i v er e s u l t so u t p u ti n s i d eo ro u t s i d et h eg r a p ha r e a 2, 3 a o r iY o s h i d a T a k a y u k iHirae, andChikumaHamada R y u j iUozumi1,S lD 申a r . 抑 制o f B i o m e d i c a lS t a t i s t i c sandB i o i n f o r m a t i c s ,身 o t oU n i v e r s i t yGraduateS c h o o lofM e d i c i n e ,P h a r m a c e u t i c a lDevelopmentD i v i s i o n ,N i J フ ponJ ( , のl a 加 C o ., Ltd 2 B i o s t a t i s t i c sTeam おかoUniversityofScience 3 加 ,e n tof I n f o r m a t i o nandComputerT e c h n o l o g y ,Fa c u l t yof E n g i n e e r i n g , D伊 ar 要旨 K a p l a n ‑ M e i e rプロットおよび F o r e s tプロットは,いずれも医薬品開発でよく用いられるグラフである.本稿 a p l a n ‑ M e i e rプロットおよび F o r e s tプロ では, ODSGRAPHICS による機能を用いて,様々な修飾を加えた K ットを作成する方法を報告する. K a p l a n ‑ M e i e rプロットにリスク集合の大きさを修飾させて作成する場合, LIFETESTプロシジャのデフォルトではグラフ出力範囲内,すなわち横軸の上段にリスク集合の大きさが出 力される.リスク集合の大きさをグラフ出力範囲外,すなわち横軸の下段に出力させる方法として, V9. 4 の SGPLOTプロシジャから追加された XAXISTABLEステートメントを用いる方法を取りあげる.次に, F o r e s t プロットの作成を考えると,グラフの横に実際の点推定値と信頼区間も示されることが多い .V9. 4 の SGPLOT プロシジャから追加された複数のステートメントを併用することで,実際の学術論文に用いられるようなク o r e s tプロットを作成する方法を報告する. オリティーの高い F キーワード:生存時間解析 を加えたプロット K a p l a n ‑ M e i e rプロット リスク集合 F o r e s tプロット サブ、グ、ループ解析 SGPLOT 修飾 XAXISTABLE YAXISTABLE X2AXIS Y2AXIS 1 はじめに データのグラフ化は,データ解析の結果を可視化するために有用な手段である. SASでは, V9.2 から ODS ( O u t p u tD e l i v e r yS y s t e m )GRAPHICS による機能が正規版として追加され,グラフィックベースのきれいなプ ロットを出力することができるようになった.例えば, ODSGRAPHICSONの状態で LIFETESTプロシジャ a p l a n ‑ M e i e rプロットが自動的に出力される.オプションを指定すれば,様々な修飾を加 を実行させれば, K 216
えることが可能である.また, V9.2 から追加された SG(S 凶 i s t i c a lG r a p h i c s ) プロシジャである, SGPLOTプ ロシジャや SGPANELプロシジャを用いれば,より見栄えの良いプロットを作成することができる. 本稿では,医薬品開発で用いられるグラフを SASで作成することに焦点を当てる.これまで SASによるグ 2 0 1 3 ) は GPLOTプロシジャと SGPLOTプロシジャを比 ラフ作成に関して多くの報告が行われている.西本 ( 較した上で, SGPLOTプロシジャによるグラフ作成について解説した.豊泉ら ( 2 0 1 4 ) によって, SGPLθT プロシジャによるデータの可視化の有用性について述べられている.さらに,魚住・浜田 ( 2 0 1 2 ) は SG A n n o t a t i o nの機能を用いて,医薬品開発でよく用いられるグラフを作成する有用性を示した.また,より実 務的な応用として, SGプロシジャ, GTL(GraphTemplateLa n g u a g e ) および ODSPDFを用いた簡易解析帳票 aM( C l i n i c a lDataI n t e r c h a n g eS t a n d a r d s の作成方法事例や, SASと HTMLアプリケーションによる CDISCAD C o n s o r t i u mA n a l y s i sDataModel)形式の解析用データセットを用いた解析帳票・グラフ簡易作成ツールの開発 2 0 1 2 ) . 加えて, V9.4から利用できるようになった ODS 事例についても報告されている(高浪, 2011, P o w e r P o i n tを用いて, SASで作成したグラフを P o w e r P o i n tにアウトプットさせる方法も報告されている(吉 0 1 5 ) . 田ら, 2 医薬品開発で用いられるグラフのうち, Kaplan‑Meierプロットは生存時間データの視覚化の手段として 20 年以上前から用いられており(大橋・浜田, 1 9 9 5 ),V9.2リリース以降, SASによるKa p l a n ‑ M e i e rプロットの 作成に関する多くの報告が行われている.長島・佐藤 σ010) は , LIFETESTプ口、ンジャおよび GPLOTプロ シジャを用いて, Kap1an‑Meierプロットに付加情報を加えるマクロを開発している.魚住・浜田 ( 2 0 1 1 )は , SGPLOTプロシジャおよび SGRENDERプロシジャを用いて, K a p l a n ‑ M e i e rプロットを作成する手順を示し ている.LIFETESTプロシジャではラスター形式のグラフ出力であり,ベクター形式の出力ができない一方, SGPLOTプロシジャではベクター形式の出力も可能である点からも有用といえる(平井ら, 2 0 1 5 ) . 長島・佐藤 ( 2 0 1 0 )および魚住・浜田 ( 2 0 1 1 )のいずれの報告においても, Ka p 1 a n ‑ M e i e rプロットのリスク u b j e c t sa tr i s k ) を出力させる方法について言及されている.リスク集合の大きさは, 集合の大きさ (numberofs LIFETESTプロシジャのオプ、ンョンを指定すれば, ODSGRAPHICSによる出力で自動的に付加されるが,よ り工夫を凝らした出力をするための方法が報告されている.例えば,学術論文において, リスク集合の大き さはKa p l a n ‑ M e i e rプロットの横軸の下段に示されることが多いが, LIFETESTプ口、ンジャのオプションで ATRISKを指定して出力すると, Ka p l a n ‑ M e i e rプロットの横軸の上部に示される.よって,リスク集合の大き さを Kaplan‑Meierプロットの下段に示す方法を考える意義があるといえる.Ka p 1 a n ‑ M e i e rプロットに限らず, o r e s tプロットの作成においても工夫した出力を考える意義がある. F o r e s tプロットは その他にも,例えば F メタアナリシスやサブグループ解析の報告によく用いられるグラフであり,プロットに加えて,グラフの横 に実際の推定値と信頼区間を示すことが多い.以上のようなことから,医薬品開発に携わる統計家および SAS プログラマにとって,グラフ出力範囲外にリスク集合の大きさや信頼区間などの情報を出力させる方法を考 える必要が生じる. o r e s tプロットを作成するにあたり, 本稿では,医薬品開発でよく用いられる Kaplan‑Meierプロットおよび F グラフ出力範囲外に数値を出力させる方法として, LIFETESTプロシジヤおよび SGPLOTプロシジャを用い た方法をレビューした上で,新たにできるようになった方法を報告する. なお,本稿において示すプロットは,モノクロ印制されても識別しやすいよう, ODSの出力としてジャー ナルスタイル "STYLE=JOURNAL" を指定している.例えば,群別のグラフを示す場合,デフォルトでは群 の違いが色で分けて出力されてしまう.ジャーナルスタイルの場合,モノクロ印刷で群の違いを識別できる よう,実線と破線で分けて出力される. 217
2 K a p l a n ‑ M e i e rプロットの作成 本節では,リスク集合の大きさの情報を修飾した Kaplan‑Meierプロットを作成することを考える. K a p l a n ‑ M e i e rプロットを作成する対象データとして,肺癌のデータ(データセット名:VALung) を用いる. V e t e r a n sA d m i n i s t r a t i o nLungc a n c e r凶 a l )は , K a l b f l e i s c handP r e n t i c e( 2 0 0 2 ) で使用され データセット VALung( n=1 3 7 ),SAS/STATPHREGプロ、ンジャのマニュアル,および大橋ら たデータを一部抽出したものであり ( ( 2 0 1 6 )第 3章においても用いられている.この研究の目的は,男性の進行性肺癌患者を対象としたランダム 化比較試験であり,治療法として,試験治療と標準治療を比較するために行われた.評価項目は死亡までの 時間(日)(変数名:Time) で,共変量の lっとして組織型(変数名:C e I I ) が挙げられる.組織型は 4 水準 ( C e I I 腺癌 J ,' s m a I I ' =' a d e n o ' r r 小細胞癌 J ,1 ' 紅g e ' r 大細胞癌 J ,' s q u a m o u s ' r 扇平上皮癌 J)のカテゴリカル変 数である.本節では,組織型別の Kaplan‑Meierプロットを作成することを考える. 2 . 1 グラフの出力範囲内へのリスク集合の出力 LIFETESTプロシジャでは,デ、フォルトではリスク集合の大きさは付与されないが, PLOTS=Sのオプショ ンとして, ATRISKを指定すれば,図 lに示すような出力が得られる.その他のオプションの指定に関して は,大橋ら ( 2 0 1 6 ) を参照されたい. SASプログラム proc lifetest data=VALung plots=s(atrisk atrisktick); time Time*Censor(l); strata Cell; run; 出カ結果 P r o d u c t ‑L imit生存推定 リスクのある対象敏 1 . 0 E : J T h 四 0 . 8 0 . 2 l a r g e 。11112242咽7 5 a d e n s m a l l s q u a m o u s 。 093m 0 . 0 。 2 0 0 600 400 800 T i m e I C e l l 一 一 ‑a d e n o ‑一一.l a r g e ‑ ‑‑ s m a l l 一 一 ‑s q u a m o u sI 図1 :LIFETESTプロシジャによる K a p 1 a n ‑ M e i e rプロットの作成 l 218 1000
SASプログラム ods graphics; ods output Survivalplot=Survivalplot; proc lifetest data=VALung atrisk plots=s(atrisk); time Time安 Censor(l); strata Cell; run; *ーーーーーー一一一一一ーーーーー一一一一一一一一ー一一ーーーーー一一一一会 J *ーデータハンドリング(詳細は付録A参照)一女; *ーーーーーーー一一一一一ーーーーーーー一一一一ーーーーーーーーーーー一一*; proc sgplot data=Survivalplot2 noautolegend; step x=Time y=Survival / group=StratumNum name='Survival'; scatter x=Time y=Censored / group=StratumNum markerattrs=(symbol=plus); scatter x=tAtRisk y=StratumNum / markerchar=atrisk y2axis; keylegend 'Survival' / location=outside noborder position=bottom; yaxis offsetmin=0.20 values=(O to 1 by 0.1) label='Survival'; y2axis offsetmin=0.03 offsetmax=0.85 min=l max=4 label=' 'display=(noticks novalues); xaxis offsetmin=0.05 values=(O to &TimeMax by &Timelnterval) label='Time'; format StratumNum Cellf.; run; 出カ結果 1 . 0 0 . 9 L 1 1 0 . 8 よ11 n 0 . 7 .~ 0 . 6 ' l ¥ 1 ; " ¥ . 0 . 5 hLF 吃+L̲ z a0.3 ー 」 寸 ~L 目2 。 一寸 l . ーL, 一‑ ‑U L ‑ L ‑ ‑ 1ーー一一一一一一一一一一 ー・「っ一一一一 τ H 0 . 1 『 aamu‑nu‑nu auauauau 1 o 備 守・ 。 800 白 anuvau u 27 27 aaweau 3 5 48 '︐.︐ 0 . 0 2 0 0 400 s ∞ T i m e ー一一一一‑a d e n o 一一一.l a r g e ‑ ‑‑ s m a l l ‑一一‑s q u a m o u s 図 2:SGPLOTプロシジャによる K a p l a n ‑ M e i e rプロットの作成 1 219 ∞
しかし,図 1の出力では,リスク集合の大きさが出力されていない時点および群が存在する.データセッ トVALungの特徴として,例数に対するイベント割合が高いため,後半の時点ではリスク集合の大きさが O となってしまう.リスク集合が 0となると, 0になった最初の時点では出力されるが,それ以降の時点では 0 は出力されない.本稿ではリスク集合の大きさが Oの場合は 0に統一する出力を考える. PLOTS=Sのオプ ションで指定できない修飾を加える場合,生存関数の推定値を一度データセットに落として,グラフ関連の プロシジャで出力し直す必要がある. 図 2は SGPLOTプロシジャを用いたプログラムおよびその出力結果を示しており,大橋ら ο016)第 2章 閲 N で解説されている方法に加えて, Y2AXISステートメントに加えた上で YAXISステートメントの OFFSET =を指定することで,グラフの出力範囲内にリスク集合の大きさを出力させるスペースを確保している. YAXISおよび XAXISステートメントはグラフの縦軸および横軸の指定として,グラフの左側および下側の 軸の設定を行っている一方, Y2AXISおよびX2AXISステートメントではグラフの右側および上側の軸の設 定を行っている. OFFSETMIN=と OFFSETMAX= を指定すれば,輸の下限と上限をそれぞれ指定できる. . 2 0を指定し,縦軸全体の 20%の値からス 図 2のプログラムでは, YAXISステートメントで OFFSETMIN=0 タートさせている.縦軸全体は生存割合 1であるため,生存割合 20%に相当する位置が原点として描かれて いる.一方,右側の縦軸に関して, Y2AXISステートメントで OFFSETMIN=0 . 0 3を指定することで,横軸と リスク集合の値が重ならないように設定している.さらに, OFFSETMAX=0 . 8 5を指定することで,全体の 85%の部分を出力範囲の上限としている.なお, ODSOUTPUTによって得られたデータセットに対して,グ ラフで出力する時点のリスク集合の大きさが 0であった場合に 0が出力されるよう,データハンドリングし た上で, SGPLOTプロシジャを実行させる必要がある.データハンドリングの詳細は付録 A を参照されたい. 2.2 グラフの出力範囲外へのリスク集合の出力 図 1および図 2は,いずれもグラフの出力範囲内にリスク集合の大きさを追加したKa p l a n ‑ M e i e rプロット である. Kaplan ・ Meierプロットに関しては,学術論文においてリスク集合の大きさを K a p l a n ‑ M e i e rプロット の横軸の下段に示されることが多い.そのための方法として, SGRENDERプロシジャを用いて, TEMPLATE プロシジャで事前に定義したテンプレート,特に LAYOUTLATTICEステートメントなどを活用することに p l a n ‑ M e i e rプロットの下段に示すことが可能である(魚住・浜閏, 2 0 1 1 ) . よって,リスク集合の大きさをKa しかし,テンプレートの定義には,長文のプログラムを組まなければならない.そこで, V9. 4 の SGPLOTプ ロシジャに追加されたステートメントを用いて,リスク集合の大きさをKa p l a n ‑ M e i e rプロットの下段に示す 方法を考える. 図 3は SGPLOTプロシジャを用いたプログラムおよびその出力結果を示している. V9.4から利用できる XAXISTABLEステートメントを用いて,リスク集合の大きさを K a p l a n ‑ M e i e rプロットの下段に示している. XAXISTABLEステートメントでは出力させたい値を表す変数 At R is kを指定した上,オプションとしてリス i s kを ク集合の大きさを出力させる横軸の値を持つ変数tAtR x =に指定し,群に該当する変数 S同 制n剖 umを CLASS =に指定している.共通の横軸を用いて, K a p l a n ‑ M e i e rプロットの出力とリスク集合の大きさの出 力を行っているため,この場合 XAXISTABLE ステートメントを用いている.共通の縦軸を用いる場合は YAXISTABLEステートメントを用いればよい.なお, XAXISTABLE ステートメントを用いて,グラフの範 囲内にリスク集合の大きさを出力させたい場合, LOCATION=INSIDEをオプションとして指定すればよい. 220
図 3では, SGPLOTプロシジャを用いてリスク集合の大きさを Kaplan‑Meierプロットの下段に示したが, 実は SAS/STAT1 2 . 1以降の LIFETESTプロシジャでは,オプション OUTSIDEを指定することで,リスク集合 ) . なお, OUTSIDE(k) と指定するこ の大きさを Kaplan‑Meierプロットの下段に示すことが可能である(図 4 臥 PHICSで構成される全体の出力範囲のうち,リスク集合の大きさを表示させる割合を指定で とで, ODSG kのデフォルト値は,群の数の 0 . 0 3 5倍である.図 4の場合, 4群に対してプロットを描いているため, きる . 全体のうち 14%の範囲にリスク集合の大きさを出力させている. SASプログラム proc sgplot data=Su工vivalplo七2 noautolegend; step x=Time y=Su工vival I group=StratumNum name='Survival'; scatter x=Time y=Censored I group=StratumNum markerattrs=(symbol=plus); xaxistable AtRisk / x=tAtRisk class=StratumNum; keylegend 'Survival' I location=outside noborder position=bottom; .1) label='Survival'; yaxis values=(O to 1 by 0 xaxis values=(O to &T工meMax by &T工melnterval) label='T工me'; format StratumNum Cellf.; run; 出カ結果 1 . 0 , L 0 . 9 0 . 8 」4 0 . 7 1 0 . 6 ω と コ 〉 伺 日 [ L L 0 . 5 1..,~ 斗‑ LトL 0 . 4 目 。3 ア ¥ 0 . 2 " LL ~寸『 ‑ ‑ L ‑ 1 ‑ ‑ z h 「一一一‑,一一一一一一「 」 「 ー 「 0 . 1 」 0 . 0 ‑r 。 ∞ 4 ー ‑ ‑ ‑ 一一一. 6 0 ︐ 角 n u 内uw ︐ ︒ nuau 0 図 3:SGPLOTプロシジャによる Kaplan‑Meierプロットの作成 2 221 800 T i m e l a r g e ‑ ‑‑ s m a l l一 一 一 一 ‑squamous 0 ‑‑auz‑w a d e n o o 93m a d e n o 27 l a r g e 27 s m a l l 48 s q u a m o u s 35 ∞ 2 0 0 1 0 0 0
SASプログラム proc lifetest data=VALung plots=s(atrisk atrisktick outside); time Time*Censor(l); strata Cell; run; 出力結果 P r o d u c t ‑ U m i t 生存推定 リスクのある対象敏 1 . 0 E : l T h 盟 0 . 8 可 ・ ー ー 、 auaq au u 自 副首鰻体制 門 司 寸 LL パ 1 t ‑ . ̲ + L . ̲ 工 1 ‑, ‑ , ̲ 司 0 . 2 0 . 0 。 .ユ.生一一‑‑‑L.̲一一一一一「 z ∞ 6 0 0 400 ∞ 8 1000 T ime l C e l l 一一一 a d e n o一 一 一 .Ia唱 e一 ‑‑ small 一 一 ‑squamωsl 2 7 2 7 48 35 093m a d e n o l a r g e s m a l l s q u a m o u s 。 図 4:LIFETESTプロシジャによる K a p l a n ‑ M e i e rプロットの作成 2 3 F o r e s tプロットの作成 医薬品開発では様々なプロットを用いてデータの可視化が行われるが,メタアナリシスやサブグループ解 析の報告においては F o r e s tプロットがよく用いられる.メタアナリシスであれば研究開の異質性を視覚的に 確認するために,サブグ、ループ解析で あればサブグループ聞でどのような傾向がみられるか確認するために 用いられる. F o r e s tプロットにおいても, K a p l a n ‑ M e i e rプロットに対するリスク集合の大きさのように,実際の推定値お よびその信頼区間などの修飾を加えることが多い.近年報告された臨床論文におけるサブグループ解析の結 果を例に挙げると, B o r g h a e ie tal .( 2 0 1 5 ) はハザード比とその 95% 信頼区間に加え,各サブグループの例数も o t z e re ta l .( 2 0 1 5 ) は各群のイベント割合を修飾しており,点推定値のプロットの大 修飾して出力している. M u r n e re ta l .( 2 0 1 5 ) は各サブグ きさについてもそれぞれのサブグループの例数に依存させて変化させている. T ノレープにおける交互作用の p値についても修飾させている. SASによる F o r e s tプロットの報告として,堀田 ( 2 0日)は, GPLOTプロシジャとそのAn n o t a t i o nの機能を o r e s tプロットを作成する方法を取りあげている.本稿では, F o r e s tプロッ 用いて,連続量データに対して F トに修飾する内容として,点推定値のプロットの大きさを例数に依存して変化させた上,各サブグループに おける例数,イベント割合,点推定値と信頼区間,交互作用の p値を修飾して出力することとする.前節で 用いたデータセット VALungにおける治療法 ( T h e r a p y 2=1 r 試験治療 J ,2 r 標準治療 J)の違いのサプグル <6 5歳J,2 r>=6 5歳 J),組織型 ( C e l l C=1 r 腺癌 J,2 r 大細胞 ープ解析として,年齢カテゴリ (AgeC=1r 222
癌 J , 3I 小細胞癌 J ,4 I 扇平上皮癌 J),既往歴の有無 ( P r i o r=0 I 無 J , 1I 有 J)をサブグ ループとした,比 例ハザードモデルによる解析を実施することを考える.生存時間データに対するサブ、グ、ループ解析であるた め,点推定値としてハザード比およびその 95% 信頼区間を示すこととする.なお,データセット VALungに 含まれている文字変数を数値変数として定義した変数が T h e r a p y 2, AgeC(Ageから I Fステートメントで作成), C e l l Cである. 表 1: F o r e s tプロット作成時のデータセットに格納されている変数の概要 サブグループ名およびサブ、グ、ループ内のカテゴリ名 [プロットに修飾] 交 E作用の p値 [プロットに修飾] サブグ ループ名とサブ グ、ループ内のカテゴリ名の判別 サブ、グループにおける例数 試験治療群におけるイベント数/例数(%) [プロットに修飾] 標準治療群におけるイベント数/例数(%) [プロットに修飾] ノ、ザード比 ノ、ザード比の 95% 信頼下限 ノ、ザード比の 95%信頼上限 ハザード比 (95% 信頼区間) [プロットに修飾] サブ、グ、ループ名とサブグループ内のカテゴリ名の出力の 違いを表すインデントを設定 プロットの縦軸 プロット行のうち,色を変える行に対応する縦軸の値 SGPLOTプロシジャで F o r e s tプロットを作成する場合, PHREGプロシジャを用いた比例ノ、ザード モデ、ルに よる解析などを実施し,表 lの変数が含まれるデータセットを準備する.なお, PHREGプロシジャによるサ ブ、グ、ループ解析から SGPLOTプロシジャで使用するデータセット作成までのプログラムは付録 B,表 lのデ ータセットのアウトプットは付録 Cを参照されたい.表 lのデータを用いて, SGPLOTプロシジャで F o r e s t プロットを作成するプログラムおよび出力結果を図 5に示す.図 5では, BUBBLEステートメントで、ハザー ド比の点推定値の大きさを・印で示し,各サブグループにおける例数によって大きさを変更している.ただ し,メタアナリシスで用いる F o r e s tプロットの場合,点推定値の大きさは各研究の例数の大きさとは限らず, 0 0 2 ) . また,横軸はハザード比であるので, 各研究における点推定値の分散の逆数とする場合もある(丹後, 2 XAXISステートメントで TYPE=LOGを指定することで対数スケールとしている.ただし,縦軸の一番下に おいてサブ、グループでない O v e r a l lの結果が示されており,縦軸に指定している変数 F o r e s t v a lの値の大きさ 223
を逆順にしなければならない.このプロットを P o w e r P o i n tなどに貼り付けて,ハザード比とその 95% 信頼区 間やサブグループ名などの修飾を加えて,図のファイルとして用いることが多いのではないだろうか. V9. 4 から ODSP o w e r P o i n tも利用できるようになり(吉田ら, 2 0 1 5 ),手動で P o w e r P o i n tに貼り付けなくても,プロ グラムを実行させることで P o w e r P o i n tに出力できるような環境が整ってきているといえる. しかし,上記のような手順でなく, SASですべて操作して修飾を加えたプロットを作成したい場合,プロ ットの場合はどのような方法で行えばよいだろうか. SASプログラム proc sgplot data=forestdata noautolegend; refl工ne ref / axis=y lineattrs=(thickness=30 color=cxfOfOfO); scatter y=forestval x=HazardRatio / errorbarattrs=(thickness=l color=blue) markerattrs=(size=O) xerrorupper=HRUpperCL xerrorlower=HRLowerCL; bubble y=forestval x=HazardRatio size=N / bradiusmax=4.2 bradiusmin=O.2 fillattrs=(color=blue) lineattrs=(color=blue); refline 1 / axis=x lineattrs=(pattern=shortdash) transparency=O.5; xaxis type=log minor min=O.l max=5 display=(nolabel) valueattrs=(size=7); yaxis display=none; run; 出力結果 • • ‑ a ‑ 0 . 1 0 . 5 1 . 5 図 5:SGPLOTプロシジャによる F o r e s tプロットの作成 l 224 2 . 5 3 3 . 5 44 . 55
F o r e s tプロットに修飾を加えるためには,前節のように Y2AXISステートメントを用いた記述を図 5のプ 4 に ログラムに加えれば作成できそうである.図 5は V9.3の SGPLOTプロシジャで作成可能であるが, V9. おいてさらに多くのステートメントおよびオプションが追加されている. 図 6は , V9.4から利用できるようになった SGPLOTプロシジャの機能を用いて,修飾を加えた F o r e s tプロ ットを作成するプログラムである. DATTRMAP=A廿 RMAPとして指定しているデータセットの詳細は,付 録 D を参照されたい.図 5までのプログラムに比べて長文になった上,出力結果も他のプロットよりも大き く示すことを意図して,プログラムと出力結果を別々に示している. proc sgplot data=forestdata noautolegend dattrmap=attrmap nowall noborder nocycleattrs; styleattrs axisextent=data; refline ref / axis=y lineattrs=(七hickness=13 color=cxfOfOfO); scatter y=forestval x=HazardRatio / errorbaratt工s=(thickness=l color=blue) xerrorupper=HRUpperCL xerrorlower=HRLowerCL markerattrs=(size=O); / 決 highlowy=forestval low=HRLowerCLhigh=HRUpperCL/lineattrs=(color=blue); * / bubble y=forestval x=HazardRatio size=N / bradiusmax=4.2 bradiusmin=0.2 fillattrs=(color=blue) lineattrs=(color=blue); scatter y=forestval x=HazardRatio / markerattrs=(size=O) x2axis; refline 1 / axis=x lineattrs=(pattern=shortdash) transparency=0.5; text x=xl y=forestval text=text / posit工on=center contributeoffsets=none; yaxistable subgroup / location=inside position=工eft textgroup=valtype labelattrs=(size=8) labeljustify=left titlejustify=left textgroupid=text indentweight=indent; yaxistable g工pl grp2 / location=inside position=left labelattrs=(size=8) valueattrs=(size=7) valuehalign=center valuejustify=right; yaxistable HR intpval / location=inside position=right labelattrs=(size=8) valueattrs=(size=7) valuehalign=center; yaxis reverse display=none offsetmin=O.l colorbands=odd colorbandsattrs=(transparency=l); xaxistype=logvalues=(0.20.525)minordisplay=(nolabel) valueattrs=(size=7); x2axis label='Hazard Rat工o (95も CI), display=(noline noticks novalues) labelattrs=(size=8); run; 図 6:SGPLOTプロシジャによる F o r e s tプロットの作成 1(V9.4から実行可能) 225
表 2:F o r e s tプロット作成時にデータセットに格納されている変数概要 (一部 TS1M3以降でなし、と指定 できないオプションあり) 色を変えるサブグループにおいて色の縦方 向の幅を指定 ノ、ザード比 =1に対する参照線を出力 点推定値とその信頼区間のグラフを作成 (HIGHLOWステートメントでも可能) グラフの上部における HazardR a t i o(95%C I ) のラベルを修飾するために指定 (X2AXISステートメントとあわせて指定) 点推定値を表す・印を出力 (サプ、グ ループにおける例数に依存して大き さを変化) グラフの下部(くー T e s tB e t t e rや S t a n d a r d V9.4以降で指定可能 B e t t e rー>)の修飾 左側のサブ グ、ループ名の装飾 V9.4以降で指定可能 左側の各群のイベント割合の装飾 (一部 TS1M3以降でないと指定 右側の点推定値とその信頼区間および交互 できないオプションあり) 作用の p値の装飾 縦軸が変数 F o r e s t v a 1の値の大きさと逆順で 一部オプションは V9.4以降で 出力 指定可能 左側のサブグループ名の装飾 横軸を対数スケールで出力 a t i o(95%C I ) グラフの上部における HazardR のラベルを修飾する際の細い設定 図 6で指定している SGPLOTプロシジャのステートメントについて,表 2にそれぞれの役割と V9.4での み実行可能な注意点について示している.図 7は,図 6のプログラムの実行結果である.図 5と異なり,縦 軸において指定している値の大きさと逆i l 慎で出力されている.これは YAXISステートメントで REVERSEを オプション指定しているためである.また,参考までに, BUBBLEステートメントの代わりに, HIGHLOW ステートメントを指定した上で作成したプロットを図 8に示している.図 8では,信頼下限・上限において 縦方向のヒゲを装飾していない.Motzere ta l .( 2 0 1 5 ) による報告で示したハザード比の信頼区間のプロットは, 図 8に近いといえる.図 7および図 8を見ると,学術論文に投稿する際の図として文句のないクオリティー a p l a n ‑ M e i e rプロットの作成では XAXISTABLEステートメント のプロットを作成できたといえる.前節の K を利用したが,図 7および図 8では YAXISTABLEステートメントを利用している. YAXISTABLEステート 226
メントのオプションとして, LOCATION= INSIDEと指定しているので,グラフの出力範囲内への修飾を行っ ていることになる.図 6の SGPLOTプ口、ンジャでは, YAXISステートメントにおいて DISPLAY= NONEを 指定しているが,この記述を削除すれば, サブ、グ、ループの項目名の左側に縦軸が出力され, グラフの出力範 囲内への修飾であることを確認できる. S u b g r o u p N o .o f No.of a t i e n t si n P a t i e n t si n P t a n d a r d T e s tGroup S ( I J 6 ) Gr oup( 紛 HazardR a t i o(95首 C I ) O v e r a l l 64/68( 9 4 . 1 ) 64/69( 9 2 . 8 ) トー十→ 1 . 02( 0 . 71 ‑ 1. 4 5 ) Ag e <65 > =65 9 3 . 6 ) 42146( 9 1 . 3 ) 44/47( トー・←‑‑‑l 初} 0 . 9 0( 0 . 5 8 ‑ 1 . . 1 . 3 9( 0 . 7 5 ‑ 2 . 5 8 ) P‑v a l u e f 町 I n t e 悶 c t i o n 0. 2 84 ∞ ト→一→ 9 0 . 9 ) 1 0 ) 20/22( 22/22( C e l l 1 7 / 18( 9 4 . 4 ) 9/9( 1 0 0 . 0 ) a d e n 12/12( 1 0 0 . 0 ) 14/15( 9 3 . 3 ) l a r g e 1 7/1 8( 9 4 . 4 ) 28/30( 9 3 . 3 ) s m a l l 9 0 . 0 ) 13/15( 8 6 . 7 ) s q u a m o u s 18/20( P r i o r 0 . 0 3 8 。 。 N Y e s 1 . 23( 0 . 5 3 ‑ 2 . 8 7 ) 1 . 54( 0 . 6 9 ‑ 3 . 4 1 ) 1 . 63( 0 . 8 5 ‑ 3 . 1 2 ) 0 . 5 4( 0 . 2 5 ‑1 . 18 ) 0 . 0 9 0 ト ー ・ ‑ → 9 1 . 7 ) 47/49( 9 5 . 9 ) 44/48( 9 5 . 2 ) 1 7/1 9( 8 9 . 5 ) 20/21( (‑T e s tB e t t e r 0 . 2 . 2 5( 0 . 8 2 ‑ 1 . 8 9 ) 1 0 . 6 8( 0 . 3 4 ‑ 1. 3 3 ) S t a n d a r dBe 坑: e r ‑ ー 〉 0 . 5 5 2 図7 :SCATTERステートメントを用いた Forestプロット S u b g r o u p No.of No.of P a t i e n t si n P a t i e n t si n TestGroup S t a n d a r d ( 首 ) 弛 ) Group( O v e r a l l 64/68( 9 4 . 1 ) 64/69( 9 2 . 8 ) Ag e (65 42/46( 9 1 . 3 ) 44/47( 9 3 . 6 ) > =65 9 0 . 9 ) 22/22( 1 . 0 ) 20/22( C e l l 。 a由 n P‑v a l u e f o r I n t e r a c t i o n HazardR a t i o(95覧 CI ) 一 一 . ド ー ー 一 一 + ← 一 一 ∞ 02( 0 . 71 ‑ 1. 4 5 ) 1 . 0 . 2 84 0 . 9 0( 0 . 5 8 ‑ 1 . 4 0 ) 1 . 39( 0 . 7 5 ‑ 2 . 5 8 ) 0 . 0 3 8 17/18( 9 4 . 4 ) 9/9( 1 0 0 . 0 ) 1 . 2 3( 0 . 5 3 ‑ 2 . 8 7 ) 1 .54( 0 . 6 9 ‑ 3 . 4 1 ) 1 . 6 3( 0 . 8 5 ‑ 3 . 1 2 ) 0 . 5 4( 0 . 2 5 ‑ 1 . 1 8 ) 12/12( l a r g e 1 0 0 . 0 ) 14/15( 9 3 . 3 ) 17/18( 9 4 . 4 ) 28/30( 9 3 . 3 ) s m a l l 9 0 . 0 ) 13/15( 8 6 . 7 ) s q u a m o u s 18/20( P r i o r 9 1 . 7 ) 47/49( 9 5 . 9 ) 44/48( No 1 7/1 9( 8 9 . 5 ) 20/21( 9 5 . 2 ) Y e s (‑Te s tB e t t e r 0 . 2 0 . 0 9 0 ー十‑e‑一一 . 8 9 ) 1 . 2 5( 0 . 8 2 ‑1 0 . 6 8( 0 . 3 4 ‑ 1 . 3 3 ) S t a n d a r dBe 坑: e rー〉 0 . 5 2 5 図 8:HIGHLOWステートメントを用いた Forestプロット 227
4 まとめ 本稿では,医薬品開発で用いられるよく用いられるグラフとして, Kaplan‑Meierプロットと F o r e s tプロッ トに焦点を当て,修飾を加えたプロットの作成方法を報告した. SASによる Kaplan‑Meierプロットの作成に 関してはいくつかの報告が行われているが,本稿では SAS/STA Tl2 . 1以降, V9.4以降で実施できる方法を示 AXISステートメントの役割についても詳述した.なお,本稿で報告した K a p l a n ‑ M e i e rプロットの作 し , X2 成方法は,大橋ら ( 2 0 1 6 ) の一部を引用している.また, F o r e s tプロットの作成に関しては, K a p l a n ‑ M e i e rプ ロットと異なり SASによる実装報告が少ないトピックで、あったため, SGPLOTプロシジャを実行するにあた って,どのようなデータセットを用意しなければならないかについても詳述した.グラフの下段に数値出力 を行う Kaplan‑Meierプロットでは XAXISTABLEステートメントによる実行手順を示したが,グラフの左右 に数値出力を行う F o r e s tプロットの作成では YAXISTABLEステートメントを用いた.図 7および図 8のグラ フは,見栄えとしてはグラフの出力範囲外への出力とし、えるが, YAXISTABLEステートメントによるプログ ラム上は LOCATION= INSIDEを指定することで,グラフの出力範囲内への出力をしている.本稿で取りあ o r e s tプロットの作成手順は,比例ハザードモデルによるハザード比の出力に限らず,ロジスティック げた F モデ、ルによるオッズ比の出力にも応用できる.なお,本稿で取りあげた生存時間データに対する F o r e s tプロ ットの作成方法は,付録 Bに SASプログラムを詳細している.本稿の内容が国内外の多くの臨床試験の報告 にお役に立てれば幸いである. 参考文献 [ 1 ]B o r g h a e iH,p a z ‑ Ar e sL,HornL,e ta l .Nivolumabv e r s u sD o c e t a x e li nAdvancedNonsquamousN o n ‑ S m a l l ‑ C e l l LungC a n c e r .NewEnglandJoumal01M e d i c i n e .3 ' 守3 :1627‑1639, 2 0 1 5 . [ 2 ]HebbarP .L o s ti nt h eF o r e s tP l o t ?F o l l o wt h eGTLAXISTABLERoad!P r o c e e d i n g so l t h eSASG l o b a lForum.SAS I n s t i t u t eI n c .,Cary , NC, 2 0 1 5 .A v a i l a b l ea t h t t o : / / s u o o o r t . s a s . c o m l r e s o u r c e s / o a o e r s / o r o c e e d i n g s15/SAS1 7 4 8 ‑ 2 01 5 . o d f . ⑧ 9 . 4 .P r o c e e d i n g so l t h eSASG l o b a lForum.SASI n s t i t u t eI n c .,Cary ,NC, [ 3 ]MatangeS .Graphsa r eEasyw i t hSAS 2 0 1 5 .A v a i l a b l ea t b t t o : / / s u o o o r . ts a s . c o r r ν r e s o u r c 巴: s / o a o e r s / o r o c e e d i n ! ! s15/SAS1 7 8 0 ‑ 2 01 5 . o df . [ 4 ]MotzerRJ,E s c u d i e rB,McDermottDF ,e ta l .Nivolumabv e r s u sE v e r o l i m u si nAdvancedR e n a l ‑ C e l lC a r c i n o m a . NewEnglandJoumal01M e d i c i n e .訂 3 : 1 8 0 3 ‑ 1芭1 3, 2 0 1 5 . [ 5 ]SASI n s t i t u t eI n c .S AS/STAT(R)1 2 . 1U sers 'G u i d e .SASI n s t i t u t eI n c .,Cary , NC, 2 0 1 2 . [ 6 ]SASI n s t i t u t eI n c .S A S ( R )9 . 3ODSG r a p h i c s :P r o c e d u r e . 宮 G uide( 3 r de d n . ) .SASI n s t i t u t eI n c .,Cary , NC,2 0 1 2 . [ 7 ]SASI n s t i t u t eI n c .S A S ( R )9. 4ODSG r a p h i c s :P r o c e d u r e sGuide( 4 t he d n . ) .SASI n s t i t u t eI n c ., Cary , NC,2 0 1 5 . ,An d r eF ,e ta l .P a l b o c i c l i bi nHormone‑ReceptorP o s i t i v eAdvancedB r e a s tC a n c e r .NewEngland [ 8 ]T u r n e rNC,RoJ 司 守3 :209‑219, 2 0 1 5 . Joumal01M e d i c i n e .3 ' [ 9 ] 魚住龍史,浜田知久馬.SG( S t a t i s t i c a lG r a p h i c s )P r o c e d u r e s による K a p l a n ‑ M e i e r プロットの作成 .SASユー , 1 8 5 ‑ 1 9 9 . ザ ー 総 会 論 文 集 20日 [ 1 0 ]魚住龍史,浜田知久馬.がん臨床試験における腫蕩縮小効果の検討に有用なグラフの作成 SGPLOTプロシジャの最新機能を活用一.SASユーザー総会論文集 2012,1 5 1 ‑ 1 6 5 . 228
[ 1 1 ] 大橋矯雄・浜田知久馬.生存時間解析 ‑SAS による生物統計東京大学出版会, 1 9 9 5 . [ 1 2 ] 大橋靖雄・浜田知久馬・魚住龍史.生存時間解析応用編 ‑SAS による生物統計.東京大学出版会, 2 0 1 6 . [ 1 3 ] 高浪洋平.SGプロシジャと GTLによるグラフの作成と ODSPDF による統合解析帳票の作成 ~TQT 試 験における活用事例 ~.SAS ユーザー総会論文集 2011 , 201-219. [ 1 4 ] 高浪洋平 .SASと HTMLアプリケーションによる CDISCADaM形式の解析用データセットを用いた有害 事象の解析帳票・グラフ簡易作成ツールの開発事例 .SASユーザー総会論文集 2012,1 8 5 ‑ 2 0 5 . [ 1 5 ] 丹後俊郎.メタ・アナリシス入門ーエピデンスの統合をめざす統計手法.朝倉書l 苫 ,2 0 0 2 . [ 1 6 ] 豊泉樹一郎・財前政美・北西由武・都地昭夫.ODSGRAPHICSを用いた臨床試験データの可視化への挑 戦 .SASユーザー総会論文集 2 014, 3 0 7 ‑ 3 2 3 . [ 1 7 ]長島健倍,佐藤泰憲. K a p l a n ‑ M e i e rプロットに付加情報を追加するマクロの作成. SASユ ー ザ ー 総 会 論 文集 2 010, 2 8 5 ‑ 2 9 4 . [ 1 8 ] 西本尚樹.データの可視化を加速する SAS/JMPのグラフ新機能ー ODSG r a p h i c sと 品1 Pグラフピルダー 一.SASユーザー総会 2 0 1 3 . [ 1 9 ] 平井隆幸・吉田早織・叶健・魚住龍史.ベクター形式を用いたグラフの作成と有用性. SAS ユーザー総 0 1 5, 3 0 3・ 3 1 0 . 会論文集 2 e t ' smakeF o r e s tP l o tbySAS.SASユーザー総会論文集 2014,6 7 5‑67 9 . [ 2 0 ]堀田真一.L i c r o s o丘P o w e r P o i n t への [ 2リ吉田早織・平井隆幸・叶健・魚住龍史.ODSPOWERPOINTの活用 :SAS から M 0 1 5, 295・ 3 0 2 . エクスポート .SAS ユーザー総会論文集 2 連絡先 E ‑ m a i l :uozumi ( a J ,k u h v . k v o t c トu . G c. i v 付録 A: 図 2で省略したデータハンドリングの詳細 女==================================================*~, *リスク集合出力時間間隔; 宅l et Timelnterval=200; , *==================================================女. 女リスク集合の出力最大時間; もl et TimeMax=lOOO; , *ーーーーーーー‑‑‑‑ーーー‑‑‑‑ーーー一ーー‑‑‑ーーーーーーー一一一ーーーーーーー一一一一一一ーーーー一一一ーーーーーーー一一ーーーーーー一一一ーーーーーーーーーーー‑ーーーー合 . 大フォーマット proc format; value Cellf l='adeno' 2='large' 3='small' 4='squamous'; run; 会==================================================*‑ 女データセット Survivalplotから Survivalplot2の 作 成 ; data form; do StratumNum=l to 4 ; do time=O to 晶TimeMax by 長Timelnterval; output; end; end; data atriskO; merge form Survivalplot; by StratumNum time; data Surv工valplot2; set atr工skO; if AtRisk=. then do; AtRisk=O; tAtRisk=七工 me; end; run; 229
付録 B:F
o
r
e
s
tプロット作成時のデータセット FORESTDATAの作成プログラム
,
女==================================================会.
*フォーマット
proc format;
value Cellf l='adeno' 2='large' 3='small' 4='squamous';
value Priorf lO='Yes' O='No'; value AgeCf 1='< 65' 2='>= 65';
value Allf l='Overall';
run;
,
*===========================================================*.
安
MACRO: ForestTTE ;
*===========================================================女;
*サプ、グ ループ解析およびForestプロット用のデータセット作成
安===========================================================女.
*司│数の説明;
女
data :解析対象データセット
* sub :サブグ、ループや表すカテゴリ変数 r
* varname : Forestプロットに示したいサブグソレープ名
女
format :サフ守グ、ループのカテゴリの{事前に宗義した)フォーマット名
*αro :鮮や表す変数 {αro = 2 表対照群とする)
安
tte :牛存時間の評価項目荷表す変数;
* censor :打ち切りや表す変数;
決 c
ensorval :
キ11:,切り値;
* num :サブグループに付与した識別値;
女
out :出力データセット名;
安===========================================================*.
もmacro ForestTTE(data,
sub,
varname,
format,
grp,
tte,
censor,
censorval,
num,
out);
proc sort data=&data out=dataOO; by ⊂
run;
安一一ー尚一一一ー一一一一一一一一一一一一一一一ーー一ー 一一一ー一ー一一 一ー一一一ー一一一一一一一ー一一一ー・,
*各群のイベン卜割合の計算;
ods listing close; ods output CensoredSummary=eventOO;
proc lifetest data=dataOO;
time &tte女 &censor(&censorval); strata &grp; by ⊂
run;
ods listing;
2);
data eventOO;set eventOO; where &grp in(1,
N=Total; Event=Failed; prop=FailedjTotal;
pevent=trim(left(put(cat(trim(left(Event)),
"j",
trim(left(N)),
"(
"
,
trim(left(put(
工'ound(prop*lOO,
le‑1),
8.1))),
"
)
"
)
, 20.)));
keep &grp &sub pevent;
run;
proc transpose data=eventOO out=eventOO; id &grp; by ⊂ var pevent;
run;
data eventOO;set eventOO; rename ̲l=grpl ̲2=grp2; drop ̲NAME̲;
run;
女一一一一一一一一一一一一一一一一一一一一一ー一ーー一一一一一一一一一ー一一一ー一一一ー一一一一一一一一一一一一・,
*各サブグループにおける例数の計算;
ods listing close; ods output CensoredSumma工y=totalOO;
proc lifetest data=dataOO; time &tte安 &censor(&censorval); by ⊂
runi
ods listing;
data totalOO;set totalOO; N=Total; Event=Failed; keep &sub N Event;
run;
*一一ー一一一ー一一一一一一一一一一 一一ーー一一ー一一一一一一一一一ーー一一一一一一ーー一一一一一一一一一一一・,
*ハザード比の計算;
ods listing close;
ods output Parame七erEs七imates=HROO;
proc phreg data=dataOO;
class &qrp(ref="2"};
230
model &tte*&censor(&censorval) = &grp / rl ties=breslow; by 晶sub; run; ods listing; data HROO;set HROO; where Parameter="&grp"; keep &sub HazardRatio HRLowerCL HRUpperCL HR; HR=trim(left(put(cat(trim(left(put(round(HazardRatio, 1e‑2), 8.2))), 8.2))), " ー " , "( " , trim(left(put(round(HRLowe工CL,1e‑2), trim(left(put(round(HRUpperCL, le‑2), 8.2))), " ) " ) , 20.))); run; *ー一一一一一一一一一一一一一 一一一一ー一一一一一一一一一一一一一一一一一一一ーー一一一一一一一一一・, f i 宣の計算; *交互作用の p ods listing close; /* SAS/STAT14.1に対応, STAT/STAT13.2以前で、はModelANOVAの代わりに Type3を指定*/ ods output ModelANOVA=intOO; proc phreg data=dataOO; class &grp(ref="2") ⊂ model &tte*&censor(晶censorval) = &grp &sub &grp*&sub / rl ties=breslow; run; ods listing; data intOO; set intOO; where Effect="&grp*&sub"; intpval=trim(left(put(round(ProbChiSq, le‑3), pvalue8.3))); subgroup=&varname; subgroupc=晶num; keep subgroup subg工oupc intpval; run; *一一ー一一一一一一一一一一一一一一一一一一一一一一一 一 一一一ーーー一一一 一一ーーーー一一一一ーー・, 安すべての計算結果を集約; data survOO; merge totalOO eventOO HROO; by ⊂ &grp=l; data survOO;set survOO; whe工e &sub^=.; run; data survOO;set survOO; subgroupc=# subgroup=put(&sub, &format); catc=⊂ run; data itemOO;set intOO; valtype=l; data catOO;set survOO; valtype=2; if &varname="Overall" then valtype=l; data &out; length subgroup $ 50; set itemOO catOO; drop &sub &g工p; run; %mend ForestTTE; , 大==================================================女. *サブグ、ループご、とに解析実行; もForestT ' l 宮 ( VALung, all, "Overall", Allf., Therapy2, Time, Censor, 1, 0, a1工); もForestTTE(VALung, AgeC, "Age", AgeCf., Therapy2, Time, Censor, 1, 1, age); もForestTTE(VALung, CellC, "Cell", Cellf., Therapy2, Time, Censor, 1, 2, cell); もForestT7 宮( VALung, Prior, "Prior", Priorf., Therapy2, Time, Censor, 1, 3, prior); , *==================================================安. 合サフ、夕、ルーフ 解 析 結 果 の 集 約 ; η data forestdataOO; length subgroup $ 50; set all age cell prior; run; , *==================================================*. 女全体の解析・結果をマクロで実j 庖した結果の調幣; data forestdataOO;set forestdataOO; if subgroupc=O and N=. then delete; run; 合ーーーーーー一一一一一ーーーーーーーーーーーーーーーーー一一一一一ーーーーーーーーーーーーーーーー‑‑‑一一ーーーーーーーーーーーーーーーーーーーー一一ーーー ーーーーーーーーー一 , *インデン卜の設定; 台 . data forestdataOO;set forestdataOO; forestval= n ; if mod(subgroupc, 2)^=0 then ref=forestval; lndent=l; if subqroup="Overall" or intpval^="" then indent=O; 231
run;
ods listing close; ods output summary=forestvalmax;
proc means data=forestdataOO max; var forestval;
run;
ods listing;
,
*==================================================*.
*横軸の説明テキストの設定;
data xaxis; length text $ 50; set forestvalmax;
forestval=forestval̲Max+1; valtype=2;
xl=0.2; yl=forestval; text='<一
一 Test Better'; output;
xl=4; yl=forestval; text='Standard Better 一一>'; output;
run;
data forestdata;set forestdataOO xaxis;
run;
,
六==================================================*.
女変数ラベルの指定;
data forestdata;set forestdata;
label grpl="No. of Pat工ents in Test Group (も)"
grp2="No. of Pat工ents in Standard Group (も)"
intpval="P‑value for Interaction" subgroup="Subgroup" HR=" "
;
run;
*==================================================*;
* 付 録 Dのデータセット ATTru
仏P
作成プログラム;
data attrmap; length textweight $10;
id='text'; value='l'; textcolor='Black・; textsize=7; textweight='bold'; output;
id='text';value='2'; textcolor='Black'; textsize=5; textweight='normal';output;
run;
付 録 C:F
o
r
e
s
tプロット作成時のデータセット FO
阻 STDATA
S阻bgroup
I
n
t Type
p
v
a
l
O
v
e
r
a
l
l
Age
<65
0
.
2
8
4
>=65
C
e
l
l
a
d
e
n
o
2
0
.
0
3
8
l
a
r
g
e
2
2
s
q
u
a
m
o
u
s
Yes
2
2
s
m
a
l
l
P
r
i
o
r
No
1
2
0
.
0
9
I
2
2
N
Grpl
Grp2
1
3
7 6
4
/
6
8
(
9
4.
1
)
6
4
/
6
9
(
9
2
.
8
)
93 4
2
/
4
6
4
4
1
4
7
0
.
9
0
3
0
.
5
8
3
(
9
0
3
/
2
.
6
2
)
4
4
2
(
9
2
1
/
2
.
3
2
) 2
(
1
0
0
.
0
) (
9
0
.
9
)
1
.
39
3
0
.
7
5
1
2
.
5
8
2
1
.2
3
1
0
.
5
2
8
1
.5
3
6
0
.
6
9
2
1
.6
3
3
0
.
8
5
4
0
.
5
4
3
0
.
2
5
.2
3
2
.
8
7
2 1
2
.
8
7
)
(
0
.
5
3・
.
4
0
9 1
.5
4
3
41
)
(
0
.
6
9
‑
3.
3
.
1
2
3 1
.6
3
3
.
1
2
)
(
0
.
8
5・
1
.
17
9 0
.
5
4
(
0
.
2
5・
1
.
18
)
1
.2
4
8
0
.
8
2
2
0
.
6
7
6
0
.
3
4
4
2
7 1
7
/
1
8
2
7
(
1
9
2
4
/
.
1
4
2
)
(
1
0
0
.
0
)
48 1
7
/
1
8
9
1
9
(
l
o
o
1
5
‑
O
)
1
4
1
(
2
9
8
3
/
3
.
3
0
)
3
5
(
1
9
8
4
/
2
.
4
0
)
(
9
0
.
0
)
(
1
9
3
3
/.
3
)
1
5
(
8
6
.
7
)
97 4
7
/
4
9
4
4
/
4
8
(
2
9
0
1
/
2
.
7
1
)
(
9
5
.
2
4
0
(
1
9
7
5
/
9
1
9
)
(
8
9.
5
)
Hazard
HR
HR
HR
Ra
t
i
o Lower U
C
p
p
L
e
r
CL
1
.0
1
6 0
.
7
1
3 1
.4
4
8 1
.0
2
(
0
.
7
1・
1
.
4
5
)
。
。
1
.4 0
.
9
0
(
1
0
.
3
5
9
8
‑
l
.
4
0
)
2
.
5
8
)
(
0
.
7
5・
1
.8
9
4 1
.2
5
(
0
.
8
2
‑1
.8
9
)
1
.3
3 0
.
6
8
(
0.
34
‑
1.
33
)
付 録 D:SGPLOTプロシジャ(固めで用いるデータセット AπRMAP
X
I
れ'
a
lMax f
o
r
e
s
t
v
a
l valWpe
t
e
x
t
f
o
r
e
s
I
!
〈ー T
e
s
tB
e
t
t
e
r
2
0
.
2
1
3
I
3
1
2
1
2
1
3
2
4
1
3
S
t
a
n
d
a
r
dB
e
t
t
e
rー 〉
232
I
n
d
e
n
t F
o
r
e
s
t Ref
v
a
l
。
2
3
2
3
4
4
5
6
7
8
。
9
1
0
1
1
1
0
1
2
1
2
1
1
臨床試験における SGプロシジャを用いた G r a p h i cD e s i g nの考察 0山 崎 文 寛 ¥ 清 水 康 平 l、 高 浪 洋 平 l 武田薬品工業株式会社日本開発センタ一生物統計室 l C o n s i d e r a t i o n sonGoodG r a p h i cD e s i伊 u s i n gSGP r o c e d u r e si nC l i n i c a lT r i a l s F u m i h i r oYamasaki1, KoheiS h i m i z u1, Y o h e iTakanamiI I T a k e d aP h a r m a c e u t i c a lCompanyL im i t e d 要旨 臨床試験で一般的に用いられてきた被験者の推移図や散布図等について,それらのグラフで表現しきれ なかった情報を付加した新たなグラフを紹介し, SAS9. 4 の SGプロシジャを用いた作成方法を提案する. キーワード :SGプロシジャ, LasagnaP l o t (ラザニアプロット), S u n f l o w e rP l o t 1 はじめに 臨床試験の統計解析業務において,グラフによるデータの可視化は非常に有用な分析ツールとなるが, 一般的に用いられる被験者の推移図や散布図等から読み取れる情報には限りがある.一方,近年 SAS をはじめとするソフトウェア技術の進歩により,数多くの種類のグラフが容易に,かっ高品質に作成で 2 0 1 5 )は,適切にデザインされたグラフは強力なコミュニケ きる環境が整いつつあり, SusanP.Dukeら ( ーショ・ンツールとなる事,データに対する適切なグラフの選択が重要である事を主張するとともに,こ れまで表現しきれなかった情報を付加した新たなグラフの作成によるデータの分析方法を提案してい 4 の SGプロ、ンジャに る.本稿では,それらのグラフを従来のグラフと比較・考察するとともに, SAS9. よる作成方法及びカスタマイズ方法を報告する. 2 適切な G r a p h i cD e s i g nについて グラフによるデータの可視化における課題の一つは,データに対して適切な G r a p h i cD e s i g nを選択する ! l t t o s : / / w w w . c t s o e d i a . o r 立)では, FDA・製薬企業・アカデミアのメンバーから構成 ことである. CTSPediaC される S a f e t yG r a p h i c s WorkingGro 叩によって推奨されている,適切な G r a p h i cD e s i g n の選択方法 ( C h o o s i n gt h eR i g h tGraph‑WhatI st h eP r o c e s s ? )やグラフを作成するサンプルのソースコード等が公開 されている.本章では,その適切な G r a p h i cD e s i g nの選択方法について概要をまとめる.なお, CTSPedia は,臨床研究者向けに,統計解析やグラフ等に関する知識・ツール・教育資料等を蓄積し,タイムリー で有用なアドバイスを提供するために設立されたものである. 233
2 . 1 適切な G r a p h i cD e s i g nの原則 S a f e t yG r a p h i c sWorkingGroupは,図 2 .1.1に示すフローによって,適切な G r a p h i cDesignを選択するこ とを推奨している.本フローには,解析する変数の性質(連続値,カテゴリ値等),解析要件(経時デ ータの解析,群間比較等),グラフの表現方法 ( 1群で l図,複数群で l図等),グラフの種類等に関す る選択肢が設けられており,最終的にデータに対して適切な GraphicDesignを選択することができるよ うに構成されている. 解析する変数 のカテゴリ数, グラフの種類 を決定 グヲフめ穣類が 許容するなら XorY輸を 時間軸とする. 無理であれば, 個々の時点を複i のグループとみ尤 すことを検討 図 2ム1GraphicDesignの選択するためのプロセス ( S a f e t yG r a p h i c sWorkingGroup( 2 0 1 2 ) より抜粋) 一つの連続値データのグラフ作成において,個々のレコードが利用可能な状態であれば,図 2 .1 .2 に示 234
す詳細度 ( L e v e lofD e t a i l )に従って,適切な G r a p h i cD e s i g nを選択することができる.ここで言う詳細 度とは,グラフ上でデータを示す線や記号等自身が示す情報量の多さのことであり,左に行くほど高く, 右に行くほど低くなる.より多くの情報をグラフで示す場合は,詳細度の高い G r a p h i cD e s i g nを選択す Ka p l a nMeier 四 │細かい分布│ ・ ・ ・ ・ ・ ・ ・ : : ・ :a l‑:l ‑ る必要がある. ヒストグラム │詳細度高│ │詳細度低│ │生データ│ │要約データ│ │解析蝶索│ │ V i o l i nプロット シンボ/ルレ& 1 • │確率密度分布 J I 箱ひげ図 │伝宙簡潔│ 誤差パ} l : 1 │ I . M h 什 .L i n eP l o t I• F o r e s tP l o t e s i g nの遺択 ( S u s a nP.Dukeら ( 2 0 1 5 ) より抜粋) 図2 .1 .2 詳細度による GraphicD l枚のグラフに示す情報は,群やサブグループの数によって,図 2 .1 .3に示す方法に従って,適切な G r a p h i c D e s i g nを選択することができる.その際,以下の 2点のバランスによって選択する事が望ましい. ・比較したいグラフにおける要素をできるだけ近くに配置すること ‑複数のパネルやグ ラフを使用することで,グラフの乱雑さを避けられること I枚のグラフに lグループ ; │ l枚のパネルに lグループ (複数パネル使用) 複数の変数 (例:年齢, 性別,投与群) l枚のグラフに 複数グ.ループ 桝 1枚のパネルに 複数グループ (複数ノ fネル使用) 1‑'‑1 ' 1 コE 豆 ヨ 図2 . 1 . 3 グラフサブタイプによる GraphicD e s i g nの選択 ( S u s a nP.Dukeら ( 2 0 1 5 ) より抜粋) 235
2 . 2G r a p h i cD e s i g nの推奨事項 S a f e t yGraphicsWorkingGroupは,以下に示す「グラフ作成のための 9つ最良の方法 ( 9BestP r a c t i c e sf o r n gG r a p h s ) J を CTSPediaで公開している.以下に主な内容を示す.原文については CTSPediaを参 M依 i 照されたい. ① 内 容 (Content):説明文無しで意味する内容が表現され,明快・効果的・有益であるべき. ② 伝 達 (Communication):伝達内容に対して本質的及び直感的であるべきで,情報の詰め込みすぎや, 最も伝えたいことから逸らす表現は避ける. ③情報(Inf o r r n a t i o n ):不必要な情報は表示せず,必須情報の表示に充てるシンボル及び文字の割合を 描画領域全体に対して最大化する. t a t i o n ):注釈及び凡例は,解釈を助け,最も伝えたいことから逸らさないように正しく配 ④注釈(Anno 置し,読みやすいフォントを使用する. ⑤ 軸 (Axes):経時データに対して V i s i t番号(順序尺度)の代わりに時間(連続尺度)を使用する等, 輿味のあるデータの特徴を示すのに適した軸スケールを検討する.また,ゼロを含まない場合はそ れを明記し,比較するグラフ間で同じスケールとすることも重要.データの性質からグラフ形状が 自動的に決まる場合はそれに従い,それ以外のグラフは横向きで,横方向の長さは縦方向よりも 50% 広くする. ⑥様式 ( S t y l e s ):実薬は rAJ,プラセボは r p J といった、ンンプルかっ直感的に解釈できるシンボルを 選ぶ.スクリーンやポスター用には,太線や大きなシンボル・フォントを使用する.また,シンボ ル・線等は,すべて同ーのものを指すべき. ⑦ 色 (Colors):情報を解釈する場合にだけカラーを使用する.その場合,対照的で明瞭な色を選ぶ(モ ノクロでは,イエローは自になり,レッド・グリーン・ブラウンは互いに区別できなし、).なお,印 刷等によりモノクロで見る可能性があれば,シンボ、ルやラインスタイル等と同様に,その特徴を確 保すべき.色の選択は, rCOLORBREWER(colorbrewer2.org)J が有用. ③ 技 術 (Techniques):データの関連性に従ってカテゴリを分類したり,一緒に表現すべき情報であれ ば一つのグラフで表現するとし、った,伝えたい内容を明確にするために確立された技術を使用する. l o t s ):データの分布を示すために最も適した種類のグラフを使用する. ⑨ プ ロ ッ ト の 種 類 (Typesofp 例えば,変数聞の関連性を示す場合は散布図やラインプロット,第 3の変数に関して, 2変数の関 連性を示すには格子グラフを使用する. 3 SGプロシジャを用いた G r a p h i c sの提案 SGプロシジャは,高品質な統計グラフを作成するプロシジャである.複数のグラフを重ね合わせたり, 並べて表示する場合に非常に有用である. SGプロ、ンジャには以下の 5種類があり,目的に応じて使い 分けることができる.詳細については,高浪・舟尾 (2015) や舟尾 (2016) を参照されたい.なお,本 稿では,上述した S a f e t yG r a p h i c sWorkingGroupが推奨する G r a p h i cD e s i g nの中から, L a s a g n aP l o tと S u n f l o w e rP l o tを紹介するとともに, SGプ口、ンジャによる作成方法を提案する. 表 3SGプロシジャの種類 SGプロシジャ S G P L O T │概要 I 様々な種類の 2次元プロットを作成.複数の種類のグラフを重ね合わせて作成する 236
SGプロシジャ
S
G
P
.
刷E
L
S
G
S
C
A
T
T
E
R
S
G
R
印D
E
R
S
G
D
E
S
I
G
N
概要
ことが可能
G
P
L
O
T
P
A
N
E
L
B
Y スアートメントの指定に基づき,複数のグフフをパネル状に表示. S
で作成可能な,ほぽ全てのグラフをサポート
散布図の作成に特化したプロシジャで,変数の組合せごとに,複数の散布図を並べ
て I枚で作成
G
r
a
p
hT
e
m
p
l
a
t
eL
a
n
g
u
a
g
e(GTL) でカスタマイズしたアンプレートを読み込んで、グフ
フを作成
SGRENDERで読み込み可能な GTLを,ユーザがマウス操作でカスタマイズして作
成
3
.
1 サンプルデータ
本項では,プラセボ対照の 4群比較 (
P
l
a
c
e
b
o,ABC‑123lOmg
,
ABC‑12320mg,ABC‑12330mg) で
, 1群
あたり 5
0例計 2
0
0例,計 5時点 (
B儲 e
l
泊e
,
V
V
e
e
k
2
,V
V
e
e
k
4,
V
V
e
e
k
6,
V
V
e
e
k
8
) から成る高血圧患者を対象と
した仮想の臨床試験データから得られた,図 3
.
1
.
1 に示すノミイタルサインの解析用データセット ADVS
を用いて, G
r
a
p
h
i
cD
e
s
i
g
nの比較・検討を行う.本データセットは, CDlSCADaMBDS形式に準拠して
おり,検査項目として,収縮期血圧,拡張期血圧等を含んでいる.また,成人における血圧値の分類(表
3
.1
.2
) を適用したカテゴリ変数 (AVALCA
T
l
, BASECA
Tl)を含んでいる.なお,図 3
.1.1は一部のレコ
ードを抜粋して表示している.
• S
A
F
F
L PARAM
P岨w.∞
5TU1J別 o u
s
u
副1
0
TRTA
:
ν国 同 時8N
J
C
.
l
2
3lQo可 Y
島 届 出 回u割dI'Ie園周肘",1
胡 S
B
C
.
I2
・
1
2
:
)
,
咽1A
Y
5
B
P
l
l
A
B
C
盲
目P
配・1
23/001A
B
C
‑
1
Z
ν田 3
剖担 A
B
C
‑
I
2
311>司 Y
布団O
I
C包ood附喫臨周併問均) SY
21A
Z
ν田 1
品調 A
YSBP
3
1
O
O1A民戸l
B
C
‑
I
2
311>珂 Y
匂
ョa
必c匝"'"刊号血血依田均i S
3
1
A
B
C
‑
12
・
1
2
3
1
叩 1A
荷量O
I
CBIOOd町宮阻周肺胃均) 計 四 P
41ABC
B
C
‑
I
2
3
1
田1
制調 A
B
C
‑
I
2
3市 咽 Y
・
.
1
2
3
1
田1‑(
)
4
担 A
配 1
2
3
1岱咽 Y
BC
配ー1
2
3
1
田 1A
51A
剖坦 A
B
C
‑
l
2
31Q咽 Y
S
C
‑
12l1田1
GI
A
B
C
‑
I23/001A
・
1
2
3
1
叩 1A
B
C
‑
I
2
3
1
田1‑()拍8A
B
C
‑
1
2
31O咽 Y
71ABC
:
ν田 1
・出羽 A
B
C
‑
I2
B
C
‑
I
2
3
1o.咽 Y
8
I
A
B
C
‑
I23/001A
D
C
‑2
3
1
田1
制調 A
・
1
2
3
1
田 1A
B
C
‑
1
2
3
1伽 市 Y
9
1
A
B
C
・
1
2
3
1
0
0
1A
B
C
‑
I
2
3
1
田1
‑
0
唱8A
B
C
‑
1
2
31G咽 Y
1
0
l
A
B
C
・l
Z
ν田 1
‑
凪3
9A
B
C
‑
l呂 田 咽 Y
B
C
.
・
1
2
3
1
田 1A
lllABC
,
B
C
‑
1
2
3
1
田1
‑
制3
9A
B
C
‑
I
2
3市 咽 Y
1
2
I
A
B
C
‑
I23/001A
B
C
.
1
2
3
11)可 Y
‑04担 A
1
3
1
A
B
C
‑
12
3
1
U
O
lA
B
C
‑
1
Z
ν田 1
咽 1A
B
C
‑
l町 田1
剖担 T
S
C
.
1
2
3
1(h司 Y
1
4
I
A
B
C
‑
I
2
3
1
田1
剖担 A
B
C
‑
I
2
3
1
B
C
‑
I
2
3
11
1
‑
咽 Y
1
5
1A
B
C
‑
I23/001A
咽1
制 調 MJ{;
‑
1
2
31Q咽 Y
B
C
‑
I
2
3
1
田 1A
1
6
1A
B
C
‑
I
2
3
1
配:
‑
1
2
3
咽 1
制調 A
B
C
‑
I
2
3
1助羽 γ
田 1A
1
7
I
A
B
C
‑
I
2
3
1
担 U田 1A
B
C
‑
I2:),咽1
制調 A
BC.l23m
司 Y
1
8
1
A
B
C
田1
‑
制調 A
B
C
‑
I
2
3
1
咽 1A
1
9
I
A
B
C
‑
1
2
3
1
B
C
‑
'垣 市 司 Y
却 A
B
C
‑
l
2
3
1
咽 1A
8C
‑
12
:
ν曲 1
・白羽 A
B
C
.
1
2
31O司 Y
勤"
O
I
C臨 吋 内 明 醐 胸 同 } S
Y
S
8
P
P
α画旬IicBo<訓d向型阻周伽四均} 。仇B
鴎 岨O
I
C品。dl'le阻Z司令m均 } D仇BP
O
I
C90<泌門官園周併問均} D眺BP
P
印国必clJ慌が府曹阻""伊m匂 } 日除B
印 国 此 恩 田d ̲
司 肺 均 }D
眺B
P
甜
。
S
同.oIc晶。d冊目....肘m均) S
YSBP
勾宮.oIclJOOd向田....肘m匂 } 5
YSBP
骨雷O
I
C勘吋間取臨周肘m均) SY5BP
YSBP
嗣oIclJ副‑.加地} S
Y5BP
骨量宜酷副‑.肺匂} S
P
印国oIcl
l
低調'"型園周伽別地) む仇B
以B
P
鴎国必c9
o
<
調dI'Ie血血伽開地} D
白 岨O
I
C盟国dl'!電盟国伽問地} 四ABP
印鑑監t 園町別dl'!型車皿伽m均 } 口
抗BP
印画旬IicBIOOd丹"
"
"
"
'
l
n
m
l
匂} O
I
A
B
P
AV
N
S
:
.
A
1
N 包括E B崎B:A
T
l
A~此 AVNS:.ATI
出 1
4
0
1
0
1回目別均
1
1
国 1
4
0
0
01
田町四地
盟国百地
1
4
5
1
1
4
0旬 1
1
4
5
1
1
4
0
1
01
盟問冒均
盟 国1
0
1耳 m 均 │
1
0
2
1
1曲 旬 1
田 mm
同
9
7叩 1
0盟 国n
匂
割 田 畑 盟 問n
均
田 由1
0盟 問n
H
g
括 時1
0盟 問n
H
g
4
Ot
o1
盟問地
1
5
2
11
担問司均
1
3
6
1
1羽 旬 1
0
1羽 田n
均
1
3
3
1
1却 1
1
3
1
1
1却 t
ロ1
担"'"均
却t
白 1
3
9間前均
1
3
11
自 由1
0曲目",1
旬
4
1 1
副 1
4
0
t
o1
田 ...
均
4
1 1
剖 1
4
0加 1
国間百均
4
0旬 1
国間百十句
4
1 1
副 1
4
0旬 1
園田冒均
4
1 1
剖 1
9
' 由 旬 国 間n
均
担割旬国間叶句
4
8
5
1
0田 岡n
Hg
田 8
5
1
0田町叫句
4
1 ‑
9 ‑
5
.
8噛劃01<4
4
1 ‑
9 ‑
5
.
8Week6
1
4
.
3Week8
4
1 ‑
2
2 .
。
OIB
置曲槍
5
5
1 ‑
5
1 ‑
4.
9Week2
5
1 ‑
81 ‑
7
.
8 Wod<4
,*6
5
1 ‑
41 .
3
.
9W回
5
1 ‑
61 ‑
5
.
9Wod<8
。
4
01&
誕脅噂
4
1 .
1
& ・1
0
.
5Week2
4 ・
1
9
1‑
12
.5Week4
4
! .
2
1
!.
1
3
.
8W創*6
3
1 1
5
41
4
0
1
0159nm均
由旬1
園田川匂
5
1 1
田 1
4
1 1
田 1
田1
0
1国 間n
均
4
1 1
田 1
岨1
0
1岡 田n
l
匂
4
1 1
0
21
田1
0
1国 間 均
4
1 1
但 1
田恒 1
曲m
ml
句
4
1 1
5
2 14010159mm
均
3
1 1
5
21
4
0旬 1
日 mm
均
4
0
1
0
1国間百均
3
1 1
5
21
田間百地
4
0
1
01
3
1 1
5
21
3
1 1
包 1
40ω1国間胃均
4 田 田1
0盟 問n
均
3 田 国1
0四 mm
均
3 田 由 旬 盟 問n
l
句
4 由 国1
0由 mm
均
田
BAS
B:A
1
NC
I
幅
P
C
I
幅 AVISπAV
隠πN
4
1
o
! 。陸海面槍
4
I
W
e
e
k2
2
。I o
田 田1
0盟 mm
H
o
3
4
5
1
2
3
4
5
1
2
3
4
I
e
e
k8
4
1 ‑
2
1i‑
1
3
8柄
4
。
O
l&s曲活
1
4
・
1
0
1‑
1
0
.
1 Wod<2
2
4
1 ‑
1
3
1 ・1
3
.
1 W.
曲4
4
1 ‑
8i‑
8
.
' Week6
4
.
]
! ‑
7
.
1 W"
ホ8
3
4
5
図3
.1.1パイタルサインのデータセット ADVS (CDISCADaM形式)
表3
.1
.2成人における血圧値の分類(高血圧治療ガイドライン 2
0
1
4より抜粋)
検査項目
収縮期血圧
(SYSBP)
拡張期血圧
(
D
l
ABP)
1
.
至適血圧*
2
.
正常血圧
3
.
正常高値血圧
4
.
I度高血圧
E度高血圧
E度高
6
.血圧
<120
1
2
0
‑
1
2
9
1
3
0
‑
1
3
9
1
4
0
‑
1
5
9
1
6
0
‑
1
7
9
>=180
<80
8
0
‑
8
4
8
5
‑
8
9
9
0
‑
9
9
1
0
0
‑
1
0
9
>=110
5
.
*収縮期血圧と拡張期血圧の and条 件
3
.
2S
p
a
g
h
e
t
t
iP
l
o
tと L
a
s
a
g
n
aP
l
o
tの比較検討
臨床試験で,各被験者の経時的なデータを単一グラフで示す場合は, S
p
a
g
h
e
t
t
iP
l
o
t (スパゲッティプロ
237
ット)がよく使用される.しかし,被験者数が多くなるにつれて,線と線の重なりが多くなるため,外 れ値の検出は可能だが,各被験者の推移を正確に読み取ることは困難となる.それを改善する手法とし て , S u s a nP .Dukeら( 2 0 1 5 )によってLas a g n aP l o t (ラザニアプロット)が提案されている. S p a g h e t t iP l o t がパスタ料理に似ていることからそのように呼ばれるのと同様に, L a s a g n aP l o tもラザニア料理に似て . 2.1に拡張期血圧の S p a g h e t t iP l o t,図 3 . 2 . 2 に拡張期血圧の いることからそのように呼ばれる. 図 3 L a s a g n aP l o tを示した. 亘書量雪之 ・ . . ・ w B u磁調. 初旭... A 白 " ・bY也 . ・ . 四 W " . . . ‑ . . . . ・ . ・ ・ w W回a h叫拠泊 w W凶a 図3 . 2 . 2拡張期血圧の LasagnaP l o t 図 3ム1拡張期血圧の S p a g h e t t iP l o t 図3 . 2 . 1は X軸に時点, Y軸に検査値を配置している.一方,図 3 . 2 . 2は X軸に時点, Y軸に被験者を配 置しており,各セルの色の濃淡で検査値の大小を示している.色は検査値が大きいほど濃く(黒に近づ く),小さいほど薄くなる(白に近づく)ように設定しており,グラフ右端に検査値と色の濃淡の対応 a s e l i n eの検査値の降順に配置しており, X軸方向に見ていくと各 を示す凡例を示している.被験者は B . 2.1及び図 3 . 2 . 2の作成に用いた拡張期血圧は, Week4の最大 被験者の推移が読み取り可能である.図 3 1 7である.図 3 . 2 . 1ではその最大値 1 1 7が外れ値として読み取れるが,その前後の値は線の重な 値が 1 . 2 . 2では Week4における最大値の具体的な値は読み取れないが,グラフ りによって読み取れない.図 3 右端の凡例とグラフ中の色の濃さから,上から 3 例目の被験者が該当し,ベースラインから高値で, Week4で 1 1 7を示した後,元のレンジ ( 1 0 0 . . . . . . 1 1 0 ) に戻ったこと等が読み取れる.なお,本稿では,グ レースケールを用いているが, SASのデフォルトでは 3色で値の大きい方から「赤色→白色→青色Jと 段階的に色が変化するようになっており,グレースケールよりも明確に値の大小を読み取れる.以下に, S p a g h e t t iP l o tとLa s a g n aP l o tの比較結果を要約した. p a g h e t t iP l o tと LasagnaP l o tの比較結果 表 3ム1S Lasag 回 目 。t 「多い場合」向き 「少ない場合」向き 「連続値又はカテゴリ値Jの両方 「連続値」向き 色の濃淡(変化) Y軸の目盛及び線 例えば,サーモグラフィのように,値の大 きい方から「赤色→緑色→青色」のように 変化させると分かりやすい sp列~前tiPlot 被験者数 データの種類 値の大小 の判別 238
外れ値の 検出方法 集団から逸脱している線 長所・短所 ‑長所:被験者の数が少ない場合は,連続 値で、あっても値を読み取ることが容易 ‑短所:被験者の増加と共に線の重なりが 増加するため,各被験者の推移が確認で きない 色の濃淡(変化) 例えば,値の大きい方を「赤色 J,小さい方 を「青色」としていた場合,他のセルと比 べて際立つて赤い場合や青い場合は,それ が外れ値と確認できる ‑長所:被験者の数に関係なくプロットの 重なりが発生しないため,各被験者の大 よその推移が確認できる ‑短所:連続値の場合,値に応じて変化す る色の細かい違いを読み取ることが難し いため,詳細な値が確認できない 3. 3 LasagnaP l o tの作成方法 SGPLOTプロ、ンジャにおいて, L a s a g n aP l o tを作成する方法として, HEATMAPPARMステートメント又 は HEATMAPステートメントを利用する方法の 2種類がある.両ステートメントは, 3変数を用いた 2 次元プロット(すなわち H eatmap) を作成するもので, 3変数のうち 2変数を用いて「複数の長方形か ら成る格子構造Jをプロットし,残りの l変数によってその各長方形に色付け等を行うことで 3変数の 値を表現することができる.以下に,両ステートメントの基本構文及び主要なオプションを示す. <基本構文> H臥 T 融P P 肌M X = < X軸の変数> y = < y軸の変数〉 ∞LORRESPONSE=く各セルの色付けに使用する変数〉 C O L O 間O D E L = く各セルに適用する色の組合せ> ; H 臥T 胤P x = < x軸の変数> y = < y軸の変数〉 /∞L O R R E S P O N S E =く各セルの色付けに使用する変数〉 ∞ LOR D 且=<各セルに適用する色の組合せ> ; 即 <主なオプション> ∞ L O R R E S N S E = n u m e r i c ‑v a r i a b l e ∞ L O R M O D E L 問 = c o l o r ‑ r a m p ‑ s t y l e ‑ e l e m e n tI ( c o l o r ‑ l i s t ) H e a tmapの各セルの色を,指定した数値変数の値に 応じて変化させる ∞ L O R R E S P O N S Eオプションと同時に使用する色傾斜 ( C o l o rRamp)又は色の組合せを指定 色傾斜は T hreeColorRamp.T h r e e C o l o r AltRamp, TwoColorRamp.TwoColor AltRampが指定可能 ) 慣に値 具体的な色の組合せを指定する場合は,左から 1 の小さい順に適用したい色を列挙したうえで全体を 括弧で囲む 円 比A T T R S =(TRANSPARENCY=number) 0 . . . . . . . . 1 H e a tmapのセル全体に対する,透過性を指定 ( の値を指定し, 0が透過なし) O U T L lNE O U T L 1N E A T T R S H e a tmapのセル全体に対して,輪郭離を表示 H e a tmapのセル全体における輪郭線の見た目 ( 色 , = s t y l e ‑ e l e m e n tI s t ) 必‑ e l e m e n t( l i n e ‑ o p t i o n s )I ( l i n e ‑ o p t i o n s ) 線の種類・太さ)主量産 制M E = " t e x t ‑ s t r i n g " 他のスアートメントからの参照のために,本 P l o tステ ートメントに名前を割り当てる <プログラムと出力例> プログラム 3ふ lは,色と検査値の関係の暖味さを改善する方法として,表 3 .1 .2の成人における血圧値 の分類に従って作成したカテゴリ変数 AVALCA1Nを用いている.実測値をそのままプロットするより 239
も色の段階を少なくすることで色聞の区別を明確化しているが,カテゴリ化によって詳細な検査値の情 報を失っているため,検査値の詳細さとグラフの見易さのバランスを考慮のうえ,選択されたい.なお, a s e l i n eのカテゴリ値の降順としてお 見易さの工夫として被験者のソート順は事前のソート処理により B り,さらに,各被験者聞の情報を明確に区別するために OUTLINEオプションを指定して各セルに輪郭 ふ 1I こ示す.プログラム 3 . 3 . 2は,実測値を読み取れない欠点を解 線を引いている.この実行結果を図 3 a s a g n aP l o t上に実測値そのものをシンボルとした S c a t t e rP l o tを重ね合わ 消する方法として示したが, L せるために, SCATTERステー卜メントを同時に使用している.なお,グラフの解釈を助けるために, 特に興味のある値(成人における血圧値分類が E度高血圧以上に該当する値)のみを表示させた.これ . 3 . 2に示す. は出力したい値だけを格納した変数を事前に作成することで実現した.この実行結果を図 3 p r o cS g p l o td a t a = く入力データセット> ; f o r m a tA V A L C A 1 Nくフォーマット名> ; b yP A R A M C DT R T A N; h e a t m a p p a r mx = A V I S I T y = U S U B J I D c o l o r r e s p o n s e = A V A L C A 1 N /n a m e = 'a 'c o l o r m o d e l = C W H I T EB L A C K )o u t li n eo u t li n e a t t r s = ( c o l o r= w h i t e ) y a x i sd i s p l a y = ( N O V A L U E SN O T I C K S ) g r a d l e g e n d' a ' /i n t e g e rt i t l e=' D i a s t o li cB l o o dP r e s s u r e( m m H g ), r u n プログラム 3 ふ 1 カテゴリ値を用いたグラフを作成 p r o cs g p l o td a t a = く入力データセット> ; f o r m a tA V A L C A 1 Nくフォーマット名> ; b yP A R A M C DT R T A N; h e a t m a p p a r mx = A V I S I T y = U S U B J I D c o l o r r e s p o n s e = A V A L /n a m e = ' a ' c o l o r m o d e l = ( W H I T EB L A C K )o u t li n eo u t li n e a t t r s = ( c o l o r = w h i t e ) s c a t t e r x = A V I S I Ty = U S U B J I D /m a r k e r c h a r = A V A L 2m a r k e r c h a r a t t r s = ( c o l o r= w h i t es i z e = 7 ); y a x i sd i s p l a y = ( N O V A L U E SN O T I C K S ) n t e g e rt i t l e= ' D i a s t o li cB l o o dP r e s s u r e( m m H g ), g r a d l e g e n d' a ' r u n ハ ‑ h岨~II Vi岨 図3 . 3 . 1 カテゴリ値を表示したグラフ 図3 . 3 . 2実測値を表示したグラフ 図3 . 3.1及び図 3 . 3 . 2は,ある群における拡張期血圧をプロットしたものであったが,複数の群を比較し . 3 . 3に示す SGPANELプロ、ンジャを用いることで可能となる.パネルごと たい場合には,プログラム 3 , HEATMAPPARMステートメントの " Y = "には,各群におけ に分割したいグ、ループ変数を PANELBYに る被験者の連番を格納した変数を指定する.これは, Y 軸を左右のグラフで共有しているためである. 240
この実行結果を図 3ふ 3に示す.詳細なプログラムは付録を参照されたい.
I
p
r
o
cs
g
p
a
n
e
ld
a
t
a
=
<入力データセット);
,・
Poromot 00由=阻A8P
a
‑£胃 図
苦言阜E
04
︒
言a
a
b
yP
A
R
A
M
C
D
;
f
o
r
m
a
tA
V
A
L
C
A
1
Nくフォーマット名);
p
a
n
e
l
b
yT
R
T
A
;
h
e
a
t
m
a
p
p
a
r
mx
=
A
V
I
S
I
T
y
=
<各群の被験者の連番〉
c
o
l
o
r
r
e
s
p
o
n
s
e
=
A
V
A
L
C
A
1
N/n
a
m
e
=
'a
'
附
c
o
l
o
r
m
o
d
e
l
=
(
W
H
I
T
EB
L
A
C
o
u
tI
i
n
e
r
o
w
a
x
i
sd
i
s
p
l
a
y
=
(
N
O
V
A
L
U
E
SN
O
T
I
C
K
S
)
;
g
r
a
d
l
e
g
e
n
d'
a
' /i
n
t
e
g
e
rt
i
t
l
e
i
cBI
o
o
dP
r
e
s
s
u
r
e(
m
m
H
g
)
'
;
='
Di
a
s
t
oI
r
u
n
;
プログラム 3
.
3
.
3
各群をパネル状に配置したグラフを作成
.
.
.
.
.
,
・
積
,
.
.
.
, w,
・
.
.
.
積
ゐ
.
.
・
・
,
.
.
2
凪
,
鴨
‑
,
・
̲
.
鴨
厄
.
.
.
8 8&"'訟. w.
向叫卵胞Vl'"
図 3ふ 3 各群をパネノレ状に配置したグラフ
3
.
4 色の選択方法
L
a
s
a
g
n
aP
l
o
tは解釈しやすい色の組合せを選ぶことが重要である.本稿ではモノクロ印刷を考慮して白
と黒の 2色を選択したが,カラーが利用できる環境及び状況であれば赤や青といったカラーを積極的に
c
o
l
o
r
b
r
e
v
v
e
r
2
.
o
r
g
)は適切な色の組合せの選択を容易にする.実際のサイ
利用したい. COLORBREWER(
トの画面を図 3
.
4に示したが,画面上のオプションにより,色見本とともにカラーコードが表示される.
画面左上から順に以下に記載したオプションを選択していくことで具体的に色が選択できる.
① 色 の 数 :3
"
"
'
1
2色が選択可能で,データのカテゴリ数等に応じて選択
e
q
u
e
n
t
i
a
l,D
i
v
e
r
g
i
n
g,Q
u
a
l
i
t
a
t
i
v
eの 3パターンが選択可能で, それぞれ,薄い色
②色の変化パターン:S
から濃い色の変化,ある色から別の色への変化,全く別の色の組合せ
u
l
t
i
‑
h
u
e (多色)又は S
i
n
g
l
e
‑
h
u
e (単色)が選択可能
③ カ ラ ー ス キ ー ム :M
④適切なカラースキームへの絞り込み: C
o
l
o
r
b
l
i
n
dS
a
f
e,P
r
i
n
tF
r
i
e
n
d
l
y,P
h
o
t
o
c
o
p
yS
a
f
eの 3種類が選
択可能で,それぞれ,色覚具常,デスクトップカラー,白黒印刷への対応
R
e
d
,
G
r
e
e
n,B
l
u
e(
1
0進数),HEX(RGBの 1
6進数版),CMYK(
C
y
a
n,M
a
g
e
n
t
a
,
⑤ カ ラ ー コ ー ド :RGB(
Yel
1o
v
v,K
e
y
)の 3種類が選択可能.このうち, HEXと CMYKが SASで指定可能で, HEXは主にデ
ィスプレイやデジタルカメラ, CMYKはプリンタや塗料で使用されるカラーコードとなっている.
選択した色は r
COLORMODEL=(
くカラーのリストを列挙
>
)
J の形式で指定可能
.HEX:カラーコードの"#"を "CX"に置き換えて,
r
C
O
L
O
R
M
O
D
E
L
=
(
C
X
f
O
f
O
f
OC
X
b
d
b
d
b
dC
X
6
3
6
3
6
3
)
J のよ
うに指定
.CMYK:カンマ区切りで表示されたカラーコードを各
2桁に変換し,すべて繋げて 8桁の数字にしたうえで,
r
C
O
L
O
R
M
O
D
E
L
=(
"
0
0
0
0
0
0
0
6
""
0
0
0
0
0
0
2
6
""
0
0
0
0
0
0
6
1"
)J
のように指定
図3
.
4COLORBREWER
241
枕e rP l o tと S u n f l o w e rP l o tの比較検討 3 . 5 Sca 臨床試験で,各被験者の投与前後データや 2変数の関連性を単一グラフで示す場合は, S伺 悦e rP l o t( 散 布図)がよく使用される.しかし,被験者数が多くなるにつれて,シンボルとシンボルの重なりが多く なるため,被験者の密集具合を読み取ることは困難となる.それを改善する手法として, D.B.CARRら ( 1 9 8 7 ) によって S u n f l o w e rP l o tが提案されている.花びらの数で被験者数を示し,それがひまわりの花 のように見えることからそのように呼ばれる.図 3ふ 1に拡張期血圧の S c a t 加 P l o t,図 3ふ 2に拡張期血 庄の S u n f l o w e rP l o tを示した. Pm 唱 m叫 erCo 曲 amA8PAc t u a lT I 問 a tment(tO司 ' ' ・ P国 官m . . r ̲ 臨凪BPA atUaITr e a t m . ent{ N ) : : I1 , . いみ 3 AmaldミbhnLW 舗 ︑ ・ w 晶申晶 ・ ょ 4 舗 . . , 崎 . 1 I n eVo !ue 図 3ふ 1拡張期血圧の S c a t t e rP l o t @.・・ ・ @@.川⑮・ .@@山 @・@・@ . k @・@.J ・ .E ' 0 5 J I 匝 . . 1 07 . 1 1 85 . . 16J‑e 担 ・ 掬 ︑ ︐ E 身 a ' z︐' ・司副 @・@@・ .・@ν・・@︒ @全・ 8・ ゅ ・ . ... R @ @・ ω 帽 E . , . ..• EE 錨a ・ ・ ‑ ・ E ・ ・ ・ ・ ・ ・ ‑ ‑ ‑ ‑ ‑ ‑ ‑ E ・ 14 24 ・長官雪星 ωωω 百3 ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ︐2w ‑ ‑ ‑ ‑ E ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ 凶aou ‑ ‑ ‑ ‑ ‑ ・ ・ 千 個 ‑ ‑ E E ‑ ‑ E ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ • 。" ••••••••••• ••••••• ••••••• •••••••• .• •••••••• ••••••••••• •••••••••• " 0 ・ 一 tB甲山昭︐e@ ・ . ︐ • 国 ' 。" 図 3ふ 2拡張期血圧の S u n f l o w e rP l o t いずれも X軸に投与前値, Y軸に Week8の値を配置している.図 3 . 5 . 2はグラフ描画領域全体に六角形 を敷き詰めたうえで,その六角形の領域に含まれる値を取る被験者の数を,六角形に塗られた色の濃淡 及び六角形の中心から等しい角度に出ている線で示している.例えば線が 3本であれば被験者数は 3で ある.六角形のピンは正方形のピンに比べて視覚的なバイアスが少ないとされているため,本稿では六 角形のピンを用いている.なお,プロットの色にはグレースケールを用いているが,オレンジ色等を使 用することで,グレースケールよりも明確に値の大小を読み取れるとともに, S u n f l o w e rのように見え るようになる.以下に, S c a t t e rP l o tと S u n f l o w e rP l o tの比較結果を要約した. ふ 1S c a t t e rP l o tと S u n f l o w e rP l o tの比較結果 表3 被験者数 データの種類 データの密度 外れ値の検出 長所・短所 S崎臨1"P l o t 「少ない場合J 向き 「連続値」向き 判別不可 可能 ‑長所:実測値をそのままプロットしてい るため,プロットの重なりが少ない場合 は,比較的正確な値を読み取れる ‑短所:連続値の場合,被験者の滑加と共 にプロットの重なりが発生するため, 個々の値を読み取れない(カテゴリ値の 場合は,被験者数に関係なくプロットの 重なりが増大する場合がある) 242 Suns owerP l o t 「少ない場合及び多い場合j の両方 「連続値及びカァゴリ値Jの両方 色の濃淡及び花びらの数 可能 ‑長所:被験者の数に関係なく,プロット の重なりを色の濃淡と花びらの数によっ て表現できる ‑短所:ピンの数によって視覚的なパイア スが発生する可能性がある(ピンの数を 増やすと密度が低く見え,減らすと密度 が高く見える)
3
.
6S
u
n
f
l
o
w
e
rP
l
o
tの作成方法
S
u
n
f
l
o
w
e
rP
l
o
tの作成には, SURVEYREGプロ、ンジャ及び SGPLOTプロシジャの POLYGONステートメ
ントを利用する. SURVEYREGプロ、ンジャは,線形モデルの当てはめ,回帰係数及びその共分散行列の
算出を行ない,標本調査に基づくデータに対して回帰分析を行なうことができるプロシジャであり,
PLOTSオプションを用いることで,各ビンの頂点の座標とその各ビンに含まれる被験者の数が算出でき
る. POLYGONステートメントは, S
GPLOTプロシジャ等で複数の多角形を描くことのできるステート
メントであり, SURVEYREGプロ、ンジャの実行結果を入力データとして多角形を作成できる.それらの
プロシジャ及びステー卜メントの基本構文および主要なオプションを示す.
<基本構文>
P
R
O
CS
U
R
V
E
Y
R
E
GO
A
T
A
=
<入力データセット〉
P
L
O
T
(
N
B
I
N
S
=
くピンの数> W
E
I
G
H
T
=
くグラフの種類>)=
F
I
T(
S
H
A
P
E
=
くシンボルの形状>)
M
O
D
E
LくY軸の変数>=<
X軸の変数> ;
R
U
N;
同
玩GON x=<x軸 の 変 数 〉 附 軸 の 変 数 > ID=<IOの変数> ;
<P
R
O
CS
U
R
V
E
Y
R
E
Gステートメントの主なオプション>
P
L
O
T
S
<
(
g
l
o
b
a
l
‑
p
l
o
t
‑
o
p
t
i
o
n
s
)
>
<
=
p
l
o
t
‑
r
e
q
u
e
s
t<(p
l
o
t
‑
o
p
t
i
o
n
)
>
>
2変数による六角形又は長方形の H
e
a
t
r
n
a
p上に,回帰直線を描
く r
p
L
O
T
S
=
a
lI,P
L
O
T
S
(
W
E
I
G
H
T
=
H
E
A
T
M
A
P
)
=
F
I
T
J
くP
L
O
Tオ プ シ ヨ ン >
N
B
I
N
S
=
n
b
i
n
l<nbin2>
くP
L
O
Tオ プ シ ヨ ン >
舵I
G
H
T
=
B
U
B
B
L
E IH
E
A
T
M
A
P
くF
I
Tオプション〉
S
H
A
P
E
=
R
E
C
T
A
N
G
U
L
A
R IH
E
X
A
G
O
N
A
L
ピンの数を指定 r
l
O
:1
0
0のピン, 1020:10x20=200のピン
が作成される」
u
b
b
l
eP
l
o
tか,色の濃
レコード数に対して,領域が比例する B
淡で示す H
e
a
t
m
a
pのどちらかを指定
ヒートマップ領域を長方形と六角形のどちらにするかを指定
※省│格形の r
R
E
C
J i
H
E
X
J の指定が可能
<
P
O
L
Y
G
O
Nステートメントの主なオプション>
∞
L
O
R
R
E
S
P
O
N
S
E=numeric‑variable
∞
L
O
聞O
O
E
L
=
c
o
l
o
r
‑
r
a
m
p
‑
s
t
y
l
e
‑
e
l
e
m
e
n
tI
(
c
o
l
o
r
‑
l
i
s
t
)
F
I
L
L
A
T
T
R
S=(TRANSPARENCY=number)
ビンの色を指定した数値変数の値に応じて変化させる
∞
L
O
R
旺S
P
O
N
S
Eオプションと同時に使用する色の組合せ
を指定.色リストの直接指定も可能
• 3色 T
h
r
e
e
C
o
l
o
r
R
a
m
p,Thre
e
C
o
l
o
r
A
l
t
R
a
m
p
2色:T
w
o
C
o
l
o
r
R
a
m
p,T
w
o
C
o
l
o
r
A
l
t
R
a
m
p
ビンに対する,透過性を指定 (0~1 の値を指定し, 0 が透
過なし)
ピンに対して,輪郭線を表示
O
U
T
L
I
N
E
L
I
N
臥T
T
R
S=style‑element匂 'Ptions>I
(
o
p
t
i
o
n
s
) ビンの輪郭線の見た目(色,線の種類・太さ)を指定
ピン上に表示するラベルが格納された変数を指定
L
A
B
E
L=variable
臥M
E ="
t
e
x
t
.
・
s
t
r
i
n
g
"
他のステートメントからの参照のために,本 P
l
o
tステー
,
トメントに名前を割り当てる
<プログラムと出力例>
プログラム 3
.
6.
1
は
, S
u
n
f
l
o
w
e
rP
l
o
tにおける各六角形のビンとその色の濃淡を表現するための,各ビン
の頂点の座標と被験者の数を算出する.図 3
.
6
.
1
(
a
)はその実行結果で、あり, h
I
Dは各ピンに付与された連
番
,X
Varと YVarはピンの各頂点の座標, WVarは当該ビンの領域に含まれる値を持つ被験者数を示す.
243
このデータを仮に He xBi nデータと呼ぶ.次に各ビン上で被験者数を示す中心から出る直線をプロット するためのAnn o t a t eデータを作成する.本稿では図 3 . 6 . 1(b)に示すように六角形の内接円の円弧に向け て,中心から直線を引くこととした . x軸と Y軸のスケールが異なる場合は,正六角形及び真円ではな いため,いずれかの方向に長い六角形及び楕円となることを考慮し,角度を等分するのではなく円弧を x "y , ) I X軸方向の最長半径 等分した位置に向けて線を引くこととした.また,六角形の中心の座標を ( を a,Y軸方向の最長半径を b,X 軸に対して角度 θの方向に直線を引し、た場合,楕円との交点の座標は , , ( x+ a c o s8, y+ b s i n O )となることを利用して,楕円の円周を被験者数に応じて等分した場合の座標を算出 している.図 3 . 6 . 1 ( c )は,花序を示す各六角形の中心座標とそこから楕円の円周との交点に向けて引し、た o t a t eデータである.詳細なプログラムは付録を参照されたい. 直線の始点・終点の座標を示すAnn p r o cs u r v e y r e gd a t a = <入力データセット>p l o t s ( n b i n s = 3 0w e i g h t = h e a t m a p ) = f i t ( s h a p e = h e x ) ; m o d e lA V A L=B A S E ; r u n ; プログラム 3 . 6 . 1各六角形の頂点の座標と被験者の数を算出 W V a r PARAMCD D I A B P D I A B P D I A B P D I A B P D I A B P D I A B P D I A B P 2 図3 ふl ( a )H e x B i nデータ d a t a v a l u e OVAL datavalue OVAl d a t a v a l u e BLACK BLAOK 1F I L L 1F I L L 図3 ふl ( c )Anno 飽t eデータ プログラム 3 . 6 . 2 . 1は S u n f l o w e rP l o tを作成するが,入力データセットには図 3 . 6. 1( a )の H e x B i nデータ, A n n o t a 旬データセットには図 3 . 6. 1( c )のAnno t a t eデータを指定する.この実行結果を図 3 . 6 ユlに示す. また,プログラム 3 . 6 . 2.2は花びらではなく被験者数を表示する.この実行結果を図 3 . 6ユ2に示す. p r o cs g p l o td a t a = <入力データセット>s g a n n o = く A n n o t a t eデータセット>; p o l y g o nx = X V a ry = Y V a rI D = h I D/c o l o r r e s p o n s e = W V a rf iI I c o l o r m o d e l = ( c x f f f f f fc x f e b 2 4 cc x f 0 3 b 2 0 ); r u n ; プログラム 3 ふ2 . 1被験者数を花びらで表現したグラフを作成 p r o cs g p l o td a t a = <入力データセット>s g a n n o = < A n n o t a t eデータセット>; p o l y g o nx = X V a ry = Y V a rI D = h I D/c o l o r r e s p o n s e = W V a rf iI Il a b e l = く被験者数を格納した変数〉 c o l o r m o d e l = ( c x f f f f f fc x f e b 2 4 cc x f 0 3 b 2 0 ) w h i t ew e i g h t = b o l d ); l a b e l a t t r s = ( s i z e = 1 1c o l o r= r u n ; プログラム 3 . 6 ム2被験者数を数字で表現したグラフを作成 244
I I 祖 @.・・3 $eJe・ v ‑ 川 . 8Fe ‑e8 ・ 80 0 ・ ︑ ・ ‑ ‑ d e ・8.‑ I ・哩 ・ ・ 九 gJ‑e・ ・ ・ ‑ a g e ‑ s e e‑ee‑ F q ‑ー d v 。 ・@一 。ι @ ・ 。 ・0 $ @ ・ 。". ゆ③@③ ③・ 司 1 8 ・ . ・ 8" ・ . ・ 曲r h e ‑ ・ ‑‑8 .. H88 ・ ・ ﹀ ∞切切 ・2 S5 ・ F a . . a・ ‑ ・同 . .. . 、 @ hf 品 o~a! 。 . . 1 ' . , L . 1 2 . . . ‑ .語 , 告 . ¥ 巴 、 幹 、 T 、 . i o 1 v 2 J U 7 0 " 。 訓 " 向指 前3 "0 , . '国 。 " &n l i n o V d l u e ... ・胎lOV oluo 図 3ふ 2 . 1被験者数を花びらで表現したグラフ 図 3ふ 2 . 2被験者数を数字で表現したグラフ 4 まとめ 本稿では, S u s a nP . D u k e ら( 2 0 1 5 )によって提案された適切なグラフの選択方法を紹介した.そして,臨 床試験でよく使われている S p a g h e t t iP l o tや S c a t t e rP l o tといったグラフを LasagnaP l o tや S u n f l o w e rP l o t といった付加情報を加えたグラフと比較・考察するとともに, SAS9.4の SGプロシジャによる作成方法 及びカスタマイズ方法を報告した.その中で, L a s a g n aP l o tや S u n f l o w e rP l o tはいずれもプロットの重な りがないため,個々の被験者の情報を比較的失うことなく集団の推移や分布を表現することが可能とな ることを示した.ただし,冒頭に述べたように, SASをはじめとするソフトウェアの機能が年々向上し ている一方で,医薬品製造販売承認申請資料の作成においては, eCTDの規制もあり,依然としてモノ クロ印刷を意識した記載をせざるを得ず,現状,これら最先端の技術をうまく活用できていない.本稿 で紹介したグラフを総括報告書や eCTD等で利用する場合は,さらなる議論が必要である. 連絡先 h m i h i r o .v a m a s a k i ( a )t a k e d a . c o m 参考文献 B r u c eJ .S w i h a r te . ta . l( 2 0 1 0 ) .L a s a g n aP l o t sAS a u c yA l t e m a t i v et oS p a g h e t t iP l o t s ;E p i d e m i o l o g y .2010 S e p ; 2 1 ( 5 ) : 6 2 1‑62 5 C l i n i c a lD a t al n t e r c h a n g eS t a n d a r d sC o n s o r t i u m( 2 0 1 6 ) .A n a l y s i sD a t aModelI m p l e m e n t a t i o nGuideV e r s i o n 1 . 1 C y n t h i aBrewere t .a . l( 2 0 0 9 ) .COLORBREWE R2. 0 ;A v a i l a b l ea th t t o : / / ∞lorbrewer2.onzL[Accessed1 1J u n e 2 0 1 6 ] t .a . l( 1 9 8 7 ) .S c a t t e r p l o tM a t r i xT e c h n i q u e sf o rL a r g eN;Joumalo ft h eAmericanS t a t i s t i c a l D .B .CARRe l8 2, No.398( J u n .,1 9 8 7 ), 424・436 A s s o c i a t i o n ;Vo. c o t t( 1 9 8 8 ) .ANoteonC h o i c eofB i v a r i a t eH i s t o g r a mB i nS h a p e ;Joumalo fO f f i c i a lS t a t i s t i c s DavidW.S . 14, N o . l,1 9 8 8, p 4 7 ‑ 5 1 Vo 245
F .Banckene t .a . l( 2 0 1 3 ) .G e n e r a lP r i n c i p l e s,I l l u s 回 t i o n s佃 dW i k iR e s o u r c e sf o rI m p r o v i n gS t a t i s t i c a l G r a p h s ;I n t e m a t i o n a lM e e t i n gSTATISTICALMETHODS別 BIOPHARMACYSFDS R ickW i c k l i n( 2 0 1 4 ) .Howt oc r e a t eah e x a g o n a lb i np l o ti nSAS;Ava i 1a b l ea t : / l b l o ! ! : s . s a s . c o m l c o n 匂n t l i m ν 2 0 1 4 / 0 9 / 0 2 / h e x a ! ! : 叩 a l ‑ b i n ‑ o l o t . h t m l [ A∞e s s e d1 1J u n e2 0 1 6 ] h仕o 叫' G r a p h i c sW o r k i n gGroup( 2 0 1 2 ) .C h o o s i n gt h eR i g h tG r a p h‑Whati st h eP r o c e s s ? ;A v a i l a b l ea t S a f i s : / / w w w . c t s o e d i a . o r ! : l d o / v i e w / C T S o e d ia/S e l e c t R i ! ! : h t G r a o h[ A c c e s s e d1 1J u n e2 0 1 6 ] h仕o ns t i t u t eI n c .SAS9. 4ODSG r a p h i c s :P r o c e d u r e sG u i d e, F i f t hE d i t i o n ;A v a i l a b l e SASI a th 仕o s : / / s u o o o r t . s a s . c o m l d o c u m e n t a t i o n l c d ν e n l ! ! : f s t a ω r o c / 6 7 9 0 9 I H T ML/d e f a u l t l v i e w e r . h 伽1 [A ∞essed1 1 J u n e2 0 1 6 ] 札 ( 2 0 1 2 ) . 9B e s tP r a c t i c e sf o rMakingG r a p h s ;Ava i 1a b l e S u s a nP . D u k ee t s t Pr a c t i c e sf A c c e s s e d1 1J u n e2 0 1 6 1 a th t t o s : / / w w w . c t s o e d i a . o r ! : l d o / v i e w / C T S o e d ia/Be t .a . l( 2 0 1 5 ) .S e e i n gi sb e l i e v i n g :g o o dg r a p h i cd e s i g np r i n c i p l e sf o rm e d i c a lr e s e a r c h . S u s a nP . D u k ee 9 . S t a t i s t i c si nM e d i c i n e2 0 1 5 ;3 4 ( 2 2 ) :3 0 4 05 幽 TheC l i n i c a lT r i a l sS a f e t yG r a p h i c sHomeP a g e ;A v a i l a b l e ゆ/ v i e w / C T S o e d ia/S t a t G r a o hHo m ! <[ A c c e s s e d1 1J u n e2 0 1 6 ] a th t t o s : / / w w w . c t s o e d i a . o r ! : l d t .a l .( 2 0 0 3 ) .D e n s i t yD i s t r i b u t i o nS u n f l o w e rP l o t s .J o u m a lo fS t a t i s t i c a lS o f t w a r e2 0 0 3 ; W i l l i a mD .Duponte 8 ( 3 ) 高浪洋平・舟尾暢男 ( 2 0 1 5 ) r統計解析ソフト WSAS~J (カットシステム) 野中文雄 ( 2 0 1 0 )r A c t i o n S c r i p t3 . 0による三次元表現ガイドブック J (毎日コミュニケーションズ) 2 0 1 6 )r もしも, SAS の s g p l o tと R の g g p l o t2を比較したら… J ( 第 l回ナニワデータ 舟尾暢男 ( サイエンス研究会) 2 0 1 4 )r 高血圧治療ガイドライン 2 0 1 4 J (ライ 日本高血圧学会高血圧治療ガイドライン作成委員会 ( フサイエンス出版) 付録 1 *ー L a s a g n aP l o t̲C O I S CA D a MB O S 形式のA D V S データセットを使用 * 1 p r o cs o r td a t a = O U T D A T A . A D V S o u t = ̲ A D V S ̲ S O R T ; b yP A R A M C DT R T A NU S U B J I DA V I S I T N ; r u n : p r o ct r a n s p o s ed a t a = ̲ A D V S ̲ S O R To u t = ̲ A D V S ̲ T R A N Sp r e f i x = V : b yP A R A M C DT R T A NU S U B J I D : v a rA V A L C A 1 N : i dA V I S I T N : r u n : d a t a̲ A D V S ̲ S O R T ̲ T R A N S : m e r g e̲ A D V S ̲ S O R T ̲ A D V S ̲ T R A N S ( r e n a m e = ( V l = V 1 CV 2 = V 2 CV 3 = V 3 CV 4 = V 4 CV 5 = V 5 C ) ) : b yP A R A M C DT R T A NU S U B J I D : r u n : p r o cs o r td a t a = ̲ A D V S ̲ S O R T ̲ T R A N So u t = ̲ A D V S ̲ S O R T ̲ B Y ̲ V l S I T ̲ V A L U E : b yP A R A M C DT R T A NV 1 CV 2 CV 3 CV 4 CV 5 C :*各時点のカテゴリ値昇順にソート; r u n : d a t a̲ A D V S ̲ S O R T ̲ B Y ̲ V I S I T ̲ V A L U E : s e tA D V SS O R TB YV l S I TV A L U E : b yP A R A M C DT R T A NV 1 CV 2 CV 3 CV 4 CV 5 C : l a b e l̲ U S U B J I D=' U n i q u eS u b j e c tl d e n t i f i e r ':*パネル表示用の被験者連番; U S U B J I D + l : i ff i r s t .T R T A Nt h e nU S U B J I D = l : r u n : p r o cs o r td a t a = ̲ A D V S ̲ S O R T ̲ B Y ̲ V l S I T ̲ V A L U Eo u t = A D V S : 246
b yP A R 馴C DT R T 刷 ̲ U S U B J I DU S U B J I D ; r u n ; p r o cf o r 胴 t ; キグラフ右端の凡例に表示するカテゴリ値のフォーマット; v a l u eA V A L C A 1 F 0 '2 = ' 8 0̲8 4 '3 = ' 8 5̲8 9 '4 = ' 9 0̲9 9 '5 = '1 0 0̲1 0 9・6 = '> = 1 1 0 '; 1 = 'く8 r u n ; p r o cs g p l o td a t a = A D V S ; キカテゴリ値を用いた L a s a g n aP l o t ; b yP A R 釧C DT R T A N ; f o r m a tA V A L C A 1 NA V A L C A 1 F .; h e a t m a p p a r mx = A V I S I Ty = U S U B J I D c o l o r r e s p o n s e = A V A L C A 1 N/n a m e = ' a 'o u t li n e ; y a x i sd i s p l a y = ( N O V A L U E SN O T I C K S ); g r a d1 e g e n d' a ' /i n t e g e r ti t1 e=' C a t e g o ri e s '; r u n, p r o cs g p a n e ld a t a = A D V S ; *カテゴリ値を用いた L a s a g n aP1 o t (パネル表示) ; b yP A R A M C D ; f o r m a tA V A L C A 1 NA V A L C A 1 F .; p a n e l b yT R T A N ; 川 Dc o l o r r e s p o n s e = A V A L C A 1 N/n a m e = ' a・ o u t li n e ; h e a t m a p p a r mx = A V I S I Ty = ̲ U S U B r o w a x i sd i s p l a y = ( N O V A L U E SN O T I C K S ) ; g r a d1 e g e n d' a ' /i n t e g e r ti t1 e=' C a t e g o ri e s '; r u n ; /本̲S u n f l o w e rP l o t̲C D I S CA D a MB D S形式の A D V Sデータセットを使用 * 1 o d so u t p u tf i t p l o t = ̲ H e x M a p ( w h e r e = ( n o tm i s s i n g ( h I D ) ) ) ; *各六角形の頂点の座領; p r o cs u r v e y r e gd a t a = A D V Sp l o t s ( n b i n s = 3 0w e i g h t = h e a t m a p ) = f i t ( s h a p e = h e x ) ; b yP A R A M C DT R T A N ; m o d e lA V A L=B A S E ; r u n ; o d so u t p u ts u m m a r y = ̲ H e x C e n t e r ( k e e p = P A R A M C DT R T A Nh l DW v a rX v a r ̲ M e a nY v a r ̲ M e a n ) ; p r o cm e a n sd a t a = ̲ H e x M a pm e a n ; *各六角形の中心の座標; b yP A R 馴C DT R T A Nh I DW V a r ; v a rX v a rY v a r ; r u n ; d a t a̲ D e f o r m a t i o n ̲ 0 1 0 ; s e t̲ H e x M a p ; b yP A R A M C DT R T A Nh l D ; ; S E O+ 1 i ff i r s t .T R T A Nt h e n̲ S E O=1 ; i f̲ S E O< =6 ; r u n ; o d so u t p u ts u m m a r y = ̲ D e f o r m a t i o n ̲ 0 2 0 ;* 1個の六角形から歪みを計算; p r o cm e a n sd a t a = ̲ D e f o r m a t i o n ̲ 0 1 0m i nm a x ; b yP A R A M C DT R T A N ; v a rX v a rY v a r ; r u n ; d a t a D e f o r m a t i o n ; s e t D e f o r m a t i o n0 2 0 ; b yP A R A M C DT R T A N ; 軸の最大と最小の差; D i f f ̲ L i n e ̲ X =X v a r ̲ M a x̲X v a r ̲ M i n ;* X D i f f ̲ L i n e ̲ Y =Y v a r ̲ M a x̲Y v a r ̲ M i n ;* Y 軸の最大と最小の差; F r a c t i o n =2/s q r t ( 3 ) ; *本来の X 軸に対する Y 軸の比, F r a c t i o n ̲ A c t=D i f f ̲ L i n e ̲ Y / D i f f ̲ L i n e ̲ X ; *実際の X 軸に対する Y 軸の比, F a c t o r =s q r t ( 3 ) /2*D i f f ̲ L i n e ̲ Y/D i f f ̲ L i n e ̲ X *正六角形からの変換係数; i f F r a c t i o n ̲ A c t=F r a c t i o nt h e nd o ; *六角形に歪み無し, R a d i u s ̲ X=D i f f ̲ L i n e ̲ X/2 ;* Y = Oにおける六角形の肉銭円(楕円)の半径, R a d i u s ̲ Y=D i f f ̲ L i n e ̲ X/2 ;* X = Oにおける六角形の内接円(楕円)の半径, e n d ; e l s ei fF R A C T I O N ̲ A C T>F 臥C T I O Nt h e nd o ; *六角形がY 軸方向に伸長; R a d i u s ̲ X=D i f f ̲ L i n e ̲ X/2 ; R a d i u s ̲ Y=D i f f ̲ L i n e ̲ X/2*F A C T O R ; e n d ; e l s ei fF R A C T I O N ̲ A C T<F R A C T I O Nt h e nd o ; *六角形がX 軸方向に伸長; R a d i u s ̲ X=D I F F ̲ L I N E ̲ Y/2*s q r t ( 3 ) /2ホ F A C T O R ; R a d i u s ̲ Y=D I F F ̲ L I N E ̲ Y/2*s q r t ( 3 ) /2; e n d ; k e e pP A R A M C DT R T A NR a d i u s ̲ XR a d i u s ̲ Y ; r u n ; d a t a̲ P E T A L ̲ A N N O ̲ 0 1 0 ; m e r g e̲ H e x C e n t e r ( r e n a m e = ( X v a r ̲ M e a n = X lY v a r ̲ M e a n = Y l ) ) D e f o r m a t i o n ; 247
by 一両雨間C DT R T A N ; d oA n g l e=0t o3 6 0b y0 . 1 ; *六角形の内接円(楕円)の座標を 0 . 1度刻みで導出; A n g l e=r o u n d ( A n g l e,O .1 ) ; l ; 州座標; X 2 =R a d i u s ̲ X*s i n ( A n g l e*c o n s t a n t ( ' p i ' ) /180) + X Y 2 =R a d i u s ̲ Y*c o s ( A n g l e*c o n s t a n t ( ' p i ' ) /180) +Y l ;* Y 座標, o u t p u t ; e n d ; r u n ; p r o c8 0 r td a t a = ̲ P E T A L ̲ A N N O ̲ 0 1 0 o u t = ̲ P E T A L ̲ A N N O ̲ 0 2 0 ; 馴C DT R T A Nh l DW V a rX lY lA n g l e ; b yP A R r u n ; d a t a̲ P E T A L ̲ A N N O ̲ 0 2 1 : *隣接する 2点聞の座標を同一レコードに持たせるための準備; s e t̲ P E T A L ̲ A N N O ̲ 0 2 0 ( r e n a m e =( A n gI e = ̲ A n gI e ) ); b yP A R A M C DT R T A Nh l DW V a rX lY l̲ A n g l e ; X 3=X 2 ;Y 3=Y 2 ; n g l e̲0 . 1, 0 . 1 ) ; A n g l e=r o u n dしA V a rX lY lX 3Y 3A n g l e ; k e e pP A R A M C DT R T A Nh l DW r u n ; d a t a̲ P E T A L ̲ A N N O ̲ 0 3 0 ; *肉接円(楕円)上の隣接する 2点聞の直線距離を導出; m e r g e̲ P E T A L ̲ A N N O ̲ 0 2 0 ( i n = d ) ̲ P E T A L ̲ A N N O ̲ 0 2 1 ; b yP A R A M C DT R T A Nh l DW V a rX lY lA n g l e ; i fda n dX 2= .a n dY 2= .a n dX 3= .a n dY 3= .; X Y 2 ̲ X Y 3=s q r t ( ( X 3̲X 2 )林 2+ ( Y 3̲Y 2 )林 2 ); r u n ; d a t a̲ P E T A L ̲ A N N O ̲ 0 4 0 ; 本内接円(楕円)上の各2点聞の直線距離をレコードごとに累積; s e t̲ P E T A L ̲ A N N O ̲ 0 3 0 ; V a rX lY lA n g l e ; b yP A R A M C DT R T A Nh l DW r e t a i nX Y 2 ̲ X Y 3 ̲ S U M ; i ff i r s t . h l Dt h e nX Y 2 ̲ X Y 3 ̲ S u m=X Y 2 ̲ X Y 3 ; e l s e X Y 2X Y 3S u m=X Y 2X Y 3S u m+ X Y 2X Y 3 ; r u n ; d a t a̲ P E T A L ̲ A N N O ̲ 0 4 1 ; *隣接2点問の距離と次の 2点間の距離を同一レコードに持たせるための準備: s e t̲ P E T A L ̲ A N N O ̲ 0 4 0 ; b yP A R A M C DT R T A Nh l DW V a rX lY lA n g l e ; A n g l e =r o u n d ( A n g l e̲0 . 1, 0 . 1 ) ; X Y 2X Y 3S u mN e x t=X Y 2X Y 3S u m ; DT R T A Nh l DW V a rX lY lA n g l eX Y 2 ̲ X Y 3 ̲ S u m ̲ N e x t : k e e pP A R馴 C r u n ; 点聞の距離と次の2 点間の距離を同一レコードに持たせる, d a t a̲ P E T A L ̲ A N N O ̲ 0 5 0 ; キ隣接する 2 m e r g e̲ P E T A L ̲ A N N O ̲ 0 4 0 ( i n = d ) P E T A LA N N O0 4 1 ; b yP A R A M C DT R T A Nh l DW V a rX lY lA n g l e ; i fd ; . 1 ; i fm i s s i n g ( X Y 2 ̲ X Y 3 ̲ S u m ̲ N e x t )t h e nX Y 2 ̲ X Y 3 ̲ S u m ̲ N e x t=X Y 2 ̲ X Y 3 ̲ S u m+0 r u n ; o d so u t p u ts u m m a r y = ̲ P E T A L ̲ A N N O ̲ 0 6 0 ; *内接円(楕円)の円周(近似したもの)を導出; p r o cm e a n 8d a t a = ̲ P E T A L ̲ A N N O ̲ 0 5 0s u m ; b yP A R A M C DT R T A Nh l DW V a rX lY l ; v a rX Y 2X Y 3 ; r u n ; d a t a̲ P E T A L ̲ A N N O ̲ 0 7 0 : s e t P E T A LA N N O0 6 0 ; V a rX lY l ; b yP A R A M C DT R T A Nh l DW L e n g t h ̲ P e r ̲ W V a r=X Y 2 ̲ X Y 3 ̲ S u m/W V a r ; *被験者数(=花びらの数)で内接円(楕円)の円周を割る; L e n g t h ̲ P e r ̲ W V a r ̲ S u m=0 ; d o i=1t oW V a rb y1 ; *六角形に含まれる被験者数だけ繰り返し: L e n g t h ̲ P e r ̲ W V a r ̲ S u m=L e n g t h ̲ P e r ̲ W V a r ̲ S u m+ L e n g t h ̲ P e r ̲ W V a r : o u t p u t ; e n d ; 馴C DT R T A Nh l DW V a rX lY lL e n g t h ̲ P e r ̲ W V a r ̲ S U M : k e e pP A R r u n ; p r o cs q l ; *肉接円(楕円)の円周を被験者数で等分した位置に最も近い X Y 座標を選択; c r e a t et a b l e̲ P E T A L ̲ A N N O ̲ 0 8 0a s s e l e c tA . P A R A M C D,A .T R T A N,A . h I D,A . W V a r,A . X l,A . Y l,A . X 2,A .Y 2,A . X 3,A . Y 3, X Y 2 ̲ X Y 3 ̲ S u m,X Y 2 ̲ X Y 3 ̲ S u m ̲ N e x t,L e n g t h ̲ P e r ̲ W V a r ̲ S U M,A . A n g l e f r o m̲ P E T A L ̲ A N N O ̲ 0 5 0a sA, ̲ P E T A L ̲ A N N O ̲ 0 7 0a sB w h e r eA . h I D =B . h I D a n d 臥M C D=B . P A R A M C Da n d A . P A A A A A 248
A .T R T A N =B .T R T A N a n d r o u n d( X Y 2 ̲ X Y 3 ̲ S u m ,O .0 0 0 0 0 0 0 0 1 ) く= r o u n d ( L e n g t h ̲ P e r ̲ W V a r ̲ S U M,O . O O O O O0 0 0 0 0 1 ) く= r o u n d ( X Y 2 ̲ X Y 3 ̲ S u m ̲ N e x t ,0 . 0 0 0 0 0 0 0 0 1 ) ∞∞ ∞ ∞∞ q u i t : n n o t a t eデータを作成, d a t a̲ P E T A L ̲ A N N O : 本花びら及び花序の描画用 A s e t̲ P E T A L ̲ A N N O ̲ 0 8 0 ( i n = a ) ̲ H e x C e n t e r ( i n = b ): b yP A R 釧C DT R T A N: i f aa n dW V a r > = 2t h e nd o : *被験者数を示す花びら(線): 1 i n e c o l o r =・ B L A C K ' :f u n c t i o n = 'L lNE ':d r a w s p a c e = 'd a t a v a l u e ' :1 i n e t h i c k n e s s = 2 .0 : e n d : e l s ei fbt h e nd o : ホ六角形の中心を示す花序(点): X l = X V a rM e a n :Y l = Y V a rM e a n : ; f iI l c o l o r = ' B L A C K ' :f u n c t i o n = ' O V A L ' :d r a w s p a c e = ' d a t a v a l u e・ w i d t h = 2 . 0 :h e i g h t = 2 . 0 :d i s p l a y = ' F I L L ' : e n d : r u n : 一L O O P ( k e e p = P A R A M C DT R T A N )n o d u p k e y : p r o cs o r td a t a = ̲ P E TA L ̲ A N N O o u t = . b yP A R A M C DT R T A N : r u n : d a t a̲ N U L L ̲ : キ項目及び群の数だけループさせて, S u n f l o w e rP l o tを作成, s e t L O O P : c a l le x e c u t e ( ' p r o cs g p l o td a t a = ̲ H e x M a p ( w h e r e = ( P A R A M C D = 1c o m p r e s s( P A R馴 C D )1 1 ' "andTRTAN=・1TRTAN1 1 ') s g a n n o = ̲ P E T A L ̲ A N N O ( w h e r e = ( P A R A M C D = ' "I l c o m p r e s s ( P A R A M C D )1 1 ' "andTRTAN='1 1 T R T A N1 l ') ) : ' ) : D =h I D c a l le x e c u t e ( ' p o l y g o nx = X V a ry = Y V a rI /∞ l o r r e s p o n s e = W V a rf i1 1c o l o r m o d e l = ( w h i t ec x f e b 2 4 cc x f 0 3 b 2 0 ): ' ) : c a l le x e c u t e ( ' r u n : ' ) : r u n : d a t a̲ H e x M a p ̲ N u m b e r : *花びらの代わりに被験者数を表示するための A n n o t a t eデータを作成; s e t̲ H e x M a p : ぺ strip(put(WVar, b e s t .) ) ): W V a r ̲ N u m b e r = i f c ( W V a r = l, r u n : d a t a̲ N U L L ̲ : *項目及び群の数だけループさせて, Sunflower Plot (被験者数表示V e r . ) を作成; s e t L O O P : c a l le x e c u t e ( ' p r o cs g p l o td a t a = ̲ H e x M a p ̲ N u m b e r ( w h e r e = ( P A R 馴C D = ' " 1c o m p r e s s( P A R A M C D )汀 "a n d R T A N1 1 ') ) T R T A N = '1T s g a n n o = ̲ P E T A L ̲ A N N O ( w h e r e = σ V V a r = la n dP A R A M C D = ' "1c o m p r e s s( P A R A M C D )1 1 ' "and R T A N1 1 ') ): ' ): T R T A N = '1T c a l le x e c u t e ( ' p o l y g o nx = X V a ry = Y V a rI D = h I D Icolorresponse=WVar fill label=WVar̲Number l a b e l a t t r s = ( s i z e = 1 2c o l o r = b l a c kw e i g h t = b o l d ) c o l o r m o d e l = ( w h i t ec x f e b 2 4 cc x f 0 3 b 2 0 ) : ' ) : c a l le x e c u t e ( 'r u n : ' ) : r u n : 町 249
SASプロシジャを用いた生存時間データに対する例数設計の変革 0魚 住 龍 史 l 矢 田 真 城 2 浜 田 知 久 馬 3 1京都大学大学院医学研究科医学統計生物情報学 2ェ イ ツ ー ヘ ル ス ケ ア 株 式 会 社 開 発 戦 略 本 部 生 物 統 計 部 東京理科大学工学部情報工学科 3 R e v o l u t i o ni ns a m p l es i z ec a l c u l a t i o nf o rt i m e ‑ t o ・e v e n td a t au s i n gSASp r o c e d u r e s 3 R y u j iUozumi', S h i n j oYadl, 組dChikumaHamada ' D e p a r t m e n tof B i o m e d i c a lS t a t i s t i c sandB i o i n f o r m a t i c s ,K y o t oU n i v e r s i 砂G r a d u a t eS c h o o lofM e d i c i n e 2 B i o s t a t i s t i c sD e p a r t m e n t ,D e v e l o p m e n tS t r a t e g yD i v i s i o n , A2He αl t h c a 陀 ,C o r p o r a t i o n 3 Dep 側 mentof I n f o r m a t i o nαndComputerT e c h n o l o g y , , Fα c u l t yof E n g i n e e r i n g ,T o k y oU n i v e r s i t yofS c i e n c e 要旨 POWERプロ、ンジャは,様々な解析手法に対する例数設計や検出力を計算するために有用なプロシジャ であり, TWOSAMPLESURVIVALステートメントを用いれば,生存時間解析のノンパラメトリック検定 a k a t o sの を前提とした例数設計を行うことができる. TWOSAMPLESURVIVALステートメントでは, L 方法が採用されており,生存時間解析の例数設計としてよく用いられている Freedman の方法や S c h o e n f e l dの方法と比べて性能が良いことが報告されている.その一方,中間解析を含んだ群逐次デザ インに用いられる SEQDESIGN プロシジャでは,ログランク検定を前提とした例数設計法として S c h o e n f e l dの方法が採用されている.また, SAS/STAT 1 4 . 1 からの POWER プロシジャでは,新たに COXPH ステートメントが追加され,連続量データの共変量を含んだ、多変量の比例ハザードモデルの解 析に対する例数設計ができるようになった.本稿では, SASで新たにできるようになった生存時間解析 a k a t o s の方法から算 の例数設計に関する機能を取りあげ,それらの有用性について報告する.まず, L 出される必要例数以外の出力結果として,必要イベント数や単位時間あたりの登録例数がどのように算 出されているか解説する.次に, POWERプロシジャの COXPHステートメントで実施できるようにな った例数設計法の特徴と有用性を報告する.最後に,患者の登録パターンが一様でない場合の例数設計 として, POWERプロ、ンジャの代わりに, SEQDESIGNプ口、ンジャで例数設計を行う方法を取りあげる. キーワード:生存時間解析 例数設計 POWER TWOSAMPLESURVIVAL L a k a t o s COXPH H s i e h ‑ L a v o r i SEQDESIGN S c h o e n f e l d 登録パターン切断指数分布 250
1 はじめに 医学研究では,ある基準の時刻から目的のイベントが起こるまでの時間を対象とした解析がよく行われる. このような解析手法を生存時間解析と呼び. LIFETEST. PHREG. LIFEREGといったプロシジャが 20年以上 9 9 5 ) . 近年では. SAS/STATの機能拡張により,区間打ち切りデータに関する 用いられている(大橋・浜田, 1 プロシジャとして. SAS/STAT1 3 . 1から ICLIFETEST. SAS/STAT1 3 . 2から ICPHREGが追加された (SAS 20日 ,2 0 1 4 ) . さらに. SAS/STAT1 4 . 1からの LIFETESTプロシジャでは. EVENTCODE=オプシ I n s t i t u t eI n c ., ョンが追加され,競合リスクの解析が実施できるようになった (SASI n s t i t u t eI n c ., 2 0 1 5 ) . このように生存時間解析に関連したプロシジャが拡張されている一方,近年の医学研究では,研究目的を 明確にするために,試験の必要例数を計画段階で事前に見積もらなければならない.これを例数設計と呼び, 生存時間解析の例数設計を行うためには. POWERプロシジャにおける TWOSAMPLESURVIVALステートメ ントが有用である(浜田・安藤, 2 0 0 5 ) . 生存時間解析の例数設計法として. Freedmanの方法 (Freedman,1 9 8 2 ) とS c h o e n f e 1 dの方法 ( S c h o 印 刷d ,1 9 8 1 ) がよく用いられているが. POWERプロシジャで採用されている L a k a t o sの方法 ( L a k a t o s,1 9 8 8 ) の方が良い性能であることが報告されている (LakaωsandLan,1 9 9 2 ; 中西ら, 2 0 0 6 ;水湾・浜岡, 2 0 0 8 ;魚住ら, 2 0 0 9 ) . また.SAS/STAT1 4 . 1からの POWERプロシジャでは,新たに COXPH ステートメントが追加され,連続量データの共変量を含んだ、多変量の比例ノ、ザードモデ、ルの解析に対する例 n s t i t u t eI n c ., 2 0 1 5 ) . 数設計ができるようになった (SASI 本稿では .SASで新たにできるようになった生存時間解析の例数設計に関連した機能を取りあげる.まず, POWERプロシジャの TWOSAMPLESURVIVALステートメントによる L a k a t o sの方法から算出される必要イ ベント数や登録例数の算出について取りあげ,その有用性を示す.次に. POWERプロシジャの COXPHステ ートメントで実施できるようになった例数設計法について解説し. TWOSAMPLESURVIVALステートメント と比較した場合の有用性を示す.最後に. POWERプロシジャの代わりに. SEQDESIGNプロシジャで生存時 間解析の例数設計を行う有用性について取りあげる. 2 生存時間解析における例数設計法 生存時間解析においてはイベント数が情報量となるため,必要例数を求めるためには,まずは必要イベン ト数を見積もる必要がある.必要イベント数を求めた上で, ) ‑ ( 必要例数=必要イベント数 /2群を併せたイベントの割合 を計算すればよい. 生存時間解析における必要イベント数は. Coxの比例ハザードモデ、ルによるハザード比 ( h a z a r dr a t i o )を 用いて算出される.比例ハザード、モデ、ルは,共変量ベクト/レ xで条件付けたある患者集団のハザード関数 h ( tI x )が基準患者集団のハザード関数 h o( t )の定数倍になるモデ、ルで、ある (Cox,1 9 7 2 ) . ここで,回帰パラメ ータ ω,単変量 x に対する比例ハザードモデル l o g J :h ( tI x)/九( t ) ]=邸 ( 2 ) を考えると,ハザード比は h ( tI x=1 ) 一一一一一 =exp(ω) h( tI x=O) となる.ただし .t は時聞を表す. 251
2
.
1 Freedmanの方法と Schoenfeldの方法
生存時閥解析の例数設計法として, Freedmanの方法 σreedman
,1
9
8
2
)とS
c
h
o
e
n
f
e
1
dの方法 (
S
c
h
o
e
n
f
e
1
d
,
1
9
8
1
)がよく用いられている.それぞれの方法で算出される必要イベント数を DF'Dsとする.検定の有意水
準を両側 α,検出力の名義水準を 1‑β とすると,必要イベント数はそれぞれ次の式で求まる.
n ̲(
Z
a
/
2+Zp)2(w.HR+l)2
(
3
)
w
(
HRー1
)
2
LJF‑
De=O+Wi(Za/2+zβ)2
:
s
(
4
)
w{lo~正 HRW
ただし , ZK を標準正規分布の上側 1
0
0・K %
点,HRをハザード比, wを群聞の例数の割付比(対照群:試
験 群 =1
:w) とする.いずれの式においても 2群を併せた必要イベント数を表しており, 1群あたりの必要
イベント数を求めるためには,それぞれの式から求めた DFあるいは Dsを 0
.
5倍すればよい. (
3
),(
4
)式の
いずれも,生存時間分布に指数分布を仮定して導出される.
これらの方法は,テイラー展開により 2次式で近似すると一致するため,帰無仮説 Ho:HR=1の近傍では,
0
0
3
)
. また, w=1の場合, Freedmanの方法と比べて, Scho
印 刷dの方
両式はほぼ等しくなる(浜田・藤井, 2
法の方が必要イベント数は必ず少なく済む.なお,いずれの方法においても,ハザード比を用いて例数設計
を行っているが,ノンパラメトリックなログランク検定の例数設計とほぼ等価である.
ここで,試験群(司と対照群(c)で構成される 2群問比較試験を想定し, w=1の場合で考える.このと
1
)式の分母として示した 2群を併せたイベントの割合につ
き,必要例数を求めるために必要な条件となる, (
いて,各群における最終生存割合1Z(;,
1
i
E を用いて,
̲(
1‑n
"
c
)+(I‑7l"E
)
2
2群を併せたイベントの割合一
と見積もることができる.しかし,実際の臨床試験では,患者は逐次的に登録され,一度にすべての患者が
,
組み入れられるわけではないため,登録期間を考慮する必要があるといえる.臨床試験の登録期聞を d年
フォローアップ期聞を F 年として,範囲 O‑Aを確率密度 l
I
Aで一様分布に従って登録されると仮定すると,
群 ge{C
,
E}における試験期間中の期待イベント割合は
弓=1‑jfsz仙
F‑t
同
となる.ただし ,S
g
(A+F‑t)は時点 (A+Fーのにおける患者の生存関数である.生存時間分布が指数分布
に従うと仮定すると,
1rd
e
x
p
(
ー
もF){I‑e叩 (
‑
,
1
〆
)
}
弓=1‑~Jo e
叩{ーλ
z・(d+F‑t)}d=l‑d
名
(
5
)
となる.ただし,ゐは群 ge{C
,
E}におけるハザードを表す指数分布の母数である.よって, 2群を併せた
/
2を用いて,必要例数を見積もることができる.
期待イベント割合(再+ろ )
2
.
2 SEQDESIGNプロシジャによる Schoenfeldの方法
2
.
1節の (
3
),(
4
)式に基づく Freedmanの方法および S
c
h
o
印 刷dの方法による必要イベント数,さらに必要
0
1
6
)
. 3節で述べる POWERプロシジ
例数の計算には, DATAステップによる実装が容易にできる(大橋ら, 2
252
ャによる例数設計のように, SASのプロシジャで出力させたい場合, S c h o e n f e l dの方法であれば SEQDESIGN プロシジャを活用することで,必要イベン卜数と必要例数を算出することができる. SEQDESIGNプロシジャは,本来群逐次デザインの検討を行うために有用なプロシジャである(浜田, 2 0 1 0 ) . SAMPLESIZEステートメントを指定することで,群逐次デザインの例数設計も行うことができる. SEQDESIGNプロシジャでは, DESIGNステートメントにおいて,群逐次デザインにおけるステージの数(す なわち,中間解析の回数)を指定する. NSTAGE=1とすれば,中間解析なしの固定デザインに相当する. プログラム lは,検定の有意水準を両側 α,検出力の名義水準を 1‑β のデザインを想定している.ALT= TWOSIDEDで両側検定を指定しており,片側検定の場合には LOWERあるいは UPPERを指定する .DESIGN ステートメントにおいて NSTAGE=1を指定した下で, SAMPLESIZEステートメントで MODEL= TWOSAMPLESURVIVALを指定すれば, 2群の生存時間データに対してログランク検定を実施することを前 提とした, S c h o e n f e l dの方法に基づく必要イベント数および必要例数を算出できる.なお, SAMPLESIZEス テートメントのオプションとして, NULLHAZARD=で対照群に対するハザードを指定し, ACCTIME=で 登録期間, FOLTIME=でフォローアップ期間, WEIGHT=で群聞の割付比(対照群の例数:試験群の例数= 1 :w) を指定している. プログラム 1:SEQDESIGNプロシジャによる S c h o e n f e l dの方法に基づく例数設計 proc seqdesign altref=‑log仰 R); design nstages=l beta=s alpha=αalt=twosided; samplesize model=七wosamplesurvival (nullhazard=λc ACCTIME=A FOLTIME=F weight=w); run; ‑数値例 生存時間データに対してログランク検定による群間比較を行うことを想定し,有意水準を 5%(両側),検出 力の名義水準を 1‑β=0.80,対照群(のにおける 5年生存割合を 65%,試験群(めにおける 5年生存割合を 80%(フォローアップ期間はすべての個体で等しく 5年とする),割付比として対照群の例数:試験群の例数 = 1: 1の条件の下,例数設計を行う場合を考える.各群の 5年生存割合より,生存時間分布に指数分布を仮 51 8,対数ノ、サe 定すると,各群のハザードはそれぞれ 0 . 0 8 6 2,0 . 0 4 4 6となる.このとき,ハザード比 HR は 0. ード比は l o g ( H R )=ー 0 . 6 5 7 8 となる.プログラム 2は,上記の条件の下, SEQDESIGNプロシジャで S c h o e n f e l d の例数設計を行うためのプログラムである. プログラム 2を実行させると,必要イベント数は72.5 6となり,必要例数は 2 2 7 . 6 1例となる.なお,プロ グラム 2をそのまま実行すると,対数ノ、ザード比などの値における丸めの誤差より,必要イベント数および 必要例数は上述した値とならない.付録 Aに詳細なプログラムを示しており, DATAステップで ( 4 )式を計 算した値と一致することを確認できる. なお, SAMPLESIZEステートメントによって,必要イベント数と必要例数に加えて, I n f o r m a t i o nr 情報量J が出力されるが,これは対数ノ、ザード比の分散の逆数であり, 253
ι I=D.x̲l で ~ (l+wY で算出される値である. プログラム 2 :数値例に対する S c h o e n 免l dの方法に基づく例数設計 proc seqdesign altref=O.657B; designnstages=lbeta=O.20alpha=O.05alt=twosided; samplesize model=twosamplesurvival (nullhazard=O.OB62 ACCTIME=2 FOLTlME=5 weight=l); run; 3 POWERプロシジャによる例数設計 POWERプロシジャにおける生存時間解析の例数設計に関するステートメントとして, TWOSAMPLESURVIVALと COXPHが挙げられる. TWOSAMPLESURVIVALステートメントでは, L a k a t o s の方法に基づき例数設計が実施される ( L 蜘伽, 1 9 8 8 ) . その一方, COXPHステートメントは SAS/STAT1 4 . 1 から追加された機能であり, H s i e h ‑ L a v o r iの方法に基づく例数設計法である ( H s i e ha n dL a v o r i, 2 0 0 0 ) . 3 . 1 TWOSAMPLESURVIVALステートメント POWERプロシジャの TWOSAMPLESURVIVALステートメントにおいて採用されているLak a t o sの方法で r e e d r n a nの方法や S c h o 印 刷dの方法 は,観察期間を小区間に分けて区間ごとに期待イベント数を算出する. F では,群聞のハザードあるいは対数ハザードに差がないとし、う帰無仮説を検定する一方, La k a t o sの方法では 区間ごとに群聞のハザードに差がないという帰無仮説を検定する. TWOSAMPLEステートメントによる例数設計として,比例ハザードモデルを仮定した方法を考える. 試験群(めと対照群(ので構成される 2群間比較試験を想定し,時点 t における群 gE{C , E}の生存割合 S / . / )から,ハザード比 logSE(t 勺 HR=一 一 一ι一 一 l o g S c ( t * ) を推定し,例数設計を行う場合を考える.プログラム 3は,群聞の苦手l 付比が対照群:試験群=1 :w の下, POWERプロシジャによるログランク検定に基づく例数設計法である. CURVEオプションで両群の生存割合 を指定しているが,片方の群のみ指定した上でハザード比 HAZARDRATIO=を指定しでもよい.なお,各群 の生存割合として, 1時点のみ指定しているので,比例ハザード性を仮定した例数設計が行われる. さらに,パージョン 9 . 3 からの POWERプロシジャでは,検出力の名義水準を指定した下で,必要例数の 他にも,表 1に示す値も算出できるようになった (SASI n s t i t u t eI n c ., 2 0 1 1 ) . 例えば,必要イベント数を算出 するためには,プログラム 3における NTOTAL=の代わりに EVENTSTOTAL=を指定すればよい. 254
表 1:必要例数以外に算出できる値 TWOSAM 即 日SURVIVALステートメントにおける指定 算出される数値の内容 EVENTSTOTALIEVENTTOTALIEETOTAL= 期待イベント数 ACCRUALRATETOTALIARTOTAL= 単位時間あたりの 2群の登録例数 ACCRUALRATEPERGROUPIACCRUALRATEPERGI 立時間あたりの 単f ARPERGROUPIARPERG= 1群あたりの登録例数 プログラム 3のように,指数分布を想定した例数設計を行う場合, L a k a t o sの方法による必要イベント数 DL は,必要例数 NL,群 gE{C , E}における試験期間中の期待イベント割合 Pe, PE,および群聞の割付比(対 :w) を用いて, 照群の例数:試験群の例数=1 F三 +wP~ D,=N, x~一~ ~ ~ l+w と算出される.詳細は付録 B を参照されたい. プログラム 3:POWERプロシジャによる比例ハザード性を仮定した例数設計 proc power; twosamplesurvival test=logrank curve("Control") = (七台):( Sc ) curve("Expe工imental") = (t*):( S E ) groupsurvival = "Control" I"Experimental" groupweights = ( 1 w) accrualtime = A followuptime = F ntotal = power = 1‑s; run; ‑数値例 プログラム 4は , 2 . 2節の数値例に対して,比例ノ、ザード性を仮定した L a k a t o sの方法に基づく例数設計を 行うためのプログラムである.必要イベント数は 7 4 . 3 5,必要例数は 2 3 3 . 2 3例となる. 1群あたりの必要例 数を算出したい場合は, NTOTAL=の代わりに NPERGROUP=を指定すればよい. NTOTAL=や NPERGROUP=では,小数点以下を切り上げた例数が出力されるため,プログラム 4の右側に示した必要例 数を求めるためのプログラムでは NFRACTOTALを指定し,小数点以下を切り上げる前の例数も出力してい る.NTOTAL=の代わりに, ACCRUALRATETOTAL=を指定すると, 1年あたりの塗録例数が NdA=2 3 3 . 2 3 1 2 =1 1 6 . 6 2と出力される. 2 5 5
プログラム 4 :数値例に対する比例ノ、ザード性を仮定したLak a t o sの方法に基づく例数設計 J M Lそ 吋… 川九 h 符 仇ーペー Z ユヱ止丘 ι 坐 士 = procpower; 一同割問量一一 、川 ム ぽ 島断ムシi 撒 d procpower; twosamplesurvival test=logrank curve("Control") twosamplesurvival test=logrank = (5):(0.65) curve("Control") curve("Experimental") = ( 5 ) :( 0 . 8 0 )I groupsurvival = "Control" I "Experimental" I 5 ) :(0.65) = ( curve("Experimental") = ( 5 ) :(0.80) groupsurvival = "Control" I I "Experimental" groupweights = (1 1) I groupweights = (1 1) accrualtime = 2 I accrualtime = 2 followuptime = 5 I followuptime = 5 eventstotal = I ntotal =. nfractional power = 0.8; I power = 0.8; run; Irun; 3 . 2 COXPHステ}トメント POWERプロシジャにおける生存時閥解析の例数設計に関するステートメントとしては,以前は TWOSAMPLESURVIVALのみであった.しかし, SAS/STAT1 4.1から新たに COXPHステートメントが追加 された. COXPHステートメントでは, H s i e h ‑La v o r iの方法に基づく例数設計が行われ,多変量の比例ハザー ドモデルの説明変数として,連続変数を加えた場合の変数聞の相関を考慮した例数設計を実施できる. 3 . 2. 1 Hsieh ・ L a v o r iの方法 2節の ( 2 )式に示した,単変量に対する Coxの比例ハザードモデルによるスコア検定統計量は次のように なる. S 2 = L i (x;‑eY 同 L i eDVj ただし ,D はイベント発現データの集合を表す.さらに,リスク集合を R として, L i e R X j e ;=一 一 」 一 一 , n ; L ; eR( X j ‑eY V;=‑‑ n ; とする. 同一例 一 XJ ER 円引 竺刷 Z エ 一 ここで, とすると,スコア検定統計量の分子は, 256
L
t
e
D(Xj一句 }=L
t
e
D(Xj‑17;)+L
t
e
D(17j‑ej}
と分解できる.このとき,第 1項は漸近的に
。
エ
L
:
j
j
(
X
‑
1
7
;
)‑N(O
, ω LjeR(Xjーが In
}
であり, ω→Oのとき,
zteXj
q→
ー」ι 一 =ei,
n
j
'
"
'
"
(
x ρ
V
一工一→,
Z
t
e
D
Z
j
e
R」
二
一
=
エω
(
X
1
7
l
i
j‑
LieDLjeR
j‑
吟
となるため,
L
t
e
D ‑17;)‑N(O,
L
t
e
D
(X
i
Vi}
となる.
また, ω=0の周りでテイラー展開による l次近似を行うと,
乞xj切 ( 蹴:j}}乞ieR
乞ieRXj
v
τー+ ω ' E j e R E却(叫)
f
叫 ( 卸j
}
}
‑
LjeRXj
)
f
叫(僻
ω・
=e
円
i+
となるため,
L
i
e
D
(
1
7
i一弓 }""ωZtd
となる.
以上より ,D に含まれるデータ数が DHLとすると,
主
主 む
=
ω阿
=
ω
s=
L
と表すことができる.ただし ,
dは単変量xの分散である.ここで,推定すべき回帰パラメータ ω=log
(Rめ
として,必要イベント数は
n
'‑'HL
(
Z
a
/
2+Zp)2
ー
(
6
)
一σ2{lo原HRW
と表すことができる. (
4
)式の S
c
h
o
e
n
f
e
1
dの方法と同様に, ω=0における漸近式である. (
4
)式に比べて保
守的な例数設計の式であるといえる.
… Xk}に対する Coxの比例ハザードモデル
'
1
o
(
tI
x}1九(
t
)
]=ω ,
g
{h
+… + ろ
+J
次に,多変量 x=(
列
X2
'¥X
O 2X2
(
J
)
'
k
を考えると,パラメータの推定値の分散を用いて得られる V
,
v
a
r
i
a
n
c
ei
a
c
t
o
r
)は
IF(
n
f
l
a
t
i
o
nf
皇
室J
=
.̲1̲
VIF=
V
;
[
a
)
]
l‑R'
2
5
7
(
7
)
となる.ただし, ~[ÔJ\] は (7) 式の k 変量のモデルから得られる科の分散 , V ;[ O J ]は ( 2 )式の単変量のモデ Jの分散,がは X2, X3, .・ ・, Xkに対する X1の回帰式から得られる寄与率である.検出力を名義水 ルから得られる O 準に保つために,多変量の比例ノ、ザードモデ、ルによる解析に対する必要イベント数は D ' =Dw.VIF=̲ 1Q ‑具 R . ( 8 ) 四 ,,~,,~ となる. ( 6 ),( 8 )式に基づき計算される必要イベント数を用いて, ( 1 )式から必要例数を見積もることができる. ・L a v o r iの 方 法 に 基 づ く 例 数 設 計 3 . 2 . 2 COXPHステートメントによる Hsieh ・ L a v o r iの方法による例数 プログラム 5は , POWERプロシジャの COXPHステートメントを用いて, H s i e h 6 )式は, ( 3 ),( 4 )式と異なり ,dを 設計を行うためのプログラムである.必要イベント数の計算式である ( 指定しなければならない.さらに,必要イベント数の計算には影響しないが,寄与率 R2も指定することがで 2が大きいほど必要例数は多くなる.また,必要例数を求める場合には,EVENTPROB=でイベント割 き,R 合を指定する必要がある. プログラム 5:POWERプロシジャによる H s i e h ・ L a v o r iの方法に基づく例数設計 必要イベント数 I 必要例数 proc power; proc power; coxreg coxreg hazardratio =HR hazardratio =HR rsquare =R2 rsquare =R2 stddev =SO stddev =SO eventstotal = ntotal = power = l‑s; eventprob =イベント割合 power =l‑s; run; run; *SAS/STAT1 4 . 1より実行可能 ‑数値例 COXPHステートメントによる例数設計の数値例として, SAS/STATPHREGプロシジャのマニュアルで取 り扱われている,多発性骨髄腫のデータを用いる.このデータは,アルキル化剤で 6 5人の患者を治療する 試験から得られた死亡または打ち切りまでの生存時間データであり,このうち 48人がイベント発生, 1 7人 が打ち切りであった.生存時間の共変量として,診断時の尿素窒素を表す BUNの対数をとった値 (LogBUN), 白血球数を表す WBCの対数をとった値,ヘモグロビン値,血清カルシウム値などの 9つが取りあげられて おり, 9つの共変量のうち予後因子を特定することに関心がある. ここで, LogBUNが興味のある共変量であると仮定すると,他の 8つの共変量との関連をあることが考え 2は 0 . 1 8 3 9,VIFで示 られる.このとき,他の 8つの共変量に対する LogBUNの回帰式から得られる寄与率 R すと1.2 2 5となり, LogBUNの標準偏差は 0 . 3 1 2 6となる. 258
多発性骨髄腫のデータのLo gBUNに関心がある場合,有意水準 5%(片側I J ),検出力の名義水準 80% の下, 対数ハザード比 lの差を検出できるような例数設計を行うにあたって,まず必要イベント数を求めると, ( 6 ) 式より 6 4例と算出される. ( 1 )式より,必要イベント数から必要例数を求めると,イベント割合が 1‑1 7 / 6 5 =0 . 7 3 8なので, 6 4 / 0 . 7 3 8= 8 6 . 6 7となる.よって, ( 8 )式より,多変量の比例ハザード、モデルによる解析に対 6 . 6 7を VIF=1 .2 2 5倍して, 1 0 6 . 1 7となる. する必要例数は, 8 プログラム 6は,これらの計算を POWERプロシジャで実施するためのプログラムである .R2を考慮して 8,必要例数は 1 0 5と計算される.なお ,R2=0とすれば,必要イベント数 計算すると,必要イベント数は 7 4,必要例数が 8 6と計算されることを確認できる. が6 プログラム 6 :数値例に対する H s i e h ‑ L a v o r iの方法に基づく例数設計 必要イベント数 必要例数 procpower; procpower; coxreg coxreg alpha = 0.05 alpha =0.05 sides = 1 sides =1 hazardratio =2.718 hazardratio =2.718 rsquare = 0.1837 rsquare =0.1837 stddev = 0.3126 stddev = 0.3126 eventstotal = ntotal = nfrac nfrac 8 ; power = . eventprob = 0.7385 power = . 8 ; run; run; *SAS/STAT1 4 . 1より実行可能 , SAS/STA Tl4 . 1から実行可能である.なお,日本語版の SAS/STAT1 4 . 1から, POWERプ プログラム 6は ロシジャの出力結果は一部日本語で出力される.出力結果の詳細は付録 Eを参照されたい. 4 登録パターンが一様でない場合の例数設計 3 . 1節の POWERプロシジャにおける TWOSAMPLESURVIVALステートメントでは,脱落までの時間が指 2 0 1 6 ) . しかし,登録パターンについて 数分布に従うと仮定して,例数設計を行うことが可能である(大橋ら . は,登録期間中に一様に,患者が登録されると仮定した場合のみで,脱落までの時間のように指数分布を仮定 した検討を行うことはできない. しかし, 2 . 2節で取りあげた SEQDESIGNプロシジャを用いれば,期間内で一様に登録されるパターン以外 c a t e de x p o n e n t i a 1 )分布に従って登録されると仮定することができる.切断指数分布の確率 に,切断指数(加n 密度関数および累積分布関数はそれぞれ 259
̲ y回 p(‑1
'
1
)
g
(
t
)一
1
一 切(
‑
y
A
)
ト 明(
‑
1
'
1
)
Gο)=
1
一 切(
‑
y
A
)
となる (O~t~ A
). ただし ,yは形状パラメータであるけ:;i:0
)
. 切断指数分布の累積分布関数の形状は図
1のようになり(作成プログラムは付録 Fを参照),点線で示した一様分布と比較すると , y<Oのときは凸
形の登録パターンとなり,その一方 y>Oのときは凹形の登録パターンとなる.
5
)式に対して,登録パターンが切断指数分
一様分布に従って登録される場合の期待イベント割合を表す (
布に従う場合の期待イベント割合は,
A+F
r
A
.
.
.
.
.
.
̲
F ,.
r
e
x
p
{
一
品
(A+F)}日
一
切
{(
名
+y)
A
}
J
弓
'
=J
F
g(A
+FD‑t){l‑e
x
p
(
一
勾)
}
a
'
t=1+
'
‑
‑
‑
.
‑
,
‑
-~:-- ‑ .
‑
.
,
.
‑
:
‑
r
,
,
‑
‑g ,
,
‑
‑
,
"
̲1"
4'¥(1
I
.¥lA4̲1 I
n
(l‑exp(
引)(名 ‑y)
(
9
)
となる(La
c
h
i
nandF
o
u
l
k
e
s,1
9
8
6
)
. よって ,w=lの場合で考えると, 2
.
1節と同様の手順,すなわち 2群を併
γγ
せた期待イベント割合 (
l +1 )
/
2を用いて,必要例数を見積もることができる.
節目間町司自 =~2 ;
1
.
0
0
.
9
0
.
8
0
.
7
0
.
6
害防
0
.
4
0
.
3
0
.
2
0
.
1
0
.
0
0
.
0
0
.
5
1
.
0
1
.
5
2
.
0
0
.
0
0
.
5
1
.
0
1
.
5
2
.
0
t
図 1:切断指数分布の累積分布関数
4
.
1 SEQDESIGNプロシジャによる登録パターンが一様でない場合の例数設計
2
.
2節に示した方法に基づき SEQDESIGNプロシジャを活用すれば, POWERプロシジャでは検討できなか
った登録パターンが一様でない場合の例数設計を行うことができる.プログラム 7は
, SEQDESIGNプロシ
ジャを用いて,登録パターンが切断指数分布に従うと仮定した下で,必要イベント数および必要例数を算出
するためのプログラムである. 2
.
2節同様, SEQDESIGNプロシジャの例数設計は S
c
h
o
e
n
f
e
l
dの方法に基づき
実施され,登録パターンの考慮についてのみ L
a
c
h
i
n
‑
F
o
u
l
k
e
sの方法に基づいている.
プログラム 7では, SEQDESIGNプロシジャの SAMPLESIZEステートメントにおいて, ACCRUAL=
EXP(
P,組M=GAMMA') を指定することで,登録パターンにパラメータ y
'の切断指数分布を仮定することが
, (
9
)式の y を直接指定するのでなく,
できる.注意すべき点として, ACCRUAL= で指定する GAMMA'は
y'=Ayを指定する.例えば,登録期間として ACCTIME=2を指定しており,図 Iで考えた r=‑2の切断
260
指数分布を仮定したい場合には, PARM=ー4と指定すればよい.なお, SAMPLESIZEステートメントにおい て ACCRUAL= を指定しなければ,デフォルトである ACCRUAL=UNIFORMが適用される. プログラム 7:SEQDESIGNプロシジャによる登録ノ fターンが切断指数分布に従うと仮定した例数設計 proc seqdesign altref=‑log(HR); design nstages=l beta=s alpha=αalt=twosided; samples工ze model=twosamplesurvival (nullhazard=λc ACCTIME=A FOLTIME=F accrual=exp(parm=gamma') weight=w); ruo; ‑数値例 登録パターンが一様でない場合の数値例として, 2 . 2節の数値例と同様の条件であるが,図 lのパラメータ が r =‑2, 2 の切断指数分布に登録ノ 4ターンが従う場合を考える. プログラム 8:数値例に対する登録パターンが切断指数分布に従う場合の例数設計 凸形の登録パタ←ンの場合 (y=‑1) 凹形の獲録パターンの場合 (r0 = '2 ) proc seqdesign altref=O.6578; proc seqdesign altref=O.6578; design nstages=l design nstages=l beta=O.20 alpha=O.05 beta=O.20 alpha=O.05 alt=twosided; alt=twosided; samplesize model=twosamplesurvival samplesize model=twosamplesurvival (nullhazard=O.08616 (nullhazard=O.08616 ACCTIME=2 FOLTlME=5 ACCTIME=2 FOLTIME=5 accrual=exp(parm=‑4) accrual=exp(parm=4) weight=l); weight=l); run; run; プログラム 2による実行結果より,必要イベント数は 7 2 . 5 6,必要例数は 2 2 7 . 6 1例であった. SEQDESIGN プロシジャによる登録ノ号ターンが一様でない場合の例数設計では, ( 4 ) 式に基づき必要イベント数を求め, ( 9 ) 式から得られる期待イベント割合から, (1)式に基づき必要例数が算出される.そのため,必要イベント数は 登録パターンを変動させても同様の値が得られる.しかし,必要例数に関して,登録ノ号ターンが切断指数分 布に従う場合,プログラム 8より ,r =‑2 の場合は 245. 46例に増大し ,r =2 の場合は 212. 4 2例に減少する ことを確認できる. 261
6 まとめ 本稿では,生存時間解析の例数設計に関連したプロシジャとして, POWERプロシジャ, SEQDESIGNプロ シジャによる例数設計について取りあげた. POWERプロシジャによる L a k a t o sの方法に基づく例数設計では,これまで例数のみしか出力できず,イベ ント数については算出できなかった.しかし, SAS/STAT9 . 3からイベント数についても算出され,例数設計 法として性能が優れている L a k a t o sの方法を実務に適用する機会が増えることが予想される. SAS/STAT1 4.1以降の POWERプロシジャでは, L a k a t o sの方法に加えて, H s i e h ‑ L a v o r iの方法に基づく例数 設計もできるようになった.がんを対象とした第 I I I相試験のように,生存時間データを主要評価項目とした 2群間比較試験の例数設計では, L a k a t o sの方法が有用である.しかし,疫学研究や非ランダム化比較試験で は,生存時間に対する共変量として連続変数を加える場合があり,興味のある共変量が他の共変量と独立で ないことが考えられる.このとき, H s i e h ・L a v o r iの方法に基づき, VIFを考慮して例数設計を行うことが可能 である. また, POWERプロシジャでは,登録期間中に患者が一様に登録されると仮定しており,登録パターンが 一様でない場合の検討を行うことができない.そこで, POWERプロシジャの代わりに, SEQDESIGNプロシ ジャで例数設計を行うことは有用であり,登録パターンが切断指数分布に従うと仮定した下で, S c h o e n f e 1 d の方法に基づく例数設計を行うことができることを示した. S c h o e n f e l dの方法は L a k a t o sの方法より性能が劣 B a r t h e le ta l, 2 0 0 6 ),日 ってしまうが,生存時間解析の例数設計法として最もよく用いられている方法であり ( 本語訳が出版されている生存時間解析のテキストにおいても取りあげられている ( C o l l e , 抗2 0 0 3 ;Hosmere ta , . l 2 0 0 8 ) . そのため,実務上,登録パターンが一様でない場合の必要イベント数,必要例数を検討するにあたっ て大変有用といえる. 比例ハザード性が成り立たない場合,比例ハザードモデ、ルを仮定しない方法として,生存時間分布に区分 直線モデ、ルを仮定することで,精度良く例数設計を実施できる. POWERプロシジャにより,生存時間分布 に区分直線モデルを仮定した例数設計を行うためには, CURVEオプションで 2時点以上の生存割合を指定す ればよい.比例ハザードモデルを仮定せずに,生存時間分布に区分直線モデ、ノレを仮定する方法については, 魚住ら ( 2 0 0 9 ),大橋ら ( 2 0 1 6 ) を参照されたい. s i e h ‑ L a v o r iの方法, SEQDESIGNプロシジャによる登録パターンが一様 なお, POWERプロシジャによる H でない場合の例数設計に関しては, DATAステップによる実装も付録に示しており(付録 C,G),プロシジャ による実行結果(付録 D,H) と一致することを確認できる. 参考文献 [ 1 ]B a r t h e lFMS,B a b i k e rA,R o y s t o nP ,P釘 marMK .E v a l u a t i o nofs a m p l es i z eandpowerf o rm u l t i a r ms u r v i v a lt r i a l s n o n ‑ p r o p o r t i o n a lh a z a r d s, l o s st of o l l o w ‑ u pandc r o s s ‑ o v e r .S t a t i s t i c si nM e d i c i n e . a l l o w i n gf o rn o n ‑ u n i f o r ma c c r u a l, 2 0 0 6 . 25:2521‑2542, ふChapmanandHall/CRC,BocaRaton,FL,2003. [ 2 ]C o l l e t tD .M o d e l l i n gS u r v i v a lDatai nM e d i c a lR e s e a r c h( 2 n dedn 宮岡悦良(監訳),グラクソ・スミスクライン株式会社ノ〈イオメデイカルデータサイエンス部:安藤英一・ 今井由希子・遠藤輝・兼本典明・張方紅・寺尾工・橋本浩史・本間剛介(訳).医薬統計のための生存時間 データ解析.共立出版, 20日. 262
[ 3 ]CoxDR.R e g r e s s i o nm o d e l sandl i f e ‑ t a b l e s( w i t hD i s c u s s i o n ) .J o u r n a l01t h eR o y a lS t a t i s t i c a lS o c i e 砂¥S e r i e sB . 3 4 :1 8 7 ‑ 2 2 0,1 9 7 2 . t .S t a t i s t i c si nM e d i c i n e . [ 4 ]F r e e d m a nL S .T a b l e so f t h enumbero f p a t i e n t sr e q u i r e di nc l i n i c a lt r i a l su s i n gt h el o g r a n kt e s 9 8 2 . 1 : 1 2 1 ‑ 1 2 9,1 [ 5 ]J o h n s o nNL,K o t zS,8 a l a k r i s h n a nN .C o n t i n u o u sU n i v a r i a t eD i s t r i b u t i o n s ,ぬ1 . 1( 2 n de d nふJ o h nW i l e ya n dS o n s, NewY o r k , NY ,1 9 9 4 . ,D .W.J r .,Lemeshow ,S .a n dMay ,S .A p p l i e dS u r v i v a lA n a l y s i s :R e g r e s s i o nM o d e l i n g01T i meω E v e n t [ 6 ]Hosmer Data( 2 n de d n ふJ o h nW i l e ya n dS o n s,Hoboken, NJ, 2 0 0 8 .五所正彦(監訳),佐藤泰憲・竹内久朗・長島健悟・ 中水流嘉臣・平川晃弘・松永信人・山田雅之(訳).生存時間解析入門(原書第 2版).東京大学出版会, 2 0 1 4 . [ 7 ]H s i e hFY ,L a v o r iPw .Sample‑sizecalculationsfortheCoxproportionalhazardsregressionmodelwithnonbinary / edC l i n i c a l7 トi a l s .2 1 : 5 5 2 ‑ 5 6 0,2 0 0 0 . c o v a r i a t e s .C o n t r ol [ 8 ]L a c h i nJM,F o u l k e sMA. E v a l u a t i o no fs a m p l es i z ea n dpowerf o ra n a l y s e so fs u r v i v a lw i t ha l l o w a n c ef o r n o n u n i f o r mp a t i e n te n 甘y ,l o s s e st of o l l o w ‑ u p,n o n c o m p l i a n c e,a n ds t r a t i f i c a t i o n .B i o m e t r i c s .4 2 : 5 0 7 ‑ 5 1 9,1 9 8 6 . .B i o m e t r i c s . [ 9 ]L a k a t o sE .S a m p l es i z eb a s e do nt h el o g ‑ r a n ks t a t i s t i ci nc o m p l e xt r i a l su s i n gt h el o g ‑ r a n kt e st 9 8 8 . 4 4 : 2 2 9 ‑ 2 4 1,1 G .A comparisono fs a m p l es i z em e t h o d sf o rt h el o g r a n ks t a t i s t i c .S t a t i s t i c si nM e d i c i n e . [ 1 0 ]L a k a t o sE,LanKK 1 1 :1 7 9 ‑ 1 9 1,1 9 9 2 . [ 1 1 ]SASI n s t i t u t eI n c .S A S / S T A T ( R )9. 3U s e rsG u i d e .SASI n s t i t u t eI n c .,C a r y , NC,2 0 1 1 . 日T ( R )1 3 .1U sersG u i d e .SASI n s t i t u t eI n c ., C a r y , NC, 2 0 1 3 . [ 1 2 ]SASI n s t i t u t eI n c .SAS/S [ 1 3 ]SASI n s t i t u t eI n c .S A S / S T A T ( R )1 3 . 2U s e r sG u i d e .SASI n s t i t u t eI n c ., C a r y , NC,2 0 1 4 . [ 1 4 ]SASI n s t i t u t eI n c .S A S / S T A T ( R )1 4 . 1U s e r sG u i d e .SASI n s t i t u t eI n c ., C a r y , NC,2 0 1 5 . 佐i ct e s t sf o rc o m p a r i n gs u r v i v a ld i s t r i b u t i o n .B i o m e t r i k a . [ 1 5 ]S c h o e n f e l dD .Thea s y m p t o t i cp r o p e r t i e so fn o n p a r a m e 6 8 : 3 1 6 ‑ 3 1 9,1 9 81 . a k a t o sの症例数設計法の有用性の評価 .SAS ユ [ 1 6 ]魚住龍史・水津純基・浜田知久馬.生存時間解析における L ーザー総会論文集, 1 4 3 ‑ 1 5 2,2 0 0 9 . [ 1 7 ]魚住龍史・森田智視.生存時間解析における三種の神器.呼吸, 3 4 :1083‑1089,2 0 1 5 . 9 9 5 . [ 1 8 ] 大橋靖雄・浜田知久馬.生存時間解析 ‑SAS による生物統計東京大学出版会, 1 0 1 6 . [ 1 9 ] 大橋靖雄・浜田知久馬・魚住龍史.生存時間解析応用編 ‑SAS による生物統計.東京大学出版会, 2 [ 2 0 ] 張方紅・寺尾工.非劣性試験の症例数設計方法の紹介一生存時間データの場合一.SAS ユーザー総会論文 集 ,8 7 ‑ 1 0 0, 2 0 1 0 . 6 7 ‑ 1 8 4,2 0 11 . [ 2 1 ] 張方紅 .SASによる生存時間解析の実務 .SAS ユーザー総会論文集, 1 [ 2 2 ] 中西豊支・五所正彦・菅波秀規 .POWER プロシジャを用いた生存時間解析における症例数設定方法の統 計学的一考察.SASForumユーザー会論文集, 1 6 1 ‑ 1 6 9, 2 0 0 6 . [ 2 3 ] 浜田知久馬・藤井陽介.生存時間解析の症例数設計.日本 SASユーザー会論文集, 73‑98,2 0 0 3 . [ 2 4 ] 浜田知久馬・安藤英一. POWER プロシジャによる症例数設計. SAS Forum ユーザー会論文集, 1 2 7 ‑ 1 5 1, 2 0 0 5 . 1 1 ‑ 1 7 9,2 0 1 0 . [ 2 5 ] 浜岡知久馬 .SASによる中間解析のデザインと解析 .SASユーザー総会論文集, 1 [ 2 6 ]水津純基・浜田知久馬.生存時間解析における症例数設計方法の性能比較. SAS ユーザー総会論文集, 1 9 ‑ 2 8,2 0 0 8 . 263
連絡先 E ‑ m a i l :u o z u m i{ j ) ,k u h v . k v o t o ・u .αc . i v 付 録 A:SEQDESIGNプロシジャによる S c h o e n f e l dの方法に基づく例数設計の確認プログラム , *======================================================================安. *追加の条件設定; もlet alpha=O.05; もlet beta=O.2; 宅let power= もsysevalf(l‑&beta); 宅let w=l; もl et Sc=O.65; 毛let Se=O.80; もlet HR= もsysevalf(もsysfunc(log(&Se))/%sysfunc(log(&Sc))); 宅let logHR= 告s ysevalf(ーも sysfunc(log(品目 R))) ; もlet a ccrual=2; 宅let followup=5; 宅let hc= もsysevalf(一 宅 sysfunc(log(&Sc))/&followup); もlet he= もsysevalf(ー も sysfunc(log(&Se))/&followup); , *======================================================================*. * SEQDESIGNプロシジャによる Schoenfeldの方法に基づ、く例数設計; proc seqdesign altref=&logHR; design nstages=l beta=&beta alpha=&alpha alt=twosided; samplesize model=twosamplesurvival (nul1hazard=&hc weight=&w ACCTIME=&accrual FOLTlME=&followup accrual=uniform ) ; run; , *======================================================================*‑ 合 DATAステップによる SEQDESIGNプロシジャの計算結果の確認; data sample; alpha=α beta=β w=&w; za=probit(1‑alpha/2); zb=probit(l‑beta); SC=&SC; Se=&Se; HR=log(Se)/log(Sc); accrual=&accrual; followup=&followup; total=accrual+fol1owup; hc=&hc; he=&he; ー hc*followup)*( 1一(exp(‑hc*accrual)))/(accrual勺 l C ); Pc=l‑exp( Pe=l‑exp( ー he安 followup)*( 1ー(exp(‑he*accrual)))/(accrual女 he); w女 log(HR)**2); DtotalS=(1+w)**2*(za+zb)*安 2/( NtotalS=DtotalS女 (l+w)/(Pc+w*Pe); run; 付 録 B:DATAステップによる L a k a t o sの方法に基づく必要イベント数の計算プログラム , 合======================================================================女. * Lakatosの方法に基づく必要例数; ods output Outpu七=lakatos; proc power; twosamplesurvival test=logrank curve("Control") = (5):(0.65) curve("Experimental") = (5):(0.80) groupsurvival = "Control" "Experimental" groupweights = ( 11 ) accrualtime = 2 followuptime = 5 ntotal = nfractional power = 0.8; run; *======================================================================*i * DATAステップによる Lakatosの方法に基づく必要例数から必要イベント数の計算; data lakatos; set lakatos; Sc=0.65; Se=0.80; HR=log(Se)/log(Sc); hC=‑log(SC)/FollowUpTime; he=‑log(Se)/FollowUpTime; Pc=l‑exp(‑hc*FollowUpTime)女 ( 1一(exp(‑hc女 AccrualTime)))/(AccrualTime*hc); Pe=l‑exp(‑he*FollowUpTime)*( 1一(exp(‑he*AccrualTime)))/(AccrualTime*he); Dtotal=FractionalN女 (Weightl*Pc+Weight2*Pe)/(Weightl+Weight2); runi *======================================================================*i * Lakatosの方法に基づく必要イベント数の確認、; 264
proc pOweri twosamplesurvival test=logrank curve("Control") = (5):(0.65) curve("Experimental") = (5):(0.80) groupsurvival = "Control" I"Experimental" groupweights = ( 11 ) accrualt工me = 2 followuptime = 5 eventstotal = power = 0.8i runi 付録 C:DATAステップによる H s i e h ・L a v o r iの方法に基づく必要イベント数の計算プログラム , ======================================================================*6 女変数 LogBUNの標準偏差の確認、; 安 proc means data=Myelomai var logBUNi runi ョー======================================================================*. , 安 VIFの確認、, proc reg data=Myelomai model Time = LogBUN HGB Platelet Age LogWBC Frac LogPBM Protein SCalc / vifi runiquiti *======================================================================女. 大寄与率 R2の 確 認 ; proc reg data=Myelomai model LogBUN = HGB Platelet Age LogWBC Frac LogPBM Protein SCalci runiquiti *======================================================================女; 女条件の指定; もlet alpha=O.05i 宅let be 七a=O.2i 宅let power= 宅sysevalf(l ー&beta)i もlet W=li 宅let logHR=li もlet HR= もsysfunc(exp(&logHR))i もlet sigma=O.3126i もlet VIF= 1 .225i もlet rs=宅sysevalf(l‑l/&VIF)i 宅let nO=65i もlet cO=17i もlet eventpO= もsysevalf(l‑&cO/&nO)i *======================================================================女. D且TAステップによる Hsieh‑Lavoriの方法に基づく例数設計; 安 data samplei alpha=&alphai beta=&betai W=&Wi za=probit(l‑alpha)i zb=probit(l‑beta)i logHR=&logHRi HR=exp(工ogHR)i sigma=&sigmai VIF=&VIFi rsquare=l‑l/VIFi pi=l‑&cO/&nOi DtotalHL=(za+zb)安 安 2/(sigma*logHR)**2i NtotalHL=DtotalHL/pii NtotalHL VIF=NtotalHL*VIFi DtotalHL VIF=DtotalHL*VIFi run; 付 録 D:COXPHステートメントによる H s i e h ‑ L a v o r iの方法の計算プログラム , 安======================================================================安. *必要イベン卜数一 DtotalHL,DtotalHL VIF に 一 致 ; proc poweri cox工eg &rs stddev= &s工gma alpha= &alpha sides = 1 hazardratio= &HR rsquare = 0, eventstotal = nfrac power = 品 poweri runi *======================================================================合; *必要例数一 NtotalHL,NtotalHL VIF ,こ一致; proc poweri coxreg alpha = &alpha sides = 1 &rs stddev = &sigma hazardratio = &HR rsquare = O, ntotal = nfrac eventprob = &eventpO power = &pOweri run; 265
付録 E:COXPHステートメント(付録 D) による H s i e h ‑ L a v o r iの方法の計算結果 ・ 必要イベント数 計算された C e i l i n gEventT o t a l インデックス ‑ r a c t i o n a lEventT o t a l 実際の検出力 R‑square F C e i l i n gEventTotal 1 0 . 0 0 0 6 3 . 2 6 8 8 8 7 0 . 8 0 4 64 2 0 . 1 8 4 7 7 . 5 0 4 3 8 7 0 . 8 0 2 78 必要例数 計算された上限の総標本サイズ インデックス R‑square小数点の総標本サイズ実際の検出力上限の総標本サイズ 1 0 . 0 0 0 8 5 . 6 7 6 6 1 8 0 . 8 0 1 86 2 0 . 1 8 4 1 0 4 . 9 5 3 8 5 8 0 . 8 0 0 1 0 5 付録 F・切断指数分布(図 1 ) の作成プログラム , *======================================================================*. 女切断指数分布に従う登録パターン (A = 2 ) data trunexp; a=2; do gamrna=ー 2, 2; do t=O to 2 by 0.01; 七 ))/(1‑exp(‑gamrna*a)); y=0.5*t; output; g=(1‑exp(‑gamrna女 end; end; run; *======================================================================*. , *登録パターン別にグラフ化; proc sgpanel data=trunexp noautolegend; panelby gamrna / columns=2; ser工es x=t y=g / 1エneattrs=(pattern=1 color=black); series x=t y=y / lineattrs=(pattern=35 color=black); rowaxis values=(O to 1 by 0.1) label="G(t)"; colaxis values=(O to 2 by 0.5) label="t"; run; 付録 G:DATAステップによる登録パターンを考慮、した例数設計プログラム , 安======================================================================女. *付録Aの条件に加えて以下を設定; 宅let g amrna=ー 2; もlet gamrna seqdesign=もsysevalf(&accrual女 &gamrna); 安======================================================================*" 女 DATAステップによる登録パターンを考慮、した Schoenfeldの方法に基づく例数設計; data sample; alpha=α beta=β w=&w; za=probit(1‑alpha/2); zb=probit(1‑beta); gamrna=&gamrna; Sc=⪼ Se=&Se; HR=log(Se)/log(Sc); accrual=&accrual; followup=&followup; total=accrual+followup; hc=&hc; he=&he; PcUni=1‑exp(ーhc安 followup)安 ( 1ー(exp(‑hc*accrual)))/(accrual勺lC); PeUni=1‑exp(ーhe*followup)女 ( 1一(exp(‑he*accrual)))/(accrual*he); PcExp=1+(gamrna安 exp(‑hc女 total)*(1‑exp((hc‑gamrna)安 accrual))) /((l‑exp(‑gamrna*accrual))女 (hc‑gamrna)); PeExp=1+(gamrna*exp(‑he会 total)*(1‑exp((he‑gamrna)女 accrual))) /((1‑exp(‑gamrna*accrual))*(he‑gamrna)); DtotalS=(1+w)合 *2*(za+zb)**2/(w台 工 og(HR)*女 2 ); NtotalS Uni=DtotalS安 (1+w)/(PcUni+w*PeUni); NtotalS Exp=DtotalS大 (1+w)/(PcExp+w*PeExp); run; 266
付録 H:SEQDESIGNプロシジャによる登録パターンを考慮した例数設計プログラム 安======================================================================*! 世受録パターンが一様の場合の必要例数の確認; proc seqdesign altref=&logHRi design nstages=l beta=&beta alpha=晶alpha alt=twosidedi samplesize model=twosamplesurvival (nul工hazard=&hc weight=&w ACCTIME=&accrual FOLTlME=晶followup accrual=uniform }i runi *======================================================================*~ 合登録パターンが一様でない場合の必要例数の確認; proc seqdesign altref=&logHRi design nstages=l beta=&beta alpha=&alpha alt=twosidedi samplesize model=twosamplesurvival (nullhazard=&hc weight=&w ACCTlME=&accrual FOLT工ME=晶followup accrual=exp(parm=晶gamma̲seqdesign) }i runi 267
生存時間データに対するベイズ流例数設計 0矢 田 真 城 1 魚 住 龍 史 2 浜 田 知 久 馬 3 ェイツーヘルスケア株式会社開発戦略本部生物統計部 l 2京都大学大学院医学研究科医学統計生物情報学 3東京理科大学工学部情報工学科 B a y e s i a ns a m p l es i z ec a l c u l a t i o nf o rs u r v i v a la n a l y s i s 3 S h i n j oYada¥R y u j iUozume, 佃dChikumaHamada 1 B i o s t a t i s t i c sD e p a r t m e n t .DevelopmentSI 1 ・ a t e g yD i v i s i o n .A2H e a l . 幼c a r eC o r p o r a t i o n 伽 e n tof B i o m e d i c a lS t a t i s t i c sandBωi n f o r m a t i α ,, め10ωUniversityGra ぬ , . a t eS c h o o lof 胎 . d i c i n e 2Depar , y g おかoUniversityofScience 3 Departmentof I n f o r m 叫' i o nandComputerT e c h n o l o 要旨 臨床試験では,試験のデザインや目的に従い試験結果の精度を保証するために,必要と考えられる例数を設 定する.必要例数を解析的に導出することが難しい場合,シミュレーションにより必要例数を見積もる方法 が用いられる.シミュレーションによるベイズ流例数設計では,"もし・・としたら"という状況の下で仮想的 に生成されたデータを解析し,その結果がモデル判定基準を満たすような例数を,当該臨床試験で必要な例 数と見積もる.このとき,検定の有意水準,検出力,効果の差といった概念は,事後分布に関連付けて提示 することができる.本稿では,シミュレーションによるベイズ流例数設計として, i n d i f f e r e n c ez o n eを用いた 方法について紹介する.これは,効果の差を表すモデルパラメータの信用区間と i n d i能 r e n c e z o n eとの位置関 係から必要例数を見積もる方法である.シミュレーションの実行手順に関してまとめ,適用例として生存時 間データにおける例数設計をとりあげ,対応する SASプログラムと簡単なシミュレーション結果を示す. キーワード: i n d i 能r e n c ezone , d e s i 伊 p r i o r , a n a l y s i sp r i o r 2 6 8
1.はじめに 臨床試験における例数設計は,試験デザインの重要な一つの要素である(上坂, 2 0 0 6 ) . 統計学的な例数設 計には,精度に基づく例数設計と検出力に基づく例数設計とがあるが,臨床試験では検出力に基づく例数設 ‑ β ,予 計がよく用いられている.検定に用いる帰無仮説及び対立仮説を設定し,検定の有意水準 α,検出力 1 想される群聞での効果の差&とそのばらつきを与え,適切な検定方法を選択することで,必要例数を算出す ることができる.ただし,必要例数を解析的に算出するためには,対立仮説のもとでの検定統計量の分布を 知る必要がある.より複雑なモデルを想定した場合,対立仮説のもとでの検定統計量が従う分布の導出が難 解になり,必要例数を明示できないことがありえる.このような場合,シミュレーションに基づき必要例数 を見積もる方法がある(大橋等, 2 0 1 6 ) . シミュレーションに基づくベイズ流の例数設計では,必要例数 N を仮に定めた後, 1 )予め設定した事前分 布に基づきモデルパラメータを生成させる, 2 ) 生成させたモデルパラメータを用いてデータを発生させる, 3 )発生させたデータを用いてベイズ流に解析する, 4 )得られた事後分布から予め設定したモデル性能基準 ( m o d e lp e r f o r m a n c ec r i t e r i a ) と照らし合わせる,とし、う手順をとり,モデル性能基準を満たしていなければ, N を変えて 1 )からのを再度実行する (Wanga n dG e l f a n d, 2 0 0 2 ).このとき,検定の有意水準,検出力,群聞で の効果の差といった概念は事後分布に関連付けて定義される.そこで本稿では,事後分布に基づくベイズ流 例数設計の lっとして, i n d i f f e r e n c ez o n eによる方法をとりあげ,シミュレーションによる例数設計の手順 を示し,検定の有意水準,検出力との類似性をまとめる. n d i f f e r e n c ez o n eを用いたベイズ流例数設計について説明する. 本稿の構成は以下のとおりである.第 2節で i n d i 能r e n c ez o n eを用いたベイズ流例数設計として,生存時閥解析における適用例を具体的に紹 第 3節にて, i 介する.最後に第 4節で本稿のまとめを行う. 2 . ベイズ流例数設計 2 . 1 . Indifferencezone 本稿では,対照群に対する試験群の有効性を示すことを目的とした,並行 2群比較試験における例数設計 i n d i f f e r e n c ez o n e " を用いたベイズ流例数設計において,基本となるアイデアは,検定の際に を対象とする. " 設定する帰無仮説 rHo:s=OJ をある範囲をもった区間 se[o 孔]に置き換えることにある.ここに, L, 企は c o n t r o l ) に対する試験群(紅白加e n t ) の 2群間での効果の差 , Ouは試験群がこの値を超えると対照 対照群 ( 群に比べて臨床的に優れているといえる限界値であり, δ Lはこの値を下回ると試験群が対照群よりも臨床的 に劣ると考えられる闇値である.この i n d i f f e r e n c ez o n eδ [L'OU]と 2群聞での効果の差 Aの 95% 信用区間との 位置関係から,試験群と対照群との優劣を結論付けることが可能となる.効果の差 Aが大きいほど対照群に 対する試験群の優越性が示されている状態であるとき, sの 95%信用区間に基づく判定基準 ( d e c i s i o nr u l e ) は図 2 . 1のようになる ( S p i e g e l h a l t e re ta , . l1 9 9 4 ) ." a c c e p t田 a t m e n t " (試験群を採択), " r e j e c tcon 佐0 1" (対照群 e q u i v a l e n c e "(同等), " r e j e c t出 a t m e n t "(試験群を棄却), " a c c 叩t con 仕0 1 "(対照群を採択), " n od e c i s i o n " を棄却), " (判定不能)のいずれかの判定が下される. 269
Ia c c e p tc o 唄t r o 1I 吋e c t位' e h 出削 I e q u i v a 1 e n c eI a c c 唱p t佐官a 位n e n t n o d e c i s i o n dL du ト 一 一 一 一 → :8に対する 95%信用区間 . 1:効果の差企の 95% 信用区間に基づく i n d i f f e r e n c ez o n eと判定基準との関係 図2 2 . 2 . シミュレーションによる例数設計 例数設計の大きな流れとしては次のようになる. 手順 1 データに対してあてはめるモデルを想定し.2群聞での効果の差 8 .i n d i f f e r e n c ezone[ðL • 札]及びモ デルパラメータの事前分布を設定する. j 慎2 手J 事前分布に基づき N人分の被験者の観測値を仮想的に生成する 手J j 慎3 手J j 頂2で生成された仮想的な観測値を用いてベイズ流にパラメータを更新し, 8の 95% 信用区聞を 推定する. 手順 4 8の 95% 信用区間と i n d i民 r e n c ez o n e[ d L . d . 1に従い 6つの判定基準のいず u]との位置関係から,図 2 れに該当するかを判定する.これが 1回のシミュレーションによって得られる判定結果となる. 手順 5 手J j 頂2から手順 4までを数千から数万回繰り返すことで,判定基準ごとの経験的確率を計算するこ とができ,例数 N に対する検出力などを推定することができる. a n a l y s i sp r i o rあるいは伽i n gp r i o r )とデザイン事前分布 ( d e s i 伊 p r i o r ベイズ流アプローチでは,解析事前分布 ( あるいは s a r n p l i n gp r i o r ) という 2種類の事前分布を設定し,例数設計を行う.解析事前分布は,事前情報を モデル化し(ときにヒストリカルデータに代表される情報をモデル化し).事後分布を得るために用いられる 枇i べきであり,デザイン事前分布はパラメータの不確実性をモデル化するために用いられるべきである (Bru e ta , . l2008). 解析事前分布は,文字どおり集積されたデータに対しモデルをあてはめる,即ち解析するために用いるこ とを想定し設定される事前分布である (WangandG e l f a n d , 2 0 0 2 ).たとえば対照群の治療効果をパラメータ ( } I で,試験薬の治療効果をパラメータ θ 2で表すモデルを考える.対照群については試験開始前にかなりの情報 を得ているが,試験薬については対照群ほどの豊富な情報はもちあわせていないかもしれない.このように, 各モデルパラメータに対する事前分布の検討においては,それまでの経験則やヒストリカルデータに対する 解析結果のレビューから始めるべきであり,それが解析事前分布を設定するときに役立つ (Be 町 e ta l, 2 0 1 1 ) . 一方,デザイン事前分布は"もし…だったとしたら"という見解に基づき設定される事前分布である (Wang andG e l f a n d , 2 0 0 2 ).即ち,試験をデザインするときに用いられる事前分布であり,過去に行われた試験の結 果や文献調査により収集された情報をもとに検討される ( B e r r ye ta l, 2 0 1 1 ) . 2 7 0
上記手順でいえば,デザイン事前分布は手順 2で,解析事前分布は手1
1
慎3で,それぞれ使用する.手順 2
において,デザイン事前分布に基づきモデルパラメータのもとで t番目の被験者 (
i= 1
,
2,
…,
N) に対する観
測値を仮想的に生成させる.Type1エラーに完全に対応する "
B
a
y
e
s
i
a
na
n
a
l
o
g
s
" を求めるためには,デザイン
事前分布に従いパラメータを固定させて観測値を生成させるが,よりベイズ流に行うのであれば,デザイン
事前分布からサンプリングされたモデルパラメータを用いて観測値を生成させることも考えられる.続く手
順 3にてパラメータを更新し企の 95%
信用区間を推定する際に,解析事前分布を使用する.
頻度論におけるシミュレーションによる例数設計では,帰無仮説及び想定する対立仮説を決め,対立仮説
のもとで仮想的にデータを生成させる.生成させたデータに対し治療効果に差があるかの仮説検定を行い,
有意水準 αで検定が有意となるか判定する.この過程をシミュレーション回数 Nrep繰り返し,有意になる割
合を調べればこれが検出力の推定値となる.これに対し,ベイズ流のシミュレーションによる例数設計では,
デザイン事前分布に基づき仮想的にデータを生成させる.生成されたデータに対し解析事前分布を用いてベ
イズ流に解析し,モデ、ル性能基準と照らし合わせる.この過程をシミュレーション回数 N叩繰り返し,検出
n
d
i
f
f
e
r
e
n
c
ezone を用いたベイズ流例数設計では,"モデル性能基準と照らし合わせる"とこ
力を推定する .i
ろが, 1
1と i
n
d
i能 r
e
n
c
ez
o
n
eとの位置関係から 6つの判定基準のいずれに該当するかを判定するステップに該
当する.
3
. 生存時間解析における適用例の紹介
3
.1.試験デザインと解析方法
適用例として,生存時間解析における例数設計を紹介する (
B
e
r
r
ye
ta
l,
2
01
1
).対照群の 5年生存率が 0
.
6
5,
試験群の 5年生存率が 0
.
8
0,対照群の例数:試験群の例数=1
:
1の条件の下で,例数設計を行う場合を考え
る.生存時間分布に形状パラメータ y,尺度ノ fラメータ qのワイブル分布
f(
市
J
L 叫│ー│よ II
(t>0のとき;それ以外は全て 0
)
tYI
η l¥
.
η
)}
(
3
.
1
)
を仮定する.ここで
λ=‑y!ogη
Iとなる.
とおくとき,生存関数 S
(
の及びハザード関数 h
(
のは λを用いて S
(
t
)=e
x
p
(
‑
e
x
p
(
λ)
t
Y
)
, h
(
t
)=y
e
x
p
(
λ)
tr
‑
ここで治療群を表す共変量を X (x=Oのとき対照群 ,x=1のとき試験群)として,共変量をモデルに組み込
。
むために λ=ー(
β +βIX) とおくと,対照群に対する試験群のハザード比は
I
HR一
=y
e
x
p
(
一
β一
。一
β
1)
tr
‑
I
r
y
e
x
p
(
‑
s
o
)
t‑
(
3
.
2
)
となり , s
I >0のとき HRく lとなり試験群のほうが対照群よりも死亡のリスクが低いことを表す.共変量
。
。
!の値が大きいほ
をモデ、ルに組み込む際, λ=β +βIX とせず λ=一(
β +βIX) とおいたのは,そうすることで β
ど試験群のほうが対照群よりも死亡のリスクが低い,つまり試験群のほうが対照群に比べて臨床的に望まし
い状態であることを表すため, 2群の効果の差を表す指標として β
1をとれば, β
1の 95%
信用区間と 6つの判
定基準との関係に図 2
.
1がそのまま適用できるためである (
λ =so+sIX とおくと, β
1が大きいほど試験群の
ほうが対照群に比べて劣る状態を表すため,図 2
.
1において同a
t
m
e
n
tとc
o
n
t
r
o
lを反転させねばならなくなる).
t
),試験群における時点 tでの生存率をお(
t
)と表すと,上記号デ、ルのも
対照群における時点 tでの生存率をふ (
271
とでは
。
)
S
I(
t
)=e
x
p
(
‑
e
x
p
(
一β )
tr
。
‑
s
I
)
tr)
S
2
(
t
)=e
x
p
(
‑
e
x
p
(
ーβ
により
→〈呼笠)
呼必)‑司呼必)
A
(
3
.
3
)
sI=IO{
(
3刈
である.
;
J 群を表す変数を XI
i (対照群
いま, i番目の被験者における,イベント発現時間あるいは打ち切り時間を I
i=O
,試験群であれば XIi=1
),打ち切りを表す変数を V; (イベント発現のとき V;=1
,打ち切りの
であれば XI
とき刊 =0) と表すとき (i=1
,
2,
…,
n
),被験者の生存時聞が互いに独立であるとして ,n人分のデータ D が
β,
。β
'
I
f,x1=(
I,
x
l
i
fとして
与えられたもとでの尤度は, f
J=(
が fJ)刊日
p[
L
(
,
J
fyI
D)=yde
x
(
x
T
(
3
.
5
)
F﹂
v﹂
nヤム同
こ叫.
タ﹃U =
なd
﹂
ル
とおいた.モデルパラメータ F
の事前分布として平均ベクトル1'0'分散共分散行列1:0の 2変量正規分布を,
ワイプル分布の形状パラメータ yの事前分布として平均 α。l
1
C
o,分散 α。/1C~ のガンマ分布をそれぞれとりあ
げると, f
J
と yの同時事後分布は
紗
刈 ylD)ぽ y
a
.
+
d
‑
Ie
x
刈
Y‑(
(
x
TJ
f)+v
o
g
t
;イ 銘 岬)
}
‑
1
C
f
J‑1
'0
)T1
:;
1(
f
J‑1
'0
, 日l
o
で与えられる(I
b
r
a
h
i
me
ta
,
.
l2
0
0
1
)
. fJの事後分布は閉じた形式をもたず解析的に求められないため, MCMC
法 (MarkovC
h
a
i
nMonteC
a
r
l
om
e
t
h
o
d
) を用いて事後分布を導出する.
以降では簡単のため,ワイブル分布 (
3
.
1
)の形状パラメータが固定値 γ=2をとる,即ち生存時間分布がレイ
L
e
e
m
i
sa
n
dMcQueston
,
2
0
0
8
).あてはめるモデルを決めたら,そのモデルに基づ
リ一分布に従うものとする (
いて,対照群と試験群の効果の差を表すパラメータと,対応する i
n
d
i
f
f
e
r
e
n
c
ez
o
n
e[
0
L'O
U]を設定することに
1をとりあげると, sI<Oのとき HR>I となり試
なる.対照群と試験群の効果の差を表すパラメータとして β
験群のほうが対照群よりも死亡のリスクが高くなることから, i
n
d
i
能r
e
n
c
ez
o
n
eの下限値 O
Lを 0とおく.対照
.
6
5,試験群の 5年生存率が 0
.
8
0のとき, (
3.
4
)
よ
り
群の 5年生存率が 0
s
I=
I
o
g
(
ーl
o
g
S
I
(
5
)
/
5r
)
ー l
o
g
(
ーl
o
g
S
2
(
5
)
/ダ)=l
o
g
(
ーl
o
g
(
0
.
6
5
)
/
52
)
一l
o
g
(
一l
o
g
(
0
.
8
0
)
/
52)=0
.
6
5
8
であることから, i
n
d
i
f
f
e
r
e
n
c
ez
o
n
eの上限値札を 0
.
6
5
8とおく.
ベイズ流アプローチによる例数設計では,前述のとおり,モデルパラメータの事前分布を設定しなければな
p
e
i
g
e
l
h
a
l
t
e
re
ta
.
l(
1
9
9
4
) は,事前分布の設定に関して, "
r
e
f
e
r
e
n
c
ep
r
i
o
r
'
ぺ "clinicalprior" (臨床的事
らない. S
前分布), "
s
k
e
p
t
i
c
a
lp
r
i
o
r
" (懐疑的事前分布), "
e
n
t
h
u
s
i
a
s
t
i
cp
r
i
o
r
" (楽観的事前分布)の 4種類から構成され
る"communityofp
r
i
o
r
s
"の利用を推奨している. r
e
f
e
r
e
n
c
ep
r
i
o
rは「無情報」を客観的に表現した事前分布であ
り,いわゆる無情報事前分布 (
n
o
n
・
i
n
f
o
r
m
a
t
i
v
ep
r
i
o
r
) である. s
k
e
p
t
i
c
a
lp
r
i
o
rは試験薬に対して懐疑的な見解な
立場での事前分布であり,より保守的な事前分布といえる.これに対して, e
n
t
h
u
s
i
a
s
t
i
cp
r
i
o
rは試験薬が対照
272
薬に比べて優れているとの信念に基づいた事前分布であり,臨床試験担当者にとって楽観的な事前分布とい
える.本稿では,モデ、ルパラメータ β
Iの懐疑的事前分布として平均 Oの正規分布を用いる.事前分布として
sl
>
δu
)=
0
.
0
5となるよう 0.
402と設定する.楽観的事前分布として平均 0
.
6
5
8,分
用いる正規分布の分散は, P(
4の正規分布をそれぞれ用いる.モデルパラメ
散 0.
4
02の正規分布を,無情報事前分布として平均 0 分散 1
0
ータんは対照群の治療効果を規定する局外パラメータである.そこで,s
lが 3つの事前分布いずれの場合に
おいても平均 ‑
I
o
g
(・I
Og
Sl
(
5
)
/
デ)= 4
.
0
6
1,分散 0
.
2
02の正規分布を用いる.以上の設定のもとで,3
.
2
.の手順 2か
ら手順 5を実行することで, Type1エラー,検出力に対する "Bayesiana
n
a
l
o
g
s
"を求めることも可能となる. s
l
2
)を用いたとき,対照群を却下する経験的確率がベイズ流
のデザイン事前分布として懐疑的事前分布 N(O,
0.
40
TypeIエラー (
B
a
y
e
s
i
a
nType1e
π
o
r
) の推定値となる.また, β
lのデザイン事前分布として楽観的事前分布
2
)を用いたとき,対照群を却下する経験的確率がベイズ流 T
N
(
0
.
6
5
8,
0
.
4
0
ypeI
Iエラー (
B
a
y
e
s
i
a
nTypeI
Ie
r
r
o
r
)
の推定値であり,試験群を却下する経験的確率がベイズ流検出力 (Bayesianpower) の推定値となる.
3.
2
. SASプログラムコード
プログラム 3
.
1は,上記事前分布に基づき l群あたり 1
4
0人の被験者の仮想的な観測値を生成させるため
の SASプログラムの一例である.なお,プログラムの作成にあたっては, Minnesota大学公衆衛生大学院の
webサイト (
h
t
t
p
:
/
/
w
w
w
.
b
i
o
s
t
a
t
.u
r
n
n
.
e
d
u
l
‑
b
r
a
d
/
s
o
f
t
w
a
r
e
/
B
R
u
g
s
/
) にて公開されている BUGSコードを参考にし
lに対してはデザイン事前分布として懐疑的事前分布,楽観的事前分布を記載し,楽
た.少し補足すると, s
観的事前分布が採用されるよう,懐疑的事前分布の設定に関するコードをコメントアウトしている.プログ
ラム 3
.
1を実行することにより生成されるデータセット S臥4では,イベント発現または打ち切りの時間(年)
),打ち切りを表す変数が
を表す変数が TIME,群を表す変数が x(対照群であれば 0,試験群であれば 1
CENSOR (打ち切りであれば 0,イベント発現であれば 1
)である.レイリ一分布に従う乱数 T を生成させ,
T>5であれば打ち切り例とみなして CENSORに 0を代入し, TIMEに 5と代入する.逆に T<=5であれば
イベント発現例とみなして CENSORに lを代入し, TIMEに T を代入している.
プログラム 3
.
1 :擬似乱数による生存時間データの生成
dataSIM;
=
0.65;EST2=
0.80;
EST1=
gamma 2;
c
a
l
ls
t
r
e
a
m
i
n
i
t
(
1
2
3
4
);
doi=1t
o140;
o2;
dotreatment=1t
x=treatment‑1;
=log(‑log(EST1)/(5**gamma));
betaO̲mean司
betaO=
RAND('NORMAL',
betaO̲mean,
O
.
2
0
);
I
*
o
p
t
i
m
i
s
t
i
cdesignp
r
i
o
r
*
1
=
beta1̲mean l
o
g
(
・l
og(EST
1)
/
(
5
帥 g
amma))
・l
o
g
(
・l
og(EST2)/(5**gamma));
=
beta1 RAND('NORMAL',
beta1̲mean,
0.
40
);
I
*skepticaldesignp
r
i
o
r
*
1
273
1
*beta1=RAND('NORMAL',
0,
0.
40
);
*
1
lambda=‑
(
b
e
t
a
O
+
b
e
t
a
1
*
x
);
・
t=RAND(WEIBULL,gamma,
(
1
/
e
x
p
(
l
a
m
b
d
a
)
)
*
*
(
1
/
g
a
m
m
a
)
);
o
u
t
p
u
t
;
end;
end;
r
u
n
;
d
a
t
aSIM;
s
e
tSIM;
keepi
xt
i
m
ecensor;
i
fr
o
u
n
d
(
t,
1
e・8)>5t
h
e
ndo;censor=0
;t
i
m
e=5;end;
1
e・8)<=5t
h
e
ndo;censor=1;
t
i
m
e=t;end;
e
l
s
ei
fr
o
u
n
d
(
t,
r
u
n
;
デザイン事前分布に基づき N人分の仮想的な観測値が生成できれば,それらを用いてベイズ流に解析し, 2
群の効果の差!l (今回は s
lが該当する)の 95%信用区間を推定する.プログラム 3.2は,プログラム 3
.
1で
lの 95%信用区聞を推定するための SASプログラムの一例である.
生成された l組の仮想的な観測値を用いて s
Aに対する事前分布として,無情報事前分布,懐疑的事前分布,楽観的事前分布を記載し,無情報事前分布
が解析事前分布として採用されるよう,他の 2つの事前分布の設定に関するコードをコメントアウトした.
(
3
.
5
)より対数尤度関数が
が
logL=
logy‑(
んリ凡)
V
円(
y一 胸
i+
で表されることを用い, MCMCプロシジャにて対数尤度関数を直接記述している.得られた 10000組のモン
lの 95%
信用区間を推定した.今回のように,生存時間分布に標準的な分布をあては
テカルロ標本を用いて β
めるのであれば,対数尤度関数を直接記述する以外に, SAS関数 LOGPDF及 び LOGSDFを用いて対数尤度
n
s
t
i
t
u
t
eI
n
c
.(
2
0
1
5
) を参照
を記述することも可能である.その他 MCMCプロシジャの詳細については, SASI
されたい.
プログラム 3
.
2
:MCMCプロシジャによる生存時間データの解析
procmcmcd
a
t
a=SIMo
u
t
p
o
s
t=OUTn
b
i=1000nmc=10000seed=1234;
gamma=2;EST1=0
.
6
5;EST2=0
.
8
0;
betaO̲mean・
=log(‑log(EST1)/(5**gamma));
parmsb
e
t
ョo
b
e
t
a
10;
p
r
i
o
rbetaO‑normal(betaO̲mean,
sd=0
.
2
);
I
*
o
p
t
i
m
i
s
t
i
cf
i制ngp
r
i
o
r
*
1
1
*beta1̲mean=log(‑log(EST1)
/
(
5
*
*
g
a
m
m
a
)
)
‑
l
o
g
(
‑
l
o
g
(
E
S
T
2
)
/
(
5
*
*
g
a
m
m
a
)
);
*
1
I
*p吋o
rbeta1‑normal(beta1̲mean,
sd=0.
40
);*
1
I
*
s
k
e
p
t
i
c
a
lf
i
抗i
n
gp
r
i
o
r
*
1
1
*p
r
i
o
rbeta1‑normal(0,
sd=0.
40
);*
1
274
I * r e f e r e n c e自 社i n gp r i o r * 1 sd=1e+2); p r i o rbeta1‑normal(O, lambda・ =(betaO+beta1、); I ike=censor*(log(gamma)+(gamma‑1)*log(time)+lambda) ‑exp(lambda)*(time 帥 g amma); I l i k e ); modelg e n e r a l ( run; procu n i v a r i a t edata=OUTn o p r i n t; v a rb e t a 1;o u t p u to u t=OUTp c t l p r e=P̲p c t l p t s = 2 . 597.5; run; 2群の効果の差 s tの 95%信用区聞が推定されれば, indifferencezone[oL, Ou]との位置関係から,図 2 . 1に従 い 6つの判定基準のいずれに該当するかを判定することになる.プログラム 3.3はその一例である.変数 01, D2 , … , D6は,対照群を採択,試験群を棄却,同等,対照群を棄却,試験群を採択,判定不能に対する判定フ ラグであり 1のとき該当,それ以外全て 0をとる.以上のステップをシミュレーション回数 N岬繰り返して … , D6の平均値が,各判定基準の経験的確率となる. 得られる変数O1, D2, プログラム 3 . 3:信用区間に基づく判定基準フラグの導出 dataOUT;s e tOUT; gamma=2;EST1=0.65;EST2=0.80; d e l t a L=0 ; 匂 U=l o g ( ーl og(EST 1)/(5**gamma))ーl o g ( ・l o g ( E S T 2 ) / ( 5 gamma)); d e l 帥 a r r a ya1[ 6 ]d1・d6; doi=1to6; a 1 [ i ]=0; げP ̲97 ̲5<deltaLthena1[ 1 ]=1; 崎ei fp̲97 ̲5<deltaUandp̲97 ̲5>deltaLandp̲2̲5<deltaLthena1[ 2 ]=1; e e l s ei fP ̲2̲5> d e l t a Landp ̲97 ̲5<deltaUthena1[ 3 ]=1; e l s ei fp̲2̲5> d e l t a Landp̲2̲5<deltaUandp̲97 ̲5>deltaUthena1[ 4 ]=1; [ =1, e l s ei fp̲2̲5>deltaUthena 1司 e l s ei fp̲2̲5< d e l t a Landp̲97 ̲5>deltaUthena1[ 6 ]=1; end; run; 275
3. 3 . シミュレーション結果 表3 . 1は,デザイン事前分布に楽観的事前分布を,解析事前分布に無情報事前分布を,それぞれ用いたと きのシミュレーション結果をまとめたものである.シミュレーション回数は 1000固とした.デザイン事前分 布に楽観的事前分布を用いる,即ち,楽観的事前分布に基づいて仮想データを生成するため,対照群に対す る試験群の真のハザード比は ( 3 . 2 )より 0.518であり, i 試験群を棄却Jあるいは「対照群を採択」と判定され . 1 より, 1群あたりの例数 N=80のとき た経験的確率を合算した値がベイズ流検出力の推定値となる.表 3 には, i 試験群を棄却」と判定される割合は 0.63であり, i 試験群を棄却」よりもさらに強い「対照群を採択J 試験群を棄却」あるいは「対照、群を採択Jと判定された割合 0.63+0.01= と判定される割合も 0.01 となる. i 0 . 6 4が,このシミュレーション結果から推定されるベイズ流検出力となる.デザイン事前分布に楽観的事前 対照群を棄却Jと判定された割合 分布を設定し,対照群に比べて試験群が有効な状況であるにも関わらず, i は 0.02であり,よってベイズ流 T y p e1 1エラーは 0.02と推定される.例数の増加に伴ってベイズ流検出力も . 6 4,N=1 0 0のとき 0 .7 7 , N=1 2 0のとき 0 . 8 2,N=1 4 0のとき 0 . 8 7,N=1 6 0のとき 上がり ,N=80のとき 0 0.90となった.また ,N=80のときは「判定不能 J と判定された割合は 0.34だ、ったが,例数の増加に伴いそ の割合は減少していき ,N=1 6 0のときには 0.07であった . Nが大きくなるにつれて企の信用区間の幅が狭 くなり,その結果,判定不能以外の判定結果となる割合が高くなっている. . 1 :無情報事前分布を解析事前分布として用いたときの 6つの判定基準に対する経験的確率 表3 N 8 0 1 0 0 1 2 0 1 4 0 1 6 0 Accept c o n t r o l ∞ 。 0 . 0 0 O . O . ∞ ∞ ∞ 。 Re j e c t t r 宅a t m e n t 0 . 0 2 0 . 0 2 0 . 0 ヨ 0 . 0 3 0 . 0 3 E qu i v a l e n c e ∞ 。 O . ∞ O . ∞ O . ∞ a ∞ Re j e c t c o n t r o l 0 . 6 3 0 . 7 6 0 . 8 1 0 . 8 6 0 . 8 9 Accept 田a t n 官n t t 0 . 0 1 0 . 0 1 0 . 0 1 0 . 0 1 0 . 0 1 Nod e c i s i o n 0 . 3 4 0 . 2 2 16 0. 0. 11 0 . 0 7 表 3.2は解析事前分布に懐疑的事前分布を用いたときの,表 3 . 3は解析事前分布に楽観的事前分布を用いた ときの,シミュレーション結果の要約である.シミュレーション条件は,解析事前分布の設定以外,全て表 3 . 1のときと同じである.ベイズ流検出力は ,N=80のとき懐疑的事前分布では 0. 49,楽観的事前分布では 2 0のとき懐疑的事前分布では 0.64,楽観的事前分布では 0 . 9 5,N=1 4 0のとき懐疑的事前分布で 0 . 8 9,N=1 . 9 6,N=1 6 0のとき懐疑的事前分布では 0.86,楽観的事前分布では 0.97とな は 0.80,楽観的事前分布では 0 った .N=80,100,120,140,160いずれの場合も, 3つの事前分布の中では,楽観的事前分布を用いたときの ベイズ流検出力が高く,懐疑的事前分布を用いたときのベイズ流検出力が低かった.事前分布の設定の仕方 で必要な例数が異なることが確認できる. 表 3.2:懐疑的事前分布を解析事前分布として用いたときの 6つの判定基準に対する経験的確率 N 8 0 1 0 0 1 2 0 1 4 0 1 6 0 Accept c o n t r o l O . O . O . O . O . ∞ ∞ ∞ ∞ ∞ t R申 c t r e a t m e n t 0 . 1 1 0 . 1 2 0 . 1 1 0 . 1 0 0 . 1 0 E qu i v a l e n c e ∞ 。 O . ∞ O . ∞ O . ∞ O . ∞ 276 Re j e c t c o n t r o l 0 . 4 9 0 . 6 4 0 . 7 3 0 . 8 0 0 . 8 6 Accept t r e a t m e n t O . O . O . O . O . ∞ ∞ ∞ ∞ ∞ Nod e c i s i o n 0 . 4 0 0 . 2 5 0 . 1 7 0 . 1 0 0 . 0 4
表3 . 3:楽観的事前分布を解析事前分布として用いたときの 6つの判定基準に対する経験的確率 N 8 0 1 0 0 1 2 0 1 4 0 1 6 0 A c c e p t c o n t r o l o . o . 0 . 0 0 0 . 0 0 0 . 0 0 ∞ ∞ R e j e c t e a t m e n t 0 . 0 1 0 . 0 1 0 . 0 2 0 . 0 1 0 . 0 2 住 E qu i v a l e n c e o . o . 0 . 0 0 0 . 0 0 o . ∞ ∞ ∞ Re j e c t c o n t r o l 0 . 8 9 0 . 9 2 0 . 9 5 0 . 9 6 0 . 9 7 A c c e p t t r e a t m e n t o . o . 0 . 0 0 0 . 0 0 o . ∞ ∞ ∞ Nod e c i s i o n 0 . 1 1 0 . 0 7 0 . 0 3 0 . 0 3 0 . 0 1 4 . まとめ 本稿では,シミュレーションによるベイズ流例数設計として i n d i f f e r e n c ezoneを用いた方法についてまとめ, 生存時間解析における適用例を紹介した.適用例では,一度に全患者が登録され,登録された患者のフォロ ーアップ期間は全て等しい状況を想定している.しかし実際には,患者の登録は逐次的であり,フォローア ップ期間も全ての患者で等しいとは限らない.より現実の臨床試験で起こりうる状況に応じた例数設計が求 0 1 6 ) . められる(魚住等, 2 全ての試験に共通する困難な問題は,例数の計算に用いる効果と変動の大きさの設定であり,このための 考え方には, a ) 臨床的に意味のある最小の差を定めること, b )他の試験データによるエフェクトサイズの推 0 0 6 ) .i n d i f f e r e n c ezoneを用いた方法では,臨床的に意味のある最小の差 定,のように 2通りある(上坂, 2 n d i能 r e n c ezone の設定に対応しているといえる. b ) の考え方は,先行する試験の結果を を定めることが, i 利用することが可能な場合に有用である.その際,今回紹介した方法であれば,先行する試験のデータをベ イズ流に解析し,得られたモデルパラメータの事後分布を用いてデザイン事前分布を設定し,当該試験にお ける必要例数を検討することができる.効果と変動の大きさの設定にあたり,参考可能な試験は存在するが 試験薬に関する情報はない,文献上での情報であるため,詳細なデータは入手できず,試験の結果しかわか a r l i n( 2 0 0 8 ) は,このような場合への適用例もあわせて紹介している. らない状況もおこりうる. HobbsandC ヒストリカルデータを,そのデータがもっ情報量に応じて新規試験におけるデザインと解析内容に柔軟に組 みいれることが可能なことが,ベイズ流例数設計の大きな魅力ではないだろうか. 参考文献 [ 1 ]Beπy ,S.M.,C a r l i n, B . P ., Lee, J . J .andM u l l e r ,P .( 2 0 1 1 ) .B a y e s i a nA d a p t i v eMethodsforC l i n i c a lT r i a l s .NewY o r k : Chapman& Hall/CRC [ 2 ]B r u t t i, P ., DeS a n t i s,F .andGubbio壮i ,S .( 2 0 0 8 ) .RobustB a y e s i a ns a m p l es i z ed e t e r m i n a t i o ni nc l i n i c a lt r i a l s . S t a t i s t i c s的 M e d i c i n e . 2 7 ( 1 3 ) : 2 2 9 0 ‑ 2 3 0 6 . [ 3 ]Hobbs,B . P .andC a r l i n,B . P .( 2 0 0 8 ) .P r a c t i c a lB a y e s i a nd e s i g nanda n a l y s i sf o rd r u gandd e v i c ec l i n i c a lt r i a l s . J o u r n a lB i o p h a r m a c e u t i c a lS t a t i s t i c s .1 8 : 5 4 ‑ 8 0 . [ 4 ]I b r a h i m ,J . G ., Chen, M.H.,S i n h a, D .( 2 0 0 1 ) .B a y e s i a nS u r v i v a lA n a l y s i s .S p r i n g e r ‑V e r l a g, NewY o r k . [ 5 ]Leemis,L .M.andMcQueston,J . T .( 2 0 0 8 ) .U n i v a r i a t eD i s t r i b u t i o nR e l a t i o n s h i p s .T h eAmericanS t a t i s t i c i a n .6 2 : 4 5 ‑ 5 3 . [ 6 ]SASI n s t i t u t eI n c .( 2 0 1 5 ) .S AS/S 日T ( R )1 4 . 1U s e r ' sG u i d e .Cary , NC, USA:SASI n s t i t u t eI n c . 277
[ 7 ]S p i e g e 1 h a 1 t e r ,D .J .,Freedman,L .S ., Parmar , M.K .B .( 19 9 4 ) .B a y e s i a na p p r o a c h e st orandomized凶 a 1 s( w i t h d i s c u s s i o n ) .Joumalo f R o y a lS t a t i s t i c a lS o c i e t y :S e r i e sA .1 5 7 : 3 5 7‑ 41 6 . [ 8 ]Wang , F .andGe1fand, A .E .( 2 0 0 2 ) .AS i m u 1 a t i o n ‑ b a s e da p p r o a c ht oB a y e s i a nsamp1es i z ed e t e r m i n a t i o nf o r p e r f o r m a n c eu n d e rag i v e nmode1andf o rs e p a r a t i n gm o d e 1 s .S t a t i s t i c a lS c i e n c e .1 7 ( 2 ) :1 9 5 ‑ 2 0 8 . [ 9 ] 上坂浩之 ( 2 0 0 6 ) . 医薬品開発のための臨床試験の計画と解析.朝倉書庖. [ 1 0 ]魚住龍史・矢田真城・浜田知久馬 ( 2 0 1 6 ) .SASプロシジャを用いた生存時間データに対する例数設計の変 革 .SASユーザー総会論文集. [ 1 1 ]大橋靖雄・浜閏知久馬 ( 1 9 9 5 ) . 生存時間解析 ‑SASによる生物統計.東京大学出版会 [ 1 2 ]大橋靖雄・浜田知久馬・魚住龍史 ( 2 0 1 6 ) . 生存時間解析応用編 [ 1 3 ]中村剛 ( 2 0 0 1 ) .Cox比例ハザードモデル.朝倉書庖. 連絡先 E ‑ m a i 1 :yada‑s@a 2h e a 1 t h c a r e . c o m 278 SASによる生物統計.東京大学出版会.
SASにおける文芸的プログラミングへの試み 0吹 谷 芳 博 l e 株式会社エスアールデ、ィ) Attemptt oL i t e r a t eProgrammingUsingSAS Y o s h i h i r oF u k i y a SRDC o .,L t d . 要旨 プログラミング開発においてプログラム仕様書等の文書作成は重要とされてきている.その主な理由とし て,プログラム品質の担保や文書を作成することでプログラム開発時の相互理解を高めるなどがあげられる. しかし,その一方で文書作成はソースコードとは分けて作成するため,その分の負担をかけていることも事 実である. そこで著者はこの問題の解決方法のーっとして「文芸的プログラミング」を SASに適用させることを検討 した.本発表は R言語のパッケージである i k n i t rJを利用して,文芸的フ。ログラミングを実装した事例を紹 介する.この事例を通して実装方法や実装したことによる利点・欠点等の検討事項について報告する. n i t r,LaTeX キーワード:文芸的プログラミング, markdown,k 1.はじめに 11背景と目的 ・ 医薬品業界に限らず,プログラミング開発においてソースコードの作成・運用の効率化については議論が i t L a bを用いたパージョン管理シス なされるところである.著者はソースコードの運用を効率化するために G テムについて紹介を昨年の SASユーザー総会 2 0 1 5で報告した.しかし,前回の発表では運用周りを中心と した内容であり,プログラムの作成の部分においての効率化についてあまり焦点にしていなかった.今回の 試みとしてソースコードとその関連文書の作成の効率化にスポットを当てた内容を報告する. プログラムの作成に関してはプログラム仕様書やその他の関連文書の作成も必要となるため,具体的には プログラム仕様書などの関連文書の作成は重要とされてきている.その理由として,プログラム品質の担保 するため,プログラム開発チームソースコードの共有理解を深めることがあげられる. しかし,現場のプロ グラマーとしてはソースコードと関連文書の整合'性を保ちつつ,短期間での作成はとても負担がかかり,ま た運用面でも同様のことが言える.そこで K n u t h3) (TeXの作者)が提唱したプログラミンク、、方法論の一つで ある「文芸的プログラミング」はこれらの問題を解決する一つのアイデアである著者は考えた.この文芸的 プログラミングとはソースコードと文書を併記したメタソースを記述し,そこからソースコードと文書をそ れぞれ生成させることで,情報の一体性を高めている. 281
R 言語は文芸的プログラミングを比較的よく使われている言語のひとつである .R 言語はこれまで Sweave 6)( n i t r 2 0 1 2 )などが文芸的プログラミング を実装するパッケージが開発されてきた.現在, R 言語 5 ) ( 2 0 0 2 )や k の文芸的プログラミングといえば k n i t r と言われるほど多くの人に使用されてきている.その理由として Sweave と k n i t r の大きな違いは出力形式の豊富さ,メタソースの記載しやすさと拡張性の高さである.具体 t m l 形式や p d f 形式への出力が主な形式であるが, k n i t r は Sweave ができる出力形式に 的には Sweave は h プラスして word 形式やウェブスライド形式など多岐にわたる.また,メタソースの文書部分は Sweave が LaTeX 形式で記載するのに対して k n i t r は LaTeX 形式よりも理解しやすい markdown 形式を使って記載し n i t r は R 言語だけでなく, p y t h o nや r u b y などの言語の文芸的プログラミング ている.最後の違いとして k に も 対 応 し て お り , 注 目 も さ れ て い る . 一 方 , SAS に お け る 文 芸 的 プ ロ グ ラ ミ ン グ に つ い て は SASweave 制( 2 0 0 7 )や S t a t R 2 0 1 2 )が開発されている.しかし,主な機能として Sweave とほぼ同様な機能で eplJ( あり,また通常の業務では pdf 形式より word 形式を使用することが多いため, SAS で k n i t r のようなツー ルがないか検討を行っていた. n i t r の拡張機能で SAS の文芸的プログラミングが可能で、はないかと考え調査 これらの経緯から著者は k t m l 形式への変換を行っている事例を見つけ,これを したところ, Doug2)が Rmarkdown と SAS を用いて h word 形式で実用的なレベルまでに拡張できないか検討を行った.具体的には文章変換後に数式の表示, ストの表示及び図の表示の 3 つを評価ポイントとし リ h t m l 形式と word 形式を比較し,その結果につい て考察も行った.また,変換時にうまくいかなかった点については改善策を行い,改善後の結果についても 考察を行う. 1 ・2 用語説明 ・ ・ R:オープンソースの統計解析プログラムツール LaTeX:テキストベースの組版処理システム • R s t u d i o :Rの統合開発環境(オープンソース) • Pandoc:文書変換ツールで・ h a s k e l lというプログラムで作成されている. ・ ( R s t u d i oインストール時に p a n d o cもインストールされるため,セットアップ不要. markdown ( . m d ) :文書を記述するための軽量マークアップ言語のひとつ. • Rmarkdown (.Rmd ) :markdownを R用に拡張させたファイル. • chunk:Rmarkdownでソースコードの実行や結果の表示などを制御するために設定するもの. 2 .変換フローの概要と実行方法について 2 . 1 変換フローの概要 2 . 1 . 1変 換 フ ロ ー 説 明 k n i t r は Rmarkdown 形式を変換することで,多様な形式に出力することができる ( F i g u r e1 ) .具体的には k n i t r は chunk で指定されたソースコードを実行しつつ, Rmarkdown 形式から markdown 形式に変換し その後 pandoc による変換が行われる. R s t u d i o の GUI に k n i t r を実行するボタンが実装されているが今回 そのボタンを使用せずにコードで出力形式や指定を細かく調整できる rmarkdown パッケージを使って実行 を行った. 282
園二十 ‑‑T 一 ( ﹁ 画L ‑ 一 一 ~ *1:Rmarkdownf i l e *2:markdown自l e 巴 圃 ・ 回 一 一 一 凪 圃圃 園砂 E盟国園 田圃 園園 田圃 s F i g u r e1.文書変換フローの模式図 2 . 2 . 1Rmarkdownの構造と chunkの 指 定 に つ い て (Rと SASの違し、) ‑ 9 ‑ Rmarkdownの構造は以下の大きく 3つに分かれる ( F i g u r e2 ). 1 ) 文書プロパティや出力形式の調節を記載するメタ情報 ( y a m l形式) 2 ) 文書部分 (markdown 形式) 3 ) ソースコードを記載する部分 この構造は SAS を用いた時も大きく変わらず,変更する部分は c o d eb 1 0 c k に SAS コードを記載すること と,このあとに説明する chunk 内にあるオプションの設定である. F i g u r e2 .Rmarkdown構成の模式図 283
~ chunkの指定 chunk の部分にプログラム実行の有無や結果表示の制御するパラメータがあり,必要に応じて調整する ( F i g u r e3 ) .何も変更がないときはすべてデフォルトで動作するため,注意が必要である. SAS の場合は . e x e ) 先とコマンドプロンプトなどで実行する際の l o g 出力及び 1 s t 出力先の設定も必要で 実行ファイル ( あるため, F i g u r e3 .で記載した設定が必要である. " op t s ̲ c h u n k $ s e t "変数を事前に設定すれば, c o d eb l o c kご との p a t h を設定しなくても動作するようになる. F i g u r e3 .chunkの使い方の模式図 2 . 2 実行方法 2 . 2 . 1実行環境の整備 実行環境については以下のソフトとパッケージが必要となる. 1 . R 2 . R s t u d i o 3 . L i b r a r y( k n i t r, rmarkdown) この順番にインストールを行えば,実行環境の設定は完了する. パッケージのインストールの場合は"並蜘1 1 伊 c k a g e s (m 紅 kdown')"と示すことで取り込みができる. 284
2 . 2 . 2 文書変換の評価 Dougが公開している "SASu s i n gRMarkdown"を基に以下の 3つについて word形式で出力できるように実 装し,評価を行った.比較対象として Dougが行っている h t m 1形式への出力も行った.出力内容については 「実用 SAS生物統計ノ、ンドブック J8 )の生存時間解析のページを参考にした.また, w ord形式で出力した場 合にうまく行かなかった部分については原因も探り,改善策の検討も行った. 1 ) 数式 (TeX記法) 2 ) リストの表示 3 ) 図の表示 3 .評価(結果) 3.1文書変換の評価 実装結果については T a b 1 e1.に示した. T a b 1 e1.従来の方法で word形式に出力結果 h t m 1形式 数式 (Tex記法) リストの表示 図の表示 。 。 。 word形式 0・ l ム × * 1:0節目のパージョンにより文字化けが発生 ( o f f i c e2 0 0 7 ). 今回の結果では Dougが示した方法で word形式の出力に適応させると数式以外はそのままでの方法 では適応が難しいということが示された.個別に結果を見るとリストの表示についてはリストのみの tは読み込まれて codeb 1 0 c k内で表示されるが,図も出力する設定 表示をする設定にすれば問題なくIis の場合は設定の仕方によってはうまく取り込まれなかったため表示がされなかった.また,図につい ても同様で自動的に取り込まれなかった. 3 . 2 問題点と改善策 Dougが示した方法は全体の出力結果を h t m 1形式として出力し,文書部分の html形式に出力結果の h t m l形式を取り込むことで表示をしていたこと原因であった. word形式では htm1形式を取り込んで表 示できないため,以下の方法で対応を行った. リストの表示の改善方法 1 . chunk内のリスト出力先の設定をフォルダではなく,特定のファイル名にする. 2 . 表示したい部分に新たに chunkを記載し,リストを取り込む設定を行う. 例)… { reva1=FALSE, code=read L in e s ( " C : /…/rmdpu t .1 s t " )} … 285
図の表示の改善方法 1 . 図の出力を直下のフォノレダではなく,特定のフォルダ先を指定するようにする. 2 . 図を表示させたい部分に markdown形式の記載で画像を読み込む設定を行う. ( C : /・ … . l K a p l a n ‑ M e i e r . p n g"KaplanM e i e r " ) 例) ![結果] 以上の方法を行うことにより html形式で表示した内容とほとんど変わらない形で表示することができ た.詳細の結果については画像で APPENDEXに表示する. 4 .結論と考察 4 .1.文書変換の評価についての考察 k n i 住を用いた文芸プログラミングを SASでも可能であることを示し,出力形式についても h t m lだけでな く実用性のある wordへの変換も可能であると示した. word形式への変換が実用的に使えるとなれば SAS macroの仕様書等を効率よく作成できるのではないかと考えている. 今回は PCSASで行っているため, UNIXSASでの検証は行っていない.しかし, UNIX環境に同様の環 境を作ることで実行は可能だと思われる.今後は word形式以外にもウェプスライド形式や pdf形式への変 換等も行い検証していきたい. 4 . 2今後の検討課題 今回の試みは今後の SASにおける文芸的プログラミングの発展やこの手法を応用した R e p r o d u c i b l e 7 l への貢献にもつながったのではないかと考える.今後の文芸的プログラミングが広まるためには R e s e a r c h SASu n i v e r s i t ye d i t i o nでも実装可能であることが望まれるが,今回のパッチを使う方法は SASu n i v e r s i t y e d i t i o nはパッチ実行できないため適用できない. SASu n i v e r s i t ye d i t i o nでも今回のような文書変換フローが 実装できればと考えている.また, SASにおいて pandocを使用した文書変換だと s y n 飽 xh i g h l i g h t i n gが対応 していないため,対応できるようにしたいと考えている. 2 8 6
5 .参考文献 1 )Amold, TandK u h f e l d, WF( 2 0 1 2 ) UsingSASandLaText oC r e a t eDocumentsw i t hR e p r o d u c i b l e . " 2 )Doug , H( 2 0日 ) SASu s i n gRmarkdown" J ‑hemkenlSASworkshops/SASWindows/MarkdownlSASmarkdown.html U R L : h t t p : / / w w w . s s c . w i s c . e du 3 )Kn u t h, DonaldE( 1 9 8 4 )L i t e r a t ep r o g r a m m i n g . "TheComputerJoumal( 1 9 8 4 )27( 2 ) :97 ・1 11 . H四j s g a a r dS( 2 0 0 7 ) SASweave:L it e r a t eProgrammingUsingSAS."Joumalo f S t a t i s t i c a lSo 食w are, 1 9 ( 8 ) . 4 )L e n t hRV, 1 5Page1 6 . 5 )L e i s c h ,F(2002) Sweave:DynamicGenerationofS t a t i s t i c a lR e p o r t sUsingL it e r a t eDataA n a l y s i s . "Compstatpp 575‑580 6 )Xie , Y( 2 0 1 2 ) AnI n t r o d u c t i o nt ok n i t r . " Y( 2 0 1 4 )k n i t r :ac o m p r e h e n s i v et o o lf o rr e p r o d u c i b l er e s e a r c hi nR . "ImplementReprodR e s . 7 )Xie, 8 )浜 田 知 久 馬 ( 2 0 0 5 ) 実用 SAS生物統計ハンドブック"サイエンス社, pl72 ・1 7 7 287
6.APPENDIX
Figure4
.Run.R (rrnarkdownによる文書変換プログラム)
1 library(
旬
、i
t
r
)
2 library(rmar
凶倒的
3 r
e
n
d
e
r
(
"
r
r
n
d
加 r
d
.R
m
d
'
"
, "
w
o
吐.d
oc
卿 院 " ) #M
SWor
dレポート
l
Figure5
.rrnd2word.Rrnd (
1
/
2
)
1・・・・
2 t
i
t
l
e
: 生 存 時 間 解 析 (SAS)
3 a
u
t
h
o
r
:"
@
l
Y
o
s
h
i
h
i
r
oF
u
k
i
y
a
"
4ωtput:
5
咽 F
ιdocument:
6
f
i
g
.
.
w
idth: Z
7
干i
g
̲
he
i
g
h
t
:1
.S
8
f
ig
̲
c
a
p
t
i
o
n
: true
9
p
a
n
d
o
c
̲
a
r
g
s
:[
・
・
・s
"
."
‑
‑
r
n
a
t
h
m
l
・・
3
I
統計手法 1
・ 栴 榊 陶p
l
a
n
‑
陶 i
e
r法
6
7 $
$Vhat{S}(t)=(l
・ιlI
r
しり百t
i
間 s
(
l
・d
̲ll
n̲Z)nimesVcωts=Vprω̲{t̲i<t}
^
{
}
(
l
‑
d
̲
t
/
n
̲
i
)$
$
8
i
.
$:イベント{死亡)が起こった時点.
• $t̲
i
.
$:時点 $
t
̲
i
$での死亡数.
・ $n̲i
$:f
埼点$t̲iS直前のリスク集合の大きさ.
・
$
d
̲
:
2
'縛翻晴生存関数の槙単鼠差はG
r
e
割 問 。d
の公式により計算される
$
$SE
汎e
千t
(
(
納 a
t
{
S
}
(
t
)
V
r
i
g
h
t
)
V
a
p
p
r
o
xVhat{S}(t)VcωtVsqrt{Y
s
um̲{
t
̲
i<tド{
}
V
f
r
a
c
{
d
̲
i
}
{
n
̲
i
V
c
d
a
t(
n
̲
i
‑
d
̲
i
)
}
}$
$
:
6
:
7・縛前蝉時点ごとのそれぞれの推定値$Vl咽t
{
S
}
(
t
)
$に対する E規近似した $
l
‑
V
a
l
p
h
a12$信頼区間.
8
:
9 $$信頭上限:U
C
L
=
'
百h
a
t
{
S
}
(
t
)
+
z‑{V
a
l
p
h
a
l
Z
}
^
{
}耳c
d
o
tS
E
V
l
e
f
t
((Vha
t
{
S
}
(
t
)
V
r
i
g
h
t
)
$
$
晒 $$信額下原:L
C
L
=
百h
a
t
{
S
}
(
t
)・z̲{
百a
lph
alZ}^{}冨c
d
o
tS
E
Vle
ft((
¥h
a
t
{
S
}
(
t
)
V
r
i
g
h
t
)
$
$
1
1
i
Z
.#
#
t
f
. I
デ‑';セットの綿造 1
3 ・デーヲセット名:剛
・ 群 分 付 変 敏 :TRT
‑対照祭群 (0)
・ 治 療 繋 群 (1)
・時間変数 :
TIME
・ 打 切 り 変 数 :C
ENSO
時
‑打切り〈め
・イベント (1)
288
F
i
g
u
r
e6nnd2word.Rmd (
2
/
2
)
4
1
4z・糊唖
l
S
A
Sプログラム 1
4
3・ {
r,
鵬S鎚 伊 恒F札 SE,echcoFALSE}
4
4 舗 朝 比h<・旬以拘唱gr回 Fi1es/S~νSASFI側n伽tionl9.Zlsas.exe o
4
S 縄問pts ← O_no叩11ash ・1咽・ C: lUsersly-fuki~克服鴎ntsJII句rkdownlnnd1og.1咽・ -prînt
'
C
:
I
U
鶴 r
s/y
‑
f
u
k
i
y
a
l
D
o
c
u
m
e
n
t
s
l
陶r
k
d
酬 n
l
r
m
d
p
u
t
.
1
s
t・
‑
l
s7
S
46 句 由̲ch山 崎s
e
t
(
e
噌t
n
e
c
O
s
a
s
"
.e
r
自
司i
n
e
.
p
a
t
h
o
o
s
a
s
阿凶, e
n
g
i
n
e
.句捻S S箇 句t
s
.C
O
I
I
I
J
I
I
四 t , 同 副1
t
s
.
o
"
h
i
d
e
つ
47・
4
8
49.ぃ {r伽 旬l
}
健
回
回M
調・‑一一働力歳定Z
5
1 句t
i
o
n
s1i隅s
i
z
e
‑
o
epagesizM 6nodate;
S
2
S
3 ‑一一・フォーマヲト作成 E
;
54 P門 限 向 阿 国t
咽 1
蝿 τ
官T
F
55
・
.
eα測TROL・
1
9
'
N
聞DRUG2';
v
a
1
臨 む 副S
O
R
Fe
.
.
'CENSORED'
1
.
.
・
E
V
E
N
T
'
;
58
国
r
u
n
;
謁
57
68
6
1
5
2 ‑一一・サシプルデータ作成 2
日
伽旬蹴;
制
箇
箇
6
7
dol
夜
官.
.
.
.
1
;
自 i
.
1t
o1
6
;
i
n
p
u
t1
四 E医 闘 鈎R回 ;
o
u
t
凹t
;
e
n
d
;
e
n
d
;
向円n
a
tT肺 TRTF.C聞 釦RCENSORF.;
釦劇場 T
RTTD
伍 C
E
N
S
O
R
;
個
・
個
7
71
n
c
a
r
d
s
;
41 Sl 71 71121140171201
・
73 221311338341431460掬 1毘 1
7
4 911211482012 1251261310
7s 340411440481551倒 1618770
76
u
n
;
7
7 r
7
8
o
.
.
剛
;
r
o
cp
r
i
n
td
a
t
79 p
8
0 r
u
n
.
8
1
8
2 ‑一一・出力磁定 2
抱
"
,O
Ko
p
1
a
n・地i
e
r
" im
m
a
g
e
n
a
n
回 叫 sg
r
a
p
h
i
c
sI r
e
s
e
t
.
.
in
d
e
xi
略It!伽b司
p
n
g;
畑 1c
1
o
s
e
;
84 odsh
d
s1
.
i
s
t
i
n
gg
p
o
t
h
.
.
"
C:/Us
e
r
s
/y・向臥y
a/Do
c
回 e
n
t
s
l
陶 r
k
d
o
w
n勺
8s o
踊
d
ss
e
1
e
c
ts
u
r
v
i
v
a
1
p
1
o
t
;
87 o
也s
td
枇a..tCM p
1
ots.叫
8
8 P何回cHfe
関
t
i
m
eTD
僅句聞鈎R(
0
)
;
崎
s
t
r
a
t
aTRT;
9
1 r
u
n
;
9
2
9
3 o
d
sl
i
s
t
i
n
gc1o
s
e
.
94 odsg
r
a
p
h
i
c
s I reseb
咽1
1
1
;
9
5 o
d
sU
s
t
i
n
g
;
9
6
9
7
蝿・
{
rev四1
9
F
,
札S
E
.c
o
保 司 回d
L
i
隅 s
(
n
C
:
/
U
s
e
r
s
l
y
‑向 k
i
y
a/験制E
組 隠n
tsA幅r
k
d
o
w
n
l
l
可n
d
p
t
比.
1
s
t
"
)
}
9
9・
A
lO8
p
r
o
c1
if
e
t
e
s
tの結果J
(
!
:
:削 s
e
r
s
V
v
・ 印 刷v
a
V
Do
c
u
m
e
批 s
l
O
o
佃r
k
d
a
w
n
日
'
K
aD
l
a
n
‑Mei
e
r
.
D
n
a"陶 p
1
a
nMei
e
r
"
)
1
0
1 I[
289
F i g u r e7 .r m d 2 w o r d . d o c x( 1 1 4 ) 生存時閥解析 ( S A S ) C I I I Y , 田h ihiroF 曲勿a 【銃計手法】 Ka p l a n ‑Me ぬ,建 t . ( t )= (1‑d1/n . 似 = 日(1ー 仇 ) ( 1‑d z / n z )x. . 匂<r ‑ 匂:イベント{死亡)が起こった時点. • d, :時点匂での死亡数. 町:時点t直前のリスク集合の大きさ. ・ , 生存田敏の認寧鼠霊法 G問 問W 耐の公式により計算される. ・t 、s , , ー ‑ : B { σω)吋{の・ l d 町・ ( 7 1 di) 時点ごとのそれぞれの縫定郵めに対する正規選鉱した1‑a/' 1 .信組区罷 信額土緩:首位=量的 + z . / 2.S B{( t . ( t ) } 信額下線 :LCL= . t ( t : ト z . / 2. SB{( 声納 【データセットの構造】 ・データセット名:闘 . 君事分け密教 :T 町 ー 対照藁君事【0 ) ‑ 治療業務【1) . 時間変数:官ME 打切り変数:C聞 SOR ー 打切り【句 ー イベント【Z】 ・ 290
F
i
g
u
r
e8
.rmd2word.docx (
2
/
4
)
【
S
A
Sプログラム1
・一一‑出力綾定s
optlo
悶
lineslz
e:唱opagesb
嘗>66n
叫 a
t
e
;
‑一一ーフォーマット作成z
proc 子
。
円
n
a
t
:
;
O=・∞NTROL・
valueTRTF
1='
NEWDK
出 2・
z
valueCE
陪O
RFO
=
・C
ENSOR
回・
1='四 ENT・
2
r
u
n
;
‑一一・サンプルデータ作成s
dataK
M
;
doT
RT
=8.
1
;
do1=1to16;
おt
伊比 T
IMECENSOR僧 ;
o
u
t
p
u
t
;
四1
1
1
;四 d
;
子
。
円
n
a
t
:T府 TRT
下
, C
ENSORCENSORF,;
keepTRTTIMECEN
田町
cards;
・・
4151717112114 1
712 2
815
21
2
213
113
3o34143146o5
91121148281却 12
512
613
18
516O16187
78
34o4114484815
,
r
u
n
;
pr
由cp
rintdat
a
=
1
C
J
I
匂
r
u
n
;
‑一一‑出力.定』
1
J
l
l
l
!
'
=
・
K
a
plan‑
Me
ier‑ imagefmt,弔ng;
1 rese"t=lndex imageni
c
l
o
s
e
;
;
叫 sl
isting即 at
h=a
C:/Use
円 I
y
‑
向 k
i
y
富JI)ocume
nts/
l
包r
kd
O
l
i
O
la
叫 sgr
叩 h
ics
叫 sht
叫
ods selectsurvlv
富l
plot;
proc li
干 武 田tdat
a=剛 p
lots=s;
ti
鵬
TIME*CEN
蜘 (
8
)
;
strataTRτs
r
u
n
;
。
dslistlngclose;
291
F i g u r e9 .rmd2word.docx ( 3 / 4 ) 叫 sgr 叩' h i c s I reset=all; 剖 5l i s 1 : i n g ; 国S TRT αlNT即L 田 町ROL αJNTROL α別TROL α測 τROL α測すROL α別 TROL α測 TROL α測 TROL αJI¥ITROl. αJNTROL C側 肩 脱 創EWDRl縄2 則自由RUG2 剥 日O J J U 厄2 剥EWDRUG2 NEWD R t 錨2 制EWDRUG2 制EWDRUG2 則自由阻路2 N目 。R田 2 則自iIDRI路2 闘E WDR UG2 刷E WD R t 脂2 NB 田RUG2 NEWD R t 応2 闘EWDRl陥2 闘日由日Rt鹿沼 292 4 5 7 7 U M U 却担割品 BHR岨 輔 羽 目 9 2 M 却 却 EManMHHH岨 嶋 田 回 日 刀 1 2 3 4 5 6 7 8 9泊 u u日 目 白 M U 盟 問 調 n n B M E泊 u n n 珂 狙 認 C聞 Y 聞 L 田 町T ROL αlN1I切L C O N T R O l . n旺 CENSOR E明到す EV 聞T EV 町τ EV 町I R征NT C自 国R田 町 田I 回 目T EV 闘す 町田 CE 脂製剤R 田 町 田T τ EV 町r C自由OR 回 目 副T 問 問T EV 町T 問 問T CENSOR 回 目 聞T EV 町τ EV 町τ EV 聞T C自由OR 回 a凶 四 回 EV 町T CENSOR 回 EV 聞 T EV 聞T EV 聞T C自 国R回 CEN50 R回
F i g u r e1 0 .rmd2word.docx (4/4) p,凶 u 叶‑Limit生苔盤定 1 . 0 1 +t r 1 5 t l J . J1 ‑寸 l →一一 l 0. 8 L一→ー→一一一 0 . 6 傍 祉 l ー←「 制 OA L← ーー帯ーー ーーーーー+ 0 . 2 。。 。 却 40 伺 η I I I E │TRT 一一‑ 0 側 TROL 一 一 ‑ NEWDRU 鍵 l procl i f e i 回の結果 293 ω
医療・健診データに対する S A SV i s u a lA n a l y t i c s / V i s u a lS t a t i s t i c sの適用可能性の検討 0大 津 洋1、 大 橋 靖 雄2 e 国立国際医療研究センター臨床研究センターデータサイエンス部、 中央大学理工学部人間総合理工学科) 2 医療ピックデータの時代となり、疾患予防や健康指導・疾患と治療の予後調査などの場にデータを 強力に活用していこうという動きが強まってきている。 医療データの臨床研究活用においては、使うデータを予め決めることで、その集団における基礎統 計量を用いることで、推定することが主で、あった。しかしながら、長寿高齢化が最も進むわが国に おいて、ひとつの疾患で死に至るということではなく、多くのエピソードによって構成されること が増え、そのことが、 r C a r d i o ‑ o n c o l o g y J や「糖尿病とうつ病 Jといった新たな研究領域を生む ことになっている。また、医療情報を提供することになる個人においても、集団の評価も重要であ るが、 「自分の場合ではどうなのか ?J とし、う似た個人での情報をフィードパックし、最適化され たサービス・特徴づけを期待する傾向にある。 このように、我々はできるだけ多くのデータを取り扱いながら、集団と個人にバランスよく結果を フィードパックさせて、迅速な意思決定に活かせることが必要になる。特に、自治体による健康指 導というのは、基礎自治体という単位で、長期にデータを活用することで、より適切な指導に活か せる可能性が高い分野だと考える。 Iツールにおいては、上記のことが柔軟に対応できることを明記しているものが多いが、提 近年の B 供側の情報量が多く、実際に行っている側のニーズに対応できるものであるのか?ということにつ いて、十分な情報量がないことから、その適用可能性を試行することとした。 実際に自治体などで利用する可能性がある人達にニーズ調査を行った結果を、 S A SV i s u a l A SV A / V S )にどこまで反映できるかを検討し、必要な情報に S t a t i s t i c s / V i s u a lA n a l y s i s (以下、 S 到達できるかということで、活用可能性を評価することとした。 現状 ニーズ調査を反映したシステムが S A SV A / V Sにどこまで対応できたかは、現在進行中のため、当日 のプレゼンテーションにて発表する。 2 9 4
SASに よ る 生 存 時 間 分 布 の 予 測 I D e a t hNoteの統計学」 0浜 田 知 久 馬 魚 住 龍 史 (東京理科大学) 医薬研究では生存時間解析のモデ、ルとして比例ハザード、モデルが標準的に用いられる.この方 法では共変量の効果をハザード比を用いて表すが,予後を評価する上では特定の共変量を持つ患 者の生存時間分布を予測することがより重要である.比例ハザード、モデ、ルで解析を行うための P H R E GプロシジャではB A S E L I N E 文を用いて,セミパラメトリックモデ、ルの枠組みの中で,任意の時 点、における生存率を予測することが可能で、ある. L I F E T E S Tプロシジャでは K a p l a n ‑ M e i e r 法に基づ I F E R E Gプロシジャでは,ワ いて,ノンパラメトリックに生存関数を推定することができる.更に L イプ ル分布,対数ロジスティック分布等のパラメトリックな生存時間分布を仮定して,生存時間 を予測することができる.また分位点回帰を行う Q U A N T R E Gプロシジャを打ち切りがある場合に拡 U A N T L I F Eプロシジャがパージョン 9 . 4から新たに追加された.このプロシジャを利用する 張した Q とメディアン等の分位点と共変量の関係をモデ、ル化することが出来る. 本発表では,チュートリアノレとして L I F E T E S Tプロシジャ, P H R E Gプロシジャ, L I F E R E Gプロシジ U A N T L I F Eプロ、ンジャを用いた生存関数の予測について解説する. ヤ , Q 表 1 生存時間分布の予測のためのプロシジャの比較 プロシジャ 焦点 L lFETEST 生存関数 PHREG ハザード関 数 L lFEREG QUANTL lFE 生存時間 生存時間の 分位点 モデル 比例ハザー ドモデル 加速モデル アプローチ 共変量 打ち切り ノンパラ 層別 右側 セミパラ モデル 調整 右側 パラ モデル 調整 加速モデル セミパラ* 加法モデル モデル 調整 右側, 左側,区間 右側 *QUANTL lFE:生存時間分布に特定の分布を仮定しないが,共変量で%点の関係をモデ、ル化 2 9 7
データハンドリングにおける S Q Lプロシジャの利活用 ‑PROCS Q L 入門‑ 古隅弘樹 (兵庫県立大学経済学部) Effective Use of SQL Procedure for Data Handling 一 Introduction to Proc SQL一 Hiroki Furuzumi School of Economics,University of Hyogo 要旨 データセットの作成や整備といったデータハンドリングに関わる部分で SQLプ口、ンジャは威力を発揮す る。データハンドリングを主にデータステップで行ってきた利用者にとってはプログラミングの幅が増 えることになり、リレーショナル・データベースのシステム開発経験者にとっては馴染みのある SQL命 令が SASシステムにおいても使用できるメリットは大きい。 SASシステムにおける SQLの実装が ProcSQL であり、その使用例を交えた初心者向けのチュートリアルとして報告をおこなう。 キーワード: データハンドリング、 ProcSQL、データステップ、リレーショナル・データベース 1.はじめに リレーショナル・データベースに関してシステム開発の経験がある者にとって、 SQL はとても身近な言語で ある。 SASシステムにおけるデータ管理は、データベースと同様に取り扱うことができ、 SASで SQLが利用で きるのはその j 恩恵によるものである。分析処理を行うには、まずしっかりとしたデータの整備が不可欠であ り、そのためのデータハンドリングにおいて、データステップのみならず、 SQL を利用できるメリットは大 きい。今回の報告では、 SQLの利用に不慣れな利用者向けのチュートリアルとして、 ProcSQLの使い方の基 礎から、応用に向けての便利な機能を少し紹介したい。 2 . データベースと SQL データベースではデータの定義や操作のための命令体系が必要になる。前者を DDL (Data Definition D a t aManipulationLanguage:データ操作言語)と呼ぶが、リレ Language:データ定義言語)、後者を DML ( ーショナル・データベースにおいてこれらの両方を実装した標準言語が SQL (Structured Query Language) である。 298
1 隆理路翠翠麺1 璽趨盤翠盛圏 臨趨盛掴堅調 ぷ 与 盤密密密璽盤霊 童 。 、 新た, J t集計結果や テーブル 新 た な 舗f 結集や データセット SQL=s 同dVr・ dQl崎町I.G時抑伊 建議およE 醜作を行う冨語 データベース ライフラリ データベースと SQLの関係 SASと Proc SQLの関係 データベースの中にデータを格納したテーブルが複数あり、それらの編集や、集計、新たなテーブルを作成 するといった操作を行うのが SQLである。 SASシステムの場合では、ライブラリの中にデータセットがある イメージになる。ライブラリはデータセットの保存先であり、ファイルシステムにおけるディレクトリ(フ ォルダ)に当たる。 . 4S Q Lプロシジャ:ユーザーガイドJ より) 関連用語の対応(rSAS9 SA S I SQL I データ処理 データファイル │テーブル │ファイル オプザベーション│行 │レコード 変数 │列 │フィールド 厳密には SASデータセットには、 SASデータファイルと SASデータビューの 2種類があり、 SASデータファイ ルとは、データ値に加え、データに関連づけられたディスクリプタ情報(変数の型や長さ、エンジン名など) を含んだものであるが、ここでは特に区別せず単に「データセット」と呼ぶ。 3 . Proc SQLの基礎 Proc SQLは 、 BaseSAS に含まれる SQLの実装であり、レポートや要約統計量の生成、データセットに対す る操作、などを行うことができることから、データステップや他のプロシジャの代替としても使用できる。 まずは、 ProcSQLの基本的な使い方からはじめよう。 3 .1 . Proc S Q Lの使い方 ProcSQLは対話型インターフェイスになっており、実行中は SQL文を逐次実行できる。つまり、 ProcSQL文 を実行すれば、 Quit文を実行して終了しない限り、 SQL形式で記述する Select文や Create文などのデータ ベースに対する操作命令であるクエリ (Query:問い合わせ)を繰り返し実行することができる。 【 ProcSQLの基本構造】 proc sql [options]; select文; create文; insert文; quit; 299
3 . 2 . SELECT文の基本構文 SQLにおける基本は SELECT文と言っても過言では無い。その名のとおり、テーブルから列や行を選択して出 力するための命令であり、選択クエリとも呼ばれる。なお、 S e l e c t句で指定する出力列と From句で指定す るテーブル(データセット)の参照については省略できないが、それ以外は省略できる。 【 SELECT文の基本構文】 , 列 2,・ ・ ・ ] Se1ect 列 1[ Fromテーブル 1[,テープ、ル 2,・ ・ ・ ] [ W here条件 1[and/or条件 2・ ・ ・ ]] , 列 2,・ ・ ・ ]] [ G r o u pby列 1[ [ H a v i n g 条件 1[and/or条件 2・ ・ ・ ]] [ O rderby列 1, [ 列2 ,・ ・ ・ ]] 【 注 釈1 S e l e c t 出力列(変数)の指定 From参照するデータセット [ W here出力条件] [ G r o u pb y グループ化変数] [ H a v i n g グ ループ出力条件] [ O r d e rb y並べ替え順序] 3 .3 . 出力列の指定 S e l e c t句では、 From句で指定したテープ、ルから出力する列名を指定する。複数の列を出力する場合は、出力 順にコンマ区切りで指定する。なお、 r * Jはテーブル内の全ての列を意味する記号であり、テープ、ルにおけ る格納順に列を出力する。 【記述例】出力列の指定 ・テーブル ( d a t a s e t l ) から全ての列を格納順に出力する a t a s e t l ; S e l e c t fromd ・テープ、ル ( d a t a s e t l ) から特定の列 ( v a r l,v a r 3 ) だけを出力する S e l e c tv a r l,var3 fromd a t a s e t l ; ・テーブル ( d a t a s et1)から特定の列 ( v a r l,v a r 3,v a r 2 ) を指定順に出力する a t a s e t l ; S e l e c t varl,var3,var2 fromd * 3 . 4 . 出力列の別名および属性指定 出力列の指定において、元の列名とは異なる列名(列エイリアス: c o l u m n ‑ a li a s ) を指定できる。 a sキーワ ードを使用し、列エイリアスは SASの命名規則に従う必要がある。また、列に対して属性を指定できる。指 定可能な属性は、ラベル(la b e l = ) 、出力書式 ( f o r m a t = ) 、入力書式 ( i n f o r m a t = ) 、長さ(le n g t h = ) であ る。属性指定は、列エイリアス指定がある場合にはその後ろに、複数の属性を指定する場合は空白区切りで 指定する。なお、 l a b e l = '井'と指定した列は出力結果で列見出しが空欄になる。 F o r m a tの指定については、 r S A S9 .4出力形式と入力形式リファレンス J等の関連資料を参照されたい。 【記述例】出力列の別名および属性指定 ・列の別名指定 ( a sエイリアス) a r 2a sa 1 s 2f r o md a t a s e t l ; S e l e c tv a r la sa 1 s 1 ,v ・列の属性指定(ラベル名やフォーマット指定など) 阻 , f o r m a t = $ 4 0 . ,v a r 2 fromd a t a s e t l ; S e l e c tv a r l 1abe1='NA 3 . 5 . 計算式による列の追加 From句で参照するデータセットの列を加工して新しい列を追加指定できる。出力列の指定において計算式や 関数式を記述することができる。この場合は列名が無いので、必要があれば列エイリアスを指定する。 300
【記述例 1計算式による列の追加 p o p ) と面積 ( a r e a ) から人口密度 ( d e n s it y ) を作成する ・人口 ( S e l e c tp o p,a r e a,p o pIa r e aa sd e n s i t yf o r m a t = c o r n m a 8 .f r o md a t a s e t 1 ; ・姓 ( s e i ) と名 ( m e i ) を空白で結合して氏名 ( s i m e i ) を作成する S e l e c ts e i,m e i, c a t x ( '" s e i,m e i )a ss i m e if r o md a t a s e t 1 ; 1 *catxO関数では結合に際して末尾の空白文字は除去される * 1 単純な計算式ではなく、条件によって値を変えたい場合には、 C a s e式を用いて処理を定義することができる。 e l e c t ‑ W h e n ‑ O t h e r w i s e構文と同様の処理が可能である。 これによりデータステップにおける S a s e式を用いた条件による値指定 【記述例) C I 出力例】 ・得点 ( S C O R E ) に応じた評価 ( E V A L ) を作成 S e l e c ti d,s c o r e, 臨調臨盟盟盟 C a s e 冊l e n 0く‑ s c o r eく 6 0 then'D ' W he n6 0< =s c o r eく 7 0 then'C ' Whe n7 0く= s c o r e<8 0 t h e n' B ' 腕時n8 0く= s c o r e<9 0 then'A ' Whe n9 0く= s c o r eく= 1 0 0t h e n' A ' E l s e' E r r o r ' E n da se v a ll e n g t h = 5 F r o md a t a s e t 1 3 30 4 D E r r o r C a s e に続けてオペランド(列名)を指定する場合は、 w h e n に続けて値を指定する。なお、条件は等式に限 定され、比較演算子などの他の演算子は使えない。 【出力例】 闘盟盟臨調醒 C a s es e x ̲ c d 冊l e n1t h e n' M A L E ' Whe n2t h e n' F E M A L E ' E l s e' N O N E ' E n da ss e x ̲ m fl e n g t h = 5 F r o md a t a s e t 1 雌一肌蜘一鵬 a s e吻 e r a n d式を用いた条件による値指定 【記述例】 C S E X ̲ C D ) に応じた名称 ( S E X ̲ M F ) を作成 ・性別コード ( S e l e c ts e x ̲ c d, [参考]欠損値を置換して出力 引数の最初に現れる欠損値でない値を返す関数 C o a l e s c e0を出力列の指定で用いることで、欠損値の出力を 置換処理できる。なお、引数が全て欠損値の場合は欠損値が返されるので、欠損値を出力したくない場合は、 引数の最後に欠損値ではない値を指定する。 【記述例】欠損値の置換出力 a r 2 (文字列)にある欠損値を文字列 I N .A J に置換して出力 ・列 v S e l e c tv a r l, c o a l e s c e ( v a r 2, ' N . A ' )a sv a r 2f r o md a t a s e t 1 ; .同じことは c a s e式でもできる S e l e c tv a r l,c a s ew h e nv a r 2i sm i s s i n gt h e n' N . A 'e l s ev a r 2e n da sv a r 2f r o md a t a s e t l ; 301
3 . 6 . 結果の並べ替え Orderby句を用いることで、指定した列の値を基準にして出力結果をソートできる。列名の後ろに asc ( 昇 順: ascending) または desc ( 降1 ) 頂: d e s c e n d i n g ) を指定できるが、省略時は昇順である。複数の列を基準 にソートしたい場合は、優先順位の高い列からコンマ区切りで指定する。 Orderby句では列出力の指定に含 まれない列を指定できる(並べ替えに使用した列を出力しなくてよい)。なお、欠損値は昇順の場合は先頭に 表示される。また、 ProcSQL の sortseq= オプションで言語やエンコーディングを指定することもできる。 │【出力例】 【記述例】 orderby句 ・データを身長 ( h e i g h t ) の降順で並べ替え、同じ身長なら 体重 ( w e i g h t ) の昇順で並べ替える 1 6 0 4 1 5 5 勾 160 ヴ 2 0t54 n一Oo Select i d,height,weight fromdataset1 orderbyheight desc,weight 3 . 7 . 出力条件の指定 Where句を用いることで結果出力のための条件を指定できる。条件指定では比較演算子(=,く,く‑,く>, , >> = ) 等を利用でき、複数の条件は論理演算子 ( a n d,o r ) で結合できる。 where句 【記述例 1 │ 【出力例】 . 帰 身 版 長 副 献 が 州 川 川 E 川 I 同6 叫 ω 明 附 O以此上 ( M 凶 刷 加吋吋 江 i g 凶 油 刷 h t 釦山 の行を出力 ' Select i d,height, s e x fromdatasetl whereheight>=160and s e x = ' M A L E ' 1: 日 5 , M姐 . . E 3 1 6 0 MALE 8' 1 8 0 MALE 9 附l e r e句では比較演算子に加えてさまざまな演算子が利用できる。これらすべての演算子は、 NOT演算子を付 加することで否定条件も作成できる ( n o ti n,n o tl i k e, i snotmissing,など)。また、 Like演算子では ワイルドカード文字が使え、パーセント記号(覧)は任意の文字列に一致し、アンダーライン υは任意の l文 字に一致する。文字列の比較で大文字・小文字の混在がある場合は、 UPCASEOまたは UPPERO関数で大文字 に変換し、条件指定も含め大文字に統ーして比較するなどの工夫をする。 【記述例) where勾で使える便利な演算子 s c o r e )が6 0から 1 0 0の間 ・得点 ( where scorebetween6 0and 1 0 0 ‑サイズ ( s i z e ) が Lか L Lか 3 Lのいずれか where s i z e in ( ' L ', ' L L ', ' 3 L ' ) ・メッセージ ( m s g )に r e r r o r J を含む wheremsgcontains ' e r r o r ' ・名前 ( n a m e ) が Aで始まるか、 Eで終わる 5文字か where u p p e r ( n a m e )l i k e' A , 九 orupper( n a m e )l i k e' 一 一 ・得点 ( s c o r e ) が欠損値 where score i smissing 1 *is nu11 でも可 * 1 302 E '
S Q L形式で記述された S e l e c t文などの命令をクエリというが、クエリの中でカッコ()で、括って記述された h e r e句ではサブクエリを用いて条件指定を記述できる演算子 ( a n y,a 1 1, クエリのことをサブクエリという。 W e x i s t s ) が利用できる。なお、これらの演算子も前に N O T演算子を付加して否定条件を作成できる。 h e r e句におけるサブクエリ 【記述例】 w •d a t a s e t 2の得点 ( s c o r e ) の少なくとも lつを上回っている w h e r es c o r e>a n y( s e l e c ts c o r ef r o md a t a s e t 2 ) •d a t a s e t 3の得点 ( s c o r e ) の全てを上回っている w h e r es c o r e>a 1 1( s e l e c ts c o r ef r o md a t a s e t 3 ) .サブクエリの実行結果が l行以上存在する w h e r ee x i s t s( s e l e c t* f r o md a t a s e t 4w h e r e… ) [参考]切り捨て文字列 (TruncatedString) の比較演算子 文字列の比較において相互の文字列の長さの違いが問題になることがある。その場合は切り捨て文字列の比 較演算子を用いるとよい。これらの演算子では、比較を実行する前に、長い文字列が短い文字列の長さと同 じになるように切り捨てが行われる。この切り捨て処理は P r o cS Q L内部で実行され、オペランド(被演算部) に指定した列の内容が切り捨て文字列で上書きされることはない。 A S9 . 4S Q Lプロシジャガイド」より) 切り捨て文字列の比較演算子(rS 演算子 E Q T G T T L T T G E T L E T N E T 定義 切り捨て文字列に等しい 切り捨て文字列より大きい 切り捨て文字列より小さい 切り捨て文字列と等しし、かより大きい 切り捨て文字列と等しし、かより小さい 切り捨て文字列と等しくない 記述例 w h e r eN a m ee q t' A u s t '; w h e r eN a m eg t t,B a h '; w h e r eN a m e1 t t' A n '; w h e r eC o u n t r yg e t' U n i t e dA ' ; w h e r eL a s t n a m e1 e t' S m it h '; w h e r eS t y l en e t' T W O '; 3 . 8 . データの要約 複数行の値を用いて集計することができる。出力列の指定において合計や平均などを計算する関数を指定す ることで複数行の値を 1つの値に要約することから要約関数と呼ばれる。計算式を指定する場合と同様に列 名がないので、必要に応じて列エイリアスを指定する。 P r o cS Q Lにおける主な要約関数一覧(rS A S9 . 4S Q Lプロシジャ:ユーザーガイド J より) 定義 要約関数 A V G,M E A N 値の平均 C O U N T, F R E Q,N C S S C V 非欠損値の数 MAX 修正平方和 変動係数(パーセント) 最大値 M I N N M I S S 最小値 欠損値の数 P R T より大きなスチューデントの tの絶対値を得る確率 定義 要約関数 R A N G E S T D S T D E R R S U M S U M W G T 値の範囲 標準偏差 平均の標準誤差 値の合計 眠I G H T変数値の合計 T 母集団の平均値がゼロに等しいという仮説 を検定するためのスチューデ、ントの t値 U S S 無修正平方和 V A R 分散 303
【記述例】要約関数 │【dataetl1 得点、 ( s c o r e ) が欠損でない人数、 合計、平均を出力する S e l e c t c o u n t ( s c o r e )a sc o u n t, s u m ( s c o r e ) a ss u r n, a v g ( s c o r e ) a s avg I 4 f r o r nd a t a s e t l ; 3 . 9 . データのグループ化 要約関数を Group by句と併用することで、グループ毎にデータを要約することができる。グ、ループ化の基 準となる列(グ、ループ化変数)を指定し、複数の列を用いる場合はコンマ区切りで優先順位の高い順に指定 する。なお、要約関数を使わないグループ化で、は、 g r o u pby句が orderby 句に変換されて実行される。ま た、グループ化変数に欠損値があると、欠損値を持つ行で、グループ化されるので注意が必要である。 [ d a t a et 11 【記述例】 Groupby句 【出力結果】 世帯番号 ( H H I D ) で、グループ化して、 世帯員(剛I D ) の数を出力 凶i d )a sc o u n t S e l e c t hhid,count( h i d f r o r nd a t a s e t l groupby h 2 S e l e c t hhid,c o u n t ( * )a sc o u n t h i d f r o r nd a t a s e t l groupby h ;1 *欠損値を含む* 1 2 1 2 2 日 2 lf o u n t ( h r n i d )a sc o u n t S e l e c t hhid,c f r o r nd a t a s e t l groupbyhhid havingc o u n t ( * ) > = 3 叶 一 慎 一 L 翻臨一!l 一 【記述例1Having句 世帯番号 ( H H I D ) でグ ループ化した世帯員 ( 剛I D ) の数が 3以上を出力 加 盟 一 J11 グループ化されたクエリの結果に対して出力条件を付加したい場合は Having句を用いる。 4 . データの水平結合 ( m e r g e ) 複数のデータセットにおける共通の情報をキーとして、レコード(オブザベーション)単位で列方向に結合 することを水平結合 ( r n e r g e ) という。データステップで処理する場合は r n e r g e文と by文を使う。異なるデ ータセットを水平(列)方向に結合する方法にはいくつかの種類があり、 P r o cSQLではデカルト積 ( c r o s sj o i n )、 内部結合 ( i n n e rj o i n )、外部結合 ( o u t e rj o i n )、自然結合 ( n a t u r a lj o i n ) などをサポートしている。 4 .1.デカルト積 (Cross ]oin) 結合に使用するキーを指定せず、対象のデータセットの各行について全ての組み合わせが出力される。 304
I 記述例】デカルト積 ( C r o s sJ o i n ) * 【 dataet 11 S e l e c t fromd a t a s e t l,d a t a s e t 2 ; * S e l e c t fromd a t a s e t l cross joind a t a s e t 2 ; 1 *結果は閉じ * 1 [ d a t a e t 2 1 1 A 2 B 百l 【出力結果】 童 一一一一一一一 Y 4 l A 4 一 一 ー一一 ‑ ‑ ̲ " " 晶 品 , ‑ ‑ 唱 一 一 Y 2 . B 3 X 2 B 4 Y 4 . 2 . 内部結合 (Inner Join) 結合対象のデータセットにおいて、指定した条件に合致する組み合わせが出力される。 F rom句でテーブルエ イリアス ( t a b l e ‑ a l i a s ) を利用すると列指定や条件指定を記述しやすい。 I n n e rJ o i n ) 【記述例】内部結合 ( 【 dataet 11 a t a l,d a t a 2 S e l e c ta .i d,d sb fromd a t a s e t la s a,dataset2a .i d wherea .i d=b [ d a t a e t 2 1 【出力結果】 l B 2 a t a l,data S e l e c ta .i d,d fromd a t a s e t la sa innerjoindataset2asb .i d ;1 *結果は同じ * 1 ona .i d= b 2 Y .~ '~ z 2 B Y 4.3. 左外部結合 (Left Outer Join) 左側 ( f r o m句)の全行と、右側(le f tj o i n句)の条件 ( o n句)が一致した行との組み合わせが出力される。 不一致の場合、右側の列データは欠損となる。 L e f tOu terJ o i n ) 【記述例】左外部結合 ( 11 [ d a t a et [ d a t a e t 2 1 【出力結果】 . d a t a l,b.data2 S e l e c ta .i d,a fromd a t a s e t la sa 1 1i 茸 B 2 Y B !書 l . ‑ 圃 ' ー, . ̲ ‑ 圃 圃 2 白 l e f t joind a t a s e t 2a sb 2 .i d; ona .i d=b 4 Z' k 一 一 ι A x B Y ̲ . . . ー ー ・ 一 手 ‑ ‑ . 台 4.4. 右外部結合 (Right Outer Join) 右側 ( r i g h tj o i n句)の全行と、左側 ( f r o m句)の条件 ( o n句)が一致した行との組み合わせが出力され る。不一致の場合、左側の列データは欠損となる。 R i g h t Ou terJ o i n ) I[ d a t a et 11 【記述例】右外部結合 ( [ d a t a e t 2 1 [出力結果】 臨調融盟臨翻醒盟醒盟 . d a t a l,b.data2 S e l e c ta .i d,a fromd a t a s e t la sa 1, A 1: X rj i right joindataset2 a sb 2 B 2 Y 2 .i d ona .i d=b 4 D .~ 305 A;z B Y 4 1 i‑‑ ‑‑‑ ‑‑ ‑ z z, .'
4 . 5 . 完全外部結合 (Full Quter Join) 左側 ( f r o m句)の全行と右側 ( f u l lj o i n句)の全行の組み合わせが出力される。双方で条件 ( o n勾)が一 致した行に加えて、一方にしかない行も含まれる。一致しなかった場合、それぞれの列データは欠損となる。 【記述例】完全外部結合 ( F u l l Ou terJ o i n ) I【 dataet 1 ) l d a t a e t 2 ) Select a .i d,a . d a t a 1,b.data2 盟関醒盟 【出カ結果】 fromd a t a s e t 1a sa full joindataset2a sb .i d ona .i d=b B 4 1 i B 2 2 Y 2 3 z 3 4 B Y z D [参考]欠損値(叩LL,Missing) の影響 N U L L,M I S S I N G ) の特殊な扱いに注意が必要である。 1つは、昇順でのソート時には PROCSQLでは欠損値 ( 欠損値が先頭になり、数値の大小や、文字コードの前後に依存しないことである。もう 1つは、結合(マー ジ)においても閉じ型(文字 or数値)の欠損値と接合することであり、 SQL の実装では欠損値を結合に使 わないのが一般的である。これは、 S A S における他のプロシジャやデータステップでの処理との整合性によ るものである。 【例】キーに欠損値を含む内部結合 【 dataet 1 ) l d a t a e t 2】 【出カ結果】 醒醒醒醒盟 S e l e c ta .i d,a . d a t a l,b . d a t a 2 Li ;fAjl‑pj fromd a t a s e t la s a,d a t a s e t 2a sb .i d where a .i d=b y 2 , z 2 .' B Cd Z D z ‑ 一 一 一 一 、 一 一 一 一 ̲ ‑ ̲ 叩 叩 . . . ! ! . . . . ̲ ‑ ‑ 一 一 千 D Y [参考]ユニークデータの抽出と重複データの処理 水平統合(マージ)では、緩い結合条件を指定するとレコードの重複結合 ( 1対多、多対多)が生じやすい。 マージ後のレコード件数や I D番号のユニーク性をチェックするように心がけよう。 ユニークな行のみ出力する ( D i s t i n c tキーワードの利用) s e i ) と名 ( m e i ) のユニークな組み合わせの一覧を出力する ・姓 ( S e l e c td i s t i n c ts e i,m e i fro 岨 d a t a s et 1 ; 1 *重複行を出力しない * 1 ・ユニークな姓 ( s e i ) の数を数える Se1ect count(distinct s e i )a sc o u n tf r o md a t a s e t l ; グループ化と集約関数 co 叩 t Oを使用した重複行の検出 ‑姓 ( s e i ) と名 ( m e i ) の重複(同姓同名)があれば、重複数 ( c o u n t ) と併せて出力する Select s e i,m e i,c o u n t ( * )a sc o u n t fromd a t a s e t 1 groupby s e i,m e i havingc o u n t ( * ) > l ; 5 . データの垂直結合 複数のデータセットを垂直方向に結合することもできる。 SQLでは集合(セット)演算子を用いる。基本的 には列の位置に基づいて(列名と無関係に)データセットを垂直に結合する。 306
5 .1.和集合 ( U N I O N ) 両方のクエリ結果を統合し、重複行を削除する。それぞれに追加行を持つデータを統合する際に便利である。 O N演算子) 【例】和集合(聞I S e l e c t [ d a t a e t 2 ) *fromdatasetl 1 A 1 U n i o n 2 B 2 S e l e c tキ f r o mdataset2 ; 4 D s 【出力結果】 1 A Y 2 B Z 4 D 2 Y 3 z [参考] A L Lキーワード 和集合 ( U N I O N )にA L Lキーワードをつけると、両方のクエリ結果から重複を含む行を作成する。 A L Lキーワ ードをつけることで重複行の除去が行われなくなる。重複を含めたデータを作成する場合に使用する。 I 例】凹 I O N演算子 [ d a t a et 1 ) 【 dataet2) 【出力結果】 離襲撃麟翻 +A l l キーワード Select *fromdatasetl U n i o nAll Select *fromdataset2 1 A 1 A 1 A 2 B 2 Y 2 B 4 D ' z 4 D l A 2 , Y 3 Z 5 . 2 . 差集合 ( E X C E P T ) 最初のクエリ結果にのみ含まれる行を生成する。例えば、新データから旧データとの重複情報を差し引けば、 挿入・更新された'情報を抽出することができる。 【例】差集合 ( E x c e p t演算子) Select I[dataetl】 【出力結果】 *fromdatasetl Except Select 【 dataet2) *fromdataset2 2 B 2 4 D 3 Y 4 D 5 . 3 . 積集合 ( I N T E R S E C T ) 2つのクエリ結果に共通する行を生成する。 2つのデータで 名簿で継続調査の対象や存続情報の抽出に利用できる。 307 変わっていない情報を抽出できる。新旧の調査
B 2 ; J E 仁 三E *fromdataset2 ; Select J Select Intersect 叫 瞳 一一 同盟一 J 2 一 叫盟一﹂ *fromdatasetl 同一輔君 演 算 子 ) 【例】積集合 ( I n t e r s e c t Y 3! , Z ;; 【出力結果】 !子,.1γ a‑ "! 1 . . . ̲ .̲ 5 . 4 .排他的和集合 ( E X C L U S I V EU N I O N ) 一方のクエリ結果にのみ含まれる行を作成する。管理パージョンの異なるデータを照合して、それぞれで追 加・変更された情報を抽出できる。相互の差集合に対して和集合を取れば良い。 [出カ結果】 【例】排他的和集合 [ d a t a e t 2 ] ( s e l e c t except s e l e c t unlon ( s e l e c t except s e l e c t 瞳盟闇覇瞳覇瞳盟 *fromdatasetl *fromdataset2) ‑ ‑ ~~~Jr ~~~~.] 2 *fromdataset2 ~ *fromdatasetl); •. Y z 4 D Zド Y' 3 Z 5 . 5 .連 結 ( O U T E RU N I O N ) 列を統合せずにクエリの結果を連結する 【例】連結 ̲̲̲ 列の順番では連結されず、別の列として垂直に連結される。 I【data坑 1] 【 d a t a e t 2 ] 【出力結果】 ( O U T E RU N I O N演算子)組盟盛田盟瞳盟瞳豊田醒璽 仁王[二E 仁? *fromdatasetl Select 2 B i i̲ ̲ .p! outerunion 4 * 2 3 員! Y 2 Z 4 : o l ! B ← a t a s e t 2 ; S e l e c t fromd 1 A 3 Z [参考] C O R R E S P O N D I N G( C O R R ) キーワード O U T E R聞 I O Nで C O R Rキーワードを使用すると、クエリの結果の同名の列を統合し、列名が異なるものを統合 誠 一 一 人 一 [ d a t a e t 1 ] +C O R Rキーワード outerunioncorr S e l e c t 1 J *fromdataset2; B *fromdatasetl Select [ d a t a e t 2 ] 瞳 ( 一 ︺ 演 算 子 【例] 0 町 四 国I O N 加盟団 2 せずに連結する。 I Dは重複しないが列定義が異なるようなデータを統合する場合に便利である。 . x r‑‑"一一一: r一一一日 .l~ ! 308 i ! Y i
6 . テーブルの編集 ここまで、は、 S e l e c t文を用いた行や列の選択や結合などの操作が中心であったが、 Select文以外の SQL命令、 とりわけ、テープ、ルの編集に関する命令について取り上げる。 6 .1.テーブルの作成 CreateTable文を利用することで、新規テープ、ルを作成できる。新規テーブルにおける列定義を指定したり、 S e l e c t文)の結果を新規テーブ ルに保存したりする方 既存テープ ルの列定義をコピーしたり、選択クエリ ( 法がある。 【記述例】 CreateTable文 ‑新規テーブル ( d a t a s e t 1 ) を作成し、 3つの列:i d (数値)、 n a m e( 2 0文字)、 age (数値)を定義する。 Create table dataset1 (i dnum,n a m ec h a r ( 2 0 ),a g en u m ); ・新規テーブル ( d a t a s e t 2 )にd a t a s e t 1の列定義をコピーする。行はコピーしない。 Create table dataset2 l i k ed a t a s e t 1 ‑新規テーブル ( d a t a s e t 3 )にs e l e c t文の実行結果を ( d a t a s e t 1の内容)保存する。 Create table dataset3 a s Select fromd a t a s e t 1 * 6 . 2 . テーブルへの行挿入 I n s e r t文を使用することで、既存のテープソレ(データセット)に対して行挿入を行うことができる。 【記述例】 Insert文 d a t a s e t 1 ) の指定列に対応する値を 2行挿入する ・データセット ( I n s e r ti n t o datas巴t 1( i d,n a m e,a g e )v a l u e s( 5,' T a n a k a ',3 8 ) values ( 6,' S u z u k i ',4 0 ) ・データセット ( d a t a s e t 1 ) の格納順に値を挿入する I n s e r ti n t o dataset1 s e ti d = 5,n a m e = ' T a n a k a ',age=38 s e ti d = 6,n a m e = ' S u z u k i ',age=40 ; ・データセット ( d a t a s e t 1 ) の格納順に値を挿入する Insert i n t o dataset1 values ( 5, ' T a n a k a ',3 8 )v a l u e s( 6,' S u z u k i ',4 0 ) ・データセット ( d a t a s e t 1 ) の指定列に対応する値を dataset2から抽出して挿入する I n s e r ti n t o dataset1 ( i d,n a m e,a g e )s e l e c ti d,n a m e,a g e from dataset2 ; 6 . 3 . テーブルのデータ更新 Update文を使用することで、既存のテーブル(データセット)の内容を更新できる。その際、更新対象とな る行を Where句で条件指定し、 S e t句で更新内容を指定する。サブクエリを使うことで更新用データを参照 して更新することもできる。データステップにおける u pdate文を用いる場合も同様のことができる。 【記述例 1Update文 ‑価格 ( p r i c e ) を税込み金額で更新する Update d a t a s e t 1s e t price=price 1 . 0 8where country= ' J P ' ・更新用データ ( d a t a s e t 2 ) を参照して d a t a s e t 1の内容を更新する Update dataset1 a sa s e td a t a= ( s e l e c td a t a fromdataset2 a s bwhere a .i d = b .i d ) s bwhere a .i d = b .i d ) where exists ( s e l e c t キ fromdataset2 a 1 *where 句を忘れると他の行が欠損値で更新されるので要注意 * 1 * 6 . 4 . テーブルの列定義の変更 AlterTable文を用いることで、既存テーブルの列に対して追加、変更、削除の操作を行うことができる。 309
【記述例】 A l t e rT a b l e文 •d a t a s e t 1に列 v a r 2を追加し、文字型 ( 1 0バイト)、出力書式$ 1 0 .とする A l t e rt a b l ed a t a s e t 1a d dv a r 2c h a r ( 1 0 )l a b e l = ' v a r i a b l e 2 'f o r m a t = $ 1 0 . ; ・d a t a s e t 1の列 v a r 2を変更し、文字型 ( 2 0バイト)、出力書式$ 2 0 .とする A l t e rt a b l ed a t a s e t 1m o d i f yv a r 2c h a r ( 2 0 )f o r m a t = $ 2 0 . •d a t a s et1から列 v a r 2を削除する A l t e rt a b l ed a t a s e t 1d r o pv a r 2; 6 . 5 . その他削除 D r o pや D e l e t e文を用いることで、テーブルや行などを削除することができる。 【記述例】さまざまな削除 ・テーブル ( d a t a s et1)の削除 D r o pt a b l ed a t a s e t 1 ・テーブル ( d a t a s e t1 ) からインデックス(インデ、ツクス名:i d x ) の削除 D r o pi n d e xi d xf r o md a t a s e t 1 ・ピ、ュー ( d a t a v i e w 1 ) の削除 D r o pv i e wd a t a v i e w 1 ・テーブル ( d a t a s e t 1 ) の行の削除: Aで始まる名前 ( n a m e )の行 D e l e t ef r o md a t a s e t 1w h e r eu p p e r ( n a m e )l i k e' A 見 ' 7 . 便利な機能 P r o cS Q Lには他にも様々な機能があるが、その便利な機能の一部について紹介する。また、 P r o cS Q Lの実装 では、一般的なデータベースには無い、 S A S システムとの親和性を高めるための独自拡張も行われており、 A Sシステムの強力な機能と連携して処理を行うことができる。 これらの利用によって、 S 7 .1 . SQLビュー ( V i e w ) S Q Lヒ守ューとは、 S Q Lで記述されたクエリが格納されたデータセットの一種である。 D a t aステップや P r o cス テップから参照された際にクエリ ( S Q L )が実行され、実体の情報を参照できるようになる。データファイルの ように実データを保持しないため記憶容量を節減できる。内容に対する更新や削除などの操作は、ビューに おいてクエリが参照している元のデータセットにも反映される。 P r o cS Q Lでは作成に C r e a t eV i e w文を使用 e l e c t文等の F r o m句内でネストされたクエリ式をインラインピ ュー ( I n l i n eV i e w ) と呼び、 する。なお、 S r o cS Q Lが内部生成して処理が行われる。当該クエ 外側のクエリがデータの選択に使用する一時テーブルを P リの実行が終われば一時テーブルは削除されるので、余分なプログラムステップを省き、不要なテーブ.ルの 増加を防ぐことができるメリットがある。詳細は、 f S A S9 .4S Q Lプロシジャ:ユーザーガイドJおよび f S A S 9.4 言語リファレンス」等の関連資料を参照されたい。 i e wおよび l n l i n eV i e w 【記述例】 V •d a t a s e t 1を参照する S Q Lビュー ( d a t a v i e w 1 )を作成する C r e a t ev i e wd a t a v i e w 1a ss e l e c t f r o md a t a s e t 1 ; •F r o m句内でのインラインビューの使用例 S e l e c ta .i d,a . n a m e,b . a d d r f r o m( s e l e c ti d ,n 咽 ef r o 皿 d a t a s e t 1 )a sa , ( s e l e c ti d ,a d d rf r o md a t a s e t 2 )a sb w h e r ea .i d = b .i d * 310
7 . 2 . 索引 Clndex) テーブルの各行(データセットのオブザベーション)に高速かっ効率的にアクセスするための情報を索引 ( I n d e x ) と呼び、索引が作られていれば、他のデータステップやプロシジャにおける by文でも使用され、 ソートが不要になる。また、 WHERE句の処理を最適化、グ、ループ処理を容易にすることができ、 SQLクエリの みならず、 SASシステムにおける効率的な処理の実行に貢献する。索引の種類には、 lつのキ一変数(列)の 値のみを使用した単一インデ、ックスと、 2つ以上のキ一変数の値を使用した複合インデックスがあり、いず れも CreateIndex文を使用して作成できる。索引については、データステップにおけるデータセットオプシ ヨン ( I n d e x = )や 、 ProcDATASETSの MODIFY文と INDEXCREATE文でも作成できる。詳細は r S A S9.4 言語 .4 プロシジャガイド」等の関連資料を参照されたい。 リファレンス j や rBaseSAS 9 I n d e x ) 【記述例】索引 ( dに単一インデックス i dを作成する • dataset1の列 i Create index i don dataset1 ( i d ) • dataset1の列 areaおよび addrに複合インデックス placesを作成する Create index places on dataset1 ( a r e a,a d d r ) 7 . 3 . データセットオプション Proc SQL におけるテーブル(データセット)の指定部分では、ほとんどのデータセットオプション ( K E E P = DROP= REN 馴 E= O BS= 叩 ERE= など)が利用可能である。データセットオプションの詳細は、 f S A S9 .4 デ ータセットオプション:リファレンス」等の関連資料を参照されたい。 【記述例】データセットオプション • dataset2の処理対象を先頭 1 5行とし、 dataset1の列名をはから hhidに変更する Createtabledataset1 (rename=(id=hhid)) a sselect fromdataset2 ( o b s = 1 5 ); * 7 . 4 . マクロ機能 データの内容や状況に応じてプログラムを自動生成するなど、高度な利用を想定する場合にはマクロ機能の 利用は不可欠である。 ProcSQLにおいても、 Select文における Into句を用いて実行結果をマクロ変数へ出 力したり、クエリの実行状況を格納した自動マクロ変数 (SQLOBS,SQLRC,など)を利用したりすることがで きる。マクロ機能の詳細は、 r S A S 9.4 SQL プロシジャ:ユーザーガイド」および f S A S9.4 マクロ言語: リファレンス」等の関連資料を参照されたい。 悶 ・o 句を使用したマクロ変数への出力 【記述例】 I ‑クエリ結果の先頭行の値を格納するマクロ変数を作成する Select i d,n a r n e,addr into : i d s, : n a m e s, : a d d r sf r o r ndataset1 ~put & ids& n a r n e s&addrs ; ‑複数行の結果 ( 9 9件分)を格納するマクロ変数を作成する Select i d,n a r n e into : idsl‑ids99,:namesl‑:names99 f r o r n dataset1 .値を連結してマクロ変数へ格納する Select n a r n e into : n a m e s separatedby, " f r o r ndataset1 1 *into句の末尾 (frorn の前)に NOTRIMを指定すると空白を除去しない * 1 311
8 . さいごに データハンドリング、とりわけ、データセットの作成や整備に関わる部分で、 P r o cS Q Lは威力を発揮する。 P r o cS Q Lは多機能であるが万能ではないので、データステップや他のプロシジャの得意分野とうまく組み合 わせた S A Sプログラムの作成が不可欠である。 謝辞 S A Sユーザー総会の世話人であり恩師でもある周防節雄・兵庫県立大学名誉教授にはさまざまな助言をいた A Sユーザー会(社会科学 S A S分科会)におけ だいた。また、今回の報告は、先だって開催された九州地区 S る報告をベースにしたものであるが、そこでの参加者からも有用なご意見をいただいた。この場を借りて御 礼申し上げたい。 参考文献 ‑古隅弘樹 ( 2 0 1 1 ) r 企業データを統合するための名寄せ処理技法 JS A Sユーザー総会アカデミア/テクノ 2 0 1 1年 7月 2 9日、於:神戸国際会議場) ロジー&ソリューション報告 ( 参考資料 日本語版 S A Sオンラインヘルプ(最終アクセス:2 0 1 6 . 6 .1 7 ) h t t p : / / w w w . s a s . c o m / o f f i c e s / a s i a p a c i f i c / j a p a n / s e r v i c e / o n l i n e h e l p . h t m l ・S A S9 . 4S Q Lプロシジャ:ユーザーガイド •S A S9 . 4言語リファレンス:解説編第 3版 a s eS A S9 . 4プ ロ シ ジ ャ ガ イ ド 第 4版 ・B •S A S9 . 4出力形式と入力形式リファレンス •S A S9 . 4マクロ言語:リファレンス 第 4版 •S A S9 . 4データセットオプション:リファレンス 第 2版 312
JMPによる第 4回 Le t 'sデータ分析の規定課題の解析 高橋行雄 B i o S t a t研究所(株) JMPM a n i p u l a t i o nt oS o l v et h eCompulsoryE x e r c i s e s f o rt h e4 t hM i c r oDataC o m p e t i t i o ni nSASJapanUsersForum2016 Y u k i oT a k a h a s h i B i o S t a tResearchC O ., L t d . 要旨: 第 3 5回 SASユーザー総会 ( 2 0 1 6年)にて, (独)統計センターの擬似ミクロデータを L e t ' sデータ分析ミクロデータ分析コンテスト」を開催した.残念ながら(独) 題材に第 4回目の i 統計センターからの擬似ミクロデータの提供が 2 0 1 6年 3月末で中止されたことにより,本年が 最終年となる.そこで,このコンテストの規定問題の出題者として,統計ソフト JMPを用いた ミクロデータの統計解析に関するチュートリアルとして,ボリュームが大きい社会調査データに 対する統計解析の進め方,実際に JMPではどのように行うのか,応t1Pの操作の基本にも触れつ つ出題の意図も含めて解説を行うこととした.(独)統計センターから多くのミクロデータが公開 されるようになったことは喜ばしいことである.それらを用いて新たなチャレンジを行うために は,教科書的なアプローチを超えた様々な創意工夫が必要となるので,擬似ミクロデータを例に して,どのようにアプローチしたらよいのか,具体的に例示した. キーワード:全国消費実態調査,擬似ミクロデータ,集計乗率, 1 0万世帯比,分位点, 1M P I はじめに 国の統計調査の集計結果については,冊子あるいは電子的に公開されており自由に利用すること ができるが,その元の個票データは本来その目的である統計作成以外の目的のために利用・提供で きないとの縛りがあった.最近の統計法の改正を受けて,統計の研究や教育など公益に資するため に使用される場合に限り、(独)統計センターが個人や企業が特定できない形に加工した匿名データ の提供依頼を申出ることで入手できるようになった.全国消費実態調査(全消)は, 1 9 8 9年 , 1 9 9 4 年 , 1 9 9 9年 , 2 0 0 4年の 4回分の匿名データが公開されており,それらのデータボリュームは,カ ンマ区切りの固定長データで,それぞれ 1 , 0 0 0メガバイトと膨大である. これらの大規模な公開データを用いた統計解析を行う前のトレーニングとして「擬似ミクロデー L e t ' sデータ分析ミクロデータ分析コンテスト」を企画した 1)用いた擬似ミクロ タ」を用いた i データは,全国消費実態調査(全消)の 2 0 0 4年の結果を用いて,変数名聞の相関係数を考慮、して元 のデータの特性が失われないように人工的に生成されたデータであり教育現場で自由に使え,ミク ロデータ統計解析の教材となるように作成された 2) 313
とはいえ,擬似ミクロデータのデータは 32, 0 2 7件 , 1 9 7変数でありファイルの容量は 32KX200 000kバイト =48メガバイトとなる.現代の標準的な PCの E x c e lでもデータを表示 X8バイト =48, するためにも 20秒弱とかかるが,近年,基本的なデータ操作が可能となったことは,喜ばしい. E x c e lは,現代の算盤としての地位は確立してはいるものの,自由自在にミクロデータの統計解析 を行うための機能は残念ながら持っていない. 長年にわたり多くの統計ソフトを筆者は,必要に応じて使い分けてきた.その中で,筆者の PC 上で生き残り日々用いて使用頻度が高い JMP を用いて,ミクロデータの統計解析を実践するため の,基本的な操作手順を示しす.また,規定問題をどのように意図で出題したのか,どのように作 成したかを丁寧に解説しつつ,今後ミクロデータの統計解析を試みる人達の道標になることを願っ ている.出題した規定問題の作成に際して,全く独立に SASを用いた検証 3) が共同企画者の周防 によって行なわれているので,目的は同じでもアプローチは異なることを理解しつつ,新たなチャ レンジを期待したい. 擬似ミクロデータを用いた SASでのプログラミング形式での文献 4),匿名データを用いた品。 での GUI形式での文献 5) ~こ,全く異なるアプローチが示されている.同じベンダーから提供され ている統計ソフトなので SASで作成された SASデータセットを品伊で直接読み込み, GUIにより 各種のグラフを作成できるし,逆に品。で作成された品。データセットを SASデータセットとし て保存でき,そのまま SASで利用できる. SASは,文献で提案されているあらゆる統計解析を実 Pは SASの標準的な統計解析をベ 施できることを目指して日々拡張が続けているのに対して,九!l ースとして SASを凌駕するグラフイカルな結果の表示とカスタマイズ機能が日々増強され提供さ れている. 2 . 解析用データの作成 000行ごとの ZIP圧縮ファイル (独)統計センターからダウンロードした擬似ミクロデータは, 5, であり表示 I~こ示すファイルが含まれている.これらのファイルを開くために, (独)統計センター から別途パスワードを入手した. 表示 I ZIPファイル g i j i ‑ m i c r o d a t a l の内容 A :圧縮サイズ 名前 サイズ パスワード保護 14 , 532KB 254KB 2 7 3KB 曲 目̲2捌 zensho̲layout̲!田 血 56KB 268KB 歯 GDI̲2!側Z聞 加 ー 申 剖i 凹 l a i陪 歯 GDI̲2004z ,師同」剖m mary̲: 知b l e 駐 G町一2側 Z四 国I̲vname 1 1KB 43KB 12KB 41KB 1KB 2KB 官嗣官 96KB 1 0 3KB U I 1 由 恒 GDI̲2 z e r 蜘 1 ̲ 9 '4 ∞ 1 2 314 有有有有有有有 4, 319KB 歯切り倒Z四回一由旬毘t~印刷""-'()回叩)
データは,カンマ区切り (CSV)形式であるので, E x c e lで開くと表示 2に示すように,データの みのファイルであり, 7ファイルに分割されている. J I ̲ 2 0 0 4 z e n s h o ̲ d a t a s e t ( 0 0 0 0 1" ' 0 5 0 0 0 ). c s vの最初の 1 0行 2 1変数 表示 2 Gl R A B 5 T U, JMPで CSV形式のファイルを読み込むと,変数名は,列 1 ,列 2, . . .,列 197と自動的に割り付 けられる.全体で 7ファイルを別々に読み込み,それらを JMPの【テープ、ル・連結】で行方向に 027人分の JMPファイル(サイズは 47MB)を作成する.変数名が通し番号のままでは, 結合し, 32, 迅速な解析も行えず,結果の出力も使いものならない.何らかの意味を持つ変数名を付与する必要 J I ̲2004zensho ̲v n a m e . c s v にあり,表示 3に示すように通し番号が振られ がある.変数名一覧は, Gl ており役に立たない. 表示 3 変数名リスト S e t a i K u b u n S e t a i J i n i n S h u u g y o u J i n i n Kouzou T a t e k a t a Shoyuu S 1Sex S1̲Age S1̲Shuugyou S1 ̲ K i g y o u K u b u n S 1 ̲ K i g y o u K i b o S1̲Sangyou S1̲Shokugyou W e i g h t Youto001 Youto002 Youto003 Youto004 Youto005 Yo此 0006 Youto007 Youto008 Youto009 Youto010 Youto011 Youto012 Youto013 Youto014 Youto170 Youto171 Yout0172 Youto173 Yout0174 Yo此 . 0 1 7 5 此. 0 1 7 6 Yo Yout0177 Youto178 Yout0179 Yout0180 Yout0181 Yout0182 Yout0183 そこで,表示 4 に示した GlJI̲ 2004zensho ̲ l a y o u t ̲ c o d e . x l s のレイアウトシートから, E x c e lの手 2,3,4,7,8,9, … ,5 2 6 ) を削除し,項目名の入っている行 ( 1,5,6,8 , … ,5 2 7 ) 作業で不要な行 ( を拾い出す. 表示 5に示すように,行番号,階層,項目名,変数名を残し他は削除する.新たな通し変数名と . . . , VOOI4,Y001,Y002, . ., . Y183を作成し,これに項目名を C o n c a t e n a t 怠 して,接頭語 V001,V002, 関数で結合し,合成変数名とする. 3 315
表示 4 擬似ミクロデ}タのレイアウトシート 行番号 項目名 階 層 パ イ 配 位 置 ト置 数 1 1 1 世帯区分 型 農 S e t a i K u b u n ー ‑ j 有察人員 1 0 1 . 1 1現住居等に闘する事項 住居の構造 2 1 1 2 2 2 3 1 22 1 5 1 1 6 1 22 1 2 2 3 8 1 1 2 S e t a i J i n i n 不詳 項目の区切り 3 K o u z o u 9 1 1 木造 防火木造 鉄骨・鉄筋コンヲリート造 その他(ブロッヲ造り、レンガ造りな ど) 不詳 項目の区切り 2 3 4 v 1 7 1 . 3 5 2 3財産麟入 4 12 9 2 81 5 1 21 5 2 4 1 . 5 2 5その他 4 12 9 4 3 4 12 9 4 41 5 1 21 5 2 6 1 . 4 12 9 5 9 5 2 7繰越金 3 12 9 6 01 5 1 21 1 0 1 1 Y o u t o 1 8 1 Y o u t o 1 8 2 Y o u t o 1 8 3 鏑考 Z人 項目の区切り 1人目 町 w 1 5 11& A2 3 S h u u g y o u Ji ni n Al‑ 1 1 1 2 4 3 符号内容 勤労 勤労以外 線臓 項目の区切り 2 3 3 2 4 1 . 5世帯累 6世帯普人員 7 符号 変数名 O A B A O O A B O AAAAA 1̲ 町 ∞ 日 項目の区切り 0 a 0 0 AAAAA 1̲ 0 A .A 四 ∞ 日 項目の区切り ー AAAA 1 ・ ̲ 0 a 6 A 0 0 AA a 表示 5 変数名テーブル s v形式で保存し,表示 6 に示すように Excelの「行列を入れ替える」 結合した JMPファイルを c 機能を用いて値のみを貼り付け保存し,このファイルを則Pで読み込む. 表示 6 E x c e lの 1行目へ合成変数名の貼り付け 転置 員 み y1回繰越金 ~IAIBic , DIEIFIGIHII. JiKjLjMjN 。 GO 1 9 J 1 5 要I J 1 9 7 1 事J I事 J I要 J I要 J I要 J I9 Iヲ J I9 1 J I J I列 夢J J I要 l J I~列 ヲ Jヲ 11 2 314 516 718 91101 1 121314 2 3 4 5 112 111 111 112 111 31w 1119 2873.00 両 115 5055.37 1 11 1 3l 1 11 1 3wt115 3337.98 山 12 2 111 111 2 111 1 3264.17 1 5│ 21590.0402 47930.0771 59806. 9563 23930.8901 13 1 13 517 114 111 5 1 5 3123 13592.7 32028 1 55098.2714 } 十 三1 1 1 1 7日 4 316
変数名が名義尺度の場合に,数値などにコード化されているので,元のカテゴリ名を集計表に反
映するために JMPでは,【{直ラベル]の機能を用いて対応することができるが,手作業での対応と
なるので,元のデータそのものを一括して入れ替えることにする.そのためには,表示 7に示すよ
うに,全ての合成変数名に対して符号と符号内容を一括した JMPファイルとしておく.
表示 7 符号テーブ、ル
合慮3盟
i
!
s
変叡名
符号データ
51̲
5&
1
1̲
男
41VOO7
一性別
52_:針~
2
2̲
女
43'VO
吐輔議階級
j51̲
Age
1
01
一日彰時
力 'V012J
邑器持
:
5
1
一白時you
1
01̲j韓
7S!V012
Ji;騎号
79lv012
̲i室騎号
i
52̲5ar
明'
o
u
,
2
i
0
2
‑
:
林業
1
5
3
̲
5
a
r
唱y
ou
1
3
1
03
̲漁業
95iV01
之産業符号
96V012
Ji;業病
1
5
1
S
̲
:
臼 噂V
ω
1
1S‑‑‑
,
1瓦盃務(個厄芳頚さ:tlJ品市の)
1
5
1
9
,一白暗you
'
5
2
0
̲
:
白 崎you
1
1
9
lw
:
19
,ーその他{手間撲を含む)
'
v
v不詳
合 成 変 数 名 の JMPファイルに表示 8に示すように通し番号の列 rNoJ を追加して, ryOOl世帯
区分 J から rY013 職業符号 J13変数の変数タイプを「文字」に統一し,行ごとに「列の積み重ね J
で,縦方向に展開する.積み重ねたデータに対し,符号テーブルを[結合(Jo
i
n
)】で符号データを
追加する.
表 示 8 列を積み重ねたデータに符号データを結合
合良3
盟
符号データb
1
1
̲
勤労
'
2
1VOO3̲'有業人員
1
1 V竺±二舗の髄
1V∞三住居の建て方
1
1
1V
(
∞空手駒所有関係ょ 1
∞
;
c
木
造
1
ー一戸建
1
里宇[世帯持苧)
1V 7
.
.
:
性別
'
1
:UI~
1V
0
0
8
̲
年齢E
歳階級
2
1
1
3
!W
1
'02̲25‑29議
C議
1
̲
民営
3
1
̲30̲‑499人
iW̲
不詳
'01_~詞錯侍者
1
1
̲
勤労
~-'~札識・械業一 11
1V
0
1
0
̲
企業区分
1V山一錨揖槙
1
I
V
0
1
2
ー産業符号
瓦而=二時前
2 V∞
L世帯区分
2VOO2̲
世事票
,
2
V
W
W
V̲
不詳
W̲
不詳
IW̲
,
不
詳
1
L木
造
L一戸建
11~空]時実名義J
:
U
I
!
~02_2 5‑29
議
.
1
̲
i
時
'
1
̲
民営
i
3
̲
30‑499人
:
W
̲
'
不詳
'
o
d
詞労智障者
L勤労
2
V̲
不詳
W̲
不詳
W̲
不詳
,
このようにして得られた 416,
351行の符号データを,元の 32,
027行に【列の分割】で戻す.この
符号データを元に戻すためには,【結合 (
J
o
i
n
))で行っても良いし,置き換える列を削除して[連
5
317
結] しでもよい.表示 9に規定問題の作成に関連する変数を選択した結果を示す.
表示 9 全変数から規定問題を作成するためのサブセット
型
3948亘 コ 空 車
1
二
二i
二17.84441三是正:豆空i
竺竺l 羽 9 1~
1
0
̲
旦完二十二ゴ日・96竺竺叩て j
一戸空 1
3
9
5
0
1 珂 1_~
勾ー卸売ーゾj
…
、 !122332 2.制 1 却 500[
判 3951 1~
1O̲
卸売・小一
395
扇宙 開 .i'::-~-!06_製造業
1
4
.
9
6
6
7
' 3
.
0
2
0
7
' 342233i
1
豆町{詞問一「白白│
1
2
.
1
勾 2.4竺 L
竺型152mzB
2
.
2
0
204448 47891
1
0
.
9
0
1
5
.
6 o 3
.
1
4
8
6
1 U初 切 11‑叩82'
3j
1i
1
5j!?141
1 4
.
6
8
0
3
5 5
.
0
5
7
2
6
.
2
0
0
0
1I
1
∞
∞
∞
1
.2
5
1
3
' 105224
45739
4
.
6
6
0
3
M
Pによる解析
3
.J
JMPによる解析作業は,【一変量の分布]から始めて,表示 1
0に示すようにデータの特徴を把握
すると共に,一部のヒストグラム i
V
0
1
2
ー産業符号=
0
6
一製造業 J を選択することより,他の変数で
の選択したデータの分布がハイライトされている.
表示 1
0 JMPの 「一変量の分布 J によるヒストグラム
]唖型車扇璽
園田・・晶
│
峰叡
事串
L男
L京
合計
割合
鹿慰
29381 0.91738
2646 0.08262
32027 1
.00000
欠珊唖 N
Z水 準
0
唾E
J
*
草
傷合
3 0.00009
2143 0.06691
5841 0.18238
222 0.00693
54
ア 0.01708
1238 0.03865
2284 0.07131
511 0,
01596
40 0.00125
82 0.00256
641 0.02001
1148 0.03584
324 0.01012
1922 0.06001
3786 0.11821
11295 0.35267
32027 1
.00000
鹿致
加一位鼠
05
J!1蕗酷
06̲
1
I
臨
量
盟
回 ー 電 気 盟1
曲ー情穏過哩胞
回ー浬絡組
1
0
.
一郎潟・刷機
・
時
世
話
・
水
道
扱
1L
皇国・保股雌
u一本動産調
13
̲j量食庖・措置艶
14J
居重量・福祉
m
同」覇市・学習茸茸
16
̲j甚指ヲーピス耳噛
1
7
.
ーを才‑t::;lJ再{他!と弛輔さ抗措いち由3
1
8
̲
;
盈萄{他 I
C
骨髄自明F
品、告の】
W̲j有事芋
合計
欠甜個 N
0
16水 揚
6
318
規定課題1)産業符号・性別クロス表 規定問題の表 lは,産業符号別世帯主の性別の単純クロス表及び 1 0万世帯比でのクロス表であ る.単純クロス表の作成の基本は,【二変量の関係]で 1 0万世帯あたりのクロス表を作成するため に 「 集 計 乗 率 J を用いる.集計乗率の合計は, 495464.76574 なので, 100, 000/495464.7657= 0.201830699001665をそれぞれの集計乗率に掛ければよい.ただし,それらの合計は完全に 100, 000 ではなく, 99999.95 とわずかに小さい. 10 万世帯比のクロス表の作成には,【二変量の関係】で, iVOl4 1 0万分比」を[度数】として用いればよい.結果を表 l a に示す. 表l a 単純クロス表 型甲里 [二変量の関係]を使ったクロス表 10万世帯比でのクロス表 v ∞7̲'性 別 一 一 「 世塑 ー」 V007 ー性別 3 1 2 3 8 2 2 8 4 5 1 1 4 0 3 2 8 2 270 6 4 1 8 9 1 1 4 8 3 3 2 4 1 0 6 1 9 2 2 1 3 0 3786 1 5 9 1 1 1 2 9 5 2 6 4 6 3 2 0 2 7 。 ﹀ V012̲ ,産雛符号 04̲ 鉱業 05̲ 建設業 06 ..J製造業 0 7 ̲ ' 電気・ガス・熱供給・水道業 Q I I ̲ ; 情髄儲二 09 一運輸業 19_卸売・ 1J~糟 1 1 ̲ ' 金融・保険業 不 飲 動 食 産 庖 業 ・宿泊業 I 1 Z 3 ‑ ‑ 主ι 医療・福雄 15 一教育・学習支援業 16~複合サービス事諜 17 ーサービス業{他に分類されないちの) 18 ー公務{他に分類されないちの} 一一一一一一「 V007 性別 N 1一男 2 女 7 7 6346 31 6377 17837 510 18347 697 697 2020 2020 3852 6 3858 Q644 5 1 1 9 72 お 1551 1447 104 144 144 158 107 265 8 3 2 ' 1022 810 1 3110 269 3379 981 992 11 5842 326 6167 10691 430 11121 31204 4806 36011 。 。 。 I I 。 ド N 庁 6346 1 7 8 3 7 1 8 3 4 7 697 697 2 0 2 0 2020 3852 6 3858 6644 5 8 9 7233 1 4 4 7 1 0 4 1 5 5 1 1 4 4 1 4 4 1 5 8 1 0 7 265 1 0 2 2 8 3 2 810 1 3110 2 6 9 3 3 7 9 9 8 1 1 1 992 5842 326 6167 1 0 6 9 1 430 1 1 1 2 1 31204 4806 3 6 0 1 1 92000 8000 1 0 0 0 0 0 [表の作成]による 1 0万世帯比でのクロス表とチャート 唾坐里 w 不詳 3 2 0 1 3 9 A H O 表 I b 。 222 。 547 1 7 3 世健制珊附 耐剛健制晴樹I N g﹀ 5668 222 547 1 2 3 5 2 0 8 3 472 40 5 0 3 7 1 1 0 5 9 3 2 1 1 8 1 6 3656 9704 2 9 3 8 1 92000 80001100000 7 319 。 。 。
JMP でクロス表の作成は,【要約】による方法,あるいは【表の作成】によっても作成すること ができる.ただし,縦横の合計を求めるためには,若干の追加作業が必要となる.【二変量の関係】 で別々に出力した結果を規定課題で設定したように併合表を JMPだけで実現できないので,【表の 作成】で単純クロス表および表 l bに示した 1 0万世帯比でのクロス表を別々に作成し,結果を JMP ファイルに出力し,その結果を E x c e lに貼り付けて表 l cに示すように,縦方向の合計を出すこと にする. E x c e lの機能で縦方向の合計を算出する場合に, 10万世帯比の場合には,クロス表内のセルの度 数を縦方向に足し合わせた場合には,それぞれのセルの表示が四捨五入されて表示されているので, 000とはならないことに注意が必要である. 表示されている数字を足し合わせても合計が 100, c JMPで基本集計を行い E x c e lで整形した結果 表l a )単純クロス表 女 合計 産業符号 男 3 3 鉱業 2, 1 3 4 9 2, 1 4 3 建設業 8 4 1 1 7 3 5, 製造業 5 , 6 6 8 222 222 電気・ガス・熱供給・水道業 5 4 7 5 4 7 情報通信業 1 , 2 3 5 3 1 , 238 運輸業 2, 0 8 3 2 0 1 2, 284 卸売・小売業 金融・保険業 472 3 9 5 1 1 40 40 不動産業 8 2 飲食庖・宿泊業 5 0 3 2 医療・福祉 3 7 1 270 6 4 1 教育・学習支援業 , 1 4 8 1 , 0 5 9 8 9 1 3 2 1 3 324 複合サービス事業 , 9 2 2 1 0 6 1 サービス業(他に分類されないもの 1 , 8 1 6 公務(他に分類されないもの) 3, 6 5 6 1 3 0 3, 786 9, 704 1 , 5 9 1 1 1, 2 9 5 不詳 2 9, 3 8 1 2, 6 4 63 2, 027 合計 。 。 。 。 b)10万世帯比でのクロス表 女 合計 男 7 7 6, 346 3 1 6, 377 1 7, 8 3 7 510 1 8, 347 697 697 2, 020 2, 020 3 , 8 5 2 6 3, 858 6, 644 589 7, 233 1 , 447 1 0 4 1 , 5 5 1 1 4 4 1 4 4 1 5 8 1 0 7 265 1 , 0 2 2 810 1 , 8 3 2 3, 1 1 0 269 3, 379 9 8 1 1 1 992 5 , 8 4 2 326 6, 1 6 7 1 0 , 6 9 1 430 1 1, 1 2 1 3 1, 204 4, 806 3 6, 0 1 1 9 2, 000 8 , 000 1 0 0, 000 。 。 。 。 規定課題 2 ) 経常収入および食料費 各種の統計調査の結果の表示で 1 0階級区分が標準的に用いられている.探索的な統計解析を行 うためには煩雑であり,また統計量として 4分位点が標準的ではあるが,中央値前後で 2区分され てしまう.そこで,中央値前後を 1区分とするために 5分位に着目した. JMPの【一変量の分布】 での標準出力結果に対して【表示オプション・(分位点の間隔の設定,任意の分位点)】の設定で表 2a に示すように求めることができる.課題では集計乗率を使うように指示しているが, 1 0万世帯 比を用いても全く同じ結果となる. 8 320
表2 a 品1 Pで求めた 5分位点 IYÖO~一経常収入 11 カスタム分位点 。 │分位点 │分位点 ト岳個園田備陣内・ . . 0% 最小値 100%最大値 4, 501, 874 531 310, 20% 404, 883 40% 181 501, 60% 875 635, 80% 推 定 値 下 側95% 土 偶95% 20% 310, 531 309, 151 312, 205 883 403, 844 406, 543 40% 404, 181 499, 437 503, 010 60% 501, 80% '635, 875 633, 255 638, 808 分位粛 o600000 1600000 2800000 4000000 lYO~8. . '食料 ト 王 叶 羽 田 風W │分位点 • 11力スタム分位点 5, 977 422, 939 701 49, 63, 146 055 76, 93, 036 0% 最小値 100%量大値 20% 40% 60% 80% │分位点 分位点 推 定 値 下 倒95% 土 鍋95% 20% 40% 60% 80% 701 49, 146 63, 055 76, 036 93, 49, 622 63, 007 75, 884 92, 761 50, 017 63, 443 76, 333 93, 359 o60000 140000 240000 340000 品1 Pで求めた 5分位点を JMPデータとして出力し, E x c e lのシートに張りつけた結果を表 2 bに 示す. 表2 bE x c e lシートに貼り付けた結果 分位点 20 悦 40% 60% 80% 経常収入 推定値 3 1 0, 5 3 1 404, 8 8 3 1 8 1 5 0 1, 6 3 5, 8 7 5 食料費 推定値 49, 7 0 1 6 3, 1 4 6 7 6, 0 5 5 9 3, 036 規定課題 3 ) 男 女 別 ・ 経 常 収 入 お よ び 食 料 費 の 5分 位 分 布 経常収入および食料費を 5分位数によってカテゴリ化する方法は,集計乗率を考慮しないのであ れば,列内の数値に対する順位付けの C o lR a n k関数および整数化する C e i l i n g関数を用いて J P;I Ra巾[~例超靴λ1]ml 経常収支 5分位= I C 冶i l i n g l 「ー「 1 6 4 0 5 . 5 1 のように数値計算で求めることができる.しかしながら, 1 0万世帯比とした場合には,データ数を 1 0万世帯倍とするような重みつき順位を用いる必要があり,簡単な関数計算での求め方は,思いつ 9 321
f関数で実現することとした. この結果は,表示 9にすでに示してあ かない.そこで,最も素朴な I る. 食料費 5分位= 経常収支 5分位= ~吃僻似]<堕塑|耳目 ~え創1< 座塑I ~囲 ~印乳創1< 層雪I ~固 IfIIIYOO4~鰐似]<恒国I~ 固 ド片V38_~I< 堕劃耳目 I~モ騨似1< 匝司I~ 国 暦図書同 蹴似]<医司=四 1 1 Y038̲̲̲1< I I Y O O 4 ̲ . IIYOO4_餅似1< 同99999]1~ 国 I~色~<I拘9卿~~国 e l s e e l s e 性別の経常収入 5分位および食料費 5分位の別々のクロス表なので, 「二変量の関係」を用い帯 グラフも同時に示す. 表3 a 【二変量の関係]によるクロス表および縦棒帯グラフ Anunununununununununu 唱 =田制一rhOO﹀ A 唱 nunununununununununU 菌製 lhOO﹀ 09876543210 2̲ 女 1 一男 09876543210 1型竺里 型空璽 Y004 ー経常5 分位 性塑墾 Y038食 料5分位 型塁 V007 ー性別 度叡 1 2̲ 女 ̲ 男 合計 1 5 4 9 4 4506 20000 1 1 2 18617 1377 19993 3 19099 911 20009 1 4 19356 640 19995 5 19435 567 20002 │ 曾1 1 1 92000 8000 100000 垣市明的経腿l寸OO﹀ V007性 別 1 見 2 1 女 ̲ : │合計 1 6 8 0 3 1 3 1 9 6 1 19999 1 8 0 9 7 1 1 9 0 3 1 20000 1 8 7 3 4 1 1 2 6 8 1 20001 1 9 0 5 3 1 9 4 8 1 20001 1 9 3 1 4 1 6 8 5 1 19999 9 2 0 0 0 1 8 0 0 0 1100000 この課題は, 1 0万世帯比での性別は共通な 2つのクロス表を併合する課題である. [二変量の関 係】では,別々のクロス表であるが, [表の作成】を用いれば,表 3bに示すように複合クロス表を 0万世帯比を度数としたので集計結果は,整数でなく実数で表示 作成することができる.ただし, 1 1 0 322
されるので,【形式の変更】で小数点以下を 0とした固定小数点表示を選び,形式的に整数表示と ム ロ 表 ス ロ ク 複 スw ト ι 成 M N ‑ n ? ? m m mM 1 3一 平て一 A一 一嘉一一 一江口均一加 お 一2 の附一湖一則蜘一期一剛一則一一 9 一剛一蜘一則一宮一一肌 uh 一却一回一泊一日一Z一一 一一個一却問一羽一時一川 長 l 89 上一穿野副割叫樹劉詞耐 ↑ 一綿一日一一括一∞一面開一 持一回一一∞ J 1 ‑ 封一部一一9一 一 回 側 面 一 面ω 翰一四 白 ‑ Z1 一 q d Z一 1一 ‑J1一 一 安 一od‑一 z‑11一 位一一一一一ペ一位一一一・一一ペ の一一一一一一す一品川一一一一す 一一 2季 一 一 4 廷で一!一丈一 Z 喜 llT一 一 45 て ﹂l‑ 常一一一一一幹一一一 繕一一一一一ー一一 8一 一 4 .一 一 一 一 一 3 一一 n u 一一 O 一 ‑ u一 一 V l‑‑M 一+一一日 a0 ‑2 一 4 1 一一日一一 3 ﹁﹂一一一﹂ー﹁│戸 ﹂ │JIL‑‑r│﹁│ 表 v周囲同劇刷劇耐﹁嗣刷刺嗣制耐 した. 【二変量の関係】で作成されたクロス表を 1M Pファイルに出力した結果には,縦横の計がカッ トされているので, E x c e lの合計の関数を使って計算する必要がある.【表の作成】の場合には, r す べて J も含まれるので,そのまま張付けられる. 表3 cE x c e lにデータを取り込み縦横の計を計算 食料費 5分位数 男 女 5分位 5分位数 男 女 計 計 5, 494 4, 5 0 6 20, 0 0 0 49, 7 0 1未満 1 6, 8 0 3 3, 1 9 6 1 9, 9 9 9 3 1 0, 5 3 1未満 1 2 49, 8, 617 1 , 3 7 7 1 9, 9 9 3 7 0 1以上 1 8, 097 1 , 9 0 3 20, 000 5 3 1以上 1 3 1 0, 3 6 9, 099 9 1 1 20, 0 0 9 1 4 6 以上 1 8, 734 1 , 268 20, 0 0 1 3, 8 8 3以上 1 404, 9 4 8 20, 4 76, 9, 356 6 4 0 1 9, 9 9 5 0 5 5以上 1 9, 0 5 3 0 0 1 1 8 1以上 1 5 0 1, 0 0 2 5 9 9, 4 3 5 5 6 7 20, 036 以上 1 9, 314 6 8 5 1 9, 999 3, 8 7 5以上 1 6 3 5, 言 十 計 92, 000 8 , 000 1 0 0, 000 92, 000 8, 000 1 0 0 , 000 食料費の 5分位数に出題ミスがあり横計を一部訂正した 経常収入 5 分位 2 3 4 5 規定課題 4) 男女別・経常収入・食料費についての 3重クロス表 JMPでの多重クロス表は,【表の作成】が基本である. 1 0万世帯比を度数としたので, 3重クロ ス表は,整数でなく実数で表示されるので,【形式の変更】で小数点以下を 0とした固定小数点表 aに示す.さらに,性別ごとの計,全体の計を入れ 示を選び,形式的に整数表示とした結果を表 4 るために【集計統計量の追加】を選択する. 【表の作成】に引き続き,【データテープ、ルに出力】を実行し,結果を JMPテーブルに出力し, bに示すように E x c e lシートに貼り付ける. 必要な部分を選択コピーし,表 4 1 1 323
表4 a (表の作成]による 3重クロス表の作成 望竺型空 τ { す ペ 表 4b E x c e lによる 3重クロス表の整形 経常収入 5分位 男 2 3 4 5 計 女 2 3 4 5 計 男女計 規定課題 5, 8 2 7 5, 1 3 0 2, 9 1 1 1 , 906 1 , 029 1 6, 8 0 3 2, 462 3 7 1 2 4 3 6 8 5 3 3, 1 9 6 1 9, 9 9 9 5分位) 食料 ( 3 4 2 3, 974 2, 798 1 , 834 4, 5 0 1 3, 9 7 8 2, 996 294 4, 4, 3 0 1 4, 3 9 5 4, 082 3, 2 3 3 9 0 3 4, 2, 0 8 7 3, 4 8 1 5, 026 8, 734 1 9, 0 5 3 1 8, 0 9 7 1 994 5 6 5 314 3 9 9 235 2 1 1 2 2 5 216 1 6 4 1 3 4 1 5 6 1 4 3 1 5 2 1 1 7 96 1 , 268 948 1 , 9 0 3 0 0 1 20, 0 0 1 20, 000 20, 5 計 1 , 060 1 5, 494 2, 012 1 8, 617 3, 1 9 8 1 9, 099 5, 2 3 1 1 9, 356 7, 8 1 3 1 9, 435 1 9, 314 9 2, 000 1 7 2 4, 506 1 6 1 1 , 377 6 3 9 1 1 1 4 0 640 1 4 9 567 685 8, 000 1 9, 999 1 0 0, 000 5) 男 女 別 ・ 経 常 収 入 別 に 食 料 費 を 常 用 対 数 変 換 し た 平 均 値 の 比 較 性別の経常収入 5分位についての 1 0万世帯比のクロス表は,すでに規定課題 3 )作成した結果に 一致する.食料費の常用対数変換は, LogI0関数を用いる.幾何平均の計算は,別途行わなければ ならないので,【要約]で対応することにする. [要約】では, 1 0万世帯比を[度数]に,性別および経常収支 5分位を【グループ化]に,常用 対数(食料費)を統計量欄から (N】および【平均]を選択して,【統計量】に入れる.結果は品。 データとして得られるので,幾何平均は, 1 2 324
幾 何 平 均 = 困 │ 時 間 足 掛f 切 1 で別途計算する.性別の統計量は計算されていないので,【要約】によって性別のみで計算し,表 5 aに示すように手作業で 1MPテーブルに挿入する.この結果をコピーし, E x c e lシートに張りつけ た結果を表 5 bに示す. 表5 a JMPによる幾何平均 q弓ヨ (G) 1 1546 4, 506 2 424 1 , 377 3 289 911 例0 5 6 7, 8ρ00' 表5 b 九四データの E x c e lシートへの貼り付け 経常収入 5分 位 男 2 3 4 5 言 十 女 2 3 4 5 計 食料 世帯数 1 5, 494 617 1 8, 1 9, 099 1 9 , 356 1 9 , 435 92, 000 506 4, 1 , 377 9 1 1 640 567 8, 000 常用対数平均 4 . 7 3 8 9 4 . 7 8 3 2 4 . 8 3 6 8 4 . 8 8 2 6 4 . 9 3 3 5 4 . 8 3 9 5 4 . 6 7 1 3 4 . 7 8 1 1 4 . 7 8 1 3 4 . 8 6 1 7 4 . 8 7 7 4 4 . 7 3 2 5 幾何平均 54 , 814 60 , 704 68 , 6 7 5 , 3 1 1 76 8 5, 793 69, 1 0 7 46 , 9 1 3 60 , 405 60 , 439 72, 730 75, 407 54 , 018 幾何平均の折れ線グラフは,【重ね合わせプロット】を用いる.幾何平均を [ y l に,経常 5分位 を [X】に,性別を【グ、ノレープ変数]にいれ,出力されたデ ィフォルト画面を図表 5 c に示すよう 13 325
に GUI機能で調整する.このスクリプトは,図表 5d に示すように JMPテーブルに貼り付けてあ り,何時でも再現できる. c JMPによる幾何平均の折れ線グラフ 図表 5 置ね命わゼブロ V ト 9 0, 0 0 0 8 0, 0 0 0 i70000 0 0 0 5 0, , 0004‑‑‑ 4 0 1 グループ 0 2 3 4 YOO 七経常5 分位 一 V007̲:性別 =1̲男 5 + 一 一 V007̲: 性別 = 2 一女 図表 5d JMPによる折れ線グラフ作成のための自動保存されたスクリプト │説的信プロ vト l 重ね合わせブロット【 X (: Y日 4 ー経常 5 分位】, Y( :幾何平均), グルーブ変数【:¥10 0 7 ̲ . . : 1 生 j J ] l, ) グルーブの重ね合わせ, Y 軸[ 1 ]< <{{最小値(39982 ),最大値【 94457 ),目盛り間隔( 10000, ) ) LabeIRo四 N e s t ln g( 1 ),ラベル行【 補助目盛り( 1, { S h o wM a j o rGrid( 1, 】 ShowMlnorGrid( 1】 } ) } }, J 点をつなぐ【 1, ) レポートへ送信【 ディスパッチ t { } , " 1 0 6 S c a l e B o x【2, 】 f 最小値【 39982 ),最大値【 94457, ) E I盛り間隔(100日目), ) LabeIRo田 Nesting( 1 ),ラぺル行【 補助目盛り(1, S h日明 M a j o rG r l d【1, ) Sho咽 Mlnor Grid【1)} 【 ヘ 】 】 ディスパッチ【 【 】 , " O v er1 a y P1 o tG r a p h ", F r a m e B口x(3, 】 】 【フレームサイズ【 259,254),マーカーサイズ(4 ),線の幅のスケール【 3】 ディスパッチ( { 】 , " " , LegendBox,{タイトルの指定【"タル}ブ")}】 14 326
4 . 考察 擬似ミクロデータを用いたこれまでの「ミクロデータ分析コンテスト」の優秀論文は, S ASユー ASあるいは JMPの使用経験のある人達に ザー総会の論文集にすべて収録され公開されており, S t a t aで経済データの統計解析日)を実施してい は容易に理解できると思われるが,他の統計ソフト S る人たちには,平易ではないと思われる.そこで, S ASおよび JMPの使用歴のない人達を念頭に したチュートリアルを,第 4回目の規定問題を題材に行うことにした. 擬似ミクロデータは,先頭行に変数名が付いていない CSV形式であるので,九四で内容の把握 しやすい変数名を GUIベースで付ける必要がある.規定問題の範囲内の限定された変数ならば,手 作業で変数名を付け替えることは容易で、はあるが,更なる探索的な解析を行う場合には推奨するこ 9 7変数を一括した変数名の付け替え方法を示した. とはできない.そこで,全 1 名義変数のカテゴリ名は,できる限り整数でコーディングし,統計ソフトのプログラムで符号(コ ード)と符号名(カテゴリ名)の対応付けを一括して行うのは, S ASなどのプログラミング言語系 の統計ソフトの一般的な対応である. GUI系の J MPでは,符号と符号名を手作業で変更入力する 必要があり,きわめて煩雑であり推奨できない.元の符号名自体がデータとして入力されていれば, 品1 Pではそのまま各種の解析が問題なくできるので,全ての変数の符号名を事前に E x c e lで整形し, Pファイルとして取り込み, リレーショナルデータベース的な GUI操作で,一括して置き換え 1M る方法を示した. このように統計解析を行うために利用者が煩雑な前処理を必要とすることは, 教育的"ではあ るものの擬似ミクロデータ使って統計教育を推進しようとする者にとって阻害要因である.目的と する集計表が明示されていて, F o r t r a nあるいは Cobolなどのプログラミング、言語を使ってプログラ ミングする場合には,表示 4 で示したレイアウトシートが不可欠で、あることは承知している. し かしながら,多くの統計ソフトが普及し,現在, F o r t r a nあるいは Cobolなどのプログラミング言語 を使って統計解析を行っている人達の存在を確認できない. 擬似ミクロデータのレイアウトシートに「位置」と「バイト数」が示され,その中に「項目の区 切り Jとしてカンマ[", Jもあることから,古典的な大型コンビュータ時代の流れをくんだ固定長レ コードと E x c e lでも操作できる CSV形式となっていることに苦肉の努力がなされている.区切り記 号が入つてなければ, JMPおよび E x c e lでデータを扱うことは不可能で、,筆者も慣れ親しんできた SASで固定長のデータと認識したプログラミングが統計解析に不可欠となる.さいわいハイブリッ ドな固定長 CSV形式で、のデータ提供であったので, J MPでの統計解析が可能となった. コード化された名義尺度データに対しでも古典的な「レイアウトシート」ではなく,表示 5で示 したような「変数名テーブノレ」があれば,速やかに解析のためのデータファイルを生成で、きる.ま た,表示 7で示した「符号テーブル」があれば,リレーショナル DB的な操作で,データセット内 の符号を符号名にすることは,本稿で示したように容易である. 第 4回目の規定問題は,集計乗率から推定される 10万世帯比での集計・解析を主体にした.集 計乗率は実数で提供されており,各種の統計量の算出に際しては,集計乗率を「重みJ として使 うものと文献 7) での記述により思い込みをしていた.これは,誤解であることが,ミクロデータの 解析の経験をつむ事により実感してきた. S ASおよび品。には,集計乗率を「重み」として使う ことも,実数ではあるが「度数J として扱うことも可能であり, [ " 度 数J として設定することが適 1 5 327
切であることを規定問題の作成を通して確認した.
0万人比 (
1
0万世帯比)で
政府系のミクロデータの統計解析の基本は,集計乗率から推定する 1
あることを再認識し規定問題の中心とした.また,政府系の統計資料では, 10階級区分が標準的に
用いられているが,探索的な統計解析を行うためには重すぎるので, 10万世帯比に対する 5階級区
分とし規定問題に取り込んだ.
1に示した不揃いの二元配置分散分析を念頭に常用対数変換お
最後の規定問題 5) では,表示 1
よび幾何平均なども盛り込んだ問題としたのであるが,共同主催者から経済統計の分野では一般的
ではないので,規定問題としてはし、かがなものかとのコメントがあり,設聞を丁寧に書き直して最
終的には, 2元配置分散分析での交互作用の解釈をするための折れ線グラフの作成ができるように
段階的な設問に変更した.
表示 1
1
r
度数J を 10万世帯比をした二元配置分散分析の交互作用解析プロット
i
効果の健
事方穂
暗 闘t{Prob>F)
7.23392 312.8156
<.0001*
4 130.22158 1407.790
<.0001*
<.0001本
4
4.57338 49.
4
416
144
バラメー苦言語量告白鹿
奮闘
'
¥
}
i
i
i
0
Y
C
1
陸側
VO04̲
1
a
霊
常5分位
V007̲:
性
}
]
I
J
吋 004
̲j経常5分位
l
1
5
.
0
男
コ
4
.
9
C
守
l
4
女
cl
0
義4.8
R
。
>
‑4
.
7
4
.
6
1
2
3
4
5
経常収入 5分位
表示 1
2および 1
3にしめした 1
0万世帯比および集計常率を「重み」とした分散分析は,誤差分
散の不一致などにより微妙に異なり完全に一致しない.どのように使い分けるのか,何が適切なの
かは,今後の検討課題である.一般的には,重みは該当するデータの分散の逆数とすることが知ら
れているが,ミクロデータの「重みJ一般的な定義とは異なり,本質的には「度数j であり,どの
ように正当化するのかの検討も今後の課題である.
1
6
328
表示 1 2 i 重 みj を 1 0万世帯比した二元配置分散分析の交互作用解析 │ │効果の検定 F 値 p 値( Prob> 円 1 7 . 2 3 3 9 21 0 0 . 1 6 4 2 < . 0 0 0 1* 4 1 3 0 . 2 2 1 5 84 5 0 . 7 7 7 3 < . 0 0 0 1* 4 4 . 5 7 3 3 8 1 5 . 8 3 1 3 < . 0 0 0 1キ J( ラメータ数自由康 要図 V 0 0 7 ̲ ' 性別 経 常5 分位 Y 0 0 4 ̲ i 一 間g * Y 0 0 4 ̲ j 緩 常5 分位 V007 1 4 4 平方和 平方和は「度数」の場合と同じだが,誤差の平均平方が大きいため F値が小さい 表示 1 3 i 重み」を集計乗率とした二元配置分散分析の交互作用解析 i │効果の検定 パラメータ盟主自由康 悪因 V 0 0 7 ̲ ' 性別 Y004 一経常5 分位 V007 一性別町0 04 ̲j経常 5 分位 1 4 4 平方和 F値 p 傭( Prob>円 1 3 5 . 8 4 1 5 41 0 0 . 1 6 4 2 4 6 4 5 . 2 0 2 3 74 5 0 . 7 7 7 3 4 2 2 . 6 5 9 5 0 1 5 . 8 3 1 3 < . 0 0 0 1 < . 0 0 0 1 < . 0 0 0 1* 本 ネ 平方和は異なるが,誤差の平均平方も大きくなるため ,F値は 1 0万世帯比を「重み」にした場合と同じ 文献 1 ) 高橋行雄,周防節雄 ( 2 0日),統計センター提供の教育用擬似ミクロデータを用いた SAS/JMPによる t t o : / / w w w . n s t a c . g o . i o / s e r v i c e s / o d f /I 3 1 1 2 24 ・ l .o d f . データ分析コンテストの概要, h 2 ) 独立行政法人統計センター ( 2 0 1 2 ),教育用擬似ミクロデータの開発とその利用 平成 1 6年全国消費 実態調査を例として~, h t t o : / / w w w . n s t a c . g o . i o / s e r v i c e s / o d f / s a n k o u s i r v o u 2 4 0 7 . o d f . 3 ) 周防節雄 ( 2 0 1 6 ),SASユーザー総会 2 0 1 6における i L e t 'sデ ー タ 分 析 第 4回ミクロデータ分析コンテストJ の規定課題の S ASプログラム解説, SASユーザー総会 2 0 1 6論文集掲載予定. 4 ) 周防節雄 ( 2 0 1 5 ),全国消費実態調査の匿名データとその符号表から自動的に SASのデータセット,変数ラ ム , SASユーザー総会 2 0 1 5論文集, 2 5 7 ‑ 2 7 8 . ベルと変数フォーマットを作成する SASプログ ラ F 2 0 1 5 ),統計センターの匿名データ 1 3万件を用いた統計解析の実践, SASユーザー総会 2 0 1 5 5 ) 高橋行雄 ( 論文集, 1 4 5・1 6 4 . 2 0 11 ) , S t a t aで計量経済学入門第 2版 , ミネルヴァ書房. 6 ) 筒井淳也,平井裕久,水谷正明ら ( 7 ) 二木美苗 ( 2 0 1 3 ), i 全国消費実態調査匿名データの整理概要一 k umad o及び変数対応表の活用方 t t p : / / w w w . e c o n . k o b e ‑ u . a c . j p /k uma / s a t e l l i t e / p df / 3 0 8 . p d f . 法を中心に J,h 2 0 0 0 ),ミクロ統計の集計解析と技法, 日本評論社. 8 ) 松田芳郎,伴金美,美添泰人編著 ( 1 7 329
SASユーザー総会 2 0 1 6における f L e t ' sデ ー タ 分 析 第 4回ミクロデータ分析コンテスト」の 規定課題の SASプログラム解説 周防節雄 兵庫県立大学・名誉教授 ExemplarySAS Programst oS o l v et h eCompulsoryE x e r c i s e s t h f o rt h e4 M i c r o DataC o m p e t i t i o ni nSASJapan UsersForum2016 S e t s u oSuoh P r o f e s s o rE m e r i t u so ft h eU n i v e r s i t yo fHyogo 要旨 SASユーザー総会 2 0 1 6における r L e t 'sデ ー タ 分 析 第 4回ミクロデータ分析コンテスト」の規定課題に ついて、出題者の立場から、模範解答の SASプログラムを解説する。 キーワード 全国消費実態調査、教育用擬似ミクロデー夕、 p r o cf r e q、p r o ct a b u l a t e 1 . はじめに 政府機関や地方公共団体が実査する統計調査から得られた統計調査データは、一般的に公的 統計と言われる。これらは、全数調査もあれば、標本調査もある。 b、ずれにしても、我々一般ユー ザーの利用に提供される際は、その全サンプルが入手できる訳ではなく、部分的に抽出されたミク ロデータが提供される。その際、元の母集団が推定できるように、各レコードには集計用乗率(復元 乗率とも言う)が付与されている。 独立行政法人統計センターは、平成 1 6年の全国消費実態調査のミクロデータから教育目的で 擬似ミクロデータを作成して、公的ミクロデータの利用実習用に提供してきた。 SASユーザー総会 0 1 3年からこの教育用擬似ミクロデータ(以後、「擬似ミクロデータ」と略称する)を使用して、 では、 2 毎年、データコンペを実施してきで、今年で 4回目を数える。このコンペは、規定課題(付録 5参照) と自由課題から成り、規定課題は参加者全員に課せられる。 今年の規定課題では集計用乗率を考慮したプログラミングが要求される。本稿では、この規定 課題のための SASプログラムを解説する。 2 . 教育用擬似ミクロデータの概要 統計センターから提供される擬似ミクロデータは7個の CSVファイルに分割されている。これらの CSVファイルにはメタ情報がないので、これだけでは使えないが、この他にメタ情報として「符号表」 )というエクセル形式のファイルがあり、これがメタ情報として CSVファイルに対応している 1。そ ( 表1 の中にある変数名を使って SASのデータセットに変換した。ただし、変数名の先頭部に r Y o u t o Jが 付いている変数は、全て r Y o u t o Jを r Y Jに r e n a m eして使い易くした。できあがった SASデータセット 1 このメタ情報を使って、 CSVファイルから SASデータセットへの自動変換については、(周防 2 014a, b )で詳細に解説して いる。 330
は世帯を単位とする 3 2, 027オプ、ザベーションから成る。付録 2に 全 て の 変 数 を 示 す2。 規 定 問 題 では、黒く塗りつぶした4つ の 変 数 だ け を 使 え ば よ い 。 後 で 製 表 の 際 に 必 要 に な る の で 、 「 性 別 」 と 「産業符号」の変数用に f o r r n a tを定義しておく(表 2 右)。この procformatは 符 号 表 を 使 っ て S AS プログラムから自動作成された(周防 2 014a, b ) 。 表 1 符号表 項目名 置 位 │ 型 符号肉容 符号 変数名 勤労 1 Se t a l K u b u n 1m 帯且苛 嘉 項 勤 蔵 労 目 一 以 の 外 一 区 切 一 一 り 世帯謀 世帯人艮 I S e 回U i n 、 旬 ー 1 2、 l 項│E の区切り 、̲ │ 不i │ 項 自の区切り I A 2 ‑ i n l. d .l ‑ Iw 有寒人員 1 0 出瞳墨霊 l 木造 │防火木造 I K o u z o u I 俵 そ 骨 の 他 ・ 銀 { 扇 ブ コ ロ シ ッ ヲ ヲ 造 リ ー り2 ; . ‑ ̲ 1 ! 造 り な ど 1 . ト遁 1 E │ 不 詳 l 項目の区切り I v 1 0 中略 1 5 2 . 辺5・ を 田 畑 ヨZ里 1 5 2 7│ 緑題全 型塑 1 2 9 4 3 1 2 四 41 5 直~ 国型 Y o u t o 1 8 1 ー Youto18~ Y o 凶 。1 8 3 表 2 変 数 Sl̲Sangyou 元の値 数値型 符号内容 文字型 に変換 企1 1農業 . 1 1 .2 2林業 . 1 .3 3漁業 . 1 .4 4鉱業 . 1 .5 5建援業 . 1 .6 6製造業 企7 7電気・ガス・熱供給・水道業 企8 8情報通信業 企9 9運輸業 1 0 1 0卸売・小売業 11 1 1金融・保険業 1 2 1 2不動産業 13 1 3飲食底・宿泊業 1 4 1 4医療・福祉 1 5 1 5教育・学習支媛業 1 6 1 6複 合 サ ピス事業 1 7 1 7サ ピス業(他に分類されないもの) 18 1 8公務{他に分類されないもの) 1 9 1 9その他(非就業を含む) w 不詳 (符号表から作成) 自の区切り i I 自の区切り procformat; v a l u exS1̲Sangyou 1 = "農業・・ 2="林業・・ 3="漁業" 4 = 1 1鉱業" 5="建 設 業 " 6="製 造 業 " 7="電 気 ・ ガ ス ・ 熱 供 給 ・ 水 道 業 " 8=" 情報通信業" 9="運 輸 業 " 10="卸 売 ・ 小 売 業 " 11="金 融 ・ 保 険 業 " 12="不 動 産 業 " 13="飲 食 庖 ・ 宿 泊 業 " 14="医 療 ・ 福 祉 " 15=" 教育・学習支援業" 16=" 複合サービス事業" 17=" サービス業(他に分類されないもの) " 18="公 務 ( 他 に 分 類 さ れ な い も の ) " 19="そ の 他 ( 非 就 業 を 含 む ) " .="不詳"; v a l u exS1 Sex 1="男" I ~="3t"; 注側プログラム rgUi̲form批判から一軸出│ r u n ; 2 この変数一覧表は付録 1のプログラムにある p r o cd a t a s e t sからの出力リストを、保存の物理的順序に並べ替 えたものである。このプログラムは、オプザベーション数が多いデータセットの場合に、便利なツールである。 331
3 . 集計用乗率 ここでは、集計用乗率(変数名 : w e i g h t )について簡単に解説する。 32, 027オプザベーションの変 数w e i g h tの値を全て合計すると、 495464.76574になる。因みに、最初のオブザベーションの w e i g h t の値は 1 8 . 9、二番目のオブ、ザベーションでは 1 5. 43333である。これは、全体の母集団の中でそれ ぞ れ 0.0000381460(=1 8 . 9‑ ; ‑ 4 9 5 4 6 4 . 7 6 5 7 4 )、0 . 0 0 0 0 3 1 1 4 9 2(=1 5. 43333‑ ; ‑4 9 5 4 6 4 . 7 6 5 7 4 )の比 重があるということである。つまり、提供された擬似ミクロデータでは、共に 1件分のレコード、であるが、 母集団を推定する時は、件数が変わるということになる。この割り算の値に 1 0 0を掛ければ、全体を 100 オプザベーションとした時のオプザベーション数になる。 従って、全体を 1 0 0万オブザベーションとすると、それぞれ、オプザベーションが 3 8 . 1 4 6 0個(= 0.0000381460X1 0 0万 ) 、 31 . 1492個 (=0.0000311492X1 0 0万)あることになる。 今回の規定問 題の中には 1 0 0万世帯比で計算する課題があるが、その時は、この集計用乗率を使用しなければ ならない。 4 . 規定問題のプログラム解説 模範解答の SASプログラムは付録3に掲載している。説明用に各行には連番号を付している。プ ログラムから結果 v i e w e r画面(付録4 )に出力するときは、必ず t i t l e文を付して、プログラムのどの 箇所からの出力かがすぐに分かるように配慮している。以下の解説では、該当するプログラムの行 番号を f # 3 Jのように先頭で明示している。 Jのうち、規定問題に関係するおr m a t文だけ # 3 :% i n c l u d eしている SASプログ ラム f g i j i ̲ r o r m a t品 s を抜き出して、表2(右)に示している。 # 6 : 教育用擬似ミクロデータの SASデータセット z e n s h oは、付録 2に示す変数から成り、オブザ 027件ある。ここで規定問題に必要な変数(付録 2の黒色のセルに白字)だけでテ ベーションは 32, ンポラリデータセット k a d a iを作成する。変数名もわかりやすい名前に renameした。 # 9 : 集計用乗率の変数 w e i g h tの合計を計算して、変数 allWGTに保存。 # 3 8 . . . . . . . 3 9で使う。 # 1 7 :p r o cf r e qを使って、課題の表 1の r a)単純クロス表」完成。 = ta b l e 1で、「乗率あり」のクロス表を出力すると同時に、 # 2 7 :p r o cf r e qの t a b l e s文のオプション o u t データセット t a b l eにその結果を保存する。変数 COUNTとPERCENTは SASが自動作成する。 # 3 4 : そのデータセット t a b l eの中味を表示。その際、 sum文 で 変 数 COUNTとPERCENTの合計 値も表示させて、この変数の意味を確認。 # 3 8 : データセット k a d a iの最後のオプザベーションの変数 allWGTの値を、 % p u t文でマクロ変数 l I WGTでこのプログラム中で使える。制Oで確認。 allWGTに格納する。これ以後、この値は&a # 4 2 : データセット k a d a iに元々ある集計用乗率 w e i g h tを使って、 1 0万比に換算した乗率 wgt10manを計算して、データセット newWGTに追加・保存。 wgtlOm叩 の 累 計 a l l w g t 1 0 m a nも計算 しておき、最後のオブザベーションの時に LOG画面に f a l l w g t 1 0 m a n = 1 0 0 0 0 0 Jを出力して、確認。 # 4 8 : データセット newWGTを使って、 1 0万比の乗率で度数分布表作成。 # 5 6 : 上で作成した度数分布表と閉じ表を、オプション FORMAT=COMMA6.を使って、小数点な しで再計算。課題の表1の fb)10万世帯比でのクロス表J完成。 # 6 6 :p r o cs g p l o tを使って、乗率を考慮した経常収支のヒストグラムを作図。 #71:p r o cs g p l o tを使って、乗率を考慮した食料費のヒストグラムを作図。 332
# 8 0 :p r o cu n i v a r i a t eを使って、デ、ータセット newWGTから集計用乗率を使って、経常収入と食料 費の 5 分位点を求め、新しいデータセット fivePCTL を作成。変数 income20~income80 、 food20~ f o o d 8 0の 8変数で、オブ、ザベーションは l個 。w e i g h t文を使わなければヒストグラムは自動的に出 力されるが、 w e i g h t文を使うと出力されないので、先に、 p r o cs g p l o tでヒストグラムを描いた。 # 9 0 : p r o ct r a n s p o s eを使って、 1 オフ守ザベーションのデータセット fivePCTLを縦に並べ替え、新 i n i s h T a b l e 2を作成。 しいデータセット f # 9 4 : データセット t i n i s h T a b l e 2を加工して課題の表 2の原型になるデータセット TB2SEIRIを作成。 # 1 0 2 : データセット TB2SEIRIを、経常収入と食料費で別々のデータセット i n c o m eとf o o dに分割。 #111:データセット i n c o m eとf o o dを横並びにマージして、課題の表 2が完成。 持1 1 9 : 数値変数 income20の値をマクロ変数 i n c o m e 2 0に格納する方法を確認。 # 1 2 0 :% p u t文を実行すると LOG画面に " 3 1 0 5 31 .0652"(:表示。これは経常収入の 20% 分位点。 # 1 2 2 : 先に作成したデータセット tivePCTLの 8個の変数を四捨五入して小数点以下を削除する。 # 1 2 9 :o p t i o n smacrogenを使うと、この直後の SASマクロの展開結果をし OG画面に表示してくれ るので、マクロが正しく展開されたかを確認できる。 #130: データセット fivePCTL の 8 個の変数 income20~incom巴80 、 food20~food80 の値を閉じ名 前のマクロ変数に格納。 # 1 5 0 : 経常収入と食料費の 5分位用の f o r m a tを、上で、設定したマクロ変数を使って定義するマク ロf o r m a tを作成。 # 1 6 8 : マクロ f o r m a tを実行。以後、フォーマット i n c o m e .とf o o d .が使用可能。 # 1 7 0 : 乗率 wgt10manを使って経常収入の 5分位毎の頻度表を出力。 # 1 7 6 : 乗率 wgt10manを使って食料費の 5分位毎の頻度表を出力。課題の表3が完成。 # 1 8 3 : 課題の表4の右端の「計J 欄を 1 0万比の乗率で計算するための工夫。変数 Xの値を Hこ設 定することで、これが乗率に応じて膨れる。 # 1 8 5 :p r o ct a b u l a t eで、先に定義したフォーマットを使えば、 5分位毎の分布が計算できる。課題 の表4完成。 # 1 9 8 : データセット newWGTを使って、食料費の常用対数を計算、データセット t a b l e 5 を作成。 # 2 0 2 :p r o ct a b u l a t eでデータセット t a b l e 5を使って、課題の表 5のうち、幾何平均欄以外の部分が 0万比の乗率を使ってし、るが、 SUMWGTを使うのがミソ。この後で幾何平均を計算するた 完成。 1 めに、この結果表をデータセット r e s u l t 5に保存しておく。 # 2 1 7 : 直ぐ上で出力したデータセット r e s u l t 5を性別にあらかじめソートしておく。 # 2 2 4 : データセット r e s u l t 5を使って、幾何平均を計算し、データセット f i n al ̲ r e s u l t 5を作成。 # 2 2 9 :p r o cp r i n tを使って、データセット日 n a L r e s u l t 5を LABEL文併用すれば、課題の表5が完成。 # 2 3 6 : データセット f i n a l ̲ r e s u l t 5を使って折れ線グ ラフを描くのに、「計」の列が不要なので削除し l o tを作成。 て、データセット p # 2 4 3 : データセット p l o t を使って、 p r o cs g p l o tで、折れ線グラフを作図。男女で折れ線の色の区別 はできるが、線種や糠の太さの指定がうまく効かないので、モノクロで、印刷すると、男女が識別でき P ないのが懸案事項として残る。 5 . まとめ 公的統計のミクロデータを分析するときは、常に集計用乗率を意識する必要がある。つまり、入手 したデータは全数ではないので、母集団を推定するのに必要な情報となる。今回の規定問題では、 p r o ct a b u l a t eを使うケースが多いが、 w e i g h t文を使うと、ヒストグラムが出力されないので、別途方 333
法を考えなければならない。今回、 SAS9.4から使えるようになった p r o cs g p l o tを使ったが、当初、 その存在を知らなかったo 新機能は絶えず気をつけていないとその存在すら知らないことになる。一昔前までは、 SAS のパ ージョンが上がる度に印刷物のマニュアルを購入していたが、いつのまにか冊数が増えてきたので 止めた。今では、大抵のことは、ネット上で必要な情報が得られるが、それでも分からない時は、知 0 1 1年に神戸で開催され り合いの SASのヘビーユーザーに質問して教えてもらうことにしている。 2 た SASユーザー総会で数独を解く SASプログラムを報告したが、その英語版を翌年に米国フロリ l o b a lForum2012で報告をした。この時、地元のユーザーから p r o cFCMP ダで開催された SASG がS AS9.3から使えるようになり、自作の SASサブソレーティンや SAS関数が作れることを初めて聞い た。このプロシジャーについては、昨年の東大での SASユーザー総会で、チュートリアルをした。日 本のユーザーでも SASユーザー総会で、この機能を使ってし、る報告を見つけたので、しっかりと新 機能について目を光らせているユーザーもし、るのだなと感心した。 実を言うと、今回のデータコンペの規定問題を自分で出題していながら、ヒストグラムや折れ線グ ラフを描くのに手こずった。普段から使っていれば何でもない難易度なのだが、自分では SASでグ ラフを描くことは余りないので、大変勉強になった。何人かの知人の知恵を借りた。 SASのヘビーユ ーザーになる近道は、自分の周りにヘビーユーザーの輪を作ることと心得た。 参考文献 1.周防節雄 ( 2 0 1 4 a )政府統計ミクロデータの符号表から SAS変数のラベルとフォーマットを自動生 成する SASプログラムの作成方法、 WSASユーザー総会 2 0 1 4論文集』、 p p 8 3 1 ‑ 8 4 4 2 0 1 4 b )教育用擬似ミクロデータの符号表から SASデータセット用の変数ラベルと変数フ 2 .周防節雄 ( ォーマットを自動作成する SASプログ ラム、「公的統計のミクロデータ等を用いた研究の新展開」研究 t t p : / / m i g h t y . g k . u ‑ h y o g o . a c必I c o n f i d e n t i a l /s u o h 2 01 4日 21 .h t m l、統計数理研究所 集会、 h 謝辞 全国消費実態調査の教育用擬似ミクロデータの利用に便宜を図って頂いた(独)統計センターに感 謝の意を表します。本稿は学術振興会科学研究費(課題番号 2 4 5 3 0 2 3 2 :研究代表者・周防節雄)によ る研究成果の一部である。記して謝意に代えたい。 付録 1 SASデータセットの変数一覧表を出力するプログラム 1 * 一一一一一一.l o o k d a t a .s a s ' 一一一一一一一一一一一一ー一一一一ー一一一一一ー ‑ * I 牢 / U t i li t yp r o g r a mt od i s p l a ya l1i n f o r m a t i o ni nas p e c i f i e ds a sd a t a s e t * 1 1 * 一一一一一一一一ー一一一* 1 *S p e c i f yt h ef o ll o w i n gm a c r ov a r i a b l e s ; *O n l ys p e c i f i e dn u m b e ro fo b s e r v a t i o n sa r ed i s p l a y e di nR e s u l tV i e w e rw i n d o w ; ホ/唱 l e tl i b n a m e =s u o h ; 1 * l i bn a m e ( 1i b r e fo rl s t ‑ l e v e ln a m e ) /吋 i f i n i t i o no fl i bn a m e [ d r i v en a m e平d i r e c t o r yn a m e ]キ / 引e t1 i b ̲ w h a t =F :平全消¥全消擬似ミクロデータ¥zensho̲permanent; / キS A Sd a t a s e tn a m e ( n oe x t e n s i o n ) ホ/首 l e td s n a m e ニ z e n s h o ; I * N u m b e ro fo b s e r v a t i o n ss h o w ni nR e s u l tV i e w e r ホ/略 l e to b s ̲ n o =1 ; 1 i b n a m e& 1i b n a m e" 品1 i bw h a t " ; o p t i o n sI s = 7 4p s = 6 0n o c e n t e rn o n u m b e r ; p r o cd a t a s e t sl i b r a r y = 品1 i b n a m e ;c o n t e n t sd a t a = & d s n a m e ;r u n ;q u i t ; 品o b s ̲ n o ); p r o cp r i n td a t a = & l i b n a m e . . & d s n a m e ( o b s = t i t l e " S A Sd a t a s e tn a m e : 品l i b ̲ w h a t . . & d s n a m e( f i r s t& o b s ̲ n o .o b s e r v a t i o n so n l y ) " ; r u n ; 334
付録2 変数一覧表 335
付録 3 模範解答プログラム
1 ホ
/ S
A
S
c
o
m
p
e
2
0
1
6
k
i
t
e
i完成 .
s
a
s*
/o
p
t
i
o
n
sn
o
c
e
n
t
e
r
:引 e
td
r
i
v
e
=
F
:
e
n
s
h
o
̲
pe
r
m
a
n
e
n
t
"
:
2 l
i
b
n
a
m
eg
i
j
i"
&
d
r
i
v
e
:¥全消¥全消擬似ミクロデータ¥z
n
c
l
u
d
e"
&
d
r
i
v
e
:¥全消平全消援似ミクロデータ¥p
r
o
g
r
a
m
'
平g
i
j
i
̲
f
o
r
m
a
t
.
s
a
s
"
:
3 略i
4
5 **表,*:
a
t
ak
a
d
a
i
:s
e
tg
i
j.
iz
e
n
s
h
o
:
6 d
k
e
e
pS
l
̲
S
a
n
g
y
o
uS
l
̲
S
e
xY
4Y
3
8w
e
i
g
h
ta
I
I
W
G
T
:
7
=
f
o
o
d
:
r
e
n
a
m
eS
l
̲
S
a
n
g
y
o
u=
i
n
d
u
s
t
r
yS
l
̲
S
e
x
=
s
e
xY
4
=i
n
c
o
m
eY
3
8
吋 e
i
g
h
t
:
a
l
l
W
G
T
1
0 r
u
n
:
1
1
r
o
cp
r
i
n
td
a
t
a
=
k
a
d
a
i(
o
b
s
=
1
5
)
:v
a
ri
n
d
u
s
t
r
ys
e
xi
n
c
α
n
ef
o
o
dw
e
i
g
h
ta
I
I
W
G
T
:
1
2 p
f
o
r
m
a
tw
e
i
g
h
tF
1
2
.
6
:
1
3
f
o
r
m
a
ta
l
l
W
G
TF
1
2
.
6
:
1
4
a
t
a
=
k
a
d
a
i(
o
b
s
=
1
5
)
"
:r
u
n
:
t
i
t
l
e"*表,*① d
1
5
1
6
r
o
cf
r
e
qd
a
t
a
=
k
a
d
a
i
:
1
7 p
t
a
b
l
e
si
n
d
u
s
t
r
y
*
s
e
x/m
i
s
s
i
n
gn
o
c
o
ln
o
r
o
wn
o
p
e
r
c
e
n
t
:
1
8
f
o
r
m
a
ti
n
d
u
s
t
r
yx
S
1
̲
S
a
n
g
y
o
u
.:
1
9
2
0
f
o
r
m
a
ts
e
xx
S
1
̲
S
e
x
.:
p
r
o
cf
r
e
q
) 乗率なし".
t
i
t
l
e"*表,*②産業符号 x性 >>IJ (
2
1
t
i
t
l
e
2"表, a
)単純クロス表".
2
2
2
3 r
u
n
:
i
t
l
e
2
:
2
4 t
2
5
r
o
cf
r
e
qd
a
t
a
=
k
a
d
a
i
:
2
6 p
2
7
t
a
b
l
e
si
n
d
u
s
t
r
y
*
s
e
x/o
u
t
=
ta
b
l
e
1m
i
s
s
i
n
gn
o
c
o
ln
o
r
o
wn
o
p
e
r
c
e
n
t
:
2
8
f
o
r
m
a
ti
n
d
u
s
t
r
yx
S
1
̲
S
a
n
g
y
o
u
.:
f
o
r
m
a
ts
e
xx
S
1
̲
S
e
x
.:
2
9
3
0
w
e
i
g
h
tw
e
i
g
h
t
:
p
r
o
cf
r
e
q
) 乗率あり".
3
1
t
i
t
l
e"安表,*③産業符号 x性 >>IJ (
3
2 r
u
n
:
3
3
=
ta
b
l
e
1
:s
u
mC
O
U
N
TP
E
R
C
E
N
T
:
3
4 p
r
o
cp
r
i
n
td
a
t
a
a
t
a
=
t
a
b
l
e
1 産業符号 x性別 (
p
r
o
cf
r
e
q
) 乗率あり".
t
i
t
l
e"*表,*④ d
3
5
u
n
:
3
6 r
8
9
3
7
3
8 d
a
t
a̲
N
U
L
L
̲
:s
e
tk
a
d
a
ie
n
d
=
f
i
n
a
l
:
I
I
W
G
T
)
:r
u
n
:
i
ff
i
n
a
lt
h
e
nc
a
l
ls
y
m
p
u
t
x
(
"
a
I
I
W
G
T
",a
3
9
4
0 略p
u
t"
&
a
I
I
W
G
T
"
:**数値変数 a
l
l
W
G
Tの健をマクロ変数 a
l
l
W
G
Tに格納する例;
4
1
4
2 d
a
t
an
e
洲町: s
e
tk
a
d
a
ie
n
d
=
f
i
n
a
l
:w
g
t
1伽l
a
n
=
w
ei
g
h
t
/
&
a1W
G
T
*
1
0
0
0
0
0
:
a
n
+
w
g
t
1
0
m
a
n
:i
ff
i
n
a
lt
h
e
np
u
ta
l
l
w
g
t
1伽 a
n
=
: *脅 w
g
t
1伽l
a
nの合計の確認.
a
l
l
w
g
t
1伽l
4
3
4
4 r
u
n
:
4
5
r
o
cp
r
i
n
td
a
t
a
=
n
e
w
明
日T(
o
b
s
=
2
0
)
: title"*表,*⑤ d
a
t
a
=
n
e
w
加 T(
o
b
s
=
2
0
)
"
:r
u
n
:
4
6 p
4
7
洲町;
r
o
cf
r
e
qd
a
t
a
=
n
e
'
4
8 p
t
a
b
l
e
si
n
d
u
s
t
r
y
キs
e
x/o
u
t
=
t
a
b
l
e
1m
i
s
s
i
n
gn
o
c
o
ln
o
r
o
wn
o
p
e
r
c
e
n
t
:
4
9
f
o
r
m
a
ti
n
d
u
s
t
r
yx
S
1
̲
S
a
n
g
y
o
u
.:
5
0
f
o
r
m
a
ts
e
xx
S
1
̲
S
e
x
.:
5
1
m
a
n
:
w
e
i
g
h
tw
g
t
1O
5
2
)1
0
万世帯比産業符号 x性別{小数点あり)"
:
t
i
t
l
e"脅表市安⑥ b
5
3
5
4 r
u
n
:
5
5
w
W
G
T
:
r
o
cf
r
e
qd
a
t
a
=
n
e
5
6 p
申s
e
x/o
u
t
=
ta
b
l
e
1m
i
s
s
i
n
gn
o
c
o
ln
o
r
o
wn
o
p
e
r
c
e
n
tF
O
R
M
A
T
=
C
O
M
M
A
6
.:
5
7
t
a
b
l
e
si
n
d
u
s
t
r
y
f
o
r
m
a
ti
n
d
u
s
t
r
yx
S
1
̲
S
a
n
g
y
o
u
.:
5
8
f
o
r
m
a
ts
e
xx
S
1
̲
S
e
x
.:
5
9
n
:
w
e
i
g
h
tw
g
t
1伽 a
6
0
)1
0
万世帯比産業符号 x性別(小数点なし)"
:
t
i
t
l
e"*表,*⑦ b
6
1
6
2 r
u
n
:
6
3
a
t
a
=
ta
b
l
e
1
"
:s
u
mP
E
R
C
E
N
T
:r
u
n
:
6
4 p
r
o
cp
r
i
n
td
a
t
a
=
t
a
b
l
e
1
:t
i
t
l
e"安表,*⑧ d
336
nHnHnHnHnHnH
UHUHUHUHUHU
︐
.H
VEV'vavsv
︐
句
proc sgplot data=giji.newWGT:
w
e
i
g
h
t
:
histogramfoodIweight=
title "
女 2) 食料費のヒストグラム".
r
u
n
:q
u
i
t
:
*安表 2貴 .
/
キprocsortdata=newWGT: by s
e
x
:r
u
n
:
*
1
本経常収入と食料費をまとめて計算;
proc univariatedata=newWGT n
o
p
r
i
n
t
:
v
a
ri
n
c
o
m
ef
o
o
d
: weightw
e
i
g
h
t
:
output out=fivePCTLPCTLPTS=20406080PCTLPRE=income f
o
o
d
:
柑 e
ightを使うと histogramを指定しでもヒストグラムの出力なし;
.
.
.
•
.
proc print data=fivePCTL: title "脅表 2女① data=fi
vePCTL:5
分位点:乗率あり".
v
a
ri
n
c
o
m
e
2
0i
n
c
o
m
e
4
0i
n
c
o
m
e
6
0i
n
c
o
m
e
8
0
food20 food40 food60 f
o
o
d
8
0
:
proctranspose data=fivePCTLout=finishTabeI2: r
u
n
:
u
n
:
proc printdata=finishTabeI2: title "安表 2肯② 5分位点計算完了". r
data T
B
2
S
E
I
R
I
: set f
i
n
i
s
h
T
a
b
e
l
2
: keep C
O
L
1b
u
n
i̲
N
A
M
E
̲
:
rename COL1=value NAME=
v
a
r
i
a
b
l
e
:
I
en=I
ength(
̲
N
A
M
E
̲
)
: buni
=compress(
s
u
b
s
t
r(
̲
N
A
M
E
̲
.I
e
n
‑
l
.2
)1
1.
弘
.):
proc print data=TB2SEIRI:
title "女表 2女③ data=TB2SEIRI": v
a
rb
u
n
i value v
a
r
i
a
b
l
e
:r
u
n
:
data income(rename=value=income) food(
r
e
n
a
m
e
=
v
al
u
e
=
f
o
o
d
):
s
e
t
:i
fmodしN̲.2)=0then output f
o
o
d
: *偶数番目は食料費 の分位点;
elseoutput i
n
c
o
m
e
: *奇数番目は経常収入の分位点;
︐.︐.︐
proc print data=income: title "*表 2 *④ i
n
c
o
m
e
"
:v
a
r bunii
n
c
o
m
e
:r
u
n
:
proc print d
a
t
a
=
f
o
o
d
:
⑤ f∞d
"
:
title "*表 2 *
v
a
rb
u
n
if
o
o
d
:
r
u
n
;
d
a
t
a
: merge i
n
c
o
m
ef
o
o
d
:r
u
n
:
⑥ 表 2完成". v
a
rb
u
n
ii
n
c
o
m
ef
o
o
d
:
procp
r
i
n
t
: title"宮崎表 2 *
format i
n
c
o
m
ec
o
m
m
a
7
.
0
:
format food c
o
m
m
a
7
.
0
:
﹄
*脅表 3女;
data̲
N
U
L
L
̲
: set fi
v
e
P
C
T
L
: caIIsymputx(
'
in
c
o
m
e
2
0
"
.i
n
c
o
m
e
2
0
)
:r
u
n
:
弘p
ut"&income20": *数値変数 i
n
c
o
m
e
2
0の値をマクロ変数 i
n
c
o
m
e
2
0
1こ格納する例;
data f
i
v
e
P
C
T
L
: set f
i
v
e
P
C
T
L
: キ小数点以下を四捨五入する;
array temp {
8
}i
n
c
o
m
e
2
0i
n
c
o
m
e
4
0i
n
c
o
m
e
6
0i
n
c
o
m
e
8
0 food20food40 food60f
o
o
d
8
0
:
do i
=
l to8
: temp{i}=round(temp{i}.1
)
:e
n
d
:
V
E
11111111111111111111111111111
zuc口 守 FnonuenU 咽tqL 内︒凋aTrDDO 守roonuunU41qLqdaaTrapD 守'nonwuハ
U'tnL 内
ヨ nu'tnLqdaaTrDCO 守
'oOAuunU41qLqd 凋斗 rDPO 守'non3nU41ntqda斗 raeO 守'no
d 必匂 ranO 守'nHun
cOFORVFO 戸 口 守F 守 ︐ 守 ︐ 苛 F 守
tτ17'7a .7'nunununononon目 nonunoqunudnudの
ヨ nudnununvnUAU U
日 nuunuGAUGAudn
︽ nunununv l
唱
噌 41414141414141 l
I
咽 ndηLntntnt9‑ntntnt
proc sgplot data=giji.newWGT:
histogram i
n
c
o
m
eIweight
=
w
e
i
g
h
t
:
title "女 2) 経常収支のヒストグラム".
procp
r
i
n
t
: title "女表 3肯①小数点以下を四捨五入". r
u
n
:
337
叫刷出 VEV nHnH HUHU 百p u t" & i n c o m e 2 0 " ; *数値変数 i n c o m e 2 0等の値をマクロ変数 i n c o m e 2 0等に格納; 唱p u t" & i n c o m e 4 0 " ; % p u t" & i n c o m e 6 0 " ; 唱p u t" & i n c o m e 8 0 " ; 首p u t" & f o o d 2 0 " ; 首p u t" & f o o d 4 0 " ; 唱p u t" & f o o d 6 0 " ; 略p u t" & f o o d 8 0 " ; 僧 満上上上上 来以以以以 円円円円円 内 nununununu ntnt 且マ白unnu 仰 い vnunhvnunu‑‑ nHnHnHnHnHN auahwan‑ahwah m mmmm・ nunu Ununu vv. 剣山制・白山削引剖計 ︽ 内 ︐︐ ︐︐ ︐= ︐‑ ︐ ︐ ︐ = ‑︐ = = = 白 U nununυ ︽ ntaayFORU oaoaohuea ﹄H caU Uau m mmm nununuvnu nunu hvnuωnH n nnnns ‑‑‑一ノ¥ J︑ ︽ ノ︽︑︐︽︑〆︽︑一 内 n U u 内 nunu nHnHnHnH wnunU ︽ Unu 内 un a h u n n v aマβ Enl e ﹄ 〆 eee m mmm n u ununu 川 内調 ふ Lauoaoaoaea a・ ' 明 H m山 みL 向u v z U U n v W鴨川 nus‑‑au pUPUBEE ‑anuea m川 VEMu‑ nvm n SE r ‑‑H o ru MMM制 H明 日 明 日 明 灯 特 M .︐.︐ 刊日日目白印刷円弱白山田町四 ω ω 引 位 臼 郎 防 幻ω m w m n 花判 万百川η 花 刊ω 関節 mm 幻m m ω ω 引 幻川刷出 ω m u m m お お お 幻m品開却初制 1111111111111111111111111111111111111111111111111111111111111111111 o p t i o n sm a c r o g e n ; d a t aN U L L s e tf i v e P C T L ; c a l ls y m p u t x ( " i n c o m e 2 0 " .i n c o m e 2 0 ); 1s y m p u t x( "i n c o m e 4 0 " .i n c o m e 4 0 ); c a1 1s y m p u t x( ' ' jn c o m e 6 0 ぺincome60); c a1 c a11s y m p u t x( " in c o m e 8 0 ぺincome80); c a l ls y m p u t x ( " f o o d 2 0 " .f o o d 2 0 ) ; y m p u t x( "f o o d 4 0 " .f o o d 4 0 ); c a11s 1s y m p u t x( " f o o d 6 0 " .f o o d 6 0 ); c a1 c a1 1s y m p u t x( " f o o d 8 0 ぺfood80); MW v a l u ef o o d l o w̲く品f o o d 2 0= " 品f o o d 2 0 .円未満" & f o o d 2 0̲<品f o o d 4 0= " & f o o d 2 0 .円以上" & f o o d 4 0̲<品f ∞d60="品food40.円以上" & f o o d 6 0̲<& f o o d 8 0= " & f o o d 6 0円以上" & f o o d 8 0くー h i g h = " 品f o o d 8 0 .円以上" ̲計". r u n ; 首m e n d : 百f o r m a t ; MM p r o cf r e qd a t a = n e w 制G T ;t a b l ei n c o m e * s e x/n o r o wn o c o ln o p e r c e n tF O R M A T = C O M M A 6 .; f o r m a ti n c o m ei n c o m e .; f o r m a ts e xX S 1 ̲ S E X .; w e i g h tw g t l 0 m a n ; u n ; t i t l e"女表 3女②経常収入". r 則的叫閃 p r o cf r e qd a t a = n e w W G T ;t a b l ef o o d * s e x/n o r o wn o c o ln o p e r c e n tF O R M A T = C O M M A 6 .; f o r m a tf o o df o o d .; f o r m a ts e xX S lS E X w e i g h tw g t l 0 m a n ; u n : t i t l e"*表 3女③食料費". r *貴表 4*; M d a t aX ;s e tn e w W G T ;f o o d X = f o o d ;X = l ;キ 表 4の作成のための工夫; r u n ; MM p r o ct a b u l a t ed a t a = X ; c l a s ss e xi n c o m ef o o d ; v a rf o o d XX ; t a b l es e x * ( i n c o m eA L L )A L L . 剛 a 7 .0 ) ; f o o d * ( f o o d X * S U M W G T * F = c o m m a 7 . 0 )X * ( S U M W G T * F = c o w e i g h tw g t l 0 m a n ; f o r m a ti n c o m ei n c o m e f o r m a tf o o df o o d .; f o r m a ts e xX S 1 ̲ S E X .; t i t l e"女表 4女①男女別". ﹃ 338
196 1 9 7 1 9 8 199 200 2 0 1 202 203 204 205 206 207 208 209 210 2 1 1 212 213 214 215 216 217 218 219 220 2 2 1 222 223 224 225 226 227 228 229 230 2 3 1 232 233 234 235 236 237 238 239 240 2 4 1 242 243 244 245 246 247 248 249 250 2 5 1 252 253 254 255 *女表 5宮崎; data table5: set newWGT: foodLOG=log10(food): r u n : proc print data=table5 ( o b s = 1 5 ) : title "女表 5女 ① data=table5 (obs=15)": r u n : proc tabulate data=table5 out=result5: class sex income food: var foodLOG wgt10man: tables sex*(income A L L ) . foodLOG*(SUMWGT*F=6.0 MEAN): weight wgt10man: format i ncome i n c o m e .: format sex X S 1S E X .: title "女表 5女 ② proctabulateから表示". r u n : proc print data=result5: var sex income foodLOG̲SumWgt foodLOG̲Mean: u n : title "女表 5女 ③ proctabulateか ら 出 力 の datasetrresult5J 幾何平均なし". r proc sort data=result5: by s e x :r u n : proc print data=result5: var sex income foodLOG̲SumWgt foodLOG̲Mean: format foodLOG̲SumWgt F 6 . 0 : format foodLOG Mean F 7 . 4 : result5J 幾何平均なし". r u n : title "*表 5宮崎④ proctabulateから出力の datasetr data final̲result5: set r e s u l t 5 : geomean=10林 foodLOG̲Mean: *幾何平均計算; l a b e l income="経 常 収 支 " foodLOG̲SumWgt="世 帯 数 " foodLOG̲Mean="常用対数平均" geomean="幾何平均". r u n : proc print data=final̲result5 l a b e l : var sex income foodLOG̲SumWgt foodLOG̲Mean geomean: format foodLOG̲SumWgt F 6 . 0 : format foodLOG Mean F 7 . 4 : format geomean COMMA6.0: title "女表 5女 ⑤ data=fi naI̲resuI t5:表 5完成". r u n : data p l o t : set final̲result5: *折れ線グラフ作成の準備; keep sex income geomean: i fi n c o m e = . then delete: *経常収支の『計』を削除; r u n : proc print data=plot: title "図 5 折れ線グラフ用 data=plot": r u n : proc sgplot data=plot: title "図 5 折れ線グラフ". *グループ分けのグラフの場合、 r / J以 降 l こg roup=で指定; series x=income y=geomean / group=sex: 本s tyleattrsでグループ毎の線のスタイル設定; styleattrs datacontrastcolors =(blue r e d ) d a t a linepatterns=(soli dd o t ) xaxis type=discrete: format sex X S 1S E X .: r u n : q u i t : 339
付 録 4 SAS プログラム実行後の結果Viewer 画面 340
:
1u @・ ~x制(,蜘制3
t 骨 回 坦d ‑ z
結 田 円程
*
音
量 l U d a祖 = 間 耐 相T【。ba‑‑20)
日 頃 命 日 市 町1
白日ふ五
;
;
.
;
;
;
r
&
;
ーら同函円一一
i
助
4
1
5
4 咽 S曲
i
1
8
血曲 :
2
1
1
0
1
1帽 開 1
‑
;
ト
→H話 器
1
トー2
8
‑
e
暗祖躍国B
河149m
川百 7
3
8
1
輔
6
.
9
2
!
高
1
0
.
0
4
4
4
四日制│
3
.
1同盟!
3
.
1
1
4
盟│
ミ
ト
」
1
届記│
T曲 leof̲
曲 ybJr臨置
田 減 量 副3
抽 崎 両 留 韓 関3
男
T
c
r
凶
金
3
1
2
0
4
5 4B蝿.a
宮6
田8
1
盟
0
掴
8
1
l
。
6.821担
│不癖
!鑑禽
長J
6調6
.
1
63
1.
01
4
6
円8
掴 y5
1
0
.
1
4
1
i
i
l
l
盤1&
白歯車霞
「
子
1
電気・沼ス・鎗儀鎗・水泡裳
区
'.腐・ 4唱 鵠
S
制3.
6
5 民 自A6 7
2
l
担H
国'
7
5
。 曲'
7
5
│傭極通信冨
盟)
1
9
5
2
。 血1
9
5
2
l
iI磁鍵
窃四回会金 S笛 7田 l
│金融・儒験1&
相田町 l
1
不動車暴
世
出
1
4
3
5
荷 。 1
4
3
5
市
.
m
強
調E
[飲食庖
1
0
7
2
1
9両 市 l
1
5
7.8851
l
医fHi
鮭
'盟国!脚蹄1
1 i
叡宵・苧宮支露露
剖帽.621
畑 掴1
1卸 陥
笹倉曹~~事事量
掴 1
2
割
ゐ忌 1
l
再
~
ω
*表 1 H d a旬 司able1
*表 1*0b)1O
万世帯比産業符号 x性別 (
/
J唖点阻み
h叫 国 廿y 割 誼
│伽
001.刷TIPB
延草阿可 τ
beFREQ骨 即 時 四
持軍
男 1
3
1側 .
4
6
3
1.2悩
1 2
特事
女 川 蜘Z
抱
4.
8
O
E
i 8
錦│男!悶│
t
4
醐│男!駒山
3
1
.
0
1[
強館業女│
i
百 四j
6.3制
0
.
0
3
1
T曲,IaofIn直属甘y.
,
..
闘
田
。.
0
0
h曲蝿曽ヲ留置E持号3
不毒事
鉱提
組
一
‑
団
l 震
7
自
1
電気・却ス・鰻供鎗・水遺I!
滞緩鵠鎮
i
連総集
鑓鴎・ 4場盟毘
金蝕・保険量E
│ 官宮
気扇・小売鍵
男 総4
3
.
6
5
6
4
<
6
.
司
書
箆涜・小宛裳
女
日謁 .
4
6
0.
5
8
!
不動鐙震
14
金滋・保験裳
男
1
剖6
.
9
4
1
.
4
4
飲食庖・詣泊裳
医底・福祉
ト一一
1
i
i
'
2
,
e
7
5
金不
齢掘
保削融男
3
耳
l
…
石剛,
a
:
2
m
m
i
1
t
l 可M
叩
m面
欽食庖・宿、冶裳
18
飲食底・宿泊鍵
19
医僚・福祉
霊畠
医銀・福祉
2官
敏宵・学習支話集
22
盃
「
盃
「
1
。訓 2
3
1盟担 1
4
6
剖1
.
6
4 軍Z
5.
6
2
76
i"‑
ピス1&<倒E
分酒害れないも11)) S
1
6
7
2
7
1
0
6
!
抽S 4
坦身国 1
崎町俗説頼書机曜いも
1
1
田.9
9
2
(
泊
。2 79
曲抽 1
I
T
,由1
0
副X
拍
:11:宵・学習支鑓震
包含廿』ピス事事E
L:分績割E
布いも(1))
曹』ピス黛《健J
l
公 献 値J
L:分調副抗、も11))
同
・1
T
敏宵・学習支領案
複合サービス事業
権合そt
‑t:ス事業
サービス業〈他に分額されないもの〉
26
tD
公 務 〈 側 、 分 艶 刷 、 切)I
男~ 1
側
量
置
公務〈他 Z分 慣 れ な い 抑 }
女│
s
s
l 叩
細見
1
0
.
4
3
0
100.000
341
男
d性 問
*1 T,由E
* 表2禽<Dda祖 唱vePC孔 :5分位点=黍率あり
I
│ 伽 吋 甜 Inco刷。
l
h
問 問 伺
I
r
四 四 ! 日 。 加制。i
加制│加鋤│
071制 閤 131田 1
7鰯 5
1131悶 1
.
1曲 師 │ 宙 開 勾l崎 701位 田146.
2
31
.141
蜘話回 i
食 表2禽<2>5分位点計算完了
*表2~da祖=百担 S日間
OOL
唱
obs 点踊ME̲ j
:.絹El‑̲
.Obs bunl
帽1&細
‑
司rlab
胎
∞
官 2
舗
310
田1
.
0
7 h∞me20
せ 宿 泊.
0
∞0 E tl恰,.fαxf 49701!但
0
212
0% 49701.02
田.
1
3 Ia
0
.
0
∞0
t
l
l
e
.In開問 4048
311nccrr宙40 廿百 4
4側 同 臨 13 Inccme40
回 1
46.
2
3
41fcc
斜。
廿1
840.0
∞Op tlle.fc国
4140
9
&
63146.
2
3 fccd40
S IInc
αV
宙 船 せ唱 6
0
.
0
∞Op tlle.回目町田 回 llEお.86 5 釦 " 501180.86 Inccrr田伺
官 同o
r
r
暗 部 世槍 2
田1
.
0
0
.
1 00間 間 関t
l
l
e
.I
n
α宮 間 310
21f~ぬ
阿
聞
化国d2
伊抑制
官。聞
町 C聞
廿睡 6
0
!
以)
(
)
Operc
聞 t
l
l
e
.f
c
c
d
61f
o
吋 60
7飢渇5
.
1
4
∞
∞
71!
n
∞me前
田 75
.
2
8
甘宙 8
0
.
0 Op
宙 開 官 官t
l
l
e
.Inccme 63
d80
81f
o
o
廿 田 即.
0 Operc
官官t
l抱'.~∞d
* 表2禽 @income
obs bunl
官 2
倒
31帽 3
1
β
側
316
501180.86
側
418
63
田:
7
5.
2
8
76
時:
5
.
1
4 他 国60
田 75
.
2
8 I
n
c
町ne80
7 80
9
& 63
93(渇5.
8
0
8 回9&
9田 35.
8
0 ~O
* 表2貴 @ 和od
禽 表2禽 @ 表2費 減
obs buni
ゆh
Incon抱
田.
1
3
O
f
& 4048
214
6160
9
&
+
白田d
1120% 49701.02
214
側
46.
2
3
国 1
3160
彊
760
田.
1
4
4180
皿
93(沼5.
8
0
=
bur
叫 I
ncon掴
急提nI
.
5
31 4
9
.
7
0
1
1120% 310
214
棚
4
0
4
.
e
砲3 6
3
.
1
4
6
316
0
l
国
5
0
1
.
1
8
1 7
6
.
正
汚S
418
舗
635
.
8
75 93.036
* 表3禽 ① I
J喰点以下を四捨五入
I
r
r
m
叩
l
f
a
o I
Income4
efOOd4O
obs
卸
1倍~~l 崎両1 1
4048
田
180 Incoma田│加制
勧国諸諸ne60 仇割調
760
毘
501181
63146
*
表3* 0 経 常 収 入
*
表3*<<3)食料費
TheFREQprocedur冒
TheFREQP
r
官cedure
~吋即時 l
I
F
r
e
q
即時│
T
a
h
l
saf.Inco園田..割轄
輔 自d
鍾:JID
駐車E
h田 園 闇 鑓 量 営 破λB
男
吉
正 To
810
閣官同朱溺
別館揚'円以上
4倒観揺円以土
田口町円以上
観お87
溺司説上
To
踊 t
0
.
0
α
3
1
S
A94 4
.
5
0
6 2
,371 1
9
,
9
9
4
1
8
.
61
71
1
9
ρ
9
9 9
.
0
ω
1
1 宮0
9
,
正
淘5
1
9
,356 6
4
0 1
0
.
0
0
2
1
9
.
4
3
5 567 2
92ρ00 8
.
0
∞ 10∞
∞
3
4
2
T
a
h
l
soff
,目別i
l
b
世田副
副司崎議D
勉樹氏倉純3
男
主E
To
相自
6
.
正茸泡 a.1鉛 j~卿
497
刷岡泰舗 1
8
.
(
冶7 1
49701円 以 上 1
.
o
o
aI20.0∞
舗司以上 1
8
.
1
活41U
賂8
6814
I
官制掲揚司以上 1
9
.
o
s
a 948
1
1
2
高
函
a
9周
m
ヨ
司
'
'
ー
9
.
31
4 偲5
8割沼制司殿上 1
T圃 匂E
位制 1 8•000
*表.4*<1>男女別
l
掛
m 制 円 繍 149701円 以 上 │ 田 明 以 上 1760期 以 上 19303明 以 上 │
時
繍
刷明批│
抑制円以上1
間期以上
I
1
foo
雌
│
f
叫
│
戸竺 ~____2,7981
1
,
8
3
4
4,
5
0
11
2
,
9
鈴
̲ 1
I
ω
│
同
…!…国竺-~旦
Su
mW
I
r
t
5
,
8
2
7
剖銅明以上│
女
│
胸 部
Sum
Wct
印
ω1~[三三極r~-~~4:_395 !_~~竺仁ご玉至!三副
1
却 6
1
3,
2
331
4,
082i
4
脚│
悶 1I 1
9
.
府
引ぬ
3,
9
7
自
2,
0121 1
8
1
029l‑J
竺 L二 亙i
二二亙仁7両 〔 示 !
1
,
1~_1型 L一一竺竺 1̲ ̲
1
,
空73土1
̲ ̲
1
叩>31̲̲̲̲
2
竺
竺L
竺竺¥
│綾常収入
I
1
3
1悶 円 輔 1
1
,
峨
馴│
2
1
悶
引
3
1
3
7
1
│剖悶円以上'‑
1
‑一一云判 一~2ss 1一一一五「
1η1
雨
4
脚
1
'
:
;
3
7
1
川鵬円叫-l副一一~225r-- 一一五五1--i白「一両-l引
mm
円以上│
問
7明 以 上 !
I
伺
i
一一一一
州
3,
1
叫
│ 1
蜘 9
川
1
:
勾「一
団│
両1--~1 紛
四
961
1
1引
1
.
.
9
031
1
,
2681
∞
0
0
11
20
,
2
0
ρ
5
*
① d
a
t
a
=
t
ab
l
e
5(
o
b
s
=
1
5
)
*表
343
1
4
9
糾
町
9
叫
邸側引
(2粛1 f
1
読11∞仰(
食@proctabulat,ーから出力のda旬開,tr"回 U陥 J :轟何平均むし * 表5 obs 揖 皿 杭国間国 f 目減L OO̲ SumWct fo阻止.0G̲M1輯岡 1お 3 1円朱満 '男 3 宣男 3 1侭 3 1円以上 1 5 4 ! 抱 70 4 . 7 3 1 芸1 9 1 筋 1 6 . 7 3 4 . 7 8 : 諮1 2 冨 男 4048 田円以上 1 9 α担8 . 5 7 4 . 8:挺!80 4 男 5 0 1 1 8 1円以上 1 民主買5 BO 4 . 8 8 2 5 9 明以上 5 男 部 87 1 9 4 3 5 . 4 2 4 . 9 3 3 4 5 4民主5 . 9 4 6 女 3 1悶 1 円未満│ 1 3 7 6河 4 . 7 8 1 0 7 臨 円. 404 T J 上│ 8 女1 9 1 0 . 7 5 目1 : ま 2 4 . 7 6 3 9 . 7 0 官 霊 f 男 l 女 4. 8 6 1 7 1 7 額ぬ . 7 9 4 . 7 3 怨4 2m 主 E n u SWc量 foo乱 .00.)品開n I 1 5 4 9 4 4 . 7 3 8 9 1 邸1 7 4 . 7 8 3 2 S 男 ω4飽B円以上 1 9 0 9 9 4. 8 3 飽 4 男 5 0 1 1 8 1円以上 1 以謁唱 4鉛 26 5 男 旬開閉以上 1 9 4 3 5 4.93お 9 2 ( 耳 目 。 4. B 3 9 ! 唱 計│ 訳 出B 4 4 . 6 7 1 3 円批 3 1悶 1 日女1 1 3 7 7 4 . 7 8 1 1 u上 9 1 1 4 . 7 百1 3 3 1四 1 円未満 l 女1 0 1 1 8 1円以上 10 女 5 女 間制壮│ l 12 女│ 計 640 4 . 8 6 1 7 567 4. 8 7 7 4 自α)0 4 . 7 3 2 5 4 . 7 8 40 嶋田円以上 9 1 1 4 : 苅 ι t 叡 闇 夜 明 弘t お7 A I I 回 ∞ 8 6 640 4. 501181 円畠 笥 ‑ 蹴 収 支 出 縄 繁 樹 数 平 均 鎗筒平明 000 sex Income geomean 1 , 7 似 ω1 男 310531円 未 満 54813.86 4日3 旬 6 8 . 6 7 5 2 男 310531円 以 上 60704. 43 8 8 2 6 4. 76 . 31 1 3 男 404883円 以 上 68674. 76 男 関587 明以計上 l1 1 9 4 3 5 4.93お 8 5 . 7 9 3 男 501181円 以 上 76310. 70 男女~四1隅満Lil1m竺 mη I69.10 4 4 . 8 : 英 出5 4 . 6 7 1 3 46 , 91 3 男 百 男 4 男 │ 町 8 1 t U 四 4 抱 a 諮 刊 間 円 門 問 未 以A L 満 上 1 1 叩 閣 陪 関 咲 1 制 羽 71 8 3 4 陪ω 60 . 4 0 5 5 男 635875円 以 上 85793. 40 6 女 310531円 未 満 46913.36 60405.14 女 3 1 0 5 3 1円以上 4 . 7 日1 1 女404BB伊ヲ以上 4河 1 3 60 . 4 39 7 女 310531円 以 上 帥 4. 8 61 7 2 , 弐3 0 7 8 女 404883円 以 上 60439.18 開│ 4 . 8 7 7 4 75 . 4 0 7 9 女 501181円 以 上 72729. 70 10 女 635875円 以 上 i75407.31 l 10 女 関1 1 8 1円 批 ,11 女 部町明以上│ 12 4 . 6 7 1 3 7 7 4 . 7 8 3 2 包 l l l 」 a v 4506 別館泡官円段上 54 , 81 4 男 I6 経費量腹入 創 価31 円奪第 4 : 官誕抱 t 5 4. 8 4 図 5 折れ線グフフ用 data=plot * 表5*φdata= 宵naI ̲result 5:表5完成 お 性劉 [0 1 9 : 翌 日B 4 . 8 8 4 : 臨 I n c o r r 曲 f 田 誠L OO̲ 女 404 鹿沼円 l 9 4. 8 4 1 9 α: 92(ぬ0 21 君男 3 1倍 3 1円以上 9 404 鶴組問段上 国 1 181円紘上 4 . 7 4 19435 4 : 鈎 官 男 3 1侭 3 1円未満 7 18617 4 . 7 8 92(ぬ9 * 4 1 >proctabulat,ーから出力のda旬 回trresu回 J :幾何平1 由男 1 日 94 310 田'円以上 A I I * 表5 obs aex 珂 1P 捧濁 310 4. 8 7 7 4 1 56 6 . 6 2 計 性 別 経常吸入 男 6 3 ! 掲2 邸司以上 円以上 10 女 飽田75 官 f̲ 乱. 00 鼠.on Wct Mean 4 . 6 7 1 3 0 円批 7 玄1 3 1伺 1 女│ぬ1 1 8 1円以上 *0proctabulateか ら 表 示 * 表5 女 計 L 01 脚 4閣 I l日 .018 344
世2 )食料貨のヒストグラム ヒストグラムと 折れ線グラフ 1 5 1 0 0 ・ c a ・ ﹄ 世2 )経常収支のヒストタラ 担 。 。 叡聞刻。 認 闘 " 。 童輯 1 5 . ‑ E 0 . .1 0 賀醐臨 3000(剛 < I l O O O 曲 経常掴λ 国 5 折れ線グラフ 80000 安時区銀 6 0 0 0 ( 】 国lOOO 310 国'円未着 3 1 0 5 3 1円以上 404 嶋3 円以上 501181円以上 経常収支 l 世ll L .---~J貢三三三E 345 63 騎7 5 円以上 4園施。
付録5 2016年 第 4固 SASミクロデータ分析コンテスト 規定課題 1 )産業符号・性別クロス表 産業符号別・性別に集計用乗率なしの単純クロス集計表,および集計用乗率を使って 10万世 帯あたり(10万世帯比)のクロス集計表を,表 1の様式で作成して下部¥.(注:産業符号の「不詳J が先頭に来ても構し、ません.) 表1 a)早純クロス表 b )1 0万世帯比でのクロス表 合計 産業符号 合計 男 女 男 女 鉱業 建設業 製造業 電気・ガス・熱供給・水道業 情報通信業 運輸業 卸売・小売業 金融・保険業 不動産業 飲食庖・宿泊業 医療・福祉 教育・学習支援業 複合サービス事業 サービス業(他に分類されなしもの) 公務(他に分類されなしもの) 不詳 合計 8, 29, 381 2, 646 32, 027 92, 000 100, 000 000 食料費 49, 701 ω別 位一却判 点一%%%% 分 2 )経常収入および食料費 経常収入および食料費について,集計用乗率を用い , 40%点 , 60%点 て表 2のように 5分位点(下側 20%点 および 80%点) A~F を求めて,表 2 を完成して下さい. 更に,経常収入および食糧費についてそれぞれヒストグラ ムを描いて下さい.ヒストグラムの縦軸はパーセント(又は 1 0万世帯比),横軸は経常収入および食糧費の階級区分 (単位:円)とします. D E F 3 )男女別・経常収入および食料費の 5分位分布 男女別に経常収入および食料費について,表 2に示す 5分位別に,以下の表 3に示す 10万 世帯比のクロス表を作成して下さい. 表 3 経常収入 5分 位 数 5分イ立 310, 531未 満 2 310, 531以 上 A 3 4 B C 5 言 十 男 92, 000 言 十 20, 000 1 9, 993 20, 009 1 9, 995 20, 002 8, 000 100, 000 女 食料費 5分 位 346 2 3 4 5 5分 位 数 49, 701未 満 701以 上 49, D E F 言 十 男 92, 000 言 十 1 9, 999 20, 000 20, 001 1 9, 998 20, 003 8, 000 100, 000 女
4 )男女別・経常収入・食料費についての 3重クロス表 男女別・経常収入 ( 5分位)別の食料費 ( 5分位)について,表 4に示す 3重クロス集計表を作 成して下さい. 表4 経常収入 5分 位 2 食料( 5分位) 3 4 5 計 男 2 3 4 5 計 92, 000 女 2 3 4 5 計 男女計 1 9, 999 20, 000 0 0 1 20, 1 9, 998 8, 000 20, 003 1 0 0, 000 5) 男女別・経常収入別に食料費を常用対数変換した平均値の比較 5分位)別に,食料費の常用対数を計算し平均値を求め 表 5に示すように,男女別・経常収入 ( て下さい.その平均値について逆対数変換(10')をして幾何平均を計算して下さい.この幾何平均 について男女別・経常収支の分位点別に食糧費を比較するために,折れ線グラフを作成して下さ い.縦軸を幾何平均(単位:円),横軸を経常収入 ( 5分位)とします. 表5 経常収入 5 分位 世幣数 食料 常用対数平均 幾何平均 見 ,0 0 0 4 . 8 3 9 5 6 9 , 1 0 3 8 , 0 0 0 4 . 7 3 2 5 5 4 , 0 1 3 男 2 3 4 5 言 十 女 2 3 4 5 言 十 3 4 7
局外トレンドのある回帰モデ、ルの推測 0藤原混 l、丸川真友子 1、冨田哲治 l (1県立広島大学経営情報学部経営情報学科) 経時データに対する回帰モデルにおいて,測定時点が少ない場合は経時変化の記述に直線などの 単純な関数形を用いる場合が多い.しかし,測定時点が多い場合は,より複雑な関数形(例えば,多 項式関数・スプライン関数・非線形関数)を考える必要がある.その結果,多項式関数ならば次数選 択,スプライン関数であれば基底の種類や個数の選択など,解析者に新たな負担が生じる.本発表 では,あまり関心はないが無視できない経時変化を局外トレンドとして捉え,局外トレンドの関数 形を特定することなく,共変量の効果を推測する方法について説明する. 経時データの例として,少女 1 1人と少年 1 6人に対し,歯科矯正の診断に利用するために頭部X線 m m ]を4時点、 ( 8,1 0,1 2,1 4歳)で計測したデータ 写真から 2つの基準点(脳下垂体と翼上顎裂)の距離 [ 抗h o f fandR o y :B i o m e t r i k a, 5 1, 3 1 3 ‑ 3 2 6,1 9 6 4 )を用いる.個体i のt 歳における距離をY i ( t ),性別を表 ( P O すダミー変数を αi(O=少女, 1=少年)とし,次のような回帰モデ、ルを考える. Y i ( t )=。 戸( t )+s l ( t )α i+Eル E i t‑ N ( O . σ 2 ) 戸~j(t) は変化係数(Hasti a ndT i b s h i r a n i :J .R o y .S t a t i s t .S o c .S e r .B, 5 5 ( 4 ), 757・ 796,1 9 9 3 )と呼ばれる時間と o ( t )は少女の経時変化.s l ( t )は性差の経時変化を表し,本稿では ともに変化する回帰係数である .s 少女の経時変化ん ( t )を局外トレンドとする.つまり , s o ( t )の関数形を特定せずにs l ( t )を推定する. 性差の経時変化に直線を用いた推定結果が図 l である.共変量の効果の推定値を用いて,事後的に 局外トレンドを推定することもでき,その推定結果が図2である. 生存時間解析において,コックスの比例ノ、ザードモデルが広く用いられている理由として,ベー スラインハザードの関数形を特定する必要がないことが挙げられ,考慮すべきことが減ることによ り解析者への負担が軽減されているからと思われる.本発表の方法においても,同様の利点が期待 される.このような方法は,測定時点が多い経時データにおいて有効であると考えられる.本発表 では,簡単のため時点間相聞は独立として扱ったが, S a t o handTonda( A m e r .J .Mat h .M anagementS c i ., 3 5 ( 3 ),1 8 3・ 1 9 3, 2 0 1 6 ) は,成長曲線モデ、ルの枠組みで時点間相関も考慮した推測法を提案している. 図2:少女と少年の推定曲線 図 , :共変量効果(性差)の推定結果 ︐ ︐ ︐ ︐ ︐ ‑)(‑少女(局外トレンド} . . . . ー少年(局外トレンド+性差) g . 。 ︐ ︐ ︐ x x×× x ︿ ︒髄質ぽ受O X X ︐ ︐ ︐ 8 8 8 ‑ x E除草 00 、 E ヨ 。 8 n p 4 ︐ ︐ ︐ ︐ ︐ ︐ ︐ ︐ ︐ ‑ ‑ ‑ [島区]種組側震 [ E ]出国国似震 ︐ ︐ ‑ ‑ ‑ ‑ ︐ ︐ ︐ ーー推定曲線 ‑‑ 9 5 耳岡崎信頼区間 X X o x 1 0 1 1 1 2 1 3 1 4 8 年齢 1 0 1 1 年齢 351 1 2 1 3 1 4
ベイジアンモデルによる地域人口予測モデ、ルの可能性について 0片桐智志 l,山下諭史 l (1ネイチャーインサイト株式会社) Thep o s s i b i l i t yofr e g i o n a lp o p u l a t i o nf o r e c a s t i n gmodelbyB a y e s i a nmodel S a t o s h iK a t a g i r ia n dS a t o s h iY a m a s h i t a N a t u r eI n s i g h tCO.,LTD. 要旨 人口増減を表現したリー・カータ一法に基づく階層ベイズモデ、ルをマルコフ連鎖モンテカルロ法によって推 定し,岩手県の市町村別人口の予測モデルの作成を試みた.利用できるデータの制約上,全国規模のデータ を代用したため完全で、はないものの,直線的な人口推計モデ、ルと異なる,確率的モデルによる人口予測の可 能性を示すことができた. キーワード:人口予測 MCMC マルコフ連鎖モンテカルロ法階層ベイズリー・カーター ( L e eC a r t e r )法 働 はじめに [国立社会保障・人口問題研究所, 2 0 1 3 ]は , 2010年から 60年までの 50年の聞に約 3分の lの人口減少が発 生するとの推計を示した.これは出生率の低下が長期間続いてきたことが原因のひとつであるため,推計の 精度に差こそあれ, (仮に今すぐ出生率の水準がおおきく上昇したとしても)長い人口減少期聞が発生する という結果は頑健である.人口の減少が確実となった場合,とりわけ,昼夜人口の差が小さく,住人の生活 が限られた範囲に根付いているような地方では,将来の商品の需要を見きわめるため,市町村のような小さ な地域の人口を年齢層ごとの分布を含めて適切に予測することが重要となってくる. 市区町村別の推計として,すでに国立社会保障・人口問題研究所の「日本の地域別将来推計人口」が存在す るが,これは人口の「推計」という立場をとっており,現在から直近数年分の人口の変化が直線的に続くと いう仮定のもとでのいわば「参考値 Jである.本稿では,人口の増減率が動的に変化するモデ、ルを採用する ことで,より「予測」として適した,市町村別の人口推計モデルの作成を意図している. 3 5 2
人口予測の背景 人口が増減する要因は自然糟減と社会増減の 2つに大別される.自然増減とは死亡と出生による人口の増減 で,社会増減とは経済・社会活動のために人聞が他地域へ移動することによって発生する増減を意味する. 自然増減と社会増減の大きさを適切に予測できれば,そこから人口予測が可能となる. 特に自然増減に関しては, ( L e e& C a r t e r ,1 9 9 2 )と ( L e e,1 9 9 3 )においてそれぞれ,死亡率と出生率を予測する L e e ‑ C a 巾 r )法として定着している.国内におけるリー・カータ一法の モデルが提案され,リー・カーター ( 応用研究には, [石井太, 2 0 0 6 ]や[南保善治&吉永一彦, 2 0 0 6 ]ほか多くがある.さらに ( B r o u h n s,e ta , . l2 0 0 2 ) によって,リー・カータ一法を発展させポアソン分布を用いた確率モデルが導入され,確率モデルを導入し 0 0 5 ]などの研究がある. ( B r o u h n s, e t た人口予測の研究がすすんでいる.圏内でも[小暮厚之&長谷川智弘, 2 , . l2 0 0 2 )を素朴に発展させ階層ベイズモデルとした ( W i s n i o w s k i, e ta , . l2 0 1 5 )で示された方法に基づいた人口 a 予測を試みる. モデル ( L e e& C a r t e r ,1 9 9 2 ) にもとづいて, t年に x 歳である人々の死亡率Jl x . tを μx, t= e x p ( αx+sx,Kt ) とする. α x 's x はいずれも年齢ごとの係数で,年次によって変化することがない. 一方, でも同じだが年によって値が変化する. これらの 3種類の母数のうち ( 1 ) 内 Kt はどの年齢 は時間経過に対して一定な 年齢ごとに固有の効果で, ( 2 ) 払は各年齢に固有の死亡率の減少(増加)傾向の大きさであり, ( 3 ) Kt は 時間に対して変動するトレンドと解釈できる. この 3つに分解し, Kt に何らかの時系列モテ手ルを仮定する ことで将来の死亡率の予測を行うのがリー・カータ一法となる. さらに,これは死亡率だけでなく出生率に 対しでも適用できる ( L e e,1 9 9 3 ) . リー・カーター法は当初は実際のデータとしては死亡者数だけを利用し て特異値分解によってこれらのパラメータを求めていたが,パラメータを人口に対する死亡の発生確率のパ B r o u h n s,e ta , . l2 0 0 2 )によ ラメータとし,人口と死亡者数のデータを用いた確率モデ ルとして定義しなおした ( って,特異値よりも直感的に解釈しやすいパラメータとして求めることができるようになった.この式は双 線形モデ、ルと呼ばれる形式のため,制約っき最適化計算により求める必要がある. x . t の対数は正規分布にしたがうものとする.なお, ( W i s n i o w s k i, e ta , . l2 0 1 5 ) パラメータの分散を表すため, J l では (Renshaw&H a b e r r n a n,2 0 0 6 )で導入されたコーホート別効果 Y x をさらに仮定しているが,本稿では一 般化のためこのパラメータは使用しない. よって, l n μ吋 = λf ( αx+品κt .0 ‑ ; ) とする.つまり, J l x, t は正の値に収まるため,発生率として矛盾がない値だけをとりうる. 分散は標準偏 差σ μ が連続一様分布 σr v U ( O, 1 0 0 ) 包 にしたがうようにする. さらに,イベン卜の発生数をポアソン分布 2 353
,
九 rvPo(μx,tEx,t)
t
とする. Y
.
丸tは実際の発生数, E
x
.
tはイベントが起こりうる人間の数である.ポアソン分布のパラメータがイ
ベントの発生数の期待値であることから, I
l
x
.
tは発生率と解釈できる.よって,以降は一般性をもたせるた
x
' Kt については以下のよう
x
.
t を(イベントの)発生率パラメータと呼ぶ.さらに,パラメータ a
めにIl
x' s
に事前分布を設定する.
χ
α はそれぞれ独立に正規分布に従う.
α
'
".
.
.
.
.
N
I
D
(
O
,
1
0
0
)
sx は相関のある多変量正規分布とする.
β山
会
,
世
)
,
MVN(
.
.
.
.
.
sx=1‑Esi
i
f
.X
ただし,共分散行列の係数 τF はガンマ分布に従う.
Tsr
v
r
(
O
.
O
O
1
,0
.
0
0
1
)
4
f
寸
ぺ
:
L
Ktはベクトル自己回帰過程とする.ただし,
1(
1
は固定する.
MVN(
φ。
+etl向ー 10T,
;
)
, t= 1
,2
,
・
・
・
,
民 t.
.
.
.
.
KO=1
ただし, φ0' <
<
T1 の事前分布は要素ごとに独立な正規分布で,分散は逆ウィシャート分布とする.
φ。
.
.
.
.
.
N
I
D
(
O,
1
),
⑨ 1.
.
.
.
.
N
I
D
(
O
,1
),
T invWish(2,
2x1
2)
1
<",
とする.また,
(Wi
釦i
o
w
s
k
i,
e
ta
,
.
1 2015)で提案されているようにKtを VAR ではなくドリフト項のあるラ
ンダムウオークとした場合についても試し,さらに男女で独立な AR(I)の場合についても推定した.この場
1
>1がドリフト項となり,分散は VARと同様に逆ウイシャート分布とする.
合
, <
x
.
tも男女の出
同様に出生率も求められるが,出生率の場合Ktは男女別ではなく,女性だけの単変量となり, Y
生数の合計となる.また,
(
L
e
e,1
9
9
3
)に則して ARMA(I,
I
)の場合と AR
(l)の場合の 2通りで推定した.単変
量の場合の分散はいずれも,標準偏差が連続一様分布 U(0,
100)となるように事前分布を設定した.これらの
院の事前分布の候補のうちどれを採用するかについては,
(
S
p
i
e
g
e
l
h
a
l
t
e
r
,
e
ta
,
.
12002) によるデピエンス情報
量基準(DIC)のより小さいものを選ぶようにした.
以上のモデルはいわば階層ベイズモデルの一種であるため,マルコフ連鎖モンテカルロ (MCMC)法でパラメ
ータを求めることができる.この求めたパラメータを用いて,同一出生集団ごとに人口を毎年の人口を計算
するコーホート要因法の一種であるロジャース・モデルにより人口を求めることができる.まず,単一地域
3
3
5
4
のコーホート要因法を考えると,コーホート別出生率とコーホート別人口を掛けて新生児 ( 0歳年齢)人口を 小 求め,さらに前年のコーホート別人口と対応する生残率を掛けることで翌年の予測人口を計算できる. [ 池司朗, 2 0 0 8 ] によれば,複数の地域ごとにコーホート要因法で人口を計算する場合,地域間の人口の移動の 考慮が必要という課題があり,そのなかでもロジャース・モデ、ルはある地域からある地域への転入出率のパ ( W i s n i o w s k i,e ta , . l2 0 1 5 )の方法にならって,以下のようなモデ.ルを ラメータを個別に設定したものである 仮定する. P~.t を t 年における性別 k, x歳の人口とする.同様に, b~.t は誕生率, s~.t は生残率, itt は転 入人口である. ι o0 1 戸 P ,Ot+l P i, t +l p , 長t+l 1 ' 0, t+1 1 Mt+1 X, L 0 [0 。 •• : l sLl.t s L J ぺ~" 0 1 毘 P ' o t 。 15t Pi .t Z i, t P~.t +li~.t 011 IPo 同 Z O A 1 1L P 笠 z 笠t s 望‑l, t S~tJ VA M O F 'K xx <一一一 百貨 x, t‑ ) 1 ‑ μ f f zz (1 ‑ μ f f s~. =~ ~+μ41 , t ‑ ‑ 生残率ノ号ラメータは以下のように計算する. 1 1 + μ ζ i i ここで Hlf は先のモデルでの死亡率ノミラメータを意味する.誕生率パラメータは, ( W i s n i o w s k i,e ta , . l 2 0 1 5 )にならい,男女合計出生率 b x , t, t=‑i‑dfl(dt+sftd+1t) 1+0.5 ー , 1 , ; 2 ' , : : Z : , ( ; , ‑ X, Z ;' X‑ r . 1 , ' t に対し 1 / 2 . 0 5をかけたものを女児誕生率に, ( 1‑1 / 2 . 0 5 )をかけたものを男児誕生率に使っている. t E z z o ︐ ﹄ 1m 一 ︑ 柏 LJj‑ ‑一 0 1 M吋 J 一Z/tl¥ 一一一一 'nu'nu F吋 ただし, Il~.t は出生率パラメータを意味する.便宜上行列を用いて表したが,実際の計算は SQL プロシジャ を用いた集計を年ごとに再帰的に実行することで可能である. 用いたデータ 本稿の目的は岩手県の市町村別人口の予測であるが,市町村別の死亡・出生人数について年齢で分けた十分 なデータを得られないため,死亡数は各年の人口動態調査の「死亡数,性・年齢別 J より,人口は国勢調査 4 355
の全国結果を補間した人口推計を,出生数は人口動態統計「出生数,性・母の年齢(各歳).出生順位・嫡出 9 9 3・ 2010年間のデータを用いた.岩手県の市町村・性年齢別人口については, 子・嫡出でない別 j の 1 r いわ ての統計情報 J( h t t p : / / w w w 3 . p r e f i . w a t e . j p / w e b d b / v i e w / o u t s i d e / s I 4 T o k e i l t o p . h t m l )の岩手県人口移動報告年報の J より入手できるため,ロジャース・モデルによる計算の初期値とし 「市町村・男女別人口(各歳・ 5歳階級) た.転入出については全国データの代用ができず,また年齢別の人数を得られない.そこで,人口移動がな いと仮定した閉鎖人口のみの場合と,岩手県人口移動報告年報の「市町村別社会動態(転入数・転出数) J から得た過去 5年の市町村別データの平均を,転入出数の年齢分布の得られる県全体の値で按分した疑似値 で代用した. 計算方法と予測結果 MCMC法の計算は, SAS/STAT1 4 . 1の MCMCプロシジャで実施することができるが,パラメータの非常 に多い本モデルの計算は処理時聞が長大になったため,本稿では S t a nというソフトを用いて計算を行った. 一方で, SASの MCMCプロシジャそのものを使うことはできなかったものの,診断用の自動マクロはデー 江MLが使えるならば,例 タセットの体裁を MCMCプロシジャのものに合わせれば使うことができる. SAS えば (Geweke ,1 9 9 2 )によるパラメータ収束の検定は%GEWEKEOマクロで実行でき, , ( B r o o k s& Gelman 1 9 9 8 )による複数系列が同一の点に収束しているかの診断は%GELMANOマクロで実行できる.そのほかに も多くのマクロがユーザーガイドで紹介されている.ただし, GEWEKEはプロシジャのオプションでも可能 である. MCMCプロシジャの出力データセットは以下の表 lのようになる. 変数名 型 説明 ITERATION 数値 サンプルのインデックス (任意の変数名) 数値 事後パラメータの値 LOGPRIOR 数値 事前確率の対数 LOGLIKE 数値 対数尤度 LOGPOST 数値 事後確率の対数 表 1SASの MCMC診 断 マ ク ロ の 入 力 フ ォ ー マ ッ ト S闘の出力結果もよく似たフォーマットになり,変数名が SASの命名則に反してないことに気をつければ IMPORTプロシジャで容易に読み込むことができる. S t a nでは事後確率が I p ーという名称で自動計算される ため,対数尤度 l o g l i k eを計算するようプログラムした結果を c s vで出力したという前提で,プログラム 1の ようにして診断できる.ただし,パラメータが非常に膨大な場合, 1行あたりの読み込みバイト数上限を超 える可能性があり注意が必要である. / * csv読み込み*/ proc import file="FOO/BAR. csv" out =work. result 5 356
dbms=csv replace ; run ; /会対数事前確率計算・イテレーション追加公/ data w o r k . result ; ー =logpost)) setw o r k . result (rename =(lp logprior = logpost ‑loglike iteration + 1 run ; %GEWEKE(data=work. result) プログラム 1S t a nの 結 果 を SASの MCMC診 断 マ ク ロ で 診 断 す る DICを求めたところ,出生率は AR (1)のケースが優れていた。一方で,死亡率のパラメータはドリフトラ ンダムウオークと VAR(l)し、ずれのケースでも男性に対応するパラメータの事後分布の収束が女性のものと 比べて遅かった.そこで,男女で独立な AR(l)を事前分布として設定したものを採用した.以下の 図 l および図 2は,それぞれ MCMCで推定した死亡率ノミラメータと出生率ノミラメータの対数のプロットで ある.青色が実績期間,灰色が予測期間で,年が新しくなるほど淡色となる.年々,乳幼児の死亡率と高齢 者の死亡率が低下していることが顕著である.また,出生率についても, 30代前半までが低下傾向にあるの に対して,それより上の年代は増加傾向にあることがわかる. 死亡恵パラメ~1989-2倒的 ・ 1 町凶 " 2 4 4可 υ { 橿E v m宵 酎 四 拍 曲 皿 回 咽 同 年歯 ヨ緩衝しい年昭ど揖色.予剖期聞は灰色で壇現.置は封歯スケ四ル. 図 l男女・年齢別死亡率パラメータの推定および予測値(平均値) 6 357 国
︽ aa Mmg ︾岨留 鈎 ・ " ・ 年8 器提鏑しい匁ほど鼠色.予翻飽聞は灰色で I U I . B1 :1晴敏スケール. 図 2年齢別出生率パラメータの推定および予測値(平均値) このグラフは TEMPLTE プロシジャを用いて作成した.プログラム 2はその際のマクロの抜粋である. %macro plot̲ln̲mu̲2(ds,year̲act̲end,entrytitle,entryfootnote); /*グラデーションになるよう色コードを作成女/ dataw o r k . tmp̲color̲mst(drop = i ) ; ̲HEX̲B length = $ 8 /*16進数カラーコード青り ̲HEX̲G length = $ 8 /*16進 数 カ ラ ー コ ー ド 灰 り ; do i = 0 to 200 ; CX"PUT(̲10,H E X 2 ., ) PUTし10 ,H E X 2 . ) ,' F F・ ); ̲HEX̲B = cats(・ ̲HEX̲G = cats('C X ', PUT(̲10,H E X 2 ., )p UT(̲10,H E X 2 . ) ,PUT(̲10,H E X 2 . )) output ; end ; r u n ; /*年とカラーコード対応表を作成し、マクロ変数に出力する処理中略*/ /*グラフテンプレートを作成ず'/ proc template ; define statgraph sgspaghetti ̲MU̲YEAR̲SEX ; dynamic̲AGE̲LN dynamic ̲panelnumber̲ ; begingraph / DatacontrastColors=( &contra. ) ; entrytitle halign=center "&ENTRYTITLE. " ; entryfootnote halign=left "&ENTRYFOOTNOTE. " ; layout datalattice columnvar=̲SEx ; /*中略*/ r u n ; /*描画会/ proc sgrender data=&ds. template=sgspaghetti 7 358
dynamic ̲AGE="AGE" ̲LN̲MU="'LN̲MU'n" ̲YEAR="YEAR" ̲SEX="SEX" OOS GRAPH工CS / ANTIALIASMAX=4100 r u n ; %mend plot̲ln̲mu̲2 ; プ ロ グ ラ ム 2TEMPLATEプ ロ シ ジ ャ を 利 用 し た グ ラ フ 作 成 プ ロ グ ラ ム ( 抜 粋 ) さらに,以下図 3,図 4がロジャース・モデルによって予測した岩手県盛岡市の人口を, 5歳刻みで集計しな おして 5年ごとに人口ピラミッドを作成したものである.これも T EMPLATEプロシジャを利用して作成し た.その際に使用したのがプログラム 3である.計算には MCMCサンプル事後パラメータの平均値を用い た.転入出を考慮しない閉鎖人口が図 3,転入出を考慮した開放人口が図 4である.図 4については,擬似的 な数値を与えたため,あくまで参考として見られたい. proc template; define statgraph sgpyramid; dynamic̲RANGE̲LABEL̲MALE2 ̲RANGE̲LABEL2 ̲FEMALE; begingraph; entrytitle halign=center " & t . 年"; 巴 ntryfootnotehalign=left "&ENTRYFOOTNOTE."; layout lattice / rowdatarange=data columndatarange=data columns=2 rowgutter=10 columngutter=10 columnweights=(0.5 0.5); layout overlay/ xaxisopts=( reverse=true) yaxisopts=( display=(LINE) discreteopts=( tickvaluefitpolicy=none)); bar(h)・ barchart category=̲RANGE̲LABEL response=̲MALE2 / name=・ datatransparency=0.5 orient=horizontal groupdisplay=cluster clusterwidth=1.0; endlayout; 工C KVALUES L工N E ) layout overlay / yaxisopts=( display=(T discreteopts=( tickvaluefitpolicy=none)); ・ barchart category=̲RANGE̲LABEL2 response=̲FEMALE / name='bar(h)2 datatranspar巴ncy=0.5 orient=hor 寸z ontal groupdisplay=cluster clusterwidth=1.0 fillattrs=Graphoata2; 巴n dlayout; endlayout; endgraph; e n d ; run; プ ロ グ ラ ム 3人 口 ピ ラ ミ ッ ド の フ ォ ー マ ッ ト 8 359
図3 2015年 か ら 2 0 4 0年 ま で の 岩 手 県 盛 岡 市 予 測 人 口 ( 閉 鎖 人 口 ) 図4 2015年 か ら 2 0 4 0年 ま で の 岩 手 県 盛 岡 市 予 測 人 口 ( 開 放 人 口 ) 結び L e e ‑ C a r t e rモデ、ルを拡張した階層ベイズモデルによる人口予測を試みるにあたって,一般公開されている全 国の国勢調査データから推定した人口の自然増減ノ号ラメータを代用することで,市町村別の人口予測を行っ た.本来ならば市町村のデータを使用すべきところなので,この結果は仮のものであり,いわばデモンスト レーションという形式であるが確率的モデルによる人口予測の可能性を示すことができた. また、本稿の試みでは時間その他の制約から, SASMCMCプロシジャを活用することができなかったが, 9 360
推定結果の視覚化や,推定ノ fラメータと実際の人口から予測人口を計算する場面では SASの豊富な機能を 活用して実行できることが示された. 謝辞 本稿の執筆にあたり, SASテクニカルサポートご担当各位に MCMCプロシジャの使用法についての相談 にご対応いただいたことに感謝の意を表す.ご援助いただきながらプロシジャの活用に至らなかったのはひ とえに著者の力不足によるものである.また,通常業務で多忙のなか,校正やプログラム作成で支援いただ いた弊社先輩・同僚各位に対しでもこの場を借りてお礼を申し上げる. 参照文献 Brooks, S .P .&Gelman, A.,1 9 9 8 .G e n e r a lMethodsf o rM o n i t o r i n gConvergenceofI t e r a t i v eS i m u l a t i o n s .J o u r n a l ,7 ( 4 ), p p .434 ・ 4 5 5 . o f C o m p u t a t i o n a landG r a p h i c a lS t a t i s t i c s Brouhns, N., D e n u i t, M.& Vermunt ,J .K., 2 0 0 2 .A P o i s s o nl o g ‑ b i l i n e a rr e g r e s s i o na p p r o a c ht ot h ec o n s t r u c t i o nof if e t a b l e s .I n s u r a n c e : ・M a t h e m a t i c sandEconomics ,3 1 ( 3 ), p p .373・3 9 3 . p r o j e c t e dI J ., 1 9 9 2 .E v a l u a t i n gt h ea c c u r a c yo f s a m p l i n g ‑ b a s e da p p r o a c h e st ot h ec a l c u l a t i o no f p o s t e r i o rmoments. Geweke, e s i a nS t a t i s t i c s ,Volume4, p p .1 6 9 ・1 9 3 . Bの' Lee, R .D .,1 9 9 3 .Modelingandf o r e c a s t i n gt h et i m es e r i e sofUSf e 目 i 1i t y :a g ed i s t r i b u t i o n, r a n g e, andu l t i m a t el e v e . l I n t e r n a t i o n a l j o u r n a l o f f o r e c a s t i n g ,9 ( 2 ), p p .1 8 7 ・ 2 0 2 . Lee, R .D.& C a r t e r ,L .R .,1 9 9 2 .ModelingandF o r e c a s t i n gU .S .Mo 由Iit y .J o u r n a lo f t h eAmericanS t a t i s t i c a l ,8 7 ( 4 1 9 ), p .659 ‑671 . A s s o c i a t i o n Renshaw, A.E .& Haberman ,S ., 2 0 0 6 .AC o h o r t ‑ b a s e dE x t e n s i o nt ot h eL e e ‑ C a r t e rModelf o rM o r t a l i t yR e d u c t i o n F a c t o r . l n s u r a n c e : ・M a t h e m a t i c sandEconomics ,Volume58, p p .556・5 7 0 . S p i e g e l h a l t e r , D.J ., B e s t , N.G., C a r l i n ,B .P .& VanDerL inde, A ., 2 0 0 2 .B a y e s i a nMeasuresofModelComplexity andF i t .Journaloft h eRoyalS t a t i s t i c a lS o c i e 砂:S e r i e sB,6 4 ( 5 ), p p .583・6 3 9 . Wisniowski, A.e ta , . 12015.Bayesianp o p u l a t i o nf o r e c a s t i n g :e x t e n d i n gt h eL e e ‑ C a r t e rm e t h o d .Demography. 国立社会保障・人口問題研究所, 20 日 • f 3 J ; 大の地級別将来推H人口 f ♀Z 成 251 F3jj推計).[オンライン] Av a i l a b l ea t :h t t p : / / w w w . i p s s . g o . j p / p p ‑ s h i c y o i ! o n L j / s h i c y o ! ! o n I 3 / t ‑ p a g e . a s p 小池司朗, 2 0 0 8 .地域別将来人口推計における人口移動モデルの比較研究. λ 口周題研究:.64[3],pp.87・1 11 . 小暮厚之長谷川智弘, 2 0 0 5 . 将来生命表の統計モデリング:L e e ‑ C a r t e r法とその拡張司ヒューマンセキュ リテイへの基盤研究.総合政策学クーキングベーパーシグーズ:I s s u e71 . 石井太, 2 0 0 6 .我が国の平均寿命の動向と死亡率推計モデルの検討.人口 f l l l 題研究:.6 2 [ 3 ], p p .2 1・3 0 . 南保善治吉永一彦, 2 0 0 6 .L e e ‑ C a r t e r法による日本の将来生命表の推計:寿命レベル別生命表の利用 . β 本 大学人口研究所報告シリーズ, I s s u e1 . 1 0 361
貧困・中流・富裕世帯における教育費の実態調査 参加カテゴリー : B ) S A Sまたは JMPの 使 用 歴 3年未満 四方克成(個人参加) S u r v e yo fe d u c a t i o n a le x p e n s e si nt h ec l a s s i f i c a t i o nb yh o u s e h o l di n c o m e K a t s u n a r iS h i h o 要約 教育に対する家計負担が高まる現在 l、親の経済力が子供の進路を左右する 2。深刻な貧困問題を 引き起こす教育格差 3の実態を一つでも多く明らかにすべく疑似ミクロデータを用いて分析を行った。 全体の 3.1%が教育費を支出する貧困世帯であった。貧困、中流、富裕の 3区分で見ると、富裕世帯 における教育費の支出割合は食料費よりも高く、世帯主年齢 4 0 " " " 5 9歳の富裕世帯では平均支出額が 中流世帯の 2倍近かった。また、教育が賛沢品に該当する世帯にて、教育費を節約した場合、貧困より も富裕世帯の家計収支に与える影響の方が大きかった。 1 .はじめに <貧困の裏にある格差の構造> 2 1世紀の資本』の著者であるトマ・ピケティ七昨年、彼の来日が発 世界中で大ベストセラーとなったW 表された頃 5から、再び新聞や雑誌、テレビなどで「格差」という言葉が取り上げられるようになった。 十年前にこの言葉が取り上げられたのは、派遣社員と正規社員の聞における労働市場の二分化がき っかけであったえしかし、今回の場合は、日本の国民経済は根本的に貧富の差が広がる構造になって いるというものである(図 1 7 )。この不等式をモチーフに、 図 1 ピケティの格差論 貧困家庭で育った人が非正規労働として働く様子、自 r 分の子供にも十分な教育を受けさせてあげられない生 活など、さまざまな実態が報道されている。 (資和収益率) > g (経済成長率) 株や不動産などの資本から得る収益が国の経済成長率を 上回る為、何も策を講じなければ、富裕層が裕福になり続け 格差が広がることを示す。 <家計を圧迫する教育費> 教育に対する家計負担は明らかに高まっている。消費者物価指数の変化を調べると、教育の物価指 980年と 2015年の比較で、総合が 7 7 . 2から 1 0 3 . 6 数が他と比べ大幅に上昇していることがわかる。 1 となっているのに対し、教育は 49 .4から 1 0 2 . 3となっている(表 1 )。 9 8 0年と 2 0 1 5年における消費者物価指数の違い ( 2 0 1 0年=100) 表 11 出所.総務省統計局『平成 2 2年基準消費者物価指数』参考文献白] 365
<親の年収に左右される子供の進路〉 教育の値段が高い日本の生活において、 子供の学力と未来を支えるものは、やはり親の 経済力しかないのだろうか。 東大生の親の年収は 750万円以上が約 70%を占めている(グラフ 1 )。 そして、親の年収が高くなるにしたがって、 子供の専門学校と就職への進路率は下がり、 私立大への進路率が大きく上がっている(グラ フ2 )。 出所・東京大学「学生生活実態調査( 2 0 1 4年) J 参考文献凹 グラフ 2 親の年収jJ J l の高校卒業後の進路 601 一一一一 一一一一一一一一一 ー 1 5 . 5 50 一一一一一一一一 ι 4 i . 6 5 0 . 5 冊 。 万円以下 200 2 0 0 . . 1 0 0万円 400.600万円 600.800 万円 ・噌圃・専門学校・・・ー就職四叫炉E 私 立 大 一 8 ( ) ( ) . 1 0 0 0万円 1000 ・ 1200万円 短期大 国公立大 1200万円超 浪人・未定 出所:東京大学 ( 2 0 0 9 )r 高校生の進路と親の年収の関連について」参考文献[司 2 .分析テーマ <疑似ミクロデータを使って教育費の実態を調査する> ①貧富の差によって、教育費の支出にどのくらいの差があるか。 ②総務省の統計調査により、二人以上総世帯・勤労者世帯にとって、教育費は賛沢品に該当する B ことが明らかになっているが、貧富の差による違いはあるか。 ③教育費に対する過剰な支出をやめて節約した場合、家計に与える影響はどのくらし、か。 以上、 3つの小テーマに沿って分析を行う。 <分析の目的> 限られた条件による分析結果となる為、すべての世帯に対する汎用的な説明として、用いられること は難しいと思料する。しかし、より多くの人の問題意識を高めるきっかけとなって、さらなる分析調査につ ながり、日本における教育格差の問題が早期に解決されることを願う。 2 366
<本論の進行順序> .疑似ミクロデータに含まれる貧困率の基礎分析 ・データの分類化について ・消費構造における教育費の分析 ‑・・小テーマ①に対応 .教育費の必需品/賛沢品の分析 ・・小テーマ② 1 1 ‑教育費を節約した場合の家計に与える影響の分析 ・・小テーマ③ 1 3 .疑似ミクロデータに含まれる貧困率の基礎分析 貧困や格差の議論で用いられる指標の一つ、等価方式による相対的貧困率を使って、疑似ミクロデ ータに含まれる貧困世帯の割合を分析した。結果、等価可処分所得の中央値は 21万 423円、貧困線 0万 5, 211円、貧困線に満たない相対的貧困率は 6.7%であった(グラフ 3 表 2 )。 は1 グラフ 3 等価可処分所得に対する世帯数累積パーセント(集計用乗率使用) 100〆O 90 80 70 60 50 40 30 20 10 。。 10万 円 20万 円 30万 円 等価可処分所得(月) [用語説明司 1 ) 相対的貧困率…ある国や地域における相対的貧困者の割合。 2 ) 等価方式による相対的貧困率・・・等価可処分所得から算出した貧困線未満の人々の割合。 3 ) 貧国線・・・国民の等価可処分所得の中央値の半分の額。 4 ) 等価可処分所得・・・可処分所得を等価計算で求めた額。 5 ) 等価計算・・・値を世帯人員の平方根で除す計算方法。 表 2 等価可処分所得の範囲別世帯数と割合(集計用乗率使用) 等価可処分所得 ( x ) 世繕数{合計に占める割合) 小計(合計に占める割合) 211 x<105, I105, 211<=x<210, 423 210, 423<=x 33 , 306 ( 6 . 7 % ) 214, 425 ( 4 3 . 3 % ) 733 ( 5 0 . 0 % ) 247, 247 , 732 ( 5 0 . 0 % ) 495, 465 ( 1 0 0 . 0 % ) 合計 3 367 247, 733 ( 5 0 . 0 % )
4 .データの分類化について く貧困・中流・富裕の区分け> )。 貧富の差で分析する為、等価可処分所得の中央値を基準に分類条件を設定した(表 3 表 3 貧困・中流・富裕グループの分類条件 鯛一時一輪 分銅条件(等価可処分所得) 中央値x O . 5未満 中央値x O . 5以上、 x1 .5朱 潜 中央値x1 .5以よ 等価可処分所得の範囲 1 0 5, 2 1 1円朱満 1 0 5, 2 1 1円以上、 3 1 5, 6 3 4円未満 3 1 5, 6 3 4円以上 <教育ありと教育なし世帯の設定〉 教育を受けさせている世帯に絞って分析する為、教育費の支出 >0の世帯を対象とした。 <データ分類結果〉 格差別、教育費の支出あり・なし別に世帯数をクロス集計した結果、教育費の支出ありの貧困 世帯は、全体の 3.1%であった(表 4 )。 表 4 格差別教育区分別世帯数(集計用乗率使用) 分続対象 分析対象外 教育裂の支出あり 教育費の支出なし 合計 貧困 1 5, 4 1 9 中 i I I f 富裕 2 0 5 , 8 9 9 41 .6% 1 7 4, 6 0 4 3 5 . 2 % 3 8 0, 5 0 4 7 6 . 8 % 27 , 7 4 9 5 . 6 % 0 . 9 % 5 3, 9 0 7 1 6 5 5 1 8 1, 6 . 5 %I 合計 2 4 9 , 0 6 6 5 0 . 3 % 2 4 6 , 3 9 8 4 9 . 7 % 4 9 5, 4 6 5 3 . 1 % 5 .消費構造における教育費の分析 1 7 . 8 8 7 3 . 6 % 33 , 3 0 6 6 . 7 %I 表 5 消費支出に対する各支出項呂の割合 (集計用乗率使用) く富裕世帯における教育費は食料費を超える> 教育費の支出あり世帯を対象に貧困世帯、中流世帯、 富裕世帯のそれぞれにおける消費構造を把握する為、 消費支出(全体)に対する各支出項目の割合を比較し た(表 5 )。 食料や住居、光熱・水道などの生活必需品項目に ついては、富裕世帯よりも貧困世帯の方が割合は高か │ 貧困 中涜 6.4% 4.6% 3.7% 光熱・水道 7.8% 6.2% 4.2% 家具・家事用品 2.9% 2.7% 2.0% 被服及び厩物 4.0% 4.2% 4.0% 保健医療 3.8% 3.4% 2.6% 富裕 . . . 1 6.9% 食料 住居 交通・通信 14.1% 14.0% 教育 l1 .Q 弘 U~ ・ 活に不可欠ではない項目とともに貧困世帯から富裕世 教養鍛楽 8.8% 9.8% 8.8% 帯に向かって割合が高くなっている。 諸雑貨 4.9% 5.5% 5.6% こづかい 5.0% 7.7% 8.8% I 交際費 3.7% 4.7% 5.3% I 仕送り金 0.9% 1 .9% 5.3% った。 しかし、教育費については教養娯楽や交際費など生 注目すべき点として、富裕世帯における教育費の割 合は、食料費の割合よりも高く、食料 16.9%に対して 教 育 17.7%であった。 4 368 15.0% m~叫Jμ ρ 仇
<富裕世帯における教育費の支出割合は年齢階級による高低差が大きい> 教育費の支出割合の違いについて、世帯主年齢に対する傾向を見る為、年齢 5歳階級別にヒストグラ ムを使って比較した(グラフ 4 )。 全体的に世帯主年齢が高い方が、教育費の支出割合が高いことがわかる。富裕世帯においては、貧 困・中流世帯に比べ、年齢階級による高低差が大きい。支出割合が高めの 50‑59歳の範囲では 20% 以上となっていた。 グラフ 4 世帯主年齢 5歳階級別教育費の支出割合(集計用乗率使用) 聞貧困ロ中涜・富裕 % ; 30 25 20 叩 一 一一一一一一一一一ー一一一一一一 1 5 5 。 25‑29 歳 30‑34歳 35‑39 歳 40‑44歳 45‑49歳 50‑54歳 出 ‑59歳 60‑64 歳 65‑69 歳 0 . . . . 5 9歳で中流世帯の 2倍 近 い > <富裕世帯における教育費の支出額は 4 教育費の支出額の差を把握する為に、中流世帯の平均支出額を 1 0 0として、貧困・富裕世帯の平均 支出額をヒストグラムにして比較した(グラフ 5 )。 富裕世帯では、 40‑59歳の年齢階級で中流世帯の 2倍に近い支出額となっていた。また、富裕世 帯の支出額は年齢階級による高低差が大きいこともわかった。 グラフ 5中流世帯の平均支出額= 1 0 0とした時の貧困世帯・富裕世帯の平均支出額(集計用乗率使用) 回貧困・富裕 200 100 。 25‑29歳 :30‑34歳 35‑39 巌 40‑44 歳 45‑49歳 50‑54歳 出 ‑59歳 60‑64歳 65‑69歳 5 369
6 .教育費の必需品/賛沢晶の分析 < 4 0 . . . . . 5 9歳の年齢階級では貧富の差に関わらず教育は賛沢晶に該当> 格差別、年齢階級別に教育費の性質が必需品か賛沢品かを判別する為に支出弾力性を計算した。 計算にあたり、消費支出に対する教育費の回帰式を求める段階で、係数(限界性向)が有意では ない格差・年齢階級の組み合わせは除外した ( p < 0 . 0 5 )。 計算結果を分析すると、 40~59 歳の年齢階級においては、貧富の差に関係なく、教育費は賛 沢品に該当することがわかった(表 6 )。 表 B 消費支出に対する教育費の支出弾力性(集計用乗率使用) E覇軍調車庫掴 │必需品に該当 i [参考吋 支出弾力性とは、消費支出総額が 1%変化する時に各支出項目が何%変化するかを 0未満の支出項目は基礎的支出(必需品)に分類 示した指標である。支出弾力性が1.0 0以上の支出項目は され、食料、家賃、光熱費、保健医療サービスなどが該当する。1.0 選択的支出(賛沢品)に分類され、教育費、教養娘楽用耐久財、月謝などが該当する。 [支出弾力性の計算] 1 ) 格差別、年齢階級別に消費支出に対する教育費の回帰式を求める。 教育費 ( Y ) =限界性向 (a)・消費支出 ( X ) +切片 ( b ) 2 ) 限界性向 ( a )について、有意差が認められない ( 0 . 0 5超)場合、その格差、年齢階 級の組み合わせば除外する。 3 ) 格差別、年齢階級別の限界性向 (a)、平均消費支出(玄)、平均教育費(Y)を使つ て、支出弾力性を求める. 支出弾力性 (η) =0.01X 限界性向 (a) X 平均消費支出(宝) X 100 平均教育費(Y) 6 370
7
.教育費を節約した場合の家計に与える影響の分析
<節約の影響は貧困世帯よりも富裕世帯の方が大きい>
貧困・中流・富裕世帯において、教育費が賛沢品に該当した世帯主年齢 40~59 歳の世帯を対象に、
教育費を節約した場合の家計に与える影響を分析した。
0
) の世帯が、教育費を節約した場合に黒字(実収入・実支出
家計収支が赤字(実収入.実支出 <
+教育費 x節約率>
0
) に変わる割合を調べる方法で行った(グラフ 6
) 。節約率は 25%で設定。
結果、貧困世帯は赤字世帯の割合が大きく、節約によって黒字に変わる世帯は1.1 ~3 .4%の
聞にとどまり、節約の影響は小さかった。富裕世帯は赤字世帯の割合は小さく、節約によって黒
字に変わる世帯は 55~59 歳にて 8.8% となり、最も大きく節約の影響があらわれた。
グラフ 6 黒字世帯、赤字世帯、教育費 25%節約で黒字に変わる世帯の割合(集計用乗率使用)
掴黒字世帯
.25%節約で黒字に変わる世帯
A 赤字世帯
。
"
1
0
0
9
0
80
70
f
j
O
5
0
1
0
:
3
0
2
0
1
0
0
40‑44 45‑49 50‑54 55‑59 4
0
‑
'
1
44
5
‑
4
f
J 50‑54 55‑59 .
1
0
‑
4
4 45‑49 50‑54 1
'
i5‑;
J
f
)
歳 歳 歳 歳 歳 歳 歳 歳 歳 歳 歳 歳
貧国
中流
富裕
8
.結論 : 分析結果まとめ
<消費構造における教育費の分析(小テーマ①)>
‑富裕世帯における教育費の支出割合は食料費の割合よりも高い。
-富裕世帯における教育費の支出割合は年齢階級による高低差が大きい。 50~59 歳の範囲で
は支出割合は 20%を超えている。
-富裕世帯における教育費の支出額は、 40~59 歳の範囲で中流世帯の 2 倍近い。
<教育費の必需品/賛沢品の分析(小テーマ②) >
• 40~59 歳の範囲では、貧富の差に関係なく、教育費は賛沢品に該当する。
<教育費を節約した場合の家計に与える影響の分析(小テーマ③)>
‑節約の影響は貧困世帯よりも富裕世帯の方が大きい。
7
371
9 .考察 <メッセージ> 0 . . . . . . . 5 9歳の範囲では、貧富の差に関係 分析目的に対して得られた結論は二つある。一つ目は 4 なく教育は賛沢品に該当するなか、貧富の差によって支出に大きな格差があるということ。富裕 世帯では賛沢品であっても、食料費よりも多くの教育費を支出しており、貧困世帯にとっての賛 沢品とは性質が異なる。したがって、性質をあらわす新たな指標の発明も求められる。 二つ目は貧困世帯において、教育費の節約が家計にほとんど効果がないこと。貧困世帯は家計 が既に赤字の状態でも、学歴が左右する現実に負け、教育費を支払う決断に踏み切っているかも しれない。教育費によってさらなる貧困化が進んでいる可能性がある。 この二点が論文を読んで頂いた方へ伝えたいメッセージである。 く分析結果の適用範囲> 当分析結果は、以下の点を考慮して使用すべきである。 ・等価可処分所得の中央値を基準に貧困世帯、中流世帯、富裕世帯に分類している。 (収入階級、可処分所得による分析とは異なる可能性がある) ・疑似ミクロデータを用いており、単身世帯、無業世帯は含まれていない。 ‑教育費は、子供に対してだけではなく、自身や他の親族に対する支出の可能性がある。 1 0 .本文中の注について 1… .はじめにく家計を圧迫する教育費>の要約。 2… , , 3… 参考文献 [ 1 ]を読んだ感想要約。家庭事情や親が病気などの理由で経済水準が低 .はじめにく親の年収に左右される子供の進路>の要約。 く、まともな教育を受けられずに育った子供たちが、親になり現在も苦しい生活を続 けている。貧困の連鎖が断ち切れない社会問題がルポ形式で書かれている。 4… 参考文献 [ 1 1 ]の要約。 5… 参考文献 [ 9 ]、来日期聞は 2015年 1月 29日(木). . . . . . . 2月 1日(日)。 … 参考文献問、経済協力開発機構 (OECD)が日本に対する報告書の中で指摘した 6 ことが話題になった。日本における非正規労働が 1995年から 2005年にかけて 19%から 30%に拡大し、そして、非正規労働の賃金が正規労働の 40%しかないこ とが「経済格差」を引き起こすことになる。 7… 文章は参考文献 [ 2 ] [ 3 ]を要約、図は参考文献[幻 4 1ページ引用。 8… 参考文献 [ 8 ]のデータに基づいた根拠。 9 … 参考文献日 0 ]の要約。 1 0 . .・ 参考文献日 2 ]の引用。 8 3 7 2
1 1 .参考文献 <図書・雑誌> [ 1 ]保 坂 渉 ( 2 0 1 5 )W子どもの貧困連鎖』新潮社 凶中川│雅之 ( 2 0 1 5 )1 2 0 0 0万人の貧困 J W日経ビジネス』日経 BP社 2015年 3月 23日発行 [ 3 ]藤 田 康 範 ( 2 0 1 5 )Wコミックでわかるヒ。ケティ入門』中経出版 <オンライン> [ 4 ]経済協力開発機構 (OECD) mconomicS u r v e y s :Japan2006~ ( 2 0 1 6年 6月 1 7日) h t t p : /川 w w . k e e p e e k . c o m / D i g i t a l ‑ A s s e t ‑ M a n a g e m e n t / o e c d / e c o n o m i c s / o e c d ‑ e c o n o m i c i ̲ a p a n ‑ 2 0 0 6 ̲ e c o ̲ s u r v e v s ‑ j p n ‑ 2 0 0 6 ‑ e n 恥a g e 1 9 6 ‑ s u r v e v s ‑ [ 5 ]東京大学 (200917131)W高校生の進路と親の年収の関連について』 h t t p : / / u m p . p . u ‑ t o k v o . a c . i p / c r u m p / r ちs o u r c e /c r u m p 0 9 0 7 3 1 . p d f [ 6 ]総務省統計局『平成 22年基準消費者物価指数』 h t t p : / / w w w . e ‑ s t a t .日o .i p / S G1 /e s t a t /L is t .d o ? b i d = 0 0 0 0 0 1 0 3 3 7 0 0 & c v c o d e = O [7] 東京大学『学生生活実態調査 (2014 年)~ h t t p : // w w w . u ‑ t o k v o . a c. j p / c o n t e n t /4 0 0 0 3 7 1 5 2 . p d f 2 0 1 5年)1月改定 [ 8 ]総務省統計局『家計謂査収支項目分類及びその内容例示(平成 27年 ( u 支払消費支出(交通・通信,教育,教養娯楽,その他の消費支出)(エクセル:266KB) .. ip / d a t a / k a k e i / k o u 2 7 / r e i i . i 2 7 .h t m h t t p : / / w w w . s t a t .日o [ 9 ]みすず書房(最終更新 2015/212)W21 世紀の資本のトマ・ピケティ来日 ~(2016 年 6 月 17 日) h t t p : / / w w w . m s z . c o . i p / t o p i c s / 0 7 8 7 6 / [ 1 0 ]総務省統計局 (2015/12118)W相対的貧困率等に関する調査分析結果~(2016 年 6 月 17 日) h t t p : // v 仰w .s t at . 日o .i p / d a t a/ze n s h o / 2 0 0 9 / p df/h i n k o n r it s u .p d f [ 1 1 ]W i k i p e d i a(最終更新 2016/6/13)W21 世紀の資本~(2016 年 6 月 17 日) h t t p s : //i a .w i k i p e d i a . o r g / w i ki /2 1% E 4 % B 8 % 9 6 % E 7 % B 4 % 8 0 % E 3 % 8 1%AE%E8%B3%87%E6%9C%AC [1 幻総務省統計局『家計調査支出弾力性の計算方法について ~(2016 年 6 月 17 日) h t t p : / / w w w .s t a t .日o .i ̲p / d a t a / k a k e i / k o u 1 7 / d a n 1 7 . h t m 9 373
付録規定課題 1)産業符号・性別クロス表 表1 2 )経常収入および食料費 表2 食料箆ヒストグラム 経常収入ヒストグラム " ‑ t ! ン ト 2 5. J 2I̲ m ォ 2 泊四 50 , , ̲ 寸144喝 ﹂ , ' ‑ t ! ン ト 回 " 44lJ S , ̲ 。 ‑ ' 今 ・ ・ ・ 白 唱 8 1 Q J 3 1家満 圃 ・ 叫 闘1 以よ ・ 圃 肌"地上 園 ・ 刷 . 1 8 1 以上 園 圃 周 岡田出土踏穫量制単位開 ー 。 1 3 7 4 削町時鏑 即仰はJ: a , 3IU . 2 I 孔 . t 1 & 0 5 6. 1 以 上 健. 0 1 5出 土 防 緑E 剤取他'1'1)
3) 男女別・経常収入および食料費の 5分位分布 表3 食料費 4) 男女別・経常収入・食料費についての 3重クロス表 表4 震1 同( 5 重 量1 t 2 3 4 5 , 8 3 1 男 5, 8 2 7 3, 9 7 4 2, 7 9 8 1 t 1 3 0 4, 5 0 1 9 9 6 2, 5, 2 5 2 3 1 ,,,O 0 2 1 9 3 6 T 2 8 4 1 4 3 , •9 3 O 7 9 B 2 5 8 4, 2 9 4 . , 3 2 3 0 3 T 3 トー 2 1 , 9 9 0 1 6 1 4 9 0 3 4, 1 , 0 2 9 2 . 0 8 7 3, 4 8 1 5, 0 2 6 7, 8 1 3 5 1 6 , 8 0 31 8, 0 9 71 8, 7 3 41 9 . 0 4 91 9, 3 1 7 1 f t !実 2, 4 6 2 9 9 4 5 1 4 1 7 2 6 5 3 3 7 1 3 1 1 1 6 1 9 9 2 3 5 2 2 ー 6 3 3 2 1 5 1 6 1 1 4 6 3 4 1 4 0 4 5 3 1 1 5 2 9 6 1 1 7 1 4 9 5 3, 1 9 6 11 , 9 0 3 1 , 2 6 8 制S 面r 1 9, 9 宮 町 20, 0 0 02 , 9 9 8 9 0, i男J{計 0 0 11 i 経常収入5分位 計│ ト ÷ i 書 宅2 出 き詐筈 自 民 56 J I 5 )男女別・経常収入別に食料買を常用対数変換した平均値の比較 表5 食料費幾何平均(男女別・経常収支の分位点別) 宜料貸揖向平均 1 2 0日間一 1 0 0 0 0(1‑ 80000‑ 60000‑ 4 0 0 0目『 20000‑ a 陸常収入 5分世 ー男‑1< 2 375
付録規定課題のS A Sプログラム 1) 産業符号・性別クロス表 ヤ出力形式の準備 *i PROCFORMATL l B=SASUSER: 2= 女‑. VALUE 5 e x 1=‑男 VALUE 5 a n g y o 1=‑農業.. 2=‑林業‑ 3=‑漁業.. 4=‑鉱業. 5='建設業 6="製造業" 7="電気ガス・熱供給・水道義‑ 8= 情報通信業.. 9=‑運輸業‑ 1 0=卸売・小売業" 1 1= 金融・保険業‑ 1 2=‑不動産業" 1 3="飲食底宿泊業 14="医療・福祉" 1 5=教育・学習支援業 1 6="綾合サービス事業 1 7="サ ピス業(他に分類されないものY 1 8="公務(他に分類されないもの)" 1 9="その他(非就業を含む)" 99=..不詳勺 R U N : 1 * 表作成用デー舎の準備 * 1 PROCS Q L : .K1 d a t aAS CREATETABL 正SASUSER SELECT S I ̲ S e xFORMAT=5ex.ASS e x . 1ASS e t a i . W e i g h t * 1 0キ*5/495465ASJ m n W e i g h . t (CASES I ̲ S a n g y o uWHEN" V V "THEN99ELSEI N P U T ( S I ̲ S a n g y o u . b e 5 t I 2 . ) E N D ) FORMAT=5angyo.ASS a n g y o u .G I J I D ATA : FROM SASUSER バラベルの準備*/ tl a b e l O l=合計. 矧e 矧e tl a b e l 0 2=a )単純ウロス表 % I e tl a b e l 0 3=b )1 0万人世帯比でのウロス表. 矧e tl a b e l 0 4=産業符号, ) * iT I T L E. 表 1 " : バ表の作成(表 1 PROCTABULATEDATA=S A S U S E R . K l d a t a : VAR S e t a i : CLASS S e xS a n g y o u : L L = ( L A B E L = " & l a b e I O l " } . TABLE S a n g y o u = ( L A B E L =…}A ( S e t a i = ( L A B E L = "& l a b e I 0 2 ‑ } * F = C O M M A 6キ Sex={LA8EL=…} * N = { L A 8 E L =…}A L L = { L A 8 E L = " & l a b e I O l ‑ } * N = { L A 8 E L =…}) S e t a i = ( L A 8 E L = "& l a b e l 0 3"}*F=COMMA7 . 0 ( S e x = { L A 8 E Lピ' ' ' } * S u m W g t = { L A B E L =…} A L L = { L A 8 E L = " & l a b e I O l " } * S u m W g t = { L A 8 E L =…}) /80X={LA8EL= & l a b e I 0 4 "STYLE={JUST=LEFTVJUST=80TTOM}}MISSTEXT="O勺 WEIGHTJ m n W e i g h t : R U N :Q U I T : 2 )経常収入および食料費 1 *表作成用デー告の準備ホ/ PROCS Q L : R .K 2 d a t aAS CREATETABLESASUSE SELECT Y o u t o 0 0 4LA8EL=経常収入"ASI n c o m e . Y o u t o 0 3 8LA8EL="食料費 FROM SASUSER .G I J I D ATA : ASF o o d . W e i g h tASW e i g h t ホラベルの準備前 tl a b e l 0 5=20%: 百l e tl a b e l 0 6=40%: 捌e tl a b e l 0 7=60%: 如e tl a b e l 0 8=80%: 百l e tl a b e l 0 9= 分 位 点 矧e ) * /T I T L E表2 " : 川表の作成(表 2 PROCTA8ULATED A T A = S A S U S E R . K 2 d a t a : VAR I n c o m eF o o d : l a b e I 0 5 "S T Y L E = { J U S T = R I G HT } } P 4 0 = { L A 8 E L = " & l a b e I 0 6 "S T Y L E = [ J U S T = R I G H T } } TABLE P20={LA8EL= & P60={LA8EL="& l a b e l O TSTYLE={JUST= R I G H T } } P80=(LA8EL="& l a b e I 0 8 "S T Y L E = { J U S T = R I G H T } } . Income*F=COMMA7 . Food*F=COMMA6 } }: /B O X = { L A 8 E L = " & l a b e I 0 9 "S T Y L E = [ J U S T = R I G HT WEIGHTW e i g h : t R U N : /*グラフ出力形式の準備*/ PROCFORMATL l 8=SASUSER: VALUE i n c o m e 1=" 3 1 0 . 5 3 1未満 4=" 5 0 1 . 1 8 1以上 VALUE f o o d 1=" 4 9 . 7 0 1未満 4=" 7 6 . 0 5 5 . 1以よ R U N : 2=‑ 3 1 0 . 5 3 1以上 3=‑ 4 0 4 . 8 8 3以上 5=" 6 3 5 . 8 7 5以上 2=" 4 9 . 7 0 1以上 3=" 6 3 . 1 4 6 . 2以上" 5= 9 3 . 0 3 5 . 8以上 . 3 376
2) 経常収入および食料費【続き】 /志グラフ作成用デーヲの準備*/ PROCS Q L ; CREATETABLESASUSERK2dataGprtAS SELECT (CASEWHEN310531 >Y o u t o 0 0 4THEN1WHEN404883>Y o u t o 0 0 4> =310531 THEN2 WHEN501181 >Y o u t o 0 0 4> =404883THEN3WHEN635875>Youto004> =501181 THEN4 WHENYouto004> =635875THEN5E N D )F O R M A T = i n c o m e .ASI n c o m e Q u i n t, (CASEWHEN49701.0>Y o u t o 0 3 8THEN1WHEN6 3 1 4 6 . 2>Y o u t o 0 3 8> =49701THEN2 WHEN7 6 0 5 5 . 1 >Y o u t o 0 3 8> =6 3 1 4 6 . 2THEN3WHEN93035.8>Y o u t o 0 3 8> =7 6 0 5 5 . 1 THEN4 WHENYouto038> =9 3 0 3 5 . 8THEN5E N D )FORMAT=food.ASF o o d Q u i n t W e i g h t本 10*キ5/495464ASJ m n S e t a i FROM S A S U S E R G I J I 臼A T A ; /棒グラフ表示形式の準備 * 1 A x i s 1LABEL=("パ一セント"); A x i s 2LABEL=NONEVALUE=NONE; A x i s 3LABEL=("階級区分(単位円)"); *グラフの作成(経常収入ヒストグラム ) * iT I T L E"経常収入ヒストグラム! PROCGCHARTDATA=SASUSER .K 2 d a t a G p r t ; VBAR J m n S e t a i / G R O U P = l n c o m e O u i n t LEVELS=1 TYPE=PCTM I S S 州G R A X I S = A x s i 1 M A X I S = A x i s 2 G A X I S = A x i s 3 ; R U N ; 牢ゲラフの作成(食料費ヒストグラム)本 i T I T L E 食料提ヒストグラム". PROCGCHARTDATA=SASUSERK2dataGprt; VBAR J m n S e t a i / G R O U P = F o o d Q u i n t LEVELS=l TYPE=PCTM I S S I N G R A X I S = A x i s1 M A X I S = A x i s 2 G A X I S = A x s i 3 ; R U N ;O U I T ; 3 )男女別・経常収入および食料費の 5分位分布 バ出力形式の準備*/ PROCFORMATL l B=SASUSER; VALUE s e x 1= 男 2="女 VALUE i n c o m e 1=" 3 1 0 . 5 3 1未満 2="310, 5 3 1以上 3="404, 883以上' 4=" 5 0 1,1 8 1以上 5="635,875以上 VALUE f o o d 1="49,7 0 1未 満 2="49, 7 0 1以上 3=" 6 3,1 4 6 . 2以上" 4="76, 0 5 5 . 1以よ 5="93, 0 3 5 . 8以上勺 R U N ; 1*表作成用デ一世の準備*/ PROCS Q L ; CREATETABLESASUSERK3K4dataAS SELECT S l ̲ S e xFORMAT=sex.ASS e x, 1ASS e t a i, (CASEWHEN310531 >Y o u t o 0 0 4THEN1WHEN404883>Y o u t o 0 0 4> =310531 THEN2 WHEN501181 >Youto004> =404883THEN3WHEN635875>Y o u t o 0 0 4> =501181THEN4 WHENYouto004>=635875THEN5E N D )F O R M A T = i n c o m e .ASI n c o m e O u i n . t (CASEWHEN310531 >Y o u t o 0 0 4THEN1WHEN404883>Y o u t o 0 0 4>=310531 THEN2 WHEN501181 >Y o u t o 0 0 4> =404883THEN3WHEN635875>Y o u t o 0 0 4> =501181 THEN4 WHENYouto004> =635875THEN5E N D )ASI n c o m e O u i n t N o, (CASEWHEN49701.0>Y o u t o 0 3 8THEN1WHEN63146.2>Y o u t o 0 3 8> =49701 THEN2 WHEN7 6 0 5 5 . 1 >Y o u t o 0 3 8> =6 3 1 4 6 . 2THEN3WHEN93035.8>Y o u t o 0 3 8> =7 6 0 5 5 . 1 THEN4 WHENY o u t o 0 3 8>=9 3 0 3 5 . 8THEN5E N D )FORMAT=food.ASF o o d O u i n t, (CASEWHEN49701 .0>Y o u t o 0 3 8THEN1WHEN63146.2>Y o u t o 0 3 8> コ 4 9701THEN2 WHEN7 6 0 5 5 . 1 >Y o u t o 0 3 8> =6 3 1 4 6 . 2THEN3WHEN93035.8>Y o u t o 0 3 8> =7 6 0 5 5 . 1 THEN4 WHENY o u t o 0 3 8> =9 3 0 3 5 . 8THEN5E N D )ASF o o d O u i n t N o, Weight*10**5/495465ASJ m n W e i g h t ; FROM SASUSERGIJIDATA /本ラヘ Jレの準備本/ 目l e tl a b e l 1 0 =計 , 制e tl a b e l 1 1=5分位 5分位数; 4 377
3 )男女別・経常収入および食料費の 5分位分布【続き】 f本表の作成(表 3経常収入 ) * 1TITLEl 表 3 " ;T I T L E 2"経常収入". PROCTABULATEDATA=SASUSE R . K 3 K 4 d a t a ; VAR S e t a i ; CLASS S e xI n c o m e Q u i n t I n c o m e ロ u i n t N o ; T Y L E ( C L A S S L E V ) = ( J U S T = C E N T E R } } * TABLE I n c o m e Q u i n t N o = ( L A B E L = S T } } ALL=(LABEL="& I a b e l l0 " STYLE=( JUST= R I G H T J } . I n c o m e Q u i n t = ( L A B E L = " "S T Y L E ( C L A S S L E V ) = (JUST= R I G H … … ] ホ( S e x = ( L A B E L =…) * S u m W g t = ( L A B E L = " " }キF=COMMA6 S e t a i = ( L A B E L = A L L = ( L A B E L = "& I a b e l lO"}*SumWgt=(LABEL=""}*F=COMMA7 . ) /B O X = ( L A B E L = " & l a b e l l l" } ; m n W e i g h t ; W日GHTJ R U N ; /*衰の作成(表 3食料費 ) * / T I T L E 2"食料費". PROCTABULATEDATA=SASUSE R .K3K4data; VAR S e t a i ; CLASS S e xF o o d Q u i n tF o o d Q u i n t N o ; …STYLE(CLASSLEV)=(JUST=CENTER}}傘 TABLE F o o d Q u i n t N o = ( L A B E L = F o o d Q u i n t = ( L A B E L =…S T Y L E ( C L A S S L E V ) = ( J U S T = R I G H T } } A L L = ( L A B E L = " & l a b e l 10 "S T Y L E = ( J U S T = R I G H T } }, S e t a i = ( L A B E L = …}*(Sex=(LABEL=""}*SumWgt=(LABEL=…}*F=COMMA6. l a b e l l 0 " } * S u m W g t = ( L A B E L = …}*F=COMMA7.) ALL=(LABEL=& /BOX=(LABEL="& l a b e l 11" } ; t ; WEIGHTJmnWeigh R U N ;Q U I T ; 4 )男女別・経常収入・食料費についての 3重クロス表 /*表作成用デ一世は規定課題 3と共通 * 1 1 *ラベルの準備*/ 制e tl a b e l 1 2=計. 首l e tl a b e l l3=男女計. 矧e tl a b e l 1 4=食料 ( 5分位); 抑e tl a b e l 1 5=経常収入 5分位, ノ*表の作成(表的事 / T I T L E,.表4"; PROCTABULA 花 DA TA=SASUSE R .K3K4data; VAR S e t a i ; CLASS S e x I n c o m e Q u i n t N o F o o d Q u i n t N o ; T Y L E ( C L A S S L E V ) = ( J U S T = C E N T E R } } * ( S T Y L E = ( J U S T = R I G H T } }ホ ( TABLE Sex=(LABEL=…S }*F=COMMA6 I n c o m e Q u i n t N o = ( L A B E L = STYLE(CLASSLEV)=(JUST=CENTER}}*SumWgt=(LABEL=… 事S umWgt=(LABEL=… ] キ F=COMMA6 A L L = ( L A B E L = " & l a b e I 1 2 "S T Y L E = ( J U S T = C E N T E R } } 一 ., A L L = ( L A B E L = " & l a b e I 1 3 "S T Y L E = (JUST=CENTER}}*SumWgt=(LABEL=…}*F=COMMA7 S e t a i = ( L A B E L = … } キF o o d Q u i n t N O = ( L A B E L = " & l a b e J 1 4" } S e t a i = ( L A B E L = " & l a b e I 1 2 "STYLE=(VJUST=BOTTOM}} /B O X = ( L A B E L = " & l a b e I 1 5 "S T Y L E = ( V J U S T = B O T T O M } } ; WEIGHTJ m n W e i g h t ; R U N ;QU 汀; a調幽 ‑T nO EU 378 ‑ ‑ 悶 5 r a a﹃ ‑ ‑ a aマ O の z ‑ ‑ 女 ‑‑角︒ の 4 ="2 n ︐ ‑ = r V出 ‑ ‑ ‑ ‑ n w n 句 t'I 内KM FE nS Hu nb 唱︒ 本=山町別 健T11 ︐ ︑ J剛 備凋 X E町 内UHUHU のK f 司 剛E E ﹄ 内 J 早 FraLl JJP * ︐ ︑D R・ 円U円M 4J ARA 口同︐︑ uv v‑ u uun uu M Am ︐ d' 5) 男女別・経常収入別に食料買を常用対数変換した平均値の比較
5
)男女別・経常収入別に食料費を常用対数変換した平均値の比較【続き]
j
本表とグラフ作成用デー告の準備*/
PROOS
Q
L
:
R
.K
5
d
a
t
aAS
OREAiETABLESASUSE
キW
e
i
g
h
t
*
1
0キ*5/495465ASJ
m
n
S
e
t
a
i, W
e
i
g
h
tASW
e
i
g
h
t
,
SELECT S
I
̲
S
e
xFORMAT=sex.ASS
e
x, 1
(CASEWHEN49701
.0>Youto038THEN1WHEN63146.2>Youto038>
=49701 THEN2
WHEN7
6
0
5
5
.
1 >Y
o
u
t
o
0
3
8>
=6
3
1
4
6
.
2THEN3WHEN93035.8>Y
o
u
t
o
0
3
8>
=7
6
0
5
5
.
1THEN4
WHENY
o
u
t
o
0
3
8)
=9
3
0
3
5
.
8THEN5E
N
D
)ASF
o
o
d
Q
u
i
n
t
N
o,
L
O
G
1
0
(
Y
o
u
t
o
0
3
8
)ASF
o
o
d
L
G
.G
I
J
I
D
A
TA
:
FROM SASUSER
PROOSQL
CREATETABLESASUSE
R
.
K
5
d
a
t
a
2AS
o
o
d
Q
u
i
n
t
N
oFORMAT=FoodNo" J
m
n
S
e
t
a
i, F
o
o
d
L
G
m
e
a
n, ROUND(10キ
ロ
ト.
F
o
o
d
L
G
m
e
a
n,
l
)ASFoodGeoM
SELECT S
e
x, F
o
o
d
Q
u
i
n
t
N
o
. R
O
U
N
D
(
S
U
M
(
J
m
n
S
e
t
a
i
),
1
)ASJ
m
n
S
e
t
a
.
i
FROM (
S
E
L
E
C
T
S
e
x, F
ROUND(SUM(FoodLG
キW
e
i
g
h
t
)
/
S
U
M
(
W
e
i
g
h
t
),
O
.
O
O
O
I
)ASFoodLGmean
FROM
SASUSER
.K
5
d
a
t
a
o
o
d
Q
u
i
n
t
N
o OUTERU
N
I
O
NOORR
GROUPBYS
e
x,F
SELECT
S
e
x, 6ASF
Q
o
d
Q
u
i
n
t
N
o
, R
O
U
N
D
(
S
U
M
(
J
m
n
S
e
t
a
,
)
iI
)ASJ
m
n
S
e
t
a
i,
R
O
U
N
D
(
S
U
M
(
F
o
o
d
L
G
*
W
e
i
g
h
t
)
/
S
U
M
(
W
e
i
g
h
,
)
tO
.
O
O
O
I
)ASFoodLGmean
FROM
SASUSER
.K
5
d
a
t
a
GROUPBY S
e
x
)
o
o
d
Q
u
i
n
t
N
o
:
ORDERBYS
e
x,F
!*ラベルの準備*/
淵e
tl
a
b
e
l
1
6=世帯数
%
I
e
tl
a
b
e
l
17=食料; 矧e
tl
a
b
e
l
1
8=常用対数平均;
知e
tl
a
b
e
l
1
9=幾何平均. 知e
tl
a
b
e
1
2
0=経常収入 5分位,
1*表の作成(表 5
)
.
/
T
1
T
L
E‑表 5
"
:
PROOTABULATE
.K
5
d
a
t
a
2
:
DATA =SASUSER
VAR
J
m
n
S
e
t
a
iFoodLGmeanF
o
o
d
G
e
o
M
:
CLASS S
e
xF
o
o
d
Q
u
i
n
t
N
o
:
TABLE S
e
x
=
[
L
A
B
E
L
=
.
.
.
.STYLE(CLASSLEV)=[JUST=CENTER}}*
…STYLE(OLASSLEV)=[JUST=OENTER}},
F
o
o
d
Q
u
i
n
t
N
o
=
[
L
A
B
E
L
=
J
m
n
S
e
t
a
i
=
[
L
A
B
E
L
=…
}*F=OOMMA6本 S
u
m
=
(
L
A
B
E
L
=
"
&
l
a
b
e
I
1
6
"
}
FoodLGmean=(LABEL="&labeI17"}.F=COMMA6A*
S
u
m
=
(
L
A
B
E
L
=
"
&
l
a
b
e
I
1
8
"
}
*
F
=
C
O
M
M
A
6
.
*
S
u
m
=
(
L
A
B
E
L
=
"
&
l
a
b
e
I
1
9
"
}
FoodGeoM=[LABEL= }
/B
O
X
=
[
L
A
B
E
L
=
"
&
l
a
b
e
I
2
0
"STYLE=(V川 ST=BOTT口
M
}
}
:
…
R
U
N
:
/ホゲラフ作成用デー告の準備*/
PROCS
Q
L
:
R
.K5data3AS
CREATETABLESASUSE
o
o
d
Q
u
i
n
t
N
oFORMAT=FoodNo"J
m
n
S
e
t
a
i,F
o
o
d
L
G
m
e
a
n,R
O
U
N
D
(
1O**FoodLGmean,
1
)ASFoodGeoM
SELECT S
e
x,F
o
o
d
Q
u
i
n
t
N
o, R
O
U
N
D
(
S
U
M
(
J
m
n
S
e
t
a
i
),
1
)ASJ
m
n
S
e
t
a
i,
FROM (
S
E
L
E
C
T
S
e
x, F
RO
山J
D
(
S
U
M
(
F
o
o
d
L
G
*
W
e
i
g
h
t
)
/
S
U
M
(
W副g
h
t
),
O
.
O
O
O1
)ASF
o
o
d
L
G
m
e
a
n
.K
5
d
a
t
a
FROM
SASUSER
o
o
d
Q
u
i
n
t
N
o
):
GROUPBY S
e
x, F
パグラフ表示形式の準備*/
SYMBOLl附TERPOL=JOIN H
E
I
G
H
T
=
1
0
p
t VALUE=NONE L
lNE=l WIDTH=2 CV=̲
S
T
Y
L
E
̲
:
E
I
G
H
T
=
1
0
p
t VALUE=NONE L
lNE=l WIDTH=2 CV=̲
S
T
Y
L
E
̲
:
SYMBOL2附TERPOL=JOIN H
L
e
g
e
n
d
l LABEL=(…):
A
x
i
s
4 STYLE=1 WIDTH=1 M削OR=NONE L
A
B
E
L
=
(
"
食料費幾何平均"):
A
x
i
s
5 STYLE=l WIDTH=1 MINOR=NONE L
A
B
E
L
=
(
"経常収入 5分位"):
ITLE"
食料費幾何平均(男女別経常収支の分位点jJ
l
J
)
"
:
'キグラフの作成キ/T
PROOGPLOT
DATA =SASUSE
R
.K5data3
PLOT
FoodGeoM• F
o
o
d
Q
u
i
n
t
N
o
=
S
e
x
/
V
A
X
I
S
=
A
x
i
s
4 H
A
X
I
S
=
A
x
i
s
5 VZERO L
E
G
E
N
D
=
L
e
g
e
n
d
l
:
R
U
N
:Q
U
I
T
:
6
3
7
9
消費税率の引上げ及び軽減税率制度の導入は 低所得者にどのような影響を与えるか 参加カテゴリ:A )パワーユーザ(使用経験年数は問わなし、) チーム名: r チーム ベイ j 松本光右株式会社浜銀総合研究所情報戦略コンサルティング部 三ツ井誠株式会社浜銀総合研究所情報戦略コンサルティング部 安田浩平株式会社浜銀総合研究所情報戦略コンサルティング部 要旨 1年に実施が予定されている「消費税率の引上げ及び軽減税率制度の導入 J 本論文では、平成 3 について、主に低所得者への影響分析を行った。本分析により、低所得者層の負担緩和という導 入目的において、軽減税率を飲食料品に適用することは妥当性があることが示された。また、軽 減税率の適用範囲を拡大する場合は、交通・通信費を対象にすることが有効であることが示され 弱の家計収支が赤字になる可能性が た。一方で、、消費税率の引上げの影響により、全世帯の 3% あり、その影響度は世帯のライフステージ等によって異なる。より精微な分析を行うためには、 世帯を消費行動ごとにグループ化することが有効だろう。 6年全国消費実態調査 キーワード:消費税率引上げ、軽減税率制度、平成 1 1.背景と目的 平成 3 1年に実施が予定されている消費税率 1 0 目への引上げに伴い、軽減税率制度が導入され る公算が高い。軽減税率制度は低所得者への配慮の観点から導入されるものであり、消費税の対 象のなるもののうち、 「酒類・外食を徐く飲食料品」と「定期購読契約が締結された週 2回以上 0 出)に据え置くものである。 発行される新聞」の消費税率を 8見(標準税率は 1 本論文の目的は、「消費税率の引上げ及び軽減税率制度の導入」が主に低所得者の家計にどの ような影響を与えるかを調べることである。分析は以下の 2つの視点を中心とする。 1 . 減税対象の妥当性:軽誠税率制度は低所得者を優遇する制度になっているか I I . 生活水準の保護 :消費税率引上げにより、家計の赤字化を招く恐れがないか 「消費税率の引上げ及び軽減税率制度の導入Jにあたっては、「制度の税収への影響度」や「軽 減税率制度への対応による社会全体のコスト増加」など様々な論点があるが、本分析では「低所 得者の家計への影響 j に主眼を置くものとする。 1 380
2 . 分析方針 2 ‑ 1 . 検証方法 rI.減税対象の妥当性」の検証方法はいくつかの方法が考えられるが、本論文では「実支出 全体に占める当該項目の支出額の割合が、低所得者ほど大きくなっているか」と読みかえること とする。 rI.生活水準の保護」の検証では、 「消費税率 5%下では黒字であるが、消費税率 10%にな ると赤字になる世帯」について分析を行う。本論文を執筆している時点では消費税率は 8%であ 6年全国消費実態調査」に基づくデータであるため、消費税率は 5% るが、使用データが「平成 1 → 10% に変化するものとする。また、平成 1 6年と現在では、各種税率や所得の水準、物価、消 費行動等に変化が生じているが、本分析ではこれらの点については考慮しないものとする。 2 ‑ 2 . 消費税率引上げによって増加する支出額の算出方法 本章では、消費税率が 5%から 10%に引上げられることによって増加する支出額の算出方法 について整理する。 全国消費実態調査は「実支出 J と「実支出以外の支出」に分けられる。「実支出以外の支出」 は、預貯金や保険掛金、繰越金など、貯蓄性の支出で構成比されているため、本論文では「実支 出Jのみを検証の対象とする。 「実支出 Jは 、 A . 消費税の対象であり、軽減税率の対象となるもの B . 消費税の対象であり、軽減税率の対象とならないもの c . 消費税の対象とならないもの の 3種類に分けられる。「実支出 J の各項目の消費税率について、図表 1のように整理を行い、 これに従い消費税率引上げの支出額を算出した。 消費税率引上げによって増加する支出額の算出方法 ① 消費税の対象となるもの(図表 1の A、B ) 支出額(増税) = ② 支出額 × 税率 ‑ : ‑ 1 .0 5 消費税の対象とならないもの(図表 1の c ) 支出額(増税) = 支出額 軽減税率の対象が「酒類・外食を除く飲食料品 Jであることを考えると、 r 0 3 8食料 Jの支出 0 7 5 ̲ 酒類j の支出額と r 0 7 7 一一般外食」の支出額を控除したものに軽減税率をかけるべ 額から r 0 3 8 一食料」に一律で きであるが、これらが全体に与える影響度は小さいため、今回の分析では r 軽減税率を適用するものとする。 2 381
図表 1 税率一覧 A 消費税の対象であり、軽議種事の対象となるもの 重視寧の対象とならないもの 日消費税の対象であり.軽S C 消費税由対象とならないもの 3. 減税対象の妥当性に関する検証 本章では「減税対象の妥当性」に関する検証を行う。冒頭でも述べたが、実支出全体に占める 当該項目の支出額の割合が、低所得者ほど大きくなっている場合、減税対象に妥当性があると判 断する。また、減税対象が実支出全体に占める構成比にも注目する。 図表 2は実支出全体に占める各項目の支出の割合を示したものであり、この表の結果について 以下のように整理できる。 A ) 年間収入が小さいほど割合が大きいもの r038 一食料J r079̲住居 J r084 一光熱・水道 Jr089̲家具・家事用品 J r122̲交通・通信J B ) 年間収入が大きいほど割合が大きいもの r 1 3 0 ̲ : 授業料等 J r133一教養娯楽J r142ーその他の消費支出 J r160一直接税J r164一社会保険料」 )の項目に含まれているかを確認すればよく、 r038̲ 食料」はそ 減税対象が妥当かは、対象が A )に含まれるぞれぞれの項目について、実支出全体に占める当該項目の の条件を満たしている。 A 支出の構成比を確認すると、 r038 一食料J > r122̲交通・通信 J > r084̲光熱・水道 J > r089̲ 家具・家事用品」 ※ r079̲ 住居」は消費税の対象外であるため除外している であるため、 r038̲ 食料」を軽減税率の対象とすることは、実支出全体へのインパクトが大きい ことがわかる。 以上のことから、飲食料品に軽減税率を適用することは妥当であると考えられる。一方で、 r038 一食料」に軽減税率 8 %を適用することで、低所得者の最低限度の生活水準が保護されるか は別途検証する必要がある。次章では、消費税率引上げによって増加する支出額を元に家計収支 の分析を行い、消費税率の引上げによって低所得者の家計状況がどう変化するかについて分析を 行うものとする。 3 382
図 表 え 年 間 収 入 別 : 支 出 内 訳 ( 消 費 税 5%) ※図表 2の対象は全世帯 4. 生活水準の保護の観点 本章では、消費税率の引上げによって、主に低所得者が家計収支で黒字を維持できるかについ て、検証を行う。検証にあたり、以下のように赤字家計と黒字家計を定義する。 赤字家計:実収入一実支出 < 0 黒字家計:実収入 実支出 ~ 0 4 ‑ 1 .低所得者の定義 低所得者の明確な定義は存在しないが、本論文では「年間収入」が 4 0 0万円未満の層を低所得 者と定義する。図表 3からわかるように、低所得者は「年間収入」が下位 1 0 九程度の世帯である。 なお、本分析では地域による所得の水準差は考慮、しないものとする。 図表 3 年収収入の分布 ※図表 3の対象は全世帯 4・2 .消費税率引上げにより赤字家計となる世帯数 図表 4は、消費税率 5 %と消費税率 10%状況下における年間収入別の赤字家計と黒字家計の 分布である。消費税率引上げによって黒字家計から赤字家計になる世帯数は 2 ,8 8 2世帯 ( 1 0万 世帯比)であり、そのうち低所得者の世帯数は 392世帯 ( 1 0万世帯比)である。 4 383
消費税率引上げによって赤字家計になる世帯の構成比を示した(( A )一( B ))の値は、年収 2 0 0 ‑300万円が一番大きく、次いで年収 300‑400万円の値が大きい。従って、消費税率引上げは 低所得者への影響が相対的に大きいといえる。 図表 4 消費税率別:赤字家計と黒字家計の集計 ※図表 4の対象は全世帯 4・3 .増税後の低所得者の家計状況 図表 5は低所得者(年間収入 4 0 0万円未満)の世帯を、赤字家計と黒字家計に分類し、 1 0万 世帯あたりの世帯数を算出したものである。本章の図表 5、7は結果の一部のみを掲載し、結果 の全体は 7章の付録に記載している。 黒字家計と赤字家計を比較すると、赤字家計は「世帯人員: 2人J と「年齢:60‑64歳J の 構成比が高いことがわかる。ここから推測される人物像は「年金を満額受給する前の世帯が、貯 蓄等を切り崩して生活している像j である。これらの世帯は計画的な赤字家計とみなすことがで きるため、低所得者の家計状況を分析する際には、除くことが望ましい。次節では「消費税 5% 時は黒字家計であった世帯J のみを対象とすることで、計画的な赤字家計を排除した分析を行う。 軽減税率) (一部抜粋) 図表 5 低所得者の家計状況(消費税 10%+ 万一制一盟組制一型組輩出宝山 ※図表 5の対象は「年間収入 4 0 0万円未満」の世帯 5 384
4‑4.増税により家計が赤字になる世帯の特徴 図表 6は「消費税率 5 %時は黒字家計であった世帯Jを対象に、「消費税率 10%時に赤字家計 となる世帯」と「消費税率 10%時に黒字家計となる世帯 J について、実支出額の比較を行った ものである。図表 6の縦構成比に着目すると、ほとんどの項目で赤字家計と黒字家計に差がみら れないが、 r 1 6 0 一直接税J は赤字家計の方が支出額、構成比ともに低いという特徴がある。一般 に、年間収入が同一の場合、扶養家族が多いほど直接税が少なくなるため、ここから赤字家計世 帯は扶養家族が多いことがわかる。また、赤字家計世帯の r084一光熱・水道 Jの支出額が、黒字 家計世帯よりも大きい。これは、赤字家計世帯の方が黒字家計世帯よりも世帯人員が多いことを 暗示している(図表 8より、光熱・水道費と世帯人員の関係は明白である)。 図表 7は黒字家計と赤字家計について、属性の分布を比較したものである。図表 6で得られた 示唆と同様に、赤字家計は黒字家計よりも世帯人員が多い。また、住居の建て方に着目すると、 一戸建の構成比が高いことがわかる。 以上を踏まえると、消費税率引上げによって、黒字家計から赤字家計になる世帯には、子供の いる核家族世帯が一定数含まれているのではないかと考えられる。 図表 6 消費税 5 %時は黒字家計であった世帯の平均支出 ※図表 6の対象は「年間収入 400万円未満 Jかっ「消費税率 5 %時は黒字家計」の世帯 図表 7 消費税 5 %時は黒字家計であった世帯の平均支出(一部抜粋) 主 主 主込 ※図表 7の対象は「年間収入 400万円未満」かっ「消費税率 5 %時は黒字家計」の世帯 6 385
図表 8 世帯人員と光熱・水道費の関係 ※図表 8の対象は全世帯 7 386
5. 結論 5 ‑ 1 . まとめ 官頭で述べた 2つの視点について、結論をまとめる。 1 . 誠税対象の妥当性:軽減税率制度は低所得者を優遇する制度になっているか 年間収入が低いほど、実支出全体に占める食料費の割合が高く、また、食料費は実支 出全体の 2割を占める影響度の大きい項目であることから、飲食料品を減税対象にする ことは妥当性があると考える。軽減税率と導入する場合、導入しない場合と比べて、 実支出全体が 0.35%程度軽減されるだろう。 ※計算式 :20%X ( 1‑ 1 .0 8 ‑ ; ‑ 1 .1 0 ) 今 0.35% I I . 生活水準の保護 :消費税率引上げにより、家計の赤字化を招く恐れがないか 消費税率を引き上げた場合、赤字家計世帯が増加する可能性があり、その可能性は年 間収入が 200~400 万円の世帯が相対的に高い。また、同じ年間収入でもライフステージ 等によって実支出額が異なるため、世帯人員が多い場合などに赤字家計になりやすい。 以上より、軽減税率の対象には妥当性があるが、その効果は実支出の 0.35%と限定的である。 そのため、軽減税率を適用したとしても、赤字家計となる世帯が一定数発生する可能性があると いえる。 5・ 2 .分析から得られる示唆 消費税率の引上げによって、特定世帯の家計状況が過度に厳しくなった場合の対策として、以 下の 2つ手段が考えられる。 1つ目は、実収入を上げる施策を打つことである。低所得者層の勤労所得を上げることや、給 付金の付与等が考えられる。 2つ目は、直接税・間接税問わず、特定世帯を救済する税制を整備し、実支出を減らすことだ。 もし、軽減税率制度で実現する場合は、交通・通信費に軽減税率を拡大することが考えられる。 ただし、この方法によって得られる効果は限定的であることに留意が必要だ。 また、今回の分析では、世帯のライフステージ等の違いにより、閉じ年間収入でも消費税率引 上げが与える影響の大きさが違うことがわかった。より精綾な分析を行うためには、世帯を消費 行動ごとにグループ化することが有効だろう。 6. 参考文献 ‑総務省統計局『平成 1 6年全国消費実態調査 J ‑国税庁「消費税の軽減税率制度についてJ h t t p : / / w w w .s t a t .go・jp/data/zensho/2004/ h tt p s :/ /www.nta.go.jp/zeimokubetsu/s h o hi/k ei g e n z e i r itsu/ 8 387
7. 付録:図表 図表 5 低所得者の家計状況(消費税 1 0 世+軽減税率) 図表 7 消費税 5 %待は黒字家計であった世帯の平均支出 旦開戸且ー四豆島且 雨明二章蓋麗 zLu‑8‑iE は‑u品H‑仏 旦 隼 且 ! ! J 0 0 3 . 4 3 4 5 . 8 3 9 . 0 0 5 1 1 . 4 2 1 ・ . " 0 3 . 3 0 ω, , ‑ 舗 1 1 7 0岬 刊 山 市 上 " ‑の 0 0 回 " , ( ‑ 1 ‑1 75 314 5 3 8 1 340 350 236 3 8 1 335 556 1 3 1 1 4 3 2 . 1 6 3 4 s 6 ' 1 9 . 57 ¥ 1 . 3 1 ¥ 9 5 1 1 . 38 0 . 1 7 弘 738U 5 . 7 1 1 1 . 047 9 . 8 9 1 4 . 42 26¥ 1 786U 6. 0 . 8 2 6 . 1 0 ¥ 4430 6 . 4 4 也 4 . 5 1弘 327U 4 . 3 8 . 1 7 3531 4 . 8 6 凹 1 6 1 43 3 . 8 3 3 1 . 4 3 8 1 6 9 聞 ̲llg1 盆且 」呈 1 . 0 0 3 410 6 1 6 1 9 1 0 206 454 岨 2 1 '0 1 3 5 32 8 418 1 2 5 2 . 8 8 5 3 . 1 4 1 1 4 0 1 . 2 8 1 2. 1 0 3 746 302U 5 . 1 1 ¥ 6 . 9 1 ¥ 1 . 2 2 8 1 8 . 4 5 1 0 1 0 . 0 3 0 . 0 0 ! 1 7 . 5 3 1 7751 0 . 6 8 1 . 0 1 5 1 3 . 9 8 1 .33 1 5 1 0 . 1 7 ¥ 0 . 0 7 2 7 1 0 . 1 9 叫 0 . 3 7 ¥ 3301 3. 79¥ 4 . 5 4 8 0 0 1 1 1 8 . 3 4 8 . 2 6 3 2 1 0 . 9 0 0 . 4 3 3 1 0 . 3 & 0 . 0 5 4 1 1 1 . 11 ¥ 0 . 5 7 1 3 8 1 2 . 4 8 ¥ 1 .90 1 9 1 0 . 5 9 0 . 2 7 3 7 1 0 . 1 4 ¥ 0 . 5 1も 510! i l 7 . 6 B ¥ 7 . 0 3 1 1 8 1 2 . 3 0 唱 1 . 6 2 72喝 3 . 6 0 9 5 、 。 % 4 . 6 8 3 ! l 16 1 4 6 U 2 . 5 8 2 . 0 2 2 . 1 8 1 . 6 0 9 356 2 5 1 1 0 . 5 1 ¥ 0 . 7 1 .8 1 1 8 1 1 1 . 6 3 . 9 9 6531 t 11 3 . 7 1h 8 、 ・ 、 、由 9 388
規定課題 課題 1) 産 業 符 号 ・ 性 別 ク ロ ス 表 0万 産業符号別・性別に集計用乗率なしの単純クロス集計表,および集計用乗率を使って 1 世帯あたり (10 万世帯比)のクロス集計表を,表 l の様式で作成して下さい. (注:産業符号 の「不詳」が先頭に来ても構いません. ) 解答 1) 産業符号 鉱業 建設業 製造業 電気・ガス・熱供給・水道業 情報通信業 運輸業 卸売・小売業 金融・保険業 不動産業 飲食底・宿泊業 医療関福祉 教育・学習支媛業 複合サービス業 サービス業(他に分類されないもの) ヨ公務 弾(他に分類されないもの) 合計 表1 a ) 単純クロス表 女 男 。 , 。 。 3 2, 1 3 4 5, 668 222 547 1 . 2 3 5 2, 083 472 40 5 0 3 7 1 1 . 0 5 9 3 2 1 1, 816 3, 656 9, 704 2 9, 3 8 1 9 1 7 3 3 2 0 1 39 男 3 21 4 3 5 . 8 4 1 222 547 1 , 238 284 2, 5 1 1 40 82 6 4 1 1 , 148 324 , 922 1 3, 786 1 1, 295 32 , ( ! 2 7 7 346 6, 1 7 . 8 3 7 697 2, 020 3, 852 6, 644 1 . 4 4 7 144 158 , 022 1 110 3, 9 8 1 5, 842 6 9 1 1 0, 3 1, 204 000 9 2, 。 3 2 270 8 9 3 1 0 6 1 3 0 1 , 5 9 1 2, 646 b ) 1 0万世帯比でのクロス表 合計 。 合計 , , 。 。 女 3 1 510 6 589 104 7 6377 1 8347 697 2, 020 858 3, 7 . 2 3 3 , 5 5 1 1 144 265 , 832 1 3, 379 992 6, 1 6 7 1 1, 1 2 1 3 6 . 0 1 1 100, 000 。 1 0 7 810 269 1 1 326 430 4, 806 8, 000 企e qプロシジャを用いて集計した。 課題 2) 経常収入および食料費 経常収入および食料費について,集計用乗率を用いて表 2 のように 5 分位点(下側 20%点 , 40%点 , 60%点および 80%点) A~F を求めて,表 2 を完成して下さい.更に,経常収入お よび食糧費についてそれぞれヒストグラムを描いて下さい.ヒストグラムの縦軸はパーセント (又は 10 万世帯比) ,横軸は経常収入および食糧費の階級区分(単位:円)とします. 解答 2 ) 表2 meansプロシジャを用いて分位点の算出を行った。 10 389
ヒストタラムー経常収入 ~ ヒストタラム食満畏 1 < 0 ,0 0 02 C ω "" ' ' ' ' 1 l O . = O5tO,a ω. . . , 鈍 ' " " 防 総a 飢珂腿回開 酔 底 入t 開 , . . 田 鮒咽 GCHARTプロシジャを用いてヒストグラムを作成した。 課 題 3) 男女別・経常収入および食料費の 5 分位分布 男女別に経常収入および食料費について,表 2 に示す 5 分位別に,以下の表 3 に示す 10 万 世帯比のクロス表を作成して下さい. 解答 3) 表3 量 豊 萱 議犠 3 1 3 1 0 . 5 3 1以上 4 0 4 . 8 8 3以上 5 0 1 . 1 8 1以上 盟許よ 皇‑ 支 1 5. 494 4, 5 0 6 1 8 . 6 1 7 1 9 . 0 9 9 1 9 . 3 5 6 盟A 笠 9 2 . 0 0 0 苛 20, 000 1 9 . 9 9 3 20, 009 1 9 , 995 1 . 3 7 7 9 1 1 640 5 6 7 . . 1 Q . 盟Z 生盟E 100,000 t a b u l a t eプロシジャを用いて集計した。 1 1 390 料費 5分 位 1 2 3 4 5 5分位数 49河 1 未以上 満 4 9 . 7 0 1 6 3, 1 4 6以上 7 6, 055以上 93, 036以上 計 男 女 計 1 6, 803 3, 1 9 6 1 9, 999 1 8 . 0 9 7 1 . 9 0 3 20 , 000 1 8 . 7 3 4 0 0 1 1 . 2 6 8 20, 1 9 . 0 4 9 948 1 9 . 9 9 8 1 9, 317 003 685 20, 000 0 0, 9 2 . 0 0 0 8, 000 1
課題 4) 男女別・経常収入・食料費についての 3重クロス表 5 分位)別の食料費 ( 5 分位)について,表 4 に示す 3 重クロス集計表 男女別・経常収入 ( を作成して下さい. 解答 4) 表4 食 料( 5分位) 経常収入 5分 位 男 2 3 4 5 計 女 2 3 4 5 計 男女計 5, 827 5, 1 3 0 2, 9 1 1 , 906 1 1 . 0 2 9 1 6 . 8 0 3 2, 462 3 7 1 243 68 53 3 . 1 9 6 1 9, 999 2 3, 974 4, 5 0 1 4, 3 0 1 3, 233 2 . 0 8 7 1 8 . 0 9 7 994 399 225 134 1 5 2 , 903 1 2 0 . 0 0 0 3 2, 798 3, 978 4, 395 4, 082 3 . 4 8 1 1 8 . 7 3 4 565 235 216 1 5 6 9 6 1 , 268 0 0 1 20, 4 1, 8 3 1 2, 996 4, 294 4, 903 5 . 0 2 6 1 9, 049 314 2 1 1 164 1 4 3 117 948 1 9, 998 5 1 , 064 2, 012 3, 1 9 8 5, 2 3 1 7 . 8 1 3 1 9 . 3 1 7 172 1 6 1 63 140 1 4 9 685 20, 003 計 1 5. 494 1 8, 617 1 9, 099 1 9 . 3 5 6 1 9. 435 9 2 . 0 0 0 4 . 5 0 6 1, 377 9 1 1 640 567 8 . 0 0 0 100, 000 t a b u l a t eプロシジャを用いて集計した。 課題 5) 男女別・経常収入別に食料費を常用対数変換した平均値の比較 表 5 に示すように,男女別・経常収入 ( 5 分位)別に,食料費の常用対数を計算し平均値を 求めて下さい.その平均値について逆対数変換(10x )をして幾何平均を計算して下さい.こ Iに食糧費を比較するために,折れ線グラフを作 の幾何平均について男女別・経常収支の分位点目J 成して下さい.縦軸を幾何平均(単位:円) ,横軸を経常収入 ( 5 分位)とします. 1 2 391
解答 5 ) 表5 男 女 食料 │経常収入 世帯数 常 用 対 数 平 均 幾 何 平 均 5分位 54 , 815 1 5, 494 4 . 7 3 8 9 4 . 7 8 3 2 60, 702 2 1 8, 617 4 . 8 3 6 8 68, 3 1 9, 099 675 1 9, 4 . 8 8 2 6 76, 356 313 4 5 1 9 . 4 3 5 4 . 9 3 3 5 8 5 . 8 0 3 9 2 . 0 0 0 4 . 8 3 9 5 6 9 . 1 0 3 計 4, 4 . 6 7 1 3 46, 506 914 1 4 . 7 8 1 1 2 , 377 60. 4 09 4 . 7 8 1 3 3 9 1 1 60 . 4 37 4 . 8 6 1 7 4 640 728 72, 5 567 4 . 8 7 7 4 7 5 . 4 0 5 8 . 0 0 0 4 . 7 3 2 5 5 4 . 0 1 3 計 t a b u l a t eプロシジャを用いて集計した。 闘相官協 間 剛 咽 . . . 楓 山 " " ' ‑ ・ 一 ー 例 g p l o tプロシジャを用いて集計した。 1 3 392
シングルマザー世帯の家計の実態 一片働き世帯と共働き世帯との比較からー 参加カテゴリー:C)学部学生・大学院修士課程(社会人院生は除く) チーム名:中国からの三人娘 買慧玲(カケイレイ)、郵時韻(トウジイン)、李慧鮫(リ ケイジョウ)、 兵庫県立大学大学院応用情報科学研究科 J1A HUILING ,DENG SHlYUN,LI HUIJ1AO、 G r a d u a t eS c h o o lo fA p p l i e dI n f o r m a t i c s , U n i v e r s i t yofHyogo 要約 留学生と閉じように厳しい生活が強いられていると思われるシングルマザー世帯に焦点 を当てて、片働きと共働きの夫婦の揃った普通の子育て世帯と比較をしながら、シングル マザー世帯の家計の実態をとくに食費の観点から、内食と中食と外食の比率に注目して分 析を行いました。 キーワード:シングルマザー、エンゲ、ル係数、内食、中食、外食、就業形態 1はじめに 私たちは中国(中華人民共和国)からの留学生で、物価水準の違し、から学費や生活費 を両親からの仕送りだけでは賄えず、勉学のほかにアルバイトをして、経済的に厳しい 生活を送っています。以前から日本人は中国人と比較して裕福な生活を送っていると感 じていましたが、新聞やテレビなどの報道を見ると、シングルマザーの家計が私たちと 同様に経済的に厳しいだけでなく、子育ても大変だということが分かつてきました。シ ング、ノレマザーが増えた一番の原因として挙げられるのが離婚の増加です。厚生労働省 [ 1 ]によれば、離婚をした場合、約 8割の子供は母親が引き取ると言われています。今 回 、 2004年の全国消費実態調査の教育用疑似ミクロデータを使って分析ができるチャ ンスがあると分かつた時に、日本のシング、ノレマザー世帯は、一体どんな生活を送ってい るのかを家計の面から分析してみることに興味が湧きました。 提供された全国消費実態調査の教育用疑似ミクロデータを用いて、 JMP の「一変量 の分布」を適用して最初に行ったのが性別の構成の確認です。世帯主の性別から見ると、 女性は 8.26%で 10%にも満たないので、調査対象となっている 2人以上世帯の中でシ ング、ノレマザー世帯である可能1 ' 生が高い世帯は、割合が低いことが分かりました。総務省 [ 4 ]によれば、 2010年の国勢調査で一般世帯数は 51, 842千世帯であり、そのうち、 1 393
人世帯は 16, 785千世帯なので、 2人以上世帯は 35, 057千世帯となります。この 2人以 4, 440千世帯であり、シングルマザー世帯 上世帯のうち、夫婦と子供から成る世帯は 1 523千世帯となっています。また、総 が含まれているひとり親と子供から成る世帯は 4, 務省統計研修所 [ 3 ]によれば、日本全国のシング、ルマザー世帯は 108万世帯ほどあると されており、近年は増加傾向にあります。 3 ]によれば、 なお、シングルマザーの定義は、総務省統計研修所 [ いずれかに該当する世帯の母である。①「母子世帯 J の母、 「以下の 2種類の 「母子世帯」とは、未婚、 死別又は離別の母と、その未婚の 20歳未満の子のみから成る一般世帯をいう。②「上 記①の母子と他の世帯員からなる一般世帯」の母、 「上記①の母子と他の世帯員からな る一般世帯J とは、例えば、上記①の母子とその祖父母が同居している一般世帯などが 該当する。 J とされており、実際の分析では、 「子と同居で配偶者のいない女性 ( 1 5 082千人、そのうち "‑49歳) J として世帯数を推計し、 2010年のシングルマザーは 1, 「母子世帯」の母が 756千人、 「他の世帯員がし、る世帯」の母が 326千人としていま す 。 私たちは、以上のことを調べた上で、シング、ルマザー世帯の家計の現状、そして夫婦 と子供から成る普通の世帯との比較で、食生活を「内食」と「中食J と「外食」に分け てその支出額や構成がどうなっているのかを大学院の講義で使用法を学んだ JMPを使 用して調べてみることにしました。 2分析の方法 分析にあたっては、まず最初に、シング、ルマザー世帯と比較の対象となる夫婦と子供 3 ]では、上述のように「子 からなる世帯を区別する必要があります。総務省統計研修所 [ 1 5 " ‑ 4 9歳) J と定義して分析をしていますが、私たち と同居で配偶者のいない女性 ( が使用する教育用疑似ミクロデータでは、家族の構成員の年齢や続き柄に関する変数は 含まれていません。 そこで、 2人以上世帯のデータが提供されているので、性別が女性であれば「他の世 帯員がいる世帯Jの可能性はありますが、細かいことを気にしていては分析ができなく なってしまうので、「母子世帯 jでシングルマザ一世帯であるとみなすことにしました。 ただし、母親の年齢が高齢であれば、私たちが分析の対象としたい「死別あるいは離婚 で父親がおらず、母親が働いて高校生以下の子供を育てている Jシングルマザー世帯と は言えないので、年齢で対象を絞り込むことにしました。また、有業人員が 2人以上で あれば、母親以外に世帯内で働いている子供あるいは祖父母などがいることになるので、 有業人員が 2人以上の世帯もシングルマザー世帯からは除外することにしました。 さらに、有業人員が一人でも、年金を受給している両親と同居している可能性がある ので、このような世帯を排除するために、公的年金給付がゼロの世帯を抽出することに しました。 394
シングルマザーの年齢については、 1 8歳の高校生の子供がし、ると考えると、高齢出 産も進んで、いるので、 35歳で子供を産んだとして、 53歳のシングルマザーがし、る可能 性があります。そのため、総務省統計研修所 [ 3 ]では 1 5 " " ' 4 9歳の女性に限定しています が、私たちは 54歳までに対象を広げて、年齢が 54歳以下で性別が女性の世帯をシン グ、ルマザーの世帯と考え、世帯人員が 2人であればシングルマザーと子供が 1人、世帯 人員が 3人であればシング.ルマザーと子供が 2人、世帯人員が 4人以上であればシング ルマザーと子供が 3人以上の世帯と考えることにしました。 一方、シングルマザー世帯と比較するために、性別が男性の世帯を夫婦の世帯である とみなして、公的年金給付がゼロの世帯に限定し、有業人員が 1人であれば片働き世帯、 有業人員が 2人であれば共働き世帯と考えて、世帯人員が 3人であれば有業人員に応じ て片働き子供 1人世帯か共働き子供 1人世帯、世帯人員が 4人であれば有業人員に応じ て片働き子供 2人世帯か共働き子供 2人世帯、世帯人員が 5人であれば有業人員に応じ て片働き子供 3人以上世帯か共働き子供 3人以上世帯というように考えて、世帯を分類 することにしました。その結果、私たちが分析の対象としたい子育て世帯は、シングル マザーか夫婦片働きか夫婦共働きかという世帯 の勤労形態と、子供が 1人か 2人か 3人以上か 水準 度 重 裏 き,'fクルマザーテ諜 I 人 ペ l という子供の人数で、 9つのパターンに分類す シングルすき,-号~~λ" ることになりました。 シシクルマザー手袋 3人以上 院窃き予犠 1入 以上の分類のために使用したのは、図 1に示 す計算式で、度数に 1 0万世帯比用集計乗率を入 れて「一変量の分布」を適用した結果、図 2に 示すように、子育て世帯を 9つの類型に分類す ることができました。図 2からは、本研究での 対象となるシングルマザー世帯は 882世帯でか なり少ないということが分かりました。 ー 一一一守 山画担血ゐ""ムh ! 1 1 醐 3 10 . 0 8 4 9 5 n24 0 . 1 7 9 2 3 6758 0 . 1日泡2 そ醐 2633 0 . 0 6 1 1 1 館十 43094 1 .00 o ∞ 図 2 子育て世帯の分類結果 : r 1 イ拘置~~.I曲 d闇~~~~ d里 ∞ : │ i pbLIl rft 佐野 白人目 F 世帯嗣轡I'l‑‑恥lIjーで一一一一 衿密き子供 2人 片衝を予想車3 人喚主 裳艶手書展1人 共飽き子礁2人 共働き子供 3人以主 話会 328 0 . 0 0 7 6 1 419 0.0ω72 135 O . 313 6355 0 . 1 4 7 4 7 9884 0 . 2 2 9 3 6 5197 0 . 1 2 0 6 0 ...曽帽 図 1 世帯分類のための JMPの計算式 395 I 叫I~H~--~ご:::-~~.JI
次に、教育用擬似ミクロデータの変数リストから食料の品目別の支出の分類方法を検 討しました。私たちは、片働きで家事専業の世帯員がいて家事に余裕がある世帯では内 食の比率が高く、シング、ルマザー世帯や共働き世帯では家事に向ける時聞が少なくなる ので内食の比率は低くて外食や中食へ依存する度合いが高くなり、世帯収入の多寡で外 食と中食の比率も違ってくるのではないかと考えました。そのため、提供されている教 育用疑似ミクロデータの食料に関する品目のうち、 「乳卵類 j 、 「野菜・海藻」、 「果物」、 理食品」を「中食」グループに、 「穀類」、 「魚介類」、 「肉類」、 「油脂・調味料」を「内食」グループに、 「 調 「外食」を「外食j グループそのままとして、 3つの 食事形態にグ、ループ分けを行って定義をしました。 3分析の結果 3 ‑ 1 各世帯における経常収入、消費支出、食料費の比較 JMPを使って、子育て世帯分類を説明変数、経常収入と消費支出と食料を目的変数、 10 万世帯比集計用乗率を度数に設定して、 r2変量の関係 J を適用した結果を図 3・ 1 から図 3 ・ 3に示しています。 まず、経常収入を見ると、シングルマザー世帯は子供 1人世帯で 272 千円、子供 2 人世帯で 227千円、最高の子供 3人以上世帯で 306千円であるのに対して、片働き世 帯は子供の人数に関わらず 400千円台、共働き世帯は子供の人数に関わらず 500千円 台であり、経常収入に大きな格差が存在することが分かります。 これに対して消費支出の平均は、シングルマザー世帯では 206千円(子供 2人世帯) から 249千円(子供 3入居樹世帯)の範囲にあるのに対して、片働き世帯は 279千円 (子供 1人世帯)から 309千円(子供 3人以上世帯)の範囲、共働き世帯は 334千円 (子供 3人以上世帯)から 336千円(子供 1人世帯)の範囲であり、経常収入ほどの 世帯類型聞の違いは認められません。 閉じく、食料費についても、その平均はシング、ルマザー世帯では 47千円(子供 1人 世帯)から 70千円(子供 3人以上世帯)の範囲、片働き世帯は 58千円(子供 1人世 L 両 一 一 問 問 一 時 以 一 弘 一u 一 一 銭 一 切 ﹁ 龍 一 一 宮 P一 1千円(子供 3人以上世帯)の範囲、共働き世帯では 67千円(子供 1人世 帯)から 7 一 一 明一一ヱアL 図3 ‑ 3 食料の平均 出羽詰説 ω 一人人胤一 一よ怒川町詑認向 396 同 一 担 一 均 一 一 一 一 一 一 一 一 地 図 3‑2 消費支出の平均 一a一一⁝誌なむ説 川 明一一帯主人人アL T 一一弘紘一一耕一一捌 一 雄 一 一顧問話一一仰向山向山 γ 一一ぷ誤認町一一説 ‑ 1 経常収入の平均 図3
表 1 子供の人数別の経常収入、消費支出、食料費の世帯類型聞の平均の差の検定結果 子供 1人世帯 人世帯 子供2 子供 3人以上世帯 表2 ‑ 1 食料の割合(エンゲル係数) 表 2‑2 消費支出の割合 6千円(子供 2人世帯)の範囲で、世帯類型聞の違いは認められません。 帯)から 7 ただし、子供の人数別の世帯類型による分散分析の結果をまとめたものが表 1ですが、 子供 3人以上世帯の食料費を除いては、いずれも F検定で 1%有意水準で有意となっ ており、子供の人数別にみると、子供 1人世帯、子供 2人世帯、そして子供 3人以上世 帯のいずれにおいても、シング.ルマザー世帯、片働き世帯、共働き世帯の世帯類型間で は経常収入や消費支出や食料費の平均に差があるという結果が得られています。 一方、消費支出と食料がそれぞれ経常収入に占める割合を計算してまとめたものを表 2 ・ 1と表 2・ 2に示しています。これらの表から、シング、ルマザー世帯は経常収入に占め る消費支出の割合が 80%を超えており、特に子供 1人世帯と子供 2人世帯では 90%を 超えていて、貯蓄はほとんどできず、子供の進学費用の準備もできない状況が示されて います。子供の人数に関係なく消費支出の経常収入に占める割合が 60%台の片働き世 帯および共働き世帯と比較して、シングルマザー世帯の生活がし、かに厳しし、かが窺える 結果となっていると言えます。 3 ‑ 2 世帯類型聞の就業状況の比較 厚生労働省 [ l Jの平成 2 3年度全国母子世帯等調査結果報告によれば、日本のシング 0 1 1年の就業率は 80.6%で 、 2 0 0 6年の 84.5%から 3 . 9ポイントの悪化と ルマザーの 2 なっています。また、就業形態では、 「正規の職員・従業員」が 39.4%であるのに対 7.4%と最も多くなっており、 2 0 0 6年の調査と比較 して「パート・アルバイト等」が 4 . 8ポイ して、 「パート・アルバイト等 J (前回調査では「臨時・パート J)の割合が 3 ント増加し、 「正規の職員・従業員 J (前回調査では「常用雇用者 J)が 3 . 1ポイント 減少している状況であるとされています。 さらに、調査されたシング、ルマザーの中で、母子世帯になる前に不就労であった人の うち、 6 9.1%は就労していますが、 2 5.4%は依然として不就労のままであり、就労して 397
いる 69.1%のシングルマザーのうち、正規の職員・従業員は 31 .1%で、パート・アル 7.4%となっており、触しい就業環境であることが示されています。 バイト等が 5 2004年の全国消費実態調査に基づく教育用疑似ミクロデータでこのシング、ルマザー の厳しい就業環境を確認するために、就業・非就業の別と世帯類型との間で「二変量の 関係」を適用してみた結果が図 4です。図 4からは、教育用疑似ミクロデータの構成世 帯はすべて有業者が少なくとも 1人はいる世帯ですが、片働き世帯と共働き世帯ではほ ぼ 100%が正規での就業であるのに対して、シングルマザー世帯は非正規のパートとし ての就業の比率が高くなっており、就業状態が安定しておらず、その結果として、前項 で考察したように経常収入が低い結果につながっていると言えます。 4 . 説業・非就業の別 シ〉クルマザー子供 1人 ま,主ザクルマザ日子供 2人 ま F 孫自タルマザャ事侯 3人以上 持骨骨子倭 1 ) . . 片噴き手供 i X 片面き手候 3~県主 院陣事母静音子傑供2l~ 人 英直き手供 ;r~胤主 そ骨他 就襲 U t ー ト } 々 不審 説草 行% 6 6 . 4 2 3 9 . 4 2 3 0 . 9 9 開 . 9 0 ∞ ∞ . ∞ ∞ 1 . 0 0 1 1 . 0 0 四. 8 7 ∞ . ∞ 1 9 3 . 8 7 3 3 .盟 日. 3 4 4 0 . 0 8 0 . 1 0 O . 叩 0 . 0 0 4 . 2 4 1 2 8 . 9 3 ∞ ∞ O . 0 . 0 0 O . O . 0 . 0 0 0 . 0 0 O . 0 . 0 0 0 .131 0 . 0 0 1 5 . 3 8 0 . 7 4 ∞ ∞ 図 4 世帯類型別の就業・非就業の別 3‑3 世帯類型別の肉食と中食と外食の比率の比較 これまでの分析から、シングルマザー世帯、片働き世帯、共働き世帯の世帯類型間で 経常収入は大きく異なり、消費支出にも差があるにも関わらず、食料はそれほど大きく は異ならないという結果が得られました。しかし、家事に専業で従事できる主婦のいる 片働き世帯と比較すると、家事に時間が多くは割けないシング、ルマザー世帯と共働き世 帯は、家庭内で調理をする内食の比率が低く、外食や中食の比率が高くなることが予想 されます。また、シング、ルマザー世帯は共働き世帯と比較すると経常収入が大幅に低い ですから、外食よりは中食の比率が高くなるのではなし、かと考えられます。 そこで、内食と中食と外食の 3つの食事形態の支出の割合を、シングルマザー世帯、 片働き世帯、共働き世帯の世帯類型別に計算して、その結果をまとめてみました。結果 は表 3に示す通りです。 表 3から、内食に関しては、共働き世帯は家事に従事できる時間が少なく、調理に割 ける時間も短くなるので、他の 2つの世帯類型と比べて比率が低くなっています。一方、 398
表 3 世帯類型別の 3つの食事形態の比率 ザ 一 マ一均一な一回 レ‑J‑J一司 ︑知一引一日一幻 ン シ 片働き 共働き 61 .88 1 3 . 0 5 2 5 . 0 6 5 8 . 5 9 1 3 . 7 3 2 7 . 6 8 片働き世帯では、専業主婦のいる可能性が高いので、内食の比率が高くなっています。 シングルマザー世帯の場合は、仕事もしながら家事も一人ですることになるので、経済 的には一番安い内食で対応したくても、なかなか調理の時聞がとれなし、かもしれません。 経済的な要因を考えると、外食は高くつくので、シング、ルマザー世帯が外食をする比 率は低くなっています。その結果として、中食の比率が一番高いのは、シングソレマザー 世帯となっています。 以上の分析は、単に比率を比較しただけですが、統計的に 3つの食事形態の比率に世 帯類型間で違いがあるかどうかを確認するために、 「二変量の関係 J を適用して、 10 万世帯比集計用乗数を用いて、一元配置の分散分析を行ってみました。結果は、図 5、 図 6、図 7に示す通りです。 これらの分散分析の結果から、し、ずれも 1% 有意水準で高度に有意な結果となってお り、食料にかける支出の内訳は、シングルマザー世帯では中食に、片働き世帯では内食 竺塑型里 l 平方和 平均平方 同!I p 錨( P r o b > 町 2 106993.3 53496.7 569.1920 < 目0 00ド 40458 3802499.1 9 4 . 0 40460 3909492. 4 自由度 属国 列228 誤差 余地本〈修正済み) │各水準の平均 水溶 数 平 均 寝 梅 原 差 下 側95% 上倒95% シングルマザー 881 .845 61 .0898 0 .32647 60. 450 61 .730 共働き 1 8 1 4 2 . 6 58.5913 0.07198 58. 45 0 58732 片働き 21436.3 61 .8842 0 .06622 61 .754 62.014 目 図 5 肉食の比率の世帯類型聞の差の検定 性塑塑 寝間 刻2 2 $ 鶴差 l 金制轡蹄み) 平方濡 事均平方 噸 p 値( P r o b > F ) 2 9 3 1 8 . 1 2 4659.06 219.1370 <.0001* 40458 860169.28 21 .26 40460 869487. 41 自由度 函扇面両 水筆 重 量 平 均 摂 箪 思 議 下 側95% 上倒95% シングルマザー 881 .845 1 5 . 7 3 4 00 . 1 5 5 2 7 共働き 片働寄 1 8 1 4 2 . 6 1 3 . 7 2 6 90 . 0 3 4 2 3 2 1 4 3 6 . 3 1 3 . 0 5 2 9 0.03149 399 1 5. 43 0 1 3 . 6 6 0 1 2 . 9 9 1 1 6 . 0 3 8 1 3 . 7 9 4 1 3 . 1 1 5
図 6 中食の比率の世帯類型聞の差の検定 恒型空 輔 自轍準糊 列22a 2 75620.3 37810.1 406.6477 40458 3761760.0 9 3 . 0 40460 3837380.3 潔 重 量 L 金制緩涯潟町 珊 醐( P r o b > F ) . 職事施 <.0001* │各耕四平均 棉 1 1 量 密 輸 事 態 騨 下 倒9 5 . 坊主御崎 シングルマザー.881 .845 2 3.1761 0.32471 22.540 23.813 共働き 仲働き '18142.6 27.6819 0.07159 21436.3 25.0629 0.06586 27.542 24.934 27822 25.192 目 図 7 外食の比率の世帯類型聞の差の検定 に、共働き世帯では外食にかける比率が他の世帯類型と比較して相対的に高くなってい るという私たちの仮説が支持されたと言えます。 また、より詳しく分析するために、子供の人数別にこれまでの分析を行った結果を図 8から図 1 0にまとめてみました。 これらの図からは、子供 1人世帯と子供 2人世帯とは同じような食事形態の比率が見 られますが、子供 3人以上世帯では、少し異なった比率となっていることが分かります。 特に、内食の比率がシングルマザー世帯で片働き世帯よりも高くなっており、中食の比 率は世帯類型の中ではもっとも低くなっています。使用しているデータは 2004年の全 国消費実態調査に基づくもので、第 1子と第 2子には月額 5千円、第 3子以降は月額 1 万円という当時の児童手当の影響があるのかもしれませんが、他には、家事の手伝いが できる年齢の高い子供がいるといった家族構成の影響があるのかもしれないと考えら れます。 内食比率(パーセント) ∞ぷ片働き ‑ 一 一 子 供 1人 揺共働き ‑ si ι ES 襲‑ 子 供 2人 図 8 肉食の比率の相違 400 E 子 供 3人 以 上
中食比率(パーセント) ・シングルマザ} 品片働き 諸共働き 日目04v ∞日 ト∞由的問 凶∞巴四回 A 也∞ H 司 4Y凶 4VH m∞也冊目同 日∞NNUH ∞凸∞凹 q∞ザト的﹄[ 由目的凶 UH 子 供 3人 以 上 子 供 2人 子 供 1人 図 9 中食の比率の相違 外食比率(パーセント) m m 目 HY 子 供 2人 mHU 0> t ‑ ‑ d v白 叫 ∞ ∞ 叩司ト m ‑同 的目叫 目ト由∞.由自 由自己日出 日︹︺泊四‑mN 子 供 1人 ' " " ' ば コ " 司トト目︒ ‑シングルマザー 必片働き 去共働き 子 供 3人 以 上 図1 0 外食の比率の相違 4 おわりに 私たちの自由課題の研究では、シング、ルマザ一世帯の家計の実態を明らかにすること に焦点を当てて、食料を「内食Jと「中食」と「外食」という三つの食事形態に分けて、 シングルマザー世帯と片働きおよび共働きの普通の子育て世帯との支出構造を比較し てみました。さらに、消費支出や経常収入の状況や、就業状態についても分析を行し、ま した。 内閣府男女共同参画局 [ 2 Jによると、育児や介護などで仕事を中断しやすい女性、も しくはシングルマザーは、低収入で不安定な雇用につきやすい就業構造があると言われ 401
ています。そして、そのような低収入で不安定な就業形態の積み重ねから年金水準は低 くなり、高齢期においても経済的基盤が弱くなることが指摘されています。私たち留学 生も、本国からの仕送りだけでは学費や生活費を賄うことは厳しく、パート・アルバイ トなどの就業形態で働きながら勉強を続ける必要があり、時間的余裕はほとんどありま せん。その結果、シングルマザー世帯と閉じような食事形態となっているように思いま す 。 今、貧困の連鎖が社会的問題となっていますが、今回の研究でシング、ルマザー世帯は 普通の子育て世帯と比較して厳しい家計のもとで生活していることが明らかになりま した。私たちは、あともう少しの期聞を頑張って勉強を続けて社会人となれば、厳しい 生活から離れることができると思いますが、シング、ルマザー世帯は大変だ、と思います。 今後は、児童手当や奨学金の充実などで、シング、ルマザーが少しでも余裕をもって子育 てができればよいと感じました。 参考文献 [ 1 ]厚生労働省,平成 23年度全国母子世帯等調査結果報告 ( h t t p : / / w w w . m h l w . g o . j p / /bu nya/kodomo/kodomo̲kosodate / bo s h i . k a t ei/bo s h i. s e t a i ̲ h 2 3 / ), s e i s a k u n i t s u i t e 2016年 6月 1 6日最終閲覧 [ 2 ]内閣府男女共同参画局,男女共同参画白書(概要版)平成 22年版 ( h t t p : / / w w w . w h i t e p a p e r /h2 2 / g a i y o u/h tml/honpe n/b1 ̲s05.htm l ) ,2016年 6月 1 6 g e n d e r . g o却/ 日最終閲覧. [ 3 ]総務省統計研修所, iシング、ル・マザーの最近の状況 ( 2010 年) J , 2012 t . g o . j p / t r a i n i n g / 2 k e n k y u l pdf/zuhyou/s i n g l e 4 . p d f ) ,2016年 6月 ( h t t p : / / w w w品 a 16日最終閲覧 [ 4 ]総務省, i 平成 2 2年国勢調査人口等基本集計結果 結果の概要 J ( h t t p : / / w w w . s t a t .g o . j p / d a t a /ko k u s e i l 2 01 O /k i h o nl / p d f l g a i y o u1 .p d f に2016年 6月 16日最終閲覧. 402
規定課題 参 加 カ テ ゴ リ ー :C )学部学生・大学院修士課程(社会人院生は除く) チーム名:中国からの三人娘 買慧玲(カケイレイ)、郵時韻(トウジイン)、李慧蚊(リ ケイジョウ)、 兵庫県立大学大学院応用情報科学研究科 J I A HUILING,DENG SHIYUN,LI HUInAO、 G r a d u a t eS c h o o lo fA p p l i e dI n f o r m a t i c s,U n i v e r s i t yofHyogo 問題 1 「産業符号」という列の名前を右クリックして、「列プロパティ」の中の「値の順序」を クリックする。ここで、レポートに表示する順番に産業符号の水準を並べ替える。また、「性 別」の方も同じやり方で順序を変更する。 そして、「二変量の関係 J を適用する。説明変数に「産業符号」を、目的変数に「性別」 を設定して、 i OKj をクリックすると、以下の単純クロス表が得られる。 4、性別 手 。 1 3 2 1 3 4 1 9 1 2143 日 田1 1 7 3 1 問 1 221 0 1 222 日7 1 0 1 日7 1 2 3 5 1 3 1 1 2 3 8 朗 3 1 2 0 1 1 2284 2 4 7 2 1 3 9 1 5 1 1 4 0 1 0 1 伺 却 1 3 2 1 8 2 1 刈 倒1 1 3 7 1 1 2 1 0 5 9 1 四 1 1 1 4 8 n11 3 1 3 2 4 1 1 8 1 6 1 1 伺 1 1 但 2 団 1 1 3 0 1 37 , 踊 36 97 倒 1 1 5 9 1 11 1 2 9 5 臼6 1 3202 到 2 9 3 8 1 1 2 次に、新しい列として i l O万世帯比集計用乗率J を作る。計算式を使って、 「集計用乗率 j * 100000/495465 を入力すれば、 10万世帯比集計用乗率が計算される。 もう一回、最初と同様の「二変量の関係 J を適用するが、今回は i l O万世得比集計用乗 403
率」を「重み j のところに入れることで、以下の 10万世帯比のクロス表が得られる。
4
.性別
男
度数
鉱業
女
。
7
31 6
3n
製造業
510 18347
電気芳元・熱績給・氷遺業
回7
情報通信業
2020
置強襲(
6 3858
錦嘉・小襲業
日
目9 7
233
金融・犠蹟糞
倒
1
1447
1551
不動産糞
144
144
散毒菌¥';"積泊業
1回
265
107
田2
1022 810 1
3110
2回
3379
語
重
竃
轟
量
ー
苓
看
吾
量
轟妻轟蚕[
981
992
11
ザーピス糞(他l
{t分譲され縫いちの} 団 42 326 6167
1 10
回1
430 11121
会
聾
,c
砲E分離れ越山棚上
不詳
48
師
31~凹
3
伺1
1
叩O
92000 8000 100
7
6346
17837
回7
2020
3852
6制 4
建謹
J
。
。
‑限定鎖倒・守
。
F
,
争k
問題 2
「一変量の分布 j を適用する。 Y列に求める「経常収入Jと「食料Jを入れて、度数に「集
計用乗率」を入れる。「表示オプション」の「分位点の間隔の設定」で 0.2を設定すれば、
5分位点が以下のように示される。
i
恒:塑
4同 制 騨 臥
4
金融
l 物館
¥
l
O
O
%
:
'偉大笹 4229叩
'
1
0
0
崎、電文笹 4田 1874
'
8
(
)
t
挽
63
詔 75
畑町
1
靭略 1
回1
181
滞。鴨
咽漏
4例 田3
却秘
310531
1
略;割、値
│
冊
l
%j
i
甜鴨!
93035.8
7
,
田5
5
.
1
臼1
4
6
.
2
49701
時 一 宮 崎 町6.84
0
また、「ヒストグラムオプション j で、選択されている「縦に表示J を取り消し、「割合
軸Jをチェックして、
r
y軸の設定」の「形式Jに「パーセント」を選び、 r
x軸の設定」の
404
「形式」に「通貨J を選ぶことで、課題のヒストグラムが得られる 1 @ 4.錨細入 0 . . : 1 両 面 扇 1 ト ‑ 0 0 ‑ 輯.. 師事町・ . ト‑DJ‑→唾髄L喝J 4 l l 4 l l E 冨 ¥0 細 沼 ∞ ¥1 600 ∞ ¥2600 ∞ ¥3600 ∞ 問題 3 新しい列 i l 0万世帯比経常収入」と i l 0万世帯比食料費」を作る。計算式の I F関数を 白 E圃E 一 圏直 < I 4 Y /Ul !! !き到 厘 画 │ 匝<=圏三直司=同 f図 画<=画調〈層雪[司自 恒函<=層調〈両副司同 匝調〈唾唖j 匝唖〈半経常収利〈匝唇~I=>~ マω vT悶 悶 川 凶 匹語主君〈両五5 可 ヨ ヨ 巨E E寸経常収量〈恒割コ同 f匝 亘<=極経常m 1 <恒詞I = >同 ー コ 匝璽寸経常収利〈恒画i 一一一ル一行髄向調詩蹄一瞬一 一 町 一 一 伊 一 一 E 一 s 図5 時一回圏園圃 噛@自国園園 町一圃園田園 塁 圃 E E圃 使って、以下のように 5分位階級をそれぞれ作成し、新しい列に計算結果を入れる。 「 企 ロ ーA I L一一一 !命ロマ 11" 「二変量の関係」を分析する。説明変数に i l 0万世帯比経常収入J と i l 0万世帯比食料 費」を、目的変数に「性別」を設定して、 i lO万世帯比集計用乗率Jを「重みJのところに 入れると、求めたいクロス表が得られる。 405
L l 団 制 帰 髄 瓢 入l : 4 J 醐鋤舗闘す紛婦 1 f 自画師繍費払間切帯四百舗 垂み:1 0 沼世費量集計周量志望喜 煙雪型喧 4 因分語表 重み:1 0 万世費量獲計周愛率 恒空戸口 │ 信扇面 4 . 性別 女 │闇 男 1 1 6 回3 3 鈎 9 9 1 9 6 1 2 18ω7 1 0 似)() 9 0 3 2 3 1 8 7 3 4 1 2 6 8 2 01 例昌 1 4 ,< 1 9 例9 9 9 9 8 5 1 9 3 1 7 伺 5 20ω3 9 2 0 ω ω 1 包要領穆判事mhoH J寄 円 帽官製$割mhoH 4 . 性別 l 察 │闇 男 1 1 0 0 0 0 5 4 9 4 4506 2 畠 1 8 6 1 7 1 3n 19鈎 3 3 1 9 世甥 9 1 1 2 0 0 0 9 4 1 9 鈎5 1 9 3 5 6 5 1 9 4 3 5 5 6 7 20 2 00 0 9 2 0 80 1 。 ∞ ∞ ∞∞ ∞ 航 路 ∞∞ 」 以上の結果に基づき、エクセルで作表して課題のクロス表が得られる。。 表1 食料費 経常収入 5分 位 5分 位 数 男 女 言 十 5分 位 5分 位 数 男 女 計 1I 310, 5 3 1未満 15494 4506 000 20, 1I 49, 7 0 1未満 16803 3196 1 9, 9 9 ! 2 310, 5 3 1以上 18617 1377 1 9, 993 2I 49, 702以上 18097 1903 20, 0 0 ( 883以上 3 404, 19099 9 1 1 20, 009 3 63, 1 4 6 . 2以上 18734 1268 20, 0 0 ‑ 1 8 1以上 4 5 0 1, 19356 640 1 9, 995 4 76, 0 5 5 . 1以上 19049 948 1 9, 9 9 1 875以上 5 635, 19435 567 20, 002 5 93, 0 3 5 . 8以上 19317 685 20, 0 0 : 計 92, 000 8, 000 100, 000 計 0 0 ( 92, 000 8, 000 100, 問題 4 「二変量の関係」を適用する。説明変数に i l 0万世帯比経常収入 J を、目的変数に il0 l 0万世帯比集計用乗率J を「重み J に設定して、「性別 J 万世帯比食料費 J を設定して、 i を i B y J に設定することで、以下の結果が得られる。 ] I @ : 間 関 甑 脳 出 融 仰 向 揃 l4.'栓翻唱 重み:1 仰諸積集計潤震率 恒空墾 4 以上の結果を用いてエクセルで作表することで、課題の 3重クロス表が得られる。 406
表2 食料 ( 5分位) 経常収入 5分位 計 2 3 4 5 5827 3974 2798 1 8 3 1 1064 15494 2 5130 4501 3978 2996 2012 18617 3 2911 4301 4395 4294 3198 19099 4 1906 3233 4082 4903 5231 19356 5 1029 2087 3481 5026 7813 19435 計 16803 18097 18734 19049 19317 92000 2462 994 565 314 172 4506 2 3 7 1 399 235 2 1 1 1 6 1 1377 3 243 225 216 164 63 9 1 1 4 68 134 156 143 140 640 5 53 152 96 117 149 567 計 3196 1903 1268 948 685 8000 男 女 男女計 1 9, 999 20, 000 20, 0 0 1 1 9 . 9 9 8 003 20, 100, 000 問題 5 新しし、「常用対数食料費」とし、う名前の列を作る。計算式で超越関数の Log10を使って、 LoglO[食料費] を入力して、食料の常用対数を求める。 続いて、まず、「二変量の関係Jを適用する。説明変数に f lO万世帯比経常収入Jを、目 的変数に f lO万世帯比食料費 J を設定して、 f lO万世帯比集計用乗率」を「重み」のとこ ろに入れて、「性別」を fBYJ に入れて分析を実行すると、男性と女性のそれぞれで以下の ような分割表が得られる。この分割表から世帯数が分かる。 女性 男性 唖聖 l~[里空空 d 1 0 万世帯食事司貧 2 2 4 5 ∞ 画~ 円墜岬宮岡揖笹組問 D H ま 4 量 E 事 2 鈍 5827 3974 27 1 8 3 1 1064 15494 5130 4501 3978 2996 2012 18617 鈎 2911 4301 4395 4294 3198 190 1906 3233 4082 4903 5 2 3 1 19356 1029 2087 3 4 8 1 回 26 7813 19435 Z 臼0 3 18097 18734 19049 19317 92G J 円 J 竪盛岡高毎朝同日 │度額 1 1 2 3 4 事 s 2462 371 243 68 5 3 3196 10 万世窃食純資 2 4 994 鈎 3 225 134 152 1 9 0 3 565 235 216 156 96 1 2 6 8 5 314 211 164 143 117 例昌 172 4目指 161 13n 63 911 140 640 149 567 685 畠似)Q 次に、もう一度、「二変量の関係」を適用する。ただし、今回は目的変数を f lO万世帯比 食料費Jに代えて「常用対数食料費」に変更する。これで、多少の誤差がありますが、 5分 407
位別に、食料費の常用対数の平均値が以下のように得られます。 男性 女性 4 倒樺@輯 1 .:1扇面輔 言 瞳E 汀汀叫ふ己究旦電里i 吐 ♂ ♂ . 日 ふ ι J 三 白 日 J ぷ!踊壱層唾毒¥司頑唇極 ι 主扇 E長 蔀 ; 唖 唖 プ : プ ? 亙 垂 亙 盈 ; μ 己 二 益 殉 向 璽 察 持 鞍 彦 畏 ぷ 伺 積 叫 叫 ‑ 孟 鞠 轡 特 剤j 正 i U 力 が 三 1開 3 . 7 4 . 7 謁 ω 0 刷 2 1 量 捌 1 阻. 6 . 7 叩 4 . 瑚 辺 叩m i'~ 華吾t許洲少11捌慌闘.6 佃 4 .幻 醐 O.ω109 4 i 1 9 3 野悶 8 4 . 鑓臨 2 5 珂 1 9O . 1 ω l ' 鮒 5 . 4 仰拘 0 叩m 刷 1 胤ω 円 ι ぶ ∞ ム ? ,〆 寸ぺ ι料r 4 . 瑚 5 4 叩 1 日朗 仙 4 . B 脳M 抑7 仰 4 .回m 4 . 鵬 5 4 . 醐 7 4矧 3 仰 4 .犯 弱 ' " 三 1 約 認 : 五i ι 7 悶 仰 叩 1 0 7 0刷 弱 4珊 υ 4 . 1 7 1 η 1O . 蹴 6 ω 8 4 . 6 4 . 8 F8 η 包踊.昭 4.87741 0.00710 4. 5 4ω13 1 4 " い λ リ心 パ 川 引 印 . 蜘 , 価」晶舗 位 この男女別で 5分位階層別の常用対数食料費平均を用いて 10. (常用対数食料費平均) を計算することで、求めたい幾何平均が次のように得られます。 60, 000 50 , 000 , 000 40 000 30, l 408 ↑ 70, 000 一 00 80, ↑ … 。 i90,000 千 男 + 女 i Z 4 4 523‑3‑4599 7‑3‑ 引一刊一恒引乃花一引一拍将一花一伺一引一 E 6 5 盆 5一 6 1 7 8一 一 1 6 6 7 7一 一 i E4OA旦丘畠 9am旦 nmZ丘一£ ﹂ i r ‑ ‑一 一一1Lir‑一一 均一二一一一一一 11 1‑nu‑ i‑E928一 6 5一 5一 3 1 3 7 4一 5一 餅亙川一川一畑一仰一明一側一川一川一川一川一川一m一 4一 4一 4一 4 4 4一 4 4 4 4 4一 十一有一 4 一 一 内 L Mh 日HHh‑MA‑au 一 L 47 一 o‑‑1 一 一L 96 守︐﹄'一 ‑弘田昌 LP 一色 1JJ53 一﹄回目一同一叩﹂2 4一 ・ ‑ ロ 一 m m 刈m 一t m U 川一相一即日一 ‑ 監4 い 一m 一 A t一 一 一 一 一 一 一 一 一 一 収出 ‑iL14L ﹁ l i l i ‑ ‑ 一 車 市 一 一 ‑︐ ‑ 51; JJEt‑‑; : J J 常 旦一一一女一 求められているグラフは、以下のようになります。 1 企7 7 仰 2 1 降防蜘 倒九剖例昌 綿 野瑚唱 、細臨 朗 臼
世代別及び経常収入別に見た官民の平均貯蓄率の差異に関する考察 田中健一郎 兵庫県立大学大学院応用情報科学研究科 参加カテゴリーB 要約 官公庁に努める人(官公)と民営企業に勤める人(民営)で、貯蓄率にどのような違いが出るのかを 考察するために、教育用擬似ミクロデータを用いて、統計解析ソフト JMPにより分析を行った。官公 と民営とでは、明らかに官公の方が、平均貯蓄率が高い結果となったが、年齢 5歳階級別および経常収 入の 5つの階層別に改めて検定を行うと、平均貯蓄率の差は、一概にどちらが高いと言えない結果とな った。また官公と民営の共通点として、ともに平均貯蓄率のピークは 35 歳 ~39 歳にあり、 40 歳以降は 減少し、定年前の 55 歳 ~59 歳でようやく回復することがわかった。婚姻していると考えられる 2 人以 上世帯では、子供の教育費がかからない貯められるときに貯めておくことが肝要ということがわかった。 キーワード:教育用疑似ミクロデー夕、平均貯蓄率、公務員、官公、民営 1 . はじめに 公務員は、労働三権(団結権、団体交渉権、団体行動権)の制約がある一方で、身分の保証があり、 所得は安定している。そういった国や自治体を就職先として選んだ公務員は非公務員に比ベリスク回避 的であると推測できる。 リスク回避的であるとした場合、それは貯蓄行動に表れ、質素倹約に努め、貯蓄率が高くなるのでは ないかと考えられる。しかし逆に、安定した所得が得られるのであれば、将来の不安は少なくなるので、 貯蓄は少なくてもよいと考え、貯蓄率が低くなるとも考えられる。 官民で貯蓄率に差があるかどうかが本研究のテーマであるが、このテーマを選んだ理由は、筆者自身 が公務員であること、そして、同じ公務員で、閉じ年代、同じ収入階層の勤労者がどれくらいの額を貯 蓄に回しているのか、官民で貯蓄額に違いがでるのかどうかということに興味を持ったことによる。 以下では官民の貯蓄率の差異に関する考察を行う。 2. 平均貯蓄率の求め方 総務省統計局[ 1 ]の全国消費実態調査の定義によると、平均貯蓄率とはF 可処分所得に対する貯蓄純増 の割合のことであり、計算式で表すと下記のようになる。 平均貯蓄率= ((預貯金一預貯金引出) + (保険料一保険金) )/可処分所得 x100 可処分所得とは実収入から税金,社会保険料などの非消費支出を差し引いた額で,いわゆる手取り収 入のことを指す。 何をもって官と民を分けるかであるが、教育用疑似ミクロデータの変数として利用可能な世帯主の企 業区分を用いる。以降ではこの区分名に従って官を官公、民を民営と記すこととする。 官公・民営の 2群聞の平均の差を検定したいので、まず企業区分 不詳は分析の対象から外すこととした。そして、今回は世帯ごとの 神 崎 68221.8% 貯蓄率の差を調べたいことから、群ごとに総預貯金や総可処分所得 80.4% などを求めてから貯蓄率の平均を算出するのではなく、世帯ごとの 58.8% 43.5% 貯蓄率を求めてから、それを群ごとに平均したものを、群ごとの平 29.6% 均貯蓄率とすることとした。 13.1% その際、計算式の性質上、絶対値が 100%を大きく超えることがあ 四分位点 ‑7.9% ‑38.3% り、そのような特異な例が全体に与える影響が極めて大きくなるこ ‑102.9% とから絶対値の大きい上下 0.5%を外れ値として分析の対象から除 ‑253.3% 軍小値 ‑44 321 .1% 外することとした。具体的には、図 1に示すように、 JMPの「一変 量の分布Jを適用して得られた 99.5%点と 0.5%点の値から、分析の 図 1 貯蓄率の分位点 1 4 0 9
対象とする貯蓄率の上限を 80.4%、下限を " 2 5 3 . 3 %として、この上限と下限から外れる世帯を除外した。 3. 貯蓄率の分布 分析の手始めとして、官公・民営合わせた全体(不詳除く)の貯蓄率の分布を表示する。なお、分析 0万世帯比用乗率を用いて、 1 0万世帯当たりで分析を行うこととし にあたっては、規定課題で用いた 1 た 。 , 815世帯を対象とし 不詳と外れ値を除いた 98 1 5 0 0 0 て、一変量の分布で列に貯蓄率、 10万世帯比用 乗率を度数に設定し、ヒストグラムにしたもの . " " " " が図 2である。 健穆署員一一‑ 図 2から、貯蓄率は平均値付近に世帯が収束 する正規分布のように見えるが、 JMPの一変量 の分布から連続分布のあてはめ→正規→適合 ‑ 2 6 0 . 鮪 ‑ 1 8 0 . 附 ・1 警富島却品伺.時 度 → Kolmogorov"Smirnov" L i l l i e f o r sの検定を . 0 1となり、この分布は 行ってみたところ p値は 0 図 2 貯蓄率別世帯数のヒストグラム 正規分布であるという帰無仮説は棄却され、 正規分布ではないことがわかる。 4. 官公と民営の平均貯蓄率の差の検定 本研究の目的は、官公と民間との関で貯蓄率に違いがあるかどうか、あるとすればどのような違いで あるかを確認することである。そこで、まず、単純に、官公庁に勤める人と、民営企業に勤める人の貯 蓄率の平均に統計的な有意差があるかどうかを調べることとした。 JMPの r2変量の関係」で、貯蓄率を目的変数に、企業区分を説明変数に、 10万世帯比用の集計用 プーリングした t検定」 乗率を度数に入れて分析を実行し、結果画面のメニューから、 「平均品NOVAJ を選択することで、図 3の結果を得た。 .36% 図 3より、平均値は官公が 9.81%で、民営が 5 であり、分散分析の F値は 2 2 0 . 7 8で p値は< 0 . 0 0 0 1 であることから、 1% 有意水準で官公と民聞の貯蓄率 には有意差があることが分かった。 しかし、貯蓄率は年齢や収入に応じて変わると思わ L盟 障 れる。したがって、次に、年齢や収入が同じ場合に、 面;語語Z 0 . 0 5 6 1 8 官公と民間の 2つの集団の貯蓄率に違いが出るかど うかの検定を行う。 図 3 官公と民営の平均貯蓄率 5 . 5分位別経常収入および年齢 5歳階級別の官・民の分布 JMPで「グラフの作成」を選択し、 Xに規定課題で作成した 5分位別経常収入、重ね合わせに企業区 0万世帯用乗率を設定して作成したグラフが図 4である。 分、度数に規定課題で作成した 1 一方、 JMPで同じく「グラフの作成J を選択し、 Xに年齢 5歳階級別、重ね合わせに企業区分、度数 0万世帯用乗率を設定して作成したグラフが図 5である。 に1 , . ・ ・ ・ ‑ 4 恥...... 図 5 官公・民聞の年齢 5歳階級別世帯数 図 4 官公・民閣の経常収入 5階層別世帯数 2 410
図 4と図 5から、経常収入 5階層別と年齢 5歳階級別では、それぞれの分布に特徴があることがわか る。集計用乗率で補正されているとは言え、全国消費実態調査の回答者には偏りがあるので、グラフに 示されたデータの特徴が官民の年齢や経常収入の分布を一概に正確に表しているとは言いがたいが、グ ラフからは、公務員は経常収入が多い世帯の割合が高く、若者が少なく、 50 歳 ~54 歳が最も多くなり、 60歳を超えると急激に減少しているという特徴が挙げられる。 6 . 経常収入 5分位階層別の平均貯蓄率の義の検定 JMPで「一変量の分布」を選択し、 Y列に経常収入と食料、度数に 10万世帯用集計用乗率をセット し 、 5分位点を求め、第 1の 5分位階級として 310 , 531円未満、第 2の 5分位階級として 310, 531円 883円未満、第 3の 5分位階級として 404, 883円以上 501, 1 8 1円未満、第 4の 5分位階級とし 以上 404, 181円以上 635, 875円未満、第 5の 5分位階級として 635, 875円以上の 5つの階層に世帯を分 て 501, ける。 0 続いて、 JMPで r2変量の関係」を選択し、貯蓄率を目的変数に、経常収入の階層を説明変数に、 1 万世帯用の集計用乗率を度数に入れて一元配置プロット図を表示させる。その上で、メニューから平均 IANOVAIプーリングした t検定を選択して得られ た経常収入 5分位階層別の平均貯蓄率が図 6で r 三明‑,平時 間開陶酔司 ある。 扇 風 1 7 8 4 .お 6 判 6 : O a 4' 36ï7~6初 < : 0 ∞v 98810 12184.003 0 . 1 2 3 図 6より、経常収入の 5分位別階層が大きい 錦 僻 糊 , 98脳 1謁 68.339 (経常収入が多し、)ほど平均貯蓄率が高くなって 1 各水箪@平均 いる。そして、一元配置分析の F検定により、 F 感電車 軍 軍 事萌福事議言語←事週1 9 5 1 路島燭畢夢路 値は 3 6 1 7 . 6 6で p値は< 0 . 0 0 0 1であり、 1%有意 1 19282.9 ・0.19082 0.00253 ・0.1958 ・0.1859 2 ;1 9 8 4 8 . 3 0.04380 0.00249 0.0389 0.0487 水準で経常収入は平均貯蓄率に有意差をもたら 3 19944 0.10812 0.002 , 刈9 0 .1032 0.1130 4 1 9 9 2 2 . 5 0.14613 0.00249 0.1413 0 . 1 5 1 0 していることが判明した。 5 ,1 9 8 1 7 . 3 0.19712 0.002 坤9 0 .1922 0 . 2 0 2 0 key‑Kr amer法による多重比較を行 さらにTu 図 6 経常収入 5分位階層別の平均貯蓄率 うと、図 7に示す結果が得られ、図 7より、 すべての経常収入 5分位階層間でF 有意差が 5分位階層間)での平均貯蓄率の差を見れば、 あることが認められる。差の順位レポートでの水準間 ( 経常収入の多寡が貯蓄率に与える影響はかなり大きいことがわかる。 F ‑ ‑ " ゐ ・ 率直軍事場*事**品事* 司 d E a ‑ ‑ 44 44444 A A A 子 内 υ u U ︽ 内 nu U 内 U 内 U 内 u 内 nunu nuhunununununu u 内 nunu 内n ununununu u ︽ n unu n uu ・・・ 晶 ‑ ・ 一︿︿︿︿︿︿︿︿︿︿ ﹁ 4AEO 4 弓 4ι4A ' 守 ' o'sao 回 帰 明M 白d 陣w 掴 a ヨ 白000 4 dn''aeoa 弓 00﹃ ︐ u'J'anu 4 E周 司4 4 ﹃ 4A の ﹃ n'nu 司 e︒ 向 司 E剤 tozozo'a 白 羽 白 d dr3eo u 宮dnwマ︐ 園 開 ヲ'auau凋 守 ︑ ︐h4 a 圏 嗣 つ 合 ヲ 必 守n uamTEO ‑‑‑n3‑'zoa‑T ・ ・ 内 nunu 副割 T 引' a'J'a 4 ﹃ 4A 唱 ‑anu U ddnunuwnunununununununu ︐ mm 5763029171 陣buu抽出悶町四百四日 血 田剛一 4﹃ 4﹃ 4nヨ﹃︐﹃︐噌S ﹃ m E ι司 f aa‑Y ヲ 'ad 必 d‑aqda‑E'Aee 圃 ヨ 園 田 Y ?aw mu nnnuω 即応凶白 ︐ UAU υ 内 n ununununununu ﹃ •. 川一員一 押叫 ι ﹃ ・ 4 季 S ; i ¥ . 3 2 . i S . . 4 3 守n U6‑‑ 嵩znua ・1 民一宮市1 官daw ' t 圏 一 2 7 6 日6 1 2 0 3 7 3 4守 必 守 E3︑ ︑︐ ︑︐ 司4 司 444 騨臨︹語 劃問PF3paE3E3F3F3P3F3FSFa 圃咽当3 S 司 ‑3 J'a‑3 3 a'J s 句' 掴蹟 O n u B o o n u n u D O O 内 n 内 向 nunu M訓ヲAU u unununu U u h曙町二munununununununununu 1 唱品 h2dnu a 一﹃ ⁝2 a 0303gu 電dヨdnu'd 3 白 nu 2 湾事 E6457D81829 5U2 9 0︑ 0 118 82 EJ2d''晶 ︐ eaeo 3 'a'a﹃ ︐︑44A44nunu u 内 nu ‑‑‑ ‑‑‑‑‑‑ ‑ nunununununu 内U 向ununHW '~畠 .~ m w筑間四羽田 ωmuw切 羽 務 署l i:.,水爆 5 . " 1 l C' 図 7 経常収入 5分位階層別の平均貯蓄率の Tukey‑Kramer法による多重比較の結果 3 411
7. 年齢 5歳階級別の平均貯蓄率の差の検定 経常収入の多寡が貯蓄率に影響を及ぼすこ とが明らかとなったが、それでは年齢の違い は貯蓄率の違いにどのような影響を及ぼすの であろうか。 JMPで r2変量の関係Jを選択し、貯蓄率 を目的変数に、 5歳階級別年齢を説明変数に、 10万世帯用集計用乗率を度数に入れて得られ た一元配置プロット図において、メニューか ら平均仏NOVAI プーリングした t検定を選択 して得られた分散分析表と各水準の平均の要 約表が図 8である。 図 8から、年齢 5歳階級別の貯蓄率の平均 5 " ' 3 9歳の階級区分までは階級区分が上 は 、 3 0 " ' 4 4歳と 4 5 " ' 4 9歳 がるほど高くなるが、 4 図 8 年齢 5歳階級別の平均貯蓄率の一元配置分析 0歳 の階級区分で段階的に大きく下がり、 5 5 4歳の階級区分で少し回復し、 5 5 " ' 5 9歳の階級区分で大きく上昇、そして 6 0歳以降はまた下降する という波を描くことが示されている。 4 412
円︻司 y m G制掛起剛山側 叩吋己規﹄室町﹄出fhU43G W柳匙賓M w e ‑ ‑ R礎控犠ω鐘叫明︒図 耐町佃暢 A H 凶 史語︒daR事昌・@頃睡事異耳マ盟副m也ade署長提唱︒ agqHE曽be昌E車両qaTgh宣司ogを盟榎苫 a5・Ha何時曽田弓ea濁血盟ed‑‑Rb'EdZ由民哩e a g q 同 ‑B 富岡副REd信管盟副司ay 喧mkb萄d草剤国語︒6 ss・zammEa園調理aTER・qdHha置苫 量産d軍高唱︒司自量平田揖樋旨・回復様車se 基盤句︒h曹司自d 華曇 qayERZ萄6理軍出sd ea嵩高島盟︒君︒牢畠号︒・aoq哩司@措置鍵司6 aE司書宜潤唱︒島田mETSa自q6a匝同ad‑ aぉ28田盟国da也陵商キ貝毒白書車両型車d 寝歯ed吋怠場自Humaa両露首6・鍵話︒るq6a覇軍貝苫 age‑hmF昌qeaua司qaゐ盟副苫支置民ad ‑開昌.︒緯守録制ad田辺居酒d‑mg刻叉趨dg曽白血目‑qg aEヨ礎調副罰Hda︾民同・q=掴桶文苫胃呂田6d 鎗桜@64町内掃討怠盟gdo玄mHaEvam鍵筒q6国語RHed 寧gdbS 制 gd畠串昌三vsgaged‑EEgd a揮官話量調dm弱a白49白22盟重量d g置︒dZ肉a置伺・6軍指揮司ay鍵萄哩且EupBm剖qe aEd田守高=Je揖忌E唖 寵 説 aEdh同居困.6 冨ed曽あ鐸bq6'E=冒d L80・v認椀陪EdFR L安E︐ vgx首袋由d鍵KBedSるzuq6宮草昌司・6 ・28・0EmmEd宮阜盟問d銀事Edm弱草M6.6 80q伺目提調書dt匂高2v‑盟専adhmvsm喧e L E G ・A同目指E・6盟諸語週da窃a‑qa文語mmqe A80︒︐E草笛edm宰虫酉dm司睡6qanぉgm‑d L只5・va"namedaお盟百daHam話Mqd玄跨坦玄W0 ・HaE・uw倒潤量おadg羽彊ad耳語専袋苫訟kgるq6 ・皇室︒︒卑窃gkad向司置da蹴邑量苫自白踊又喜 ・員百よmHEEZBgd盟磁巨富.6E双磁文苫 REdg畠ESS草署qE高空苫草史専ad‑4 7 5 8 4 型 車 望 ︒ 宮 司 g d 車 直 面 q d a E号qeg‑ Z80・v再開畠2Z据置︒富岡田gda宮内wqa 塑 守一曹gda制覇ヨ@瞳置理 宮司gdRa容︒昌岨雪 一‑HSavakReo‑eg周目︒同富寧83︒HR障誕喜望 一ぉSOV恥対話事望︒鍵話量UQ20自弱虫白ed何回盟事qeg‑ v一sgd‑azs開白書aTBS2・6aR曹2 雪 788vo民国Eea濁盟a・6・巴断定首dB空軍adg‑ 7zsvS曹由︒d牢畠gdZRR司aRbHEe 堅 ‑田富62置認量da︐BaS4富田恩草gdg国語限時︒型 ‑goo‑vHee‑‑eed措置gdgマ事事gd何回白E6一瞳‑ LSQva自由民 ・ w 6E也君ad盟罰的支旨dg" ま苅観冒d 判断Zdag耳目daE琶d v 鍵 量 制 S R 昆 a g L実習0・vm踊錫弱︒62mmO69島断民窃dE再認置d 揖司dmg自由dzaE事昌自白書問45白書a ・Ha百vam商FRZZ描寝注目dZ溺錘606am磁担酉6 L袋首‑v寓aR邑Je符目sd宮司毘司assas h‑語dR記事例d$翼司aT銀語昆qaR国銀司︒ aaHdg唖g告・eaa=qayEg商gdg主回喧︒ 宮zdag富田6gsa司ayR国警製苫開高HBd eg日46Z賀民 同d強調笠置6・障宜尋gd寓剥由民苫 宮司d自国富岡・‑eE軍司qn司副ぬga 串民苫 ・揖至︒骨量砲撃喜虫歯86・m量EdE富島a b良司va由曹ゐqezagd︐Bgbqea摘露kq6 ・ 州 安 E ・ M g Z聞ageJea柑zgd'B量︒qeS民自喧6 ・Ha望Quv除草Z賀刊JepE血書dgzb思gad‑n肖mgd 自国6由Esd‑za弓白守宮間肩書esag ‑as‑‑auEヨezggdB守主将苫EREqd 曹島6au量Hd司mzdq胃亘縄文苫邑玄事sd L実YQV銀協毘目d判鍵材提苫冨向ksqaa碗m白qe ・HaEvEa=dm量民苫自福留窃daヨaaqe 田署dahHR語調da福寝込dEg国語Zd豊富鍵苫 ‑gV0・v豊富ZREdssed事E2 ・吋只gvEゐ舗湾同6哩亘書・6ag由民苫aa鋭窃qa ・同史百・vFB車両4R・6園6S569RE翼qa玄事車部q6 ・同只uuvm由民同句︒回目ゐ畠dbak誕廼d'E都銀胃da '司8・一on民団越両dg窃悶喧6Haぬ車両可︒PR語︒H・6 盛岡伺・6由ua協同.6信事盟溺dya磁調宜苫卑樫E=d h只窃vRFB胃d‑E属gd宮越前Nm苫思窃間口・‑e a¥da覇軍剤du昌盟adマ鬼歯盟事qa自由自由d ‑ 琵 琶 V壇自重荷dam睡奇6a置hagd司RR"・0 ・ 州 安 室 ロ M w m褐'E‑26am史認岱6E長mgd鐙事文望司a h︒s・uveam由民同・0岡田=・0胴良部調理eab事@zd h安uov副司唾胃6国語高伺・6国耐agedg 窓gaZee ‑H80・vRZE2R証書dm諸国gq・6高同銀盟Z6 ・事8.︒S揖再462sdnkoSSR‑胃 ・HaEd鎚園寝向付d盟藤健86 F A w ‑ ‑ 胸 h n 守 日 余M Q H ︒ 川 町 河 口 同 けの﹄刊誌州刑制・標り一時糊匙安時 間 h ド掛 V育 制 ・ 惇 求HPE出噌豊樹市川常時ーや曝 m 摺Qνてが﹀錐 h叩E Q韓 苫JBu 総 川 SJ 甲︐怒れドE(もや川内総ご心会犠 ︐ OAU叫L 令︐ゃ監(町議蜘且品塩川守(も鰍咽Zt m mEH 犠gtSF犠gtsn 縫3J h g ︐犠31gu吋縫BJB ︐犠SJ mBU州総苫JS ︐総事Jm 司 日 刊 3 礎 J m g ︐韓3JSH吋犠gt凶的︐似情︒∞J tg ︐也心会︒図︒川義州 ⁝由∞心臓詰∞ w ν n v丈 令鴨川一∞図︐心的4 開眼誕羽小リ吋 L 畠ロト 挙対側山 WA 即吋け嘉﹄世田園占 ‑h h 制QM 以 内 WHKA即 'b‑恨 M餐 叩 吋糊主賓併 Q g 一ω h ‑ n u拘 P E出端謹経由 Qh﹃恩 Q 盆川町u ︒μKJEE穿M Q H吋けの F J ‑ 国 民 側 櫛 総 得 純 惚υ一 時 綿 盆 HH鑑 川町冨出端謙一礎ω や 掛 耗 艇 ・ 偲 ポ H ︐心得 ny ︒判一層門岡や︒︒.∞ HHHU 回 υFh叩 濯'同︐心会艇事余経余 (50図︐ H転倒 ν J 5 型 g o o ‑ ν
8 . 経常収入 5分位階層別に見た官民の平均貯蓄率の違い 第 6節での分析から、経常収入が多いほど、貯蓄率が高くなる傾向があることがわかった。それでは、 経常収入が同じ 5分位階層だとしたとき、官民で貯蓄率に違いが出るのだろうか。 JMPで経常収入の各 5分位階層ごとにサンプルを抽出し、 f 2変量の関係 Jで平均貯蓄率の差の検定を行った結果を E x c e l を使用して加工し、グラフ化した結果を示したものが、以下に示す表 1と図 10である。なお、表 1の 欄外のアスタリスクは、***は 1 %水準で有意、帥は 5 %水準で有意、*は 10%水準で有意を示す(以下 も同様)。また、セルにグレーの色かけをしてい 忌雇鳶扇瓦雇轟肩車両 る方が、平均貯蓄率が高いことを示す。 03 本2 表 1と図 10から、経常収入が同じ 5分位階層 ‑81 倉 ‑1ilI 0 . 2 であるとき、民営のほうが、官公よりも貯蓄率が いずれの階層でも高くなっていることが明らか 0 . , となった。第 4節では、経常収入でグループ分け することなく分析したが、そこでは官公の方が、 0 . 0 平均貯蓄率で民営を大きく上回っていた。それに も関わらず、経常収入の 5分位階級でグループ分 , . . . けして官公と民間との間の平均貯蓄率を比較し ‑<u た結果では、サンプル数が民営では経常収入 5分 位階級が高くなるにつれて減少していくのに対 . . して、官公では経常収入 5分位階級が高くなるに つれてサンプル数が大きく増えていくことを反 映して、平均貯蓄率の大小が完全に逆転した結果 が得られているのである。 0 経常収入 5分位階級別の官民の平均貯蓄率 図1 . 表 1 経常収入 5分位階級別に見た官民の平均貯蓄率 経常収入階層 N(貯蓄率 官公) N(貯蓄率.民営) 平均(貯蓄率.官公) 平均(貯蓄率,民営) 1 77 1 ‑ 3 0 . 5 目 ー1 8 . 1 %場 1 . 5 1 2 1 7. l 2 3 4 5 計 2 . 7 4 5 3 . 8 2 0 5 . 0 5 1 6 . 3 9 7 1 9, 525 1 7 . 1 0 3 1 6 . 1 2 4 1 4 . 8 7 2 1 3 . 4 2 0 I 9 , 2 ̲ 9 ̲ Q 2 . 5 首 1 0 . 0 % 1 4 . 2 弛 1 8 . 9 弛 9 . 8 弛 * * * * * 4 . 7 拓地 1 1 . 0 部 本場 1 4 . 8 % 2 0 . 1 % 覧 本*キ 5 . 4 * * * 9. 年齢 5歳階級別に見た官民の平均貯蓄率の違い 経常収入 5分位階級別に官民の平均貯蓄率を見た場合には、階級別では民間の平均貯蓄率の方が官公 の平均貯蓄率よりも高いが、全体では官公の平均貯蓄率の方が民間の平均貯蓄率よりも高いという、合 成の誤謬を想起させる興味深い結果が得られたが、年齢 5歳階級別に官民の平均貯蓄率の違いを見た場 合はどうなるのであろうか。 2変量の関係」を適用した 1元配置分析によ 前節での分析と同様に、 JMPのサンプルの抽出機能と f 1に示している。 る結果に基づいて作表と作図をした結果を表 2と図 1 表 2 および図 11 からは、 25~29 歳階級から 55~59 歳階級までは官公の方がF平均貯蓄率が高く、 60歳を超えると民営の方の平均貯蓄率が高くなる。今回使用している教育用疑似ミクロデータは 2004 年の調査データに基づくものであり、現在は再雇用や定年延長などで 65歳までの雇用が一般的となっ ているが、調査当時では公務員は 60歳で定年を迎えることが一般的であったため、定年を迎える年齢 までは、ずっと官公の方が民間よりも平均貯蓄率が高いという結果になったものと考えられる。 6 414
. 年齢 5歳階級別で官公と民会の共通の特徴と しては、どちらも 35 歳 ~39 歳で平均貯蓄率が最 も高くなり、以降は低下し、定年前の 55 歳 ~59 画面画面 *'1 ・・盲傘 a却 歳で再度高くなるということが挙げられる。 40 歳以降で平均貯蓄率が低くなる理由として、介護 保険料の納付が 40歳から始まることや、住宅を 取得する年齢となって住宅ローン返済が始まる ことに加え、子供が中学や高校に進学して教育費 が家計の負担になっていることなどが考えられ る 。 教育費や住宅ローンの影響については、「教育」 や「土地家屋借金返済Jなどの変数との聞の関係 を調べれば明らかとなると考えられるが、これに ついては今後の課題としたい。 ‑1iII 0 .1 5 0 .1 0 . 0 . 0 0 . . ‑ 0 .1 0 留守 h a e h ・ . . , ,。,臨 。 刷 画 面 .. ~ .. 防 , C I I m 1 マ 守 脳 内 帥 百﹃語圏帥 h 20 同 百守同 τ Ea 向‑E凶 例 4国 輔輔副 図1 1 年齢 5歳階級別に見た官民の平均貯蓄率 表 2 年齢 5歳階級別に見た官民の平均貯蓄率 。 4 .年 齢5 鐙 瞥 級 N(貯 蓄 率 官 公 ) N(貯 蓄 率 毘 営 } 24歳 未 潜 2 4 0 25‑29窟 424 2 . 3 9 9 30‑34怠 1 . 2 5 3 6 . 7 2 5 35‑39 1 . 9 5 3 9 . 3 0 6 40‑44 2 . 4 5 9 9 . 5 7 4 45‑49 2 . 9 7 4 9 . 0 4 8 50-54~ 3 . 1 3 8 9 . 8 6 3 55‑59 2 . 7 1 5 9 . 7 6 1 60‑64I 7 0 2 5 . 3 9 1 65‑69 1 3 0 1 . 5 4 8 70‑74i 1 1 3 1 6 75鍾以上 7 5 不詳 3 . 7 6 6 1 5 . 0 4 1 すべて 1 9 . 5 2 5 7 9 . 2 9 0 。 宮公) 晶 1 2 . 9 1 3 . 9 ' 1 6 1 9 . 9 弛 1 4 . 0 弛 9 . 2 略 8 . 7 1 6 唱 1 1 . 8 一1 4 . 2 1 6 ‑ 1 1 . 4 首 7 . 4 首 5 . 3 弛 9 . 8 悔 毘 営1 2 . 1 1 6 8 . 6 ' 1 6キキキ 8 . 6 弛 **キ 1 1 . 1' 1 6本常事 7 . 6 覧* ホ * 3 . 0 ' 1 6 3 . 4 ' 1 6 8 . 8 弛事*傘 ‑ 3 . 9 百*梅本 ホ * 0 . 3 ' 且* 1 0 . 9 弘 1 4 . 2 唱 2 . 6 弘司 5 . 4 拓司*申* * * * * * * * * * 1 0 . 年齢 5歳階級別および経常収入 5分位階層別 l こ見たF 官民の平均貯蓄率の違い 最後に年齢 5歳階級別と経常収入 5分位階層別とを組み合わせて見た官民の平均貯蓄率の違いにつ いて分析する。 2変量の関 かなり煩雑な作業となったが、これまでの分析と同様に JMPのサンプルの抽出機能と r 2および図 1 3に 係」を適用して実施した 1元配置分析の結果から作表および作図した結果を表 3と図 1 示している。 表 3より、比較可能な年齢 5歳階級と経常収入 5分位階層の組み合わせ 46通りのうち、 21通りで官 公が民間の貯蓄率を、一方で 25通りでは民営が宮公の貯蓄率を上回っている。 年齢で特徴的なことは、 50~54 歳、 55 歳 ~59 歳、 60~64 歳の 3 つの階級は、いずれの経常収入 5 分位階層でも民営の方が官公よりも貯蓄率が高い結果となっていることである。これは、退職金の額の 官民の相違によるものと考えられるが、教育用疑似ミクロデータでは、退職金を補足することができな かったため、この仮説を検証することはできなかった。 上述の 50歳から 64歳までの年齢階級以外の 5歳階級では、経常収入 5分位階層によって大小関係が 異なっている。 7 415
。 。 。 。 。 。 。 。 。 。 。 。 8 416 官公) ‑ 9 . 8 也 1 55 坦 2 6 . 2 ' 1 6 1 6 2 9 . 1' 1 7 . 5 略 ‑ 0 . 7 ' 1 6 9 . 3 見 1 6 . 6 首 2 4 . 1略 3 8 . 2 略 ‑ 1 5 . 4 覧 1 4 . 8 覧 1 8 . 9 冒 23 . 4 百 . 4' 1 6 32 ‑ 5 9 . 9 弘 3 . 9 恒 12 . 1 臨 1 6 . 6 略 2 8 . 0 ' 1 6 ‑ 18 .1 覧 ‑ 0 . 3 弘 2 . 1司 1 1 . 6 ' 1 6 1 4 . 8 覧 ' 1 6 ‑ 3 0 . 5 ‑ 5 . 1首 4 . 7' 1 6 描 5 . 0 ! 1 4 . 6 ' 1 6 ‑ 2 7 . 0 弛 ‑ 7 . 6 首 0 . 4 弛 1 5 . 7 司 1 9 . 1覧 ‑ 5 2 . 4 喝 ‑ 1 5 . 7 % 弛 5 . 2 3 . 1 % 1 2 . 5 弛 ‑ 4 8 . 6 覧 8 . 4 弘 首 3 1 . 7 1 7 . 8 覧 1 9 . 2 % .5 也 32 ‑ 6 4 . 9 % , ‑ 3 8 . 4 覧 ‑ 2 . 1 % 1 0 . 6 % 1 4 . 0 覧 1 9 . 7 首 弘 9 . 8 毘営} ‑ 1 2 . 9 冒 31 . 5 覧 11 . 5 首 6 3 . 7 弛 0 . 9 弛* * * 1 0 . 9 弛 1 7 . 6 首* * * * 事 21 .9 ' 1 6* 1 8 . 3 略 ‑ 7 . 4 弛* * 1 1 . 5 喝事 1 7 . 4 首 2 0 . 3 首* 臨 1 6 . 4 略ー ‑ 1 1 . 2 嵩 8 . 2 弛* * * 1 5 . 0' 1 6* * * 21 . 6 弛 * ホ 2 6 . 5 弛ホ ‑ 2 1 . 6 弧* * * 3 . 4 冒 1 0 . 7 国* 1 4 . 1' 1 6* * * 2 3 . 1首* * * ‑ 2 7 . 4 首* 事 ‑ 6 . 5 也意 6 . 7 弛 1 0 . 0 首 1 4 . 0 弘 ‑ 2 7 . 3 弘 ‑ 3 . 7 首 5. 1 岨 8 . 3 冒* * 1 5 . 5 世 ‑ 2 4 . 8 弛 2 . 3 ' 弘 ホ* 9 . 5 弛* * * 1 5 . 7 弛 2 4 . 4 覧* * * ‑ 2 8 . 2 施* * * 0 . 5 %*ホ* 8 . 7 略 1 4 . 1' 1 6* * * * ホ 2 5 . 2 担* ‑ 2 0 . 1帽 **傘 6 . 9 首 11 . 3 覧 1 9 . 6 略 2 2 ; 自 由 ー1 0 . 1目* * 2 0 . 2 %* * * 1 7 . 0 % .6 岨 21 2 4 . 4 % ‑ 2 . 5 弛 4 . 5 弛 1 6 . 6 弛 4 7 . 2 % 5 3 . 2 首 ー1 7 . 0 %**本 6 . 0 ! 描* * * 1 2 . 1首 * ホ 1 8 . 0 覧本 21 .2% 5 . 4 %* * * 一 つ 一 一 │ ﹁ i J !﹁ 表 3 年齢 5歳階級別および経常収入 5分位階級別に見た官民の平均貯蓄率 v 酷 屑 N(官公) N(民営) 4 . 年 齢5 盆階級 経 営n 45 2 1 8 24 歳未溺 3 3 4 42 3 3 6 2 43 2 4 9 25‑29歳 3 20 1 0 4 4 1 7 4 9 1 9 5 6 7 7 6 0 1 2 1 5 1 7 5 3 30‑34怠 4 2 9 3 9 9 84 210 4 5 1 1 1 2 3 3 1 510 2 762 1 3 7 200 7 8 8 35‑39歳 3 1 8 6 564 4 5 1 1 7 2 3 8 4 1 4 4 3 6 1 6 2 88 40‑44歳 3 214 7 7 7 4 2 4 6 7 3 5 5 2 4 6 464 32 360 70 4 5 7 2 45‑49歳 3 1 9 4 6 4 7 4 7 6 7 284 5 429 682 25 428 2 62 472 50‑54歳 3 1 2 5 5 8 5 4 2 8 5 734 9 4 9 5 572 38 5 1 0 520 2 7 7 55‑59露 3 1 3 0 579 2 4 1 4 6 6 9 5 9 1 7 470 65 634 2 55 364 3 60‑64歳 39 2 6 8 4 2 4 0 45 39 1 9 7 5 22 1 9 3 2 1 5 1 1 9 5 74 65‑69歳 3 70 4 5 4 4 5 5 4 3 3 2 2 9 70‑74歳 3 2 1 1 1 4 5 1 3 1 1 3 2 4 75歳以上 3 3 4 4 2 5 1 5 9 1 6 8 1 2 1 0 2 6 2 1 9 3 264 7 8 3 不詳 4 610 292 5 5 0 1 2 7 1 昔 + 1 9 . 5 2 5 7 9 . 2 9 0 ‑ ー
X : 8常収入儒雇弘前平淘 24島宗潜 30 34 / l i 岬 一 一 40 441 J ! 35 398 四 岬 一一 一一 7 ケナー ご、旭 45‑4914 唱 ー 一一一宮公 ーー露営 r( 〆 ど 〆 0 . 5 0 0 . 2 5 早均 町 ‑ ロ 二 ナ←:司輔掛園田 也7 5 ‑ < 25 29 揖 o . ∞ ~.25 4回 ~.75 12345123451234...5123451234512345 緩和収入層圏 図1 2 年齢 5歳階級別および経常収入 5分位階級別に見た官民の平均貯蓄率 (2の1) x:紐鋪収入随i!l,Y : 平均 0 . 7 5 50‑54 遍 60‑64鍋 65‑69織 一一一一一 ) l 海‑副聞 55‑598 70‑74 趨 水温 ーー官公 一・民密 。 印 平均 o . ∞ ~.5O 4万 時 拘2 3 4 5 1 2 3 4 5 1 2 3 4 5 12345123451234 図1 3 年齢 5歳階級別および経常収入 5分位階級別に見た官民の平均貯蓄率 (2の 2) 1 1.まとめ 本研究では、世帯ごとの収入や預貯金、年齢 5歳階級、企業区分など、の変数を使って、官民の平均貯 蓄率の違いについて分析を行った。 全体でみると、官の方が民よりも貯蓄率が高いが、同じ経常収入の 5分位階層内での比較では、民の 方が宮をわずかに上回るという、合成の誤謬を想起させる興味深い結果を得た。 しかし、年齢 5歳階級を考慮に入れた分析では、経常収入の 5分位階層によって結果が異なり、官民 の貯蓄率の違いにおける法則性を見つけることはできなかった。 本研究での分析結果をどう役立てるかについては、お金を貯めるのはいつかということを考えるのに 役立つと考えられる。年齢 5 歳階級別に見た貯蓄率のピークは官も民も 35~39 歳に来ている。 40 歳か らは介護保険料の納付が必要になり、住宅ローンに加え子供の教育費も大きな負担になってくる。した がって、 39歳までの期間にお金を貯め逃すと、子供の独立までの期間が苦しくなる。晩婚化が進んでい る近年では、子供が独立するのは貯蓄率が上向く 50 歳 ~54 歳や老後に向けての貯蓄率が高まる 55~ 9 417
59歳ではなく、 60歳以降になってからという世帯も多く、このような世帯では、老後のための貯蓄が 十分ではなくなることも考えられる。 それぞれの家族構成や、働き方にもよるが「備えあれば憂いなし J ということわざ通り、貯め時を逃 さないことが、今後のゆとりある生活を送るには最重要であると感じた。 参考文献 [ 1 ]総務省統計局, r 平成 2 6年全国消費実態調査用語の解説 1 5 .計 算 式j ( h t t p : / / w w w . s t a t . g o . j p / d a t a / z e n s h o / 2 0 1 4 / k a i s e t s u . h t m )( 2 0 1 6 . 6 . 1 2参照) 1 0 418
規定課題 田中健一郎 兵庫県立大学大学院応用情報科学研究科応用情報科学専攻 参加カテゴリーB 1) 単純クロス表の作成 JMPの表の作成で、列を性別、行を産業符号に設定し、集計統計量の追加にチェック マークを入れて実行した。 1 0万世帯比でのクロス表の作成 9 5 4 6 4 . 7 6 5 7 4世帯となるので、 1 0万世 元々の集計用乗率をそのまま用いると合計で 4 帯比にするため集計用乗率に 1 0 0, 000/495, 4 6 4 . 7 6 5 7 4を乗じた 1 0万世帯用集計用乗率 を列として新たに追加した。 JMPの表の作成で、列を性別、行を産業符号に設定し、重みに 1 0万世帯用集計用乗 率を設定し、集計統計量の追加にチェックマークを入れて実行した。 b) IO万世帯比でのクロス表 a )単純クロス表 2134 9 1 2143 5668 173 5841 222 222 547 547 1235 3 1238 2083 201 2284 472 39 511 40 40 50 32 82 371 270 641 1059 8 9 1 1148 3 321 324 1816 106 1922 3656 130 3786 9704 1591 11295 29381 2646 32027 6346 31 6377 17837 510 18347 697 697 2020 2020 6 3852 3858 6644 589 7233 1447 104 1551 144 144 158 107 265 1022 810 1832 3110 269 3379 981 1 1 992 5842 326 6167 10691 430 11121 31204 4806 36011 92000 8000 100000 。 。 。 。 。 。 すべて 2) JMP の分析で一変量の分布を選択。 Y~IJ に経常収入と食料、度数に 10 万世帯用集計用 条率をセットして分析、分位点の間隔を 0 . 2に変更してテーブルを出力し、ヒストグラム は表示されたものをコピー 419
恒三塑竺塑
j
4j面言語軍事
~寝寵臥
∞
∞
o6000001600000 2800 o 4000000
官
皐
璃
白
8
0
%
鈎%
i
4
0
輪
.
2
0
秘!
<0% ~lilI/J'個
一一」
4501873.858
635875.2793
501180.8646
404883.1333
310531
.0652
0 600 1
咽0
00 240000 340000
4
語
昆
大
畑
包
膚
:
s
。
咽弛
温
溺
司
喝
!
伺
'
I
i
>•
z
餅拾
白
10
% 母
f
i
i
l
J
.
小
μ値
ω
昭938.自
8
凶
9
9
3
0
ω
3
5
.
8
ω
0
却
2
88
7
花6
ω
0
弱
55
.
1
4
3
位
6
2
臼
63
1
岨 2
3316
4
9
7
0
1
.
0
2
1
3
3
59
苅
7
6
.
8
3
8
3
8
3)
新規に経常収入階層、食料階層の列を追加する。 2) で求めた分位点、を各行に反映さ
F文を設定する。
せるため、計算式にそれぞれ I
経常収入の場合
I
f
(
O<=:
N
a
m
e
(
"
4
.経常収入,,)<310531,1
,310531<=:
N
a
m
e
(
"
4
.経常収入,,)く 404883,2,
404883<=:
N
a
m
e
(
"
4
.経常収入,,)<501181,3,501181<=:
N
a
m
e
(
"
4
.経常収入,,)<635875,4,
635875<=:
N
a
m
e
(
"
4
.経常収入"), 5
)
食料の場合
I
f
(
O<= :Name("5.食料,,) < 49701,1,49701 <= :Name("5.食料,,) < 63146,2,63146
<=:Name("5.食料,,)<76055,3,76055<=:
N
a
m
e
(
"
5
.食料,,)<93035,4,93035<=:Name("5.
食料"), 5
)
JMPの表の作成で、列を性別及び食料階層、行を経常収入階層に設定し、重みに 10
万世帯用集計用乗率を設定し、集計統計量の追加にチェックマークを入れて実行した。
2
11
8
0
9
7
11
9
0
3
1 20000
3
11
8
7
3
4
11
2
6
8
1 20001
4
11
9
0
4
9
1 9
4
8
1 19998
5
11
9
3
1
7
1 6
8
5
1 20003
すべて 19
2
0
0
0
18
0
0
0
1100000
2
11
8
6
1
7
11
3
7
7
1 19994
3
11
9
0
9
9
1 9
1
1
1 20009
4
11
9
3
5
6
1 6
4
0
1 19995
5
11
9
4
3
5
1 5
6
7
1 20002
すべて 19
2
0
0
0
18
0
0
0
1100000
420
4 ) JMPの二変量の関係で、 Y に食料階層 X に経常収入階層、 BYIこ性別、度数に 10万 世帯用集計用乗率をセットして分析 4 図書聖篇収入隠届と禽軍司隠居の分留患に対す奇分野 4 . 健周=男 I ~回経常収入指周と食料簡層の分割義に対する分析 4.性別=女| 度数:1 0 ] ] 世帯用集計用条率 度数:1 0 万世帯用集計用条率 4 面調議 堕璽 一一 出 問 主1 : 際 " , ' "1 L I 食料階層 協 抑 : ' 1 5 出 7 刻1 験 傘 l . . . 1 合計│ 食料階層 1 3 '̲̲1 4 ' 1 5 闘 │ 訓凶│ 出 勾1 " ' > : ' 1 '>~"I H~I 叩 U町 涼 子 1 ~/ll 四 ヲ1 L~:>I ~HI 1 b 1 1 1'>111 哲男" 1 品~I L L : > I L 1 b l 1 b 41 b~1 出 1 1 勤 母 l 凶 1 1且 1 l : > b l 14~1 1 4 U I 酬 U I 1 :>~I I : > L I 拘 1 1 1 ' 1 1 柑│ 拍 ' 1 防刊 3目 。 1 l"U~1 l. lb t l l 明 白1 b t l : > 1 出 U U I .>"円 1 ~,,,ol ~o'>~1 ~U明 1 ~"..四| U 11 ~"'tll L"出 1 LUILI l 1 "l~UI 4 : > t l b l / I ! ¥ ! a ' > . J ~"111 伺 U 1 1 4~出 1 4L四 1 ~l四 1 1 山田│ ~守 │ 四 U b l ~~~'>I 勾凶~I 柑U~I :>L~ll 1"~:>bl 寸 : : >̲ . 1 lUL " 1 山 町 1 .>4臥 1 : > U. lb l / t l U I1 四 品I │冒l i l j l b t l U. : l1 l t l U " / 1l t l /. : l 4 1 日 伊 柑 │ 日~1/1 ".lU U U I $ 河~ 乞 1 2. 竺 , 5) 食料の常用対数列を新たに作成し、 JMPの二変量の関係で Y に常用対数(食料)、 X に経常収入階層、 BYに性別、度数に 10万世帯用集計用条率をセットして分析。 メニューから平均 ANOVAを選択し、各水準の平均のところで右クリックし、連結し たテープ、ルの作成を選ぶ。 合計行がないので、新規で追加し、平均 ANOVAの結果表から転記。 常用対数平均を小数点以下第 5位で四捨五入し、幾何平均列を新規作成。計算式を1O^ 常用対数平均と入力。 q 石1 一14 常用対数平均 倒経常臥階層世轍 1 2 3 15494 18617 19099 4 . 7 3 8 9 4 . 7 8 3 2 4 . 8 3 6 8 織何平均 54815 60702 68675 567 8000 合計行は除外したあと、 JMPのグラフの作成で、 Y に幾何平均、 X に経常収入階層、重 ね合わせに性別を設定する 421
422
一戸建て・共同住居住まい世帯における傾向の比較 カテゴリー B 田中基史 株式会社コネクティボシステム開発グループ 1.はじめに 居住に関して昨今,生活者のライフスタイノレの多様化により,一戸建てまたは共同住宅のどちら を選択すべきなのか非常に悩ましし、問題である.各々どちらも利点・欠点が存在するため,一概に どちらが良し、とし、うことは難しい. そのため本稿では擬似ミクロデータを用いて,一戸建て・共同住宅住まい世帯に関して様々な観 点、から客観的にどのような傾向があるのか比較を行った.また,年間収入・平均消費性向・平均貯 蓄率の指標を用いてどのような傾向があるか比較を行った. 2 . 方法 擬似ミクロデータを用いて,変数 iTatekataJ から一戸建を~U ・共同住宅を~2~として分別する.そ の際に,本稿では対象外の『長屋建』・『その他』・『不詳』データは除外する.分類する 2グ、ループ に関して比較を行う. 1つ目の比較を行うにあたり「年齢 5歳階級 J・「世帯人数 J・「有業人員」・「職業」・「産業 J・「住居 の 所 有 関 係 Jは そ れ ぞ れ 変 数 iSI̲AgeJ・iS e t a i J i n i nJ・iShuugyo uJi n i nJ・iS1̲ ShokugyouJ・ iS1̲SangyouJ・iSho 戸u Jを使用する.尚,各々の『不詳』データは除くものとする. 2 つ目の比較を行うにあたり「年間収入J・「平均消費性向 j・「平均貯蓄率Jの指標を用いる i 年 間収入」は変数 iYouto001Jを使用する.また, i 平均消費性向 j・「平均貯蓄率」は式( 1 )の「可処分 1 )式を用いて式( 2 ) ( 3 )となる [ 1] [ 2 ] . 所得」を算出し, ( ) ‑ ( 可処分所得[円]=実収λ 一第浦安支出 実収入 : Y o u t o 0 0 3,非消費支出 : Y o u t o 1 5 9 消費支出 平均消賓住同[%]=一一一一‑xl00 可処分所得 ( 2 ) 消費支出 : Y o u t o 0 0 3 7 t 預貯金一預貯金引時吠保験料一保君主的 再指宇苦手$肉、= 可処分所得 預貯金 : Y o u t o 1 7 1,預貯金引出 : Y o u t o 0 2 2,保険料 : Y o u t o l 7 2,保険金 : Y o u t o 0 2 3 423 ( 3 )
3 . 結果 3 .1.一戸建てまたは共同住宅住まい世帯数の比較 一戸建てまたは共同住宅住まい世帯のグループで,r年齢 5歳階級J・「世帯人数」・「有業人員 J・ 「職業」・「産業 J・「住居の所有関係」を比較した.比較結果を表 l ( a トη (,図 l ( a ト(f)に示す. 表1.一戸建てまたは共同住宅住まい世帯数 (a) 年齢 5歳階級 年齢盛贋醤 2 9 0 世帯人員 (b) (c) 宣明世人員 有業人員 宥業人員 1 1 1 職業 (d) 竃魁昆 官 公E 署員窟 4 2 1 9 。 358 (e) 盲目邑 a 益量 s 皐 量 喜 市 誕住宅 同 N 。 師 3 13n 3 。1 印 4 田 3314 官 官E . . 産業 暗 血 唱 覇 白 動 宿 噛 泊 a 量 1 ‑ 屋 位 ま 膚 揺 ・ 牢 援 a怯 a ‑ 留 電 偉 鼠 種 ・ ・ 置 車E 窓嚢 盤 4 臨 ・ 議 臨 業 ・ 慢金鎗量 p 援 拍 ' 2 官7 含恒 . 7 曽 3 5 . 8 .包 48' 0 01 1 0 4 ' l . 4 8 ( f ) 担割問│ 担3 1 住居の所有関係 . . •• 1 坦 4 2 4 1 3 " 8
余凶回観 、 ' •、 、 、 、 司 、 、 喝 、 、 唱 、、 、毛、色、'" . . ~. ' : t ' ¥ . ̲ ‑!元気今、令、 百 句 2 ) . 3) , . 年 飴5 1 1 1 崎. . 僧俗人員 箇 S 亀岡盆宅闘』戸慮て 住居区分 住居区分 年齢 5歳階級 (a) ・ー戸温て阻鋳同住宅 世帯人員 (b) 余凶園紛 宅 弘 、 、 布、、 ¥ ¥ . z % V '碕 . . 会 ' ^ 2 人 ' 人 住居区分 S 人 ‑人 有.人員 ・ー戸竃て m . 亀岡金容 信扇区分 有業人員 ( c ) 7 園 羽海. ‑ ‑ ¥¥ご く¥〉4 7 ¥ 圃園 ‑圏直 h 丸山︑ ︐J m v k u 俳句 e ﹄ヤ耳︑ 4L ︑ aF ︑ 及 甲ム色句 6 弘一︑︐. ︑︑・ 丸 ︑ 知 像 日︑ a 会人臥可 ‑ J 0 甲 ・甲 a v AY a ' . ︐ ︑ 司 弘 ︑ψ d 担 割 凶 . ・ 血 鐙居区分 住居区分 産業 (f) ・ e τE員同住宅 信周の陽有閑 Bτm. 時開住宅 圏一戸 ( e ) ・ー戸盤て園鈴同住宅 職業 (d) 圃ー戸撞 住居の所有関係 図1.一戸建て・共同住宅住まい世帯数 表 1 ,図 lよ り , ["年齢 5 歳階級」の比較では,一戸建て住まい世帯で~55~59 歳』が,共同住宅 住まい世帯では~30~34 歳』がピークとなり, 65 歳以上の世帯数は 0 となった["世帯人員」の比較 では一戸建て・共同住宅住まい世帯共に~4 人』がピークとなったが, ["有業人員」では,一戸建世 帯は~2 人~,共同住宅住まい世帯は~1 人』がピークとなった["職業J の比較では一戸建て・共同 4 2 5
r 産業」の比較でも一戸建・共同住宅世帯共 住宅住まい世帯共に『民間職員』が最も多くなった に『製造業』が最も多くなった r 住居の所有関係」の比較では,一戸建て住まい世帯は『持ち家 (世帯員名義)~が最も多かったのに対し,共同住居住まい世帯は『民営賃貸住宅(設備専用)~が最 も多くなる結果となった. 3 . 2 .年間収入および貯蓄・消費の比較 一戸建て・共同住宅住まい世帯グループにおける年齢 5歳階級・世帯人員別「年間収入」・「平均 の算術平均値を用いて比較を行う.比較結果を表 2 ,3に示す. 消費性向 J・「平均貯蓄率J 表2 . 年齢 5歳階級別「年間収入J・「平均消費性向」・「平均貯蓄率J・「教育jの比較 年s5盆語種 明議集灘 住 E霊 会 。 。 。 fean τ 奪回殴λ時 間 島 ‑戸E 畠 平1 9 i 聞陸盤白附 平麹密書事 E 蝿 提白色書 年 国 旗 入 E 千冊 曲 目 個 室 S酢‑3 4 1 1 量 型炉・宮町量 島 " " ' ' ' ... 回 6 6 1 6 . 4 7 冊目河 円1 包.66 8 6 6 7 . 7 1 9 ' 2 7639 S 国0 . 4 1 6 6 7 9 . ' 21 6 4 3 1 3 5 6 6 4 8 . 7 5 7 4 ] 1 7 3血 6715 刊蝿 8235 96B4 6 8. 8 5 曲目 1 945 包 8130 557 1055 1 5J7 968 6. 2 0 ‑727 泊蝿 ‑83 1 758 3]9 由担同 7 6 曲面 以岡田 5119a 7644 盟 5 8 5 5 6 9 時 DI 曲盟 問調 n35 1 1 1 J 9 7.66 4田 1239 8JO ‑ ' l3 包 担苗蝿 平壇親臨観劃白目喧 盟陸軍E 116m 8730 強組曲 ‑ ' 2 864 e 蝿 ・ 5骨.... 盛 面 白 田 盆 岡 田 制 定 面白盟諸量 70 ‑ 74 盆 4 7 8 6罰 也. . . . . 手電書留事関 40‑ 唱量 輔 自 咽 輩 輔拍剤 54:抱掴 阿 7 6 . 4 。 。 。 。 。 。 表3 . 世帯人員別「年間収入」・「平均消費性向 J・「平均貯蓄率」・「教育」の比較 世帝人員 望人 4人 3人 E人 巨人 7人 │ 住居区分 千四 ー戸重量て 年 回 殴λE 提同住宅 46 B 田4 . 7 5 8 2 2 9 . 2 9 8808. 58 4 3 1. Mea n 7笥1. 31 9 3 1 0 . 2 7 9 平 場1 百貨色白 E 剖 Me an 平坦瞥蓄率 E 咽 M曲 目 年周般入 E 千聞 闘園田 6 1 . 17 口 7 6 . 7 8 8. 0 8 80. 3 7 8 1. 35 7 7 . 7 2 30B4 10 . 59 ‑ 1 . 2 8 7. 61 6. 35 15. 5 9I 固. 4 7 7379. 8 C 6 2 9 1. 3 0 5 7 3 7 . 4 3 6 6 0 4 . 1 0 6 33 平 勾3 酒量性白 l l d師岡田 80 . 6 官 84B4 84. 6 0 84B3 112. 6 9 平均寄書事 I 咽 1 8 . 2 9 13. 9 3 4 . 1 3 9. 59 ‑ 1 8 . 2 7 Me an 。 。 。 表 2, 3よ り , r 年間年収 jの比較では,年齢別では一戸建て住まい世帯は W 50 " ' ‑ '54歳』が最大とな 4 5 " ' ‑ ' 4 9歳』が最大となった.また,世帯人員別では共に世帯人員が り,共同住宅住まい世帯はW 増加するごとに『年間収入』も増加する結果となった い世帯の方が高くなることがわかった r 平均消費性向」の比較では,共同住宅住ま r 平均貯蓄率J の比較では,全体的一戸建て住まい世帯の 方が高くなることがわかった.また,世帯人員別では共に 426 W 2人』の場合が最大値となった.
4 . まとめ 本稿では,擬似ミクロデータを用いて様々な観点から一戸建て・共同住宅住まい世帯の比較を行 った. ~3.1 一戸建てまたは共同住宅住まい世帯数の比較』では,一戸建て住まい世帯は年齢が 上がるごとに世帯数が増加しているのに対し,共同住宅住まい世帯では~30-34 歳』がピークとな り以降は減少する傾向になった.これは年齢が上がるにつれ共同住宅から一戸建てへと住み替え が行われた等が考えられる.また, r 世帯人数」では共に~4 人』が最大となったが, r 有業人員」で は一戸建て住まい世帯ではピークが~2 人』となっているのに対し,共同住宅住まい世帯ではピー クが~1 人』となり, ~2 人』以降は減少する傾向になった.本データからは「有業人員」が唱えるにつ れ共同住宅が選択されなくなる傾向になった r職業」・「産業」では共に最大が『民間職員~~製造 業』となり特にこれといった傾向が見られなかった. r 住居の所有関係」では,一戸建て住まい世帯 は圧倒的に持ち家が多いが,共同住宅住まい世帯では賃貸の方が多くなった.このことから,持 ち家とする場合,一戸建てを選択する傾向が強いことがわかった. ~3.2 年間収入および貯蓄・消費の比較』では,一戸建て住まい世帯は~50-54 歳』で「年間 収入」が最大になるのに対し,共同住宅住まい世帯では~45-49 歳』で最大となった.また,年齢 別の各々の最大値を比較した場合, 7 1 3 . 3 [千円]の差があった消費性向の割合に関して,一戸建 て住まい世帯では,年齢では~60-64 歳』が世帯人数では~4 人』が最大となった.共同住宅住ま い世帯では,年齢では~24 歳未満』が世帯人数では~6 人』が最大となった.消費性向に伴い貯蓄 率は各々の年齢・世帯人数で最小値となった.また,消費性向の割合では,世帯人員の一戸建て 住まい世帯の最小値は 61 . 17[%]だが,共同住宅住まい世帯の最小値は 8 0 . 6 2 [ % ]となった貯蓄 率の割合では,世帯人員の共同住宅住まい世帯の最大値は 1 8 . 2 9[%]であるのに対し,一戸建て 住まい世帯の最大値は 3 0 . 8 4[%]と約 2倍の結果となった.このことから,一戸建て住まい世帯で は年齢別または世帯人員別で「年間収入」・「平均貯蓄率」が高く, r 平均消費性向」が低くなる傾 向があることがわかった. 0歳未満の場合は共同住宅を選択する傾向があり,世帯主の年齢 以上の結果より,世帯主が 3 が高齢になる,世帯の有業人員・世帯人員が増加するにつれて「年間年収」が増加することから, 経済的な余裕が増すことにより一戸建てを選択する傾向がある結果となった. 参考文献 [ 1 ]統計局ホームページ/ 1 家計 h t t p : / / w w w . s t a t . g o . j p / d a t a / g e t u j i d b / 2. ihtm [ 2 ]統計局ホームページ/平成 2 6年全国消費実態調査用語の解説 h t t p : / / w w w . s 句t . g o . j p / d a t a / z e n s h o / 2 01 4 /k a i s e t s u . h 回 427
付録規定課題 表1 産業符号 女 男 合計 。 3 鉱業 女 男 3 7 合計 。 7 建偉業 2134 9 2 1 4 3 6346 3 1 6 3 7 7 製造業 5668 1 7 3 1 7 8 3 7 510 1 8 3 4 7 電気・ガス・熱供給・水道業 222 2 2 2 6 9 7 情報通信業 547 。 。 5 8 4 1 5 4 7 運輸業 1 2 3 5 3 卸売・小売業 2083 金融・保険業 472 不動産業 飲食后・宿泊裳 2020 。 。 2020 1 2 3 8 3852 8 3858 2 0 1 2284 6644 589 7233 39 5 1 1 1 4 4 7 1 0 4 1 5 5 1 40 。 40 1 4 4 50 32 82 1 5 8 1 0 7 265 医療・福祉 3 7 1 270 6 4 1 1 0 2 2 810 1 8 3 2 教育・学習支鑓裳 1 0 5 9 89 1 1 4 8 3110 269 3379 復合サービス事業 3 2 1 3 324 9 8 1 1 1 992 サービス業(他に分類されないもの) 1 8 1 6 1 0 6 1 9 2 2 5842 326 6167 公務(他に分類されないもの) 3656 1 3 0 3 7 8 6 1 0 6 9 1 430 1 1 1 2 1 不詳 9704 1 5 9 1 1 1 2 9 5 31204 4806 3 6 0 1 1 合計 2 9 3 8 1 2 6 4 6 32027 92000 8000 100000 。 表2 分位点 経常収入 食料 20% 3 1 0 5 3 1 4 9 7 0 1 40% 404883 63146 首 60 5 0 1 1 8 1 76055 80 也 635875 93036 経常収入(右)と食料費(左)のそれぞれのヒストグラム 醤合 表 3 経常収入 5分 位 5分 位 数 男 1310531未 満 1 5 4 9 4 4506 20000 2310531以上 1 8 6 1 7 1 3 7 7 1 9 9 9 4 3404883以上 1 9 0 9 9 9 1 1 2 09 4501181以上 1 9 3 5 6 640 1 9 9 9 5 5635875以上 19435 5 6 7 20002 計 92000 8 o ∞ 1 0 0 0 0 0 女 計 ∞ 428 (単位:円) 697 1 4 4
表 3 食料費 5分位 5分位数 女 男 計 149701未 満 16803 3196 1 9 9 9 9 249701以 上 1 8 0 9 7 1 9 0 3 20000 363146以上 1 8 7 3 4 1 2 6 8 2 0 0 0 1 476055以上 19053 9 4 8 2 0 0 0 1 593036以上 19314 6 8 5 1 9 9 9 9 計 92000 8000 1 0 0 0 0 0 表4 食 料( 5分位) 経常収入 2 3 4 5827 3 9 7 4 2 7 9 8 1 8 3 4 1 0 6 0 15494 2 5130 4 5 0 1 3 9 7 8 2996 2 0 1 2 1 8 6 1 7 3 2 9 1 1 4 3 0 1 4395 4294 3198 1 9 0 9 9 4 1 9 0 6 3233 4082 4903 5 2 3 1 1 9 3 5 6 5 0 2 6 7 8 1 3 19435 5 計 5分 位 男 5 1 0 2 9 2 0 8 7 3 4 8 1 音 十 1 6 8 0 3 1 8 0 9 7 1 8 7 3 4 1 9 0 5 3 19314 92000 2462 9 9 4 5 6 5 314 1 7 2 4506 2 3 7 1 3 9 9 2 3 5 2 1 1 1 6 1 1 3 7 7 3 2 4 3 2 2 5 2 1 6 1 6 4 63 9 1 1 4 68 1 3 4 1 5 6 1 4 3 1 4 0 640 5 53 1 5 2 96 1 1 7 1 4 9 5 6 7 計 3196 1 9 0 3 1 2 6 8 948 6 8 5 8000 19999 20000 2 0 0 0 1 1 9 9 9 8 20003 100000 女 男女計 表5 食料 性別 経常収入 5分 位 男 世帯数 常用対数平均 幾何平均 15494 4 . 7 3 8 9 54814 2 1 8 6 1 7 4 . 7 8 3 2 6 0 7 0 4 3 1 9 0 9 9 4 . 8 3 6 8 68675 4 1 9 3 5 6 48826 7 6 3 1 1 5 19435 4 . 9 3 3 5 85793 計 92000 4 . 8 3 9 5 69103 4506 4 . 6 7 1 3 46913 2 1 3 7 7 4 . 7 8 1 1 6 0 4 0 5I 3 9 1 1 4 . 7 8 1 3 6 0 4 3 9 4 640 4 . 8 6 1 7 5 5 6 7 4 . 8 7 7 4 7 5 4 0 7 計 8000 4 . 7 3 2 5 54013 I 女 X : 鐙鎗思λE 分也Y : 平崎【 10^ 食潤常庖絡鶴 一明 「一一一一一一一一一一一一面一一一一一 ‑ 主 100000 → ← 一 一 一 一 一 一 一 一一一一 一 一 」 一 一 寸 1 α 9施 。 → 目 429 ト│ 400 叩 1 2 3 4 S 1 恒常哩入5分也 2 3 4 5
収入と医療費の関係から見える「医療格差」に関して 参加カテゴリー:C) 村木淘太 加唐誠剛東 九州大学薬学府薬物動態学分野 1.はじめに 947年に日本国憲法が施行され,第 25条,いわゆる「生存権」が規定されて以降,国民皆保険 わが国では, 1 1 1 0 例えば,医療 制度を基盤として,雇用保険,社会福祉,介護保険など様々な社会保障制度が整備されてきた [ 保険制度は,すべての国民に医療サービスを提供するための制度であり,国民は一定割合の自己負担金で医療を 受けることができる。こういった制度もあり,日本の医療制度は,基本的に公平であるとされているが,それで 2 ],様々な要因による格差があることが知られている。 も「医療格差Jは解消し切れていないとの報告もあり [ 本研究では,擬似ミクロデータを用いて,収入と医療費の関係に着目し, r 医療格差Jの実態を調査すること を目的とした。 2 .方法 年間収入と保健医療費の分布 20%,40%,60% 年間収入と保健医療費について分布の特徴を把握するため,集計用乗率を用いて 5分位点 ( および 80% 点)を求め,またそれぞれのヒストグラムを作成した。 年間収入別の保健医療費の関係 年間収入と保健医療費の関係を検討するため,保健医療費とその内訳項目(医薬品費,健康保持用摂取品費, 保健医療用品・器具費,保健医療サービス費)について,年間収入の 5分位別に平均を算出した。 年間収入別の医療費の負担 保健医療費が家計に与える負担と,収入の関係を検討するため,保健医療費とその内訳項目が消費支出に占め る割合を求め,年間収入の 5分位別に平均を算出した。 平成 1 6年全国消費実態調査の個票データに基づいて,独立行政法人統計センターが作成した教育用擬似ミク ロデータを使用した。また,解析ソフトは SAS9.3を使用した。 3 .結果 年間収入と保健医療費の分布 年間収入と保健医療費について,集計用乗率を使った 1 0万世帯比での 5分位点と,ヒストグラムをそれぞれ 表 1,図 1に示した。 430
表1 収入(円) 分位点 20 岨 収入総額 年間収入 4 . 6 1 8 . 7 5 3 実収入 経常収入 8 70 317, 2 20 616, 3 1 0 . 5 3 1 4 0 4 . 8 8 3 弘 40 6 . 0 3 9 . 4 5 3 7 8 8 . 認 。 60' 7 . 5 4 4 , 3 0 1 29 9 9 6 2 . 9 3 3 509, 5 0 1 . 1 8 1 80 尚 , 21 0 , 81 8 6 9 . 6 3 6, 8 68 1 4 6 . 5 8 5 6 3 5 . 8 7 5 4 1 2 . 7 1 6 医療費(円} 保健医健 医議晶 20 首 2 . 7 7 4 40 弛 5 . 4 4 2 分位点 健康保持周寝取晶 保健医徳用品・繕具 339 。 保健医愈サービス 234 1 . 183 739 56 6 5 1 2. 563 首 60 8 . 7 3 0 , 3 05 1 324 1 . 4 2 1 4. 538 80 也 1 4 , 8 87 2, 358 1 . 0 4 B 3 . 0 5 1 8 . 1 6 2I 図1 fUiIIa.ÅID~トグ歩ム,..】 ! I l I l ‑ 細 . . IHQstDt:^"グラ1 . ( 阿3 ・ . . . . . . ω a 毎回忽λ 優鑓医@ .淘鴎凶 ・ 巴掴.. 年間収入別の保健医療費の随係 年間収入別の保健医療費とその内訳項目をまとめた(表 2 )。表側は年間収入の 5分位を,表体は保健医療費 の金額と,その内訳項目の金額(医薬品費,健康保持用摂取品費,保健医療用品・器具費,保健医療サービス費) それぞれの合計値を示している。 表 2より,年間収入が多い(少ない)世帯ほど,保健医療費と内訳項目の費用は多い(少ない)傾向が見られ た 。 431
表2 年間収入 VS.医療費{円} 直 也 医 密 E鑓 品 包車保持用接取晶 母也匡由用品・器具 量償直直サービス 年間収λ ,, 円 来 由 62o . 37s17 8. 5 39, 343 . 0 0 0 円 且 . . t 88, 1 81 . 148 時 間. 4 0 2 0 0 0 円 以 上 7UB3.226 叫 白 州 開 6回 9. 7. 5 4 4 . 0 冊 円 以 土 76. 217. 558 1 1. 2 8 6. 0 88 田.000円 以 上 田川口四 12 9s . 9 3 9 . 011 1 3 . 9 2 5. 5 49 , 、, 41207 , 1 6 1 9 45 . 1 3 1 8. 1 4, 69 5. 61 6 43 . 3 5 0 . 1 2 2 8278 . 133 1 51 4 4 . 4 0 1 , 4 9 . 7 ‑ 拍s74 65 8 . 4削 2 9. 89. 8 4 8 , 2 掴 210. 350. 8 08 4619000 4. 8 0 3 . 9 1 8 同.2 6 2 : 632 4. 61 9 4. 51 5 . 1 曲 1 3 20 39 5. 61 5 . 4 1 9 合酔 382. 5 81 . 828 52 . 9 0 4 , 340 0 .0 . 3 8, 9 31729 . 120527 39 年間収入別の医療費の負担 年間収入と,医療費が消費支出に占める割合の関係を表 3に示した。表側は年間収入の 5分位を,表体は保健 医療費の金額と,その内訳項目の金額(医薬品費,健康保持用摂取品費,保健医療用品・器具費,保健医療サー ビス費)を消費支出で除した数値の平均値を示している。 表 3より,年間収入が多い(少なし、)世帯ほど,医療費が消費支出に占める割合は低い(高い)傾向が見られ た。保健医療費の各内訳項目に着目すると,健康保持用摂取品に限っては年間収入による割合の変化が見られな かったが (2.6~2.9%) ,その他の項目では保健医療費と同様の傾向が見られた。 表3 年間収入 vs消費支出おける医療費の割合何) 薬 品 健康保持周接取品 畢値医徳用品・器具 憧僅匝僚サービス 保 倍 1 I I ! l I医 年間収入 円 未 濁 円 且 よ 6 . 0 3 9 . 0 0 0 円 以 上 7, 544成 田 円 以 上 , 0 曲円以上 9 . 6 3 7 ・ 4 . 8 1 9 . 0 0 0 45 0 . 0 . 6 1 0~7 03 4 . 削9 . 0 0 0 3 . 7 5 056 0~6 016 , ~16 3 . 8 0 055 0~8 0 . 7 0 2 . 0 7 1 . 90 合計 2~5 3~7 0 . 5 1 0~1 0 . 8 5 3 . 0 9 0 . 4 8 0~9 057 1 . 16 3 . 5 8 0 . 5 4 0~8 0 . 7 0 2 . 0 5 4 .考察・まとめ まず,年間収入と医療費の関係を金額として比較してみると,年間収入が多い世帯と比べて年間収入が少ない 世帯では医療費も少ないという結果が得られた。しかし,年間収入と医療費が消費支出に占める割合として比較 したところ,年間収入が多い世帯と比べて年間収入が少ない世帯では医療費が消費支出に占める医療費の割合は 高いという結果が得られた。これは,医療費が単純に収入に依存して出費されているわけではないことを示唆し ている。そのため,収入の低い世帯では,全体の消費支出に占める医療費の割合が大きくなり,高収入世帯に比 べその負担が相対的に大きくなっていることが考えられる。 さらに,保健医療費が消費支出に占める割合を細分化した項目ごとに見てみると,医薬品,保健医療サービス, 保険医療用品・器具の 3項目と,健康保持用摂取品の 1項目で,年間収入との関係に違いが見られた。前者の 3 432
項目では,保健医療で見られた傾向と同様に,収入が低い世帯での負担が相対的に大きくなっているが,健康保 持用摂取品に関しては,収入による消費支出に占める割合にほとんど違いが見られなかった。前者の 3項目は, 疾病治療の目的で出費される項目である一方で,健康保持用摂取品は栄養成分の補給など健康増進のために用い る食品であり,疾病予防の目的で出費される項目であると予想される。そのため,収入が多く家計に余裕のある 世帯で,健康保持用摂取品をより購入する傾向にあるのではなし、かと考えられる。 本邦では,医薬品,保健医療サービス,保険医療用品・器具は,ほとんどが医療保険の対象となっている。こ のように全国民が健康な生活を送ることに必要な医療サービスは医療保険の対象になっており,低所得者でも必 要な医療を受けられることが理想だと考える。しかし,医療保険の自己負担割合は,高額医療制度等の一部の例 を除き,原則収入によらず一定である。本研究でも,低所得者と高所得者の家計における医療費負担は同じであ るとは言える結果ではなかった。通常の医療費の自己負担割合においても収入による変動を導入することで,収 入による医療費負担の相対的格差を是正することができるかもしれない。 5 .参考 [ 1 ]厚生労働省 「平成 24年版厚生労働白書一社会保障を考える一 J < h t t n : / / w w w . m h l w . l w . i n / w n/hakusvo /k o u s e i l I 2 / > [ 2 ] 池上直己 「医療における格差一構造的特性と政策的対応J E震 度 痢7 f 7 l :18( 1 ) ,5 . 2 1,( 2 0 0 6 ) 433
付録規定課題 以下に規定課題の表及び図を示す。ソフトウェアは SAS9 . 4を使用した。 1)産業符号・性別クロス表 表1 b )10 万世帯比で由。ロス褒 a )単純ヲロス褒 産案符号 周 合併 女 9 . 7 0 4 1 . 5 9 1 1 1. 295 平群 。 3 鉱集 建股裳 2 . 1 3 4 製造業 5 . 6 6 6 電気・ガス・鶴供給・水道案 222 情報通信梁 547 男 3 1. 204 女 合計 4. 8 06 3 6 . 0 1 1 。 3 7 9I 2 . 1 4 3 6, 346 3 1 6 . 3 7 7 5. 6 4 1 1 7637 510 1 6 . 3 4 7 222 697 547 2, 020 1 7 3 。 。 目 7 。 。 697 2 . 0 2 0 運輸業 1 . 2 3 5 3I 1 . 2 3 6 3 . 8 5 2 6 3 . 8 5 8 卸完・小売集 2 . 0 8 3 2 0 1 2. 2 84 6 . 6 4 4 589 7. 233 金融・保障象 472 39 1 . 4 4 7 1 0 4 1 . 5 5 1 40 。 5 1 1 不動産業 40 1 4 4 飲童庖・宿泊寒 50 32 82 1 5 8 1 0 7 285 医療・福祉 3 7 1 270 8 4 1 1 . 0 2 2 810 1 . 8 3 2 教育・学習支極集 1 . 0 5 9 89 1 . 1 4 8 3 . 1 1 0 269 3 . 3 7 9 。 144 権合サービス穆黛 3 2 1 3 324 9 8 1 1 1 9 9 2 サービス集(他に分類されないもの) 1 . 8 1 8 1 0 8 1 . 9 2 2 5 . 8 4 2 326 6 . 1 8 7 公務{他に分顕在れないも由} 3 . 6 5 8 130 3 . 7 8 8 1 0 . 8 9 1 430 11 . 12 1 合計 2 9 . 3 8 1 2 . 6 4 6 32, 027 92 , 000 8 . 0 0 0 1 0 0 . 0 0 0 2 ) 経常収入および食料費 表2 分位点 経常収入 食 料費 20 胃 3 1 0 . 5 3 1 4 9 . 7 0 1 40 首 404, 883 63, 146 60' 1 6 5 0 1 . 1 8 1 首 80 6 3 5 . 8 7 5 9 3 . 0 3 6 7 6 . 0 5 5 経鎗収λのヒストグラム 歯科置由ヒストグラム " ︑ パ 与1 て 4 ︒ 4 λ与 tt " 1 ω X I O C 淘 醐闘'" . 0 0 0 0 0 ""岡田 幅常収λ{ 阿 〉 o 鉱淘縦割 傘"罰【円} 4 3 4 3 0 0 0 0 0 淘 "00
3 )男女別・経常収入および食料費の 5分位分布 表3 表3 経常収入 女 男 食科費 酔 49, 701未讃 1 8 . 8 日3 3, 196 19 . 999 2 柑 ,701以上 . 0 97 1, 9 03 18 20 . 0 00 911 20 . 0 0 9 3 , 146以上 63 , 734 1268 18 , 001 20 640 19 . 995 . 0 55 以上 78 053 19. 948 . 0 01 20 567 , 4 20ωz 5 93 . 0 36 以上 314 19. 685 , 自 由 自 19 8. 0 00 100 , 000 針 310 . 5 31来 讃 15, 494 4. 5 08 20 . 0 0 0 2 310 , 531以上 18. 81 7 1. 377 3 404 . 8 83以よ 19. 0 99 4 501, 1 8 1以上 19. 3 56 5 835 . 875以上 19, ' 伺5 0 00 8. 0 0 0 100 . 0 由 。 92. 4 ) 男女別・経常収入・食料費についての 3重クロス表 表4 童科 ( 5 分位} 2 性別 主 l 旦主計 3 4 5 計 健常哩入5 骨位 5 , 8 2 7 3 . 9 7 4 日蝿 1 . 8 3 4 1 , 0 6 0 1 5 . 4 9 4 2 5 . 1 3 0 4白 田2 3 . 9 7 8 2 . 01 2 1 8 . 6 1 7 3 2 . 91 1 4~01 ,. 2S8 6 9 5 4 , 2 9 4 3 , 1 9 8 1 9. 0 ・8 4 1 , 9 0 6 3 . 2 3 3 4. 0 6 2 4 8 . 0 3 5. 2 3 1 1 9, 3 5 8 5 . 0 2 9 1 2 . 0 0 7 3 . 4 8 1 5 . 0 2 6 7 , 61 3 1 9, 4 3 5 肝 1 6 . 6 0 3 1 8 . 0 9 7 1 8 . 7 3 4 1 9 . 0 5 3 1 9 , 3 1 4 9 2 , 0 0 0 畢 計 19, 993 、 92. 0 ∞ 女 5分位数 5分位取 計 男 E分 位 E 分位 経常晦入5卦位 1 2, 4 6 2 9 9 4 5 6 5 3 1 4 1 7 2 4, 5 0 8 2 3 7 1 3 9 9 2 3 5 2 1 1 1 6 1 U77 3 2 4 3 2 2 5 2 1 6 1 6 4 8 3 9 1 1 4 6 8 1 3 4 1 5 6 1 4 3 1 4 0 6 4 0 5 5 3 1 5 2 9 6 1 1 7 1 4 9 5 6 7 計 3, 1 9 6 1 . 9 0 3 1 . 2 6 8 9 4 6 6 8 5 8. 0 0 0 I 1 9 , 99 9 20 . 0 00 2 0 . 0 0 1 20 . 0 0 1 1 9 . 9 9 9 1 0 0 . 0 0 0 5 ) 男女別・経常収入別に食料費を常用対数変換した平均値の比較 435
食斜費の鎗同率簡の権移 表5 食料費 世帯数 常用対数平均 .何平勾 鱗λ P 男 女 1 1 5, 494 7363 4. 54, 485 2 1 8, 6 1 7 78 1 1 4. 402 60, 3 1 9, 099 8357 4. 68, 502 4 356 1 9, 4. 8822 76, 244 5 1 9, 435 4 . 9 3 1 3 85, 3 7 1 計 92, 000 4 . 8 3 7 6 68, 805 1 4, 506 4 . 6 6 5 1 245 46, 2 1 , 3 7 7 4. 7792 60, 1 4 4 3 9 1 1 4 . 7 7 6 3 59, 7 4 5 4 640 4. 8587 72, 22 6 5 567 4 . 8 7 9 6 75, 7 9 1 針 8 , 000 7252 4. 53, 1 1 7 四一 一 一 曹 一 ・'ICl Å(~依3 ・ ・ ・ ・ ・ ・ ーーー. 436 一 一 一 . 一
付 録 規 定 課 題 の SASプログラム 1 * ‑ ‑ ‑ ‑ ‑ ‑ ‑・ ・ ・ ・ ・ ・ ・ ・ ー ー ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ー ー ・ ・ ・ ・ ・ ・ ー , ・ ・ ・ ・ ・ ・ ー ー ー ・ ‑ ‑ ‑ ‑ ‑ ‑ ̲ . ̲ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ・ ・ ・ ー ー ・ ・ ー ー ー ー ー ・ ー ー* 1 /女プログラム① 1 *ー ー ・ ・ ・ ー ー ・ ・ ・ ・ ・ ・ ー ー ー ー ー ー ・ ・ ・ ・ ー ・ ・ ・ ・ ‑ ‑ ‑ ‑ ‑ ー ー ・ ・ ・ ‑ ‑ 旬 司 ・ ・ ・ ー ー ー ー ー ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ー ・ ・ ・ ・ ・ ・ ・ ー ・ ・ ・ ・ ー ‑ ‑ ‑ ‑ ・ 圃 ・ ・ " ・ ・ ・ ー ー ー ・ 司 ・ ー ・ ・ ・ ・ ・ ・ ・ ー ー ・ ・ ・ ・ ・ ー ・ ・ ・ ・ ・ ・ ー ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ・ ・ ・ ・ ー ・ ・ ・* 1 /台① r e a d ̲ g i j i ̲ z e n s h o ( a l l ̲ a t ̲ o n c e ) ̲ s a s* 1optionsnocentermacrogen; *以下の 5つのマクロ変数を指定してください。; % l e tp a t h = c : ¥S A S c o n t e s t ;* r 全消擬似ミクロデータ・プロジェクト」用 p ath名; % l e td s ̲ f o l d er= zensho ̲ permanent; *パーマネント SASデータセット用フォルダ、名; % l e tc s v F o l d er= DATA;*教育用擬似ミクロデータの CSVファイルが保存されるフォルダ名; % l e tdsname=zensho; 女ミクロデータから作成されるパーマネント SASデータセット名; % l e tSurveyName= 全国消費実態調査.教育用擬似ミクロデータ;*調査名:結果の表示時に使用される; libnamezensho"&path ¥& d s ̲ f o l d e r " ; 女全国消費実態調査:擬似ミクロデータの全ての CSVファイル名の指定(ワイルドカード使用); f i l e n a m eFL"&path ¥& csvFolder ¥* . c s v " ; d a t azensho.&dsname; l e n g t hX1‑X197$ 1 5 ;*全ての変数を一旦文字型変数として取り込む; i n f i l eFLdsdLRECL= 3 2 7 6 7 ; i n p u tX1‑X197; run, ① ・ 1&SurveyName(先頭 1 0件)";r u n ; p r o cp r i n tdata=zensho.&dsname( o b s = 1 0 ) ;t i t l e" d a t azensho.&dsname;s e t ;d r o piX 1 ‑ X 1 9 7 ;*文字型変数を数値型変数に変換; a r r a yX{ 1 9 7 } ;*文字型変数; ー;台数値型の欠損値(不詳); d oi = lt o1 3 ;i f i n d e x ( X [ i }, 吋 , , )t henX [ i } = i f X [ i } = "" ; thenX [ i } = " 9 9 9 " ;*数値型のコード(非・.) e n d ; a r r a yF{ 1 9 7 }8戸数値変数; doi = lt o1 9 7 ;F { i } = X { i } ;e n d ;*文字型変数を数値型変数に変換; run, p r o cp r i n tdata=zensho.&dsname( o b s = 1 0 ) ;t i t l e" ① ・ 2&SurveyName(先頭 1 0件)";r u n ; 437
/*‑‑‑‑‑‑‑一一一一一一一一一一‑一一一一一一一一一一一‑一一一一一日・一一一一一一一一一一日一一‑一一一一一‑一一一一一一一一一一一一一一一一一‑一‑‑‑*/ F ブロゲラム岱 /*‑‑‑‑‑‑一一一一一‑一一一一一一‑‑‑‑‑‑‑‑‑‑一一一一ー‑‑‑‑一一一一一一一一一一一ー一一一一一一一一一一一一一一一一一一一一一一一一一一一‑‑*/ F② g i j i ̲ z e n s h o ̲ c o d e t a b l e ̲ i m p o r t . s a s* /*符号表を SASデータセットに変換; % l e tC o d e t a b l e = G I J I ̲ 2 0 0 4 z e n s h o ̲ l a y o u t ̲ c o d e . c s v ;*符号表のファイル名" d a t az e n s h o . c o d e ̲ t a b l e ; l e n g t hX1‑Xll$ 1 0 0 ; ¥& CodeTable"d s df i r s t o b s = 9 ; i n f i l e"&path i n p u tX 1 ‑X l l ; run, d a t az e n s h o . c o d e ̲ t a b l e ;*項目名に対応する変数名に renameする; s e t ; renameX1=lineNO Vl a b e l X2= X 3 = s t r a t a =po s i t i o n X4 X5=bytes h a i c h i X6=x X7=Vtype X8=xshubetsu a r i a b l e X9=v X10=Vcode X 1 1 = V c o d e C o n t e n t s ; run, ② &SurveyName. 符号表 " ; r u n ; p r o cp r i n td a t a = z e n s h o . c o d e ̲ t a b l e ;t i t l e" 438
‑ ー . * / p ブログラム③ / * ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 ‑ 一 一 一 一 一 一 一 一 一 一 一 一 一 一 ‑ ‑ ‑ ‑ * / 1 *@ l a b el ̲ r e n a m e ̲ s a s* /*教育用擬似ミクロデータの変数ラベル作成と変数の rename; 自l enameo u t l "&path ¥l a b eL t x t " ; 合変数ラベル定義用テキスト; f i l e n a m eo u t 2 "&path ¥r e n a m e ̲ t x t " ;*変数 Fl~F197 の rename 用テキスト; *全ての変数に変数ラベルを付すための LABEL文の中味を外部ファイルに出力; d a t al a b e l ̲ d e f i n e ;keepv a r ̲ l a b e lv a r i a b l eV l a b e l ; f i l eo u t l ;*LABEL文の中味を外部ファイルに出力; l e n g t hv a r ̲ l a b e l$1 0 0 ; s e tz e n s h o . c o d et a b l e ;i fv a r i a b l e = ""thend e l e t e ; *r Y J で始まる変数名を後で全て r Y J で始まる変数名(女数値型女)に置換するための rename文用変数名の作成; v a r i a b l e= t ranwrd( v a r i a b l e, " Y o u t o O O ", " Y " ) ; v a r i a b l e= t r a n w r d ( v a r i a b l e, " Y o u t o O "," Y " ) ; v a r i a b l e = t r a n w r d ( v a r i a b l e, " Y o u t o ", " Y " ) ; o m p r e s s ( V la b e lII" , , ) ; v a r ̲ l a b e l = c o m p r e s s ( v a r i a b l e )II日 , IIc putv a r ̲ l a b e l ;会最終的に作成された全ての変数に付与するラベル文の作成; run, p r o cp r i n t ;t i t l e" ③ ーl l a b e l " ;varv a r ̲ l a b e lv a r i a b l eVl a b e l ;r u n ; d a t an u l l ; 臼 eo u t 2 ; *変数 Fl~F197 を「符号表」の変数名に変える rename 文の中味をテキストファイノレに出力; s e tl a b e ld e f i n e ; s t a t e m e n t = c o m p r e s s ( " F "I I̲N 一I I" = "I Iv a r i a b l e ) ; puts t a t e m e n t ; run, d a t azensho.&dsname;*変数 Fl~F197 を rename をする; s e tzensho.&dsname; rename %include"&path ¥r e n a m e . t x t " ; ; run, p r o cp r i n tdata=zensho.&dsname(obs=5);t i t l e"③・2 変数 Fl~F197 の rename: (先頭 5件)";r u n ; e t ;l a b e l%include"&path ¥l a b eL t x t " ;; r u n ; d a t azensho.&dsname;*全ての変数にラベルを付ける;s *ミクロデータのパーマネントデータセット完成; p r o cp r i n tdata=zensho.&dsname(obs=5); t i t l e"③ ‑ 4&SurveyName.パーマネント SASデータセット(先頭 5件:変数名表示)";r u n ; p r o cp r i n tdata=zensho.&dsname(obs=5)l a b e l ; t i t l e "③ ・ 5&SurveyName.パーマネント SASデータセット(先頭 5件:変数ラベル表示) t t ;r u n ; 439
/ * ‑ ‑ ‑ ‑ ‑ ‑ ‑ 一 . . . . . .‑ ̲ . . . . . .‑ ̲ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 一 . . . . . .‑ ̲ . . . .‑ ̲ . . . . . .‑ ̲ . . . . . .‑ ̲ . . . .‑ ̲ . . . .‑ ‑ . . . . . . . . . .‑ ‑‑ ̲ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ・ ・ ー ・ ・ ・ ・ ・ ・ ・ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ * / F プログラム④ / * ‑ ‑ ‑ ‑ ‑ ‑ ‑ 一 ‑ ‑ ‑ ‑ ・ ・ ・ ー ・ ・ ・ ・ ー ・ ‑ ‑ ̲ . . , , ‑ ‑ ‑ ‑ ‑ . . ・ ・ ・ ・ ・ ・ ー ー ・ ・ ‑ 一 一 . . . . . . . . . . . . . .‑ ‑ ̲ . . . . . . . . . . . .‑ ‑ ̲ . . . . . . . . . . . . . . . . . . . . ・ ・ ・ ー ・ ・ … ・ ・ ・ ー ・ 一 . . . . . . . . . . . . . . . . . . . .‑ ̲ . . . . . . . . . . . . . . . . . . . .‑ ̲ . . . . . . . . . . . . . . . . . . . . . . . . . . . . ー * / F④ c r e a t e ̲ f o r m a t . s a s* /*ミクロデータ用の procformat作成; f i l e n a m eo u t 3"&path ¥program ¥g i j i ̲ m i c r o ̲ f o r m a t . s a s " ; 旬n t s ; d a t af o r m a t ;keepformatNameVcodeVcodeCon s e t z e n s h o . c o d e ̲ t a b l e ;*符号表のデータセットを使用; r e t a i nswformatName; i fVl a b e l = ", "thensw=O; i f v a r i a b l eNE""ANDVtype=""/宏文字型変数含/ thend o ;s w = l ;formatName=v a r i a b l e ;o u t p u t ;r e t u r n ;e n d ; i fsw=ltheno u t p u t ; run, p r o cp r i n t ;t i t l e" ④ ー 1f o r m a t対象変数(1)";varformatNameVcodeV c o d e C o n t e n t s ;r u n ; * 女 = d a t a s e t' f o r m a t 'に対して、 r V J と「ム」の処理を追加する‑‑‑‑女; d a t af o r m a t ;s e tf o r m a t ; i f i n d e x ( V c o d e, " V " )>0thenV c o d e = " . " ; ぜ f ( α f o ω r m a ω t N a m e = ' 唱1 一 ̲ K i 堵gy叩 o uK 阻i 加 b0"ORformatName="Sl̲ KigyouKubun")ANDVcode="ム" i ; thenVc o d e = ' 吻9 9 " つ e l s eVcode=kcompress(V c o d e, " ム , , ) ; run, p r o cp r i n t ;t i t l e" ④ ・2Vc o n v e r t e dt op e r i o d " ;r u n ; *女====d a t a s e t' f o r m a t ',こ対する r V J と[ム」の追加処理終了====*; p r o cs o r tdata=formatout=forma t 1 ;byformatName;r u n ; 1 ;s e tforma t 1 ;byformatName; dataformat i f f i r s t . f o r m a t N a m ethens t a 民m e n t 2 = ' v a l u e '11compress(formatName11' X ・ ) ; s t a t e m e n t = c o m p r e s s ( V c o d e1 1' = ' "1 1V codeContents1 1" , , ) ; run, p r o cp r i n t ; 3f o r m a t対象変数 ( 2 ) " ; t i t l e "④ ‑ varformatNameVcodeVcodeContentss t a t e m e n ts t a t e m e n t 2 ; run, d a t an u l l;臼eo u t 3 ; s e tforma t 1e n d = f i n a l ;byformatName; i f̲n̲ =1thenput" p r o cf o r m a t ;*&SurveyName;"; ゐ rmatNamet henputs t a ぬm e n t 2 ; i f f i r s t i fl a s t . f o r m a t N a m e thenput" e l s eput" "s t a t e m e n t" ; "/ ; "s t a t e m e n t ; i f f i n a lthenput" r u n ; " ; run, 440
/ * . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 一 一 一 一 一 一 一 一 一 一 一 一 ‑ ‑ ‑ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ̲ ‑ 一 一 一 一 一 一 一 一 一 一 一 一 . . . . . . . . . . . . . . . . . * / F プログラム⑤ / * . . . . . 一 ‑ ‑ ‑ ‑ 一 一 一 ‑ ‑ ‑ ‑ ‑ 一 ‑ ‑ ‑ ‑ 一 一 一 ‑ ‑ ̲ . . . . ̲ ‑ ‑ ̲ . . ̲ ‑ ̲ . . ̲ ‑ ̲ . . ̲ ‑ ̲ . . 一 一 . . . . ̲ ‑ ̲ . . . . 一 . . 一 一 一 一 ・ ・ … … … … ・ ・ … ‑ 一 . . . . . . . . . . . . ̲ ̲ . . . . . . 一 一 . . . . . . . . * / p r o cf o r m a t ;*全国消費実態調査:教育用擬似ミクロデータ; v a l u eKouzo uX 1 = " 木造" 2 = "防火木造" 3 = " 鉄骨・鉄筋コンクリート造" 4 = "その他(ブロック造り、レンガ造りなど) " .="不詳"; v a l u eSl̲AgeX 1="24歳未満" 2="25~2 9歳" 3="30~34 歳" 4="35~39 歳" 5="40~4 4歳" 6="45~4 9歳" 7="50~5 4歳" 8="55~5 9歳" 9="60~6 4歳" 10="65~6 9歳" 11="70~7 4歳" 1 2 = "75歳以上" .="不詳"; v a l u eSl̲ Ki g y o u Ki boX 1="1~4 人" 2="5~2 9人" 3="30~4 99人" 4="500~999 人" 5="1000人以上" 999="非就業又は官公" .="不詳"; v a l u eSl̲ Ki gyouKubunX 1 = "民営" 2 = "自営" 3 = ' 官公" 999="非就業" .="不詳"; v a l u eSl̲SangyouX 1 = " 農業" 2 = " 林業" 3 = "漁業" 441
4="鉱業" 5="建設業" 6=" 製造業" 7=" 電気・ガス・熱供給・水道業" 8 = " 情報通信業" 9=" 運輸業" 1 0 = "卸売・小売業" 1 1 = " 金融・保険業" 1 2 = "不動産業" 1 3 = '・飲食盾・宿泊業" 1 4="医療・福祉" 15="教育・学習支援業" 16=" 複合サービス事業" 17="サービス業(他に分類されないもの) " 1 8 = " 公務(他に分類されないもの) " 19="その他(非就業を含む) " .="不詳"; v a l u e818e xX 1 = '・男" 2 = "女"; v a l u e81̲8hokugyouX 1 = "常用労務作業者" 2 = "臨時及び日々雇労務作業者" 3="民間職員" " 4="官公職員 1 5="官公職員 2" 6="商人及び職人" 7=" 個人経営者" 8 = " 農林漁業従事者" 9=" 法人経営者" 1 0 = "自由業者" 1 1 = "その他" 12= 喉職" .="不詳"; v a l u e81̲8huugyouX 1 = " 就業" 2 = " うちパート" 許可'非就業" 4=" うち仕事を探している" .="不詳"; v a l u e8 e t a iK ubu nX 1 = "勤労" 442
2=" 勤労以外" 3="無職"; v a l u eShoyuuX 1 = " 持ち家(世帯員名義) " 2=" 持ち家(その他名義) " 3="民営賃貸住宅(設備専用) " 4 = "民営賃貸住宅(設備共用) " 5 = "県市区町村営賃貸住宅" 6=" 都市再生機構・公社等賃貸住宅" 7=" 社宅・公務員住宅(借上げ含む) " 8 = " f 昔間" 9 = "寮・寄宿舎" .="不詳"; v a l u eT a t e k a t aX 1 = "一戸建" 2=" 長屋建" 3="共同住宅(1・2階建) " 4 = " 共同住宅 (3‑5階建) " 5= 共同住宅 (6‑10階建) " 6=" 共同住宅 (11階建以上) " 7="その他" .="不詳"; runi 4 4 3
作一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一...*/ F ブログラム⑤ / * . . . . . . . 一 一 一 一 . . . . . . . . . ・ ・‑一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一・一一一一一一一一日一一一一一一一一一一一一一一...*/ H % l e tprogram ̲ path=C: ¥S AScontest ¥p r o g r a m ; *①ミクロデータ本体を SASデータセットに取り込む; % i n c l u d e"&program ̲ path ¥r e a d ̲ g i j i ̲ z e n s h o ( a l 1 ̲ a t ̲ o n c e )品 8 " ; 女②符号表を SASデータセットに変換; % i n c l u d e"&program ̲ path ¥g i j i ̲ z e n s h o ̲ c o d e t a b l e ̲ i m p o r t . s a s " ; *③教育用擬似ミクロデータの変数ラベル作成と変数の r ename; %include"&program ̲ path ¥l a b e lr e n a m e . s a s " ; 合 ④ p r o cf o r m a tを作成する; % i n c l u d e"&program ̲ path ¥c r e a t e ̲ f o r m a t . s a s " ; 合 ⑤ f o r m a tの実行; % i n c l u d e"&program ̲ path ¥g i j i ̲ m i c r o ̲ f o r m a t . s a s " ; /*規定課題 1* / d a t azensho.&dsname; s e tzensho.&dsname; Weight2=Weight/495465*100000; r u n ; ODSPDFFILE="c: ¥S AScontest ¥規定課題l.p d f ' ; p r o ct a b u l a t edata=zensho.&dsnameMISSINGformat=comma8.; t i t l e" 表1 " ; c l a s s SI̲SangyouS I ̲ S e x ; varW e i g h t 2 ; t a b l e sSI̲Sangyou= ALL=" 合計" N ="a)単純クロス表時 (SI̲Sex= ALL="合計,,)W e i g h t 2 = " b )1 0万世帯比 附 附 でのクロス表吋 ( S I ̲ S e x = " 時sum=""ALL=" 合計"、u m = " " )/MISSTE: l C τ ' = " 0 "BOX="産業符号"; f o r m a tSI̲SangyouSI̲SangyouX.SI̲SexSI̲Sex X . ; run, ODSPDFCLOSE; /*規定課題 2 * / ¥S AScontest ¥規定課題 2 . p d f ' ; ODSPDFF I L E = " c : p r o ct a b u l a t edata=zensho.&dsnameMISSINGf o r m a t 司 o mmaI5.; " ; t i t l e "表 2 varY4Y38; weightW e i g h t ; t a b l e s (P20="20%"P40="40%"P60="60%" P80="80%"),( Y 4 = "経常収入" Y3 拘8 ピ = "食料費"ヴ)/MI 回 SSTEXT=" ゆ O BOX=" 分 { 位 立 点 ' ' ; run, 4 4 4
p r o cf o r m a t ; lK eijoushunyulow‑<310531= " 1 " v a l u ec 310531・<404883= " 2 " 404883‑<501181= " 3 " 501181‑<635875= " 4 " " 5 " ; 635875・high= run, p r o cf o r m a t ; v a l u eclShokuryouhilow‑<49701= " 1 " 49701・<63146= " 2 " 63146・<76055= " 3 " 76055・<93036= " 4 " 93036‑high= " 5 " ; run, p r o cf o r m a t ; 310, 531未満" v a l u ec lK e i j o u s h u n y u ̲ l blow‑<310531= " 1 310531‑<404883= " 2 310, 531以上" 404883・<501181= " 3 404, 883以上" 501181‑<635875= " 4 501, 1 8 1以上" 635875恒 gh=" 5 635, 875以上"; run, p r o cf o r m a t ; 49, 701未満" v a l u ec l S h o k u r y o u h i ̲ l blow‑<49701= " 1 49701‑<63146= " 2 49, 701以上" 63, 1 4 6以上" 63146・<76055= " 3 76, 055以上" " 4 76055・<93036= 93036‑high= " 5 93, 036以上"; run, p r o cs g p l o tdata=zensho̲&dsname; t i t l e "経常収入のヒストグラム"; histogramY4 ; x a x i sl a b e l= "経常収入(円) " ; run, p r o cs g p l o tdata=zensho̲&dsname; t i t l e"食料費のヒストグラム"; histogramY38; ; x a x i sl a b e l="食料費(円) " 4 4 5
r u n ; ODSPDFCLOSE; 1 *規定課題ゲ/ ODSPDFF I L E = " c : ¥S A S c o n t e s t ¥規定課題 3 . p d f " ; p r o ct a b u l a t edata=zensho.&dsnameMISSINGf o r m a t = c o m m a 7 . ; " ; t i t l e"表 3 c l a s sY4Sl ̲ S e x ; t y l e = [ c e l l w i d t h = 4c m ] ; c l a s s l e vY4 1s v a rw e i g h t 2 ; t a b l e s( 何 Y4=" 喝 5 分位 5 分位数" AL L = " 計 " ウ) * w e i 酔 g h t 伐2 = ' " 川 " 吋 ' 悼 台 、sum 己 = ' " ぺ ' MI 回 SSTEXT="O"BOX="経常収入"ROW=FLOAT; f o r m a tY4c l K e i j o u s h u n y u ̲ l b .Sl̲SexS l ̲ S e x X . ; run, p r o ct a b u l a t edata=zensho.&dsnameMISSINGf o r m a t = c o m m a 7 . ; t i t l e "表 3 " ; c l a s sY38S1S e x ; c l a s s l e vY38 1s t y l e = [ c e l l w i d t h = 4c m l ; v a rw e i g h t 2 ; 拘 = " 喝 5分位 t a b l e s( α Y 38 5分位数"AL L = 己 " 計" ) * w e i 培 g h t 2 己 = " 川 " 叫 ' BOX=" 食料費 "ROW=FLOATτ; f o r m a tY38c l S h o k u r y o u h i ̲ l b .Sl̲ SexSl̲Sex X . ; run, ODSPDFCLOSE; 1 *規定課題 4 * 1 ODSPDFF I L E = " c : ¥S AScontest ¥規定課題 4 . p d f " ; p r o ct a b u l a t edata=zensho.&dsnameMISSINGf o r m a t = comma7.; t i t l e" 表4 " ; e x ; c l a s sY4Y38Sl̲S v a rw e i g h t 2 ; e x = " 性,8I J "*( Y 4 = "経常収入 5分 イ 立 "AL L = " 計 , , ) )ALL="男女計,,)*w ei 泡 ght2 己 = " 川s 間u m己 = ' " ぺ ' t a b l e s( ( Sl̲S 句 ( 5分位) "AL L="計"仁阻S剖 S τ 官x 訂T = " γROW=FLOATτ; f o r m a tY4c l K e i j o u s h u n y u .Y38c l S h o k u r y o u h i .Sl̲SexSl̲Sex X . ; run, ODSPDFCLOSE; 1 *規定課題伊/ d a t az e n s h o . & d s n a m e ; s e tz e n s h o . & d s n a m e ; ̲Y38=l o g l O ( Y 3 8 ) ; LOG 446
run, p r o ct a b u l a t edata=zensho.&dsnameformat=comma7.o u t = ta s k 5 ( d r o p = ̲ t y p e ̲""page̲̲ t a b l e ̲ ) ; " ; t i t l e "表 5 c l a s sY4Y3881 8 e x ; varw e i g h t 2LOG̲Y38; ALLw e i g h t 2LOG̲Y38*mean*f = comma7.41MI88TEXT="O"; t a b l e s( 8 1 ̲ 8 e x*(Y4ALL)), 女 X . ; f o r m a tY4c l K e i j o u s h u n y u .81̲8ex81̲8ex run, d a t at a s k 5 ; s e tt a s k 5 ; ̲Y38̲Mean); GM=10 (LOG 帥 ; i n p u tY4 ̲ c h$ c a r d s ; 'AQGnoaaτ ︐ b inGnod 唱 LltT' z 品 w h u ‑三 ‑百 = 一 吉 一 百 run, OD8PDFF I L E = " c : ¥8 A8contest ¥規定課題 5 . p d f ' ; p r o ct a b u l a t ed a t a = t a s k 5MI88INGformat=comma7.o r d e r = d a t a ; " ; t i t l e"表 5 c l a s sY4c h81 8 e x ; varWeight2̲8umLOG̲Y38̲MeanGM; t a b l e s( 8 1 ̲ 8 e x = " " *Y4̲ch="経 常 収 入 5 分位"), ALL=" Weight2̲8um="世帯数"、um="" ALL="食料費 吋 吋 LOG̲ Y38̲Mean="常用対数平均"、um="時全comma7. 4ALL=""GM=" 幾何平均時 s um=""IMISSTEXT="O"; 合 X . ; f o r m a t81̲8ex81̲8ex run, 8YMBOLII 寸o i nV=dotC = b l u e ; 8YMBOL2I 寸o i nV=dotC = r e d ; 447
a 幻 x i s 3 1 a b e l = ( ω h 司 = 1 .5" 経常収入(句 5分位) γ " つ ' ウ ) a泊 x i s 叫4 1 a b e l = ( 伍 h=1 .5ANGLE=90ROTATE=O"食料費の幾何平均(円) "つ'守); 川 ); P 戸r o ∞ c密 g p l o t ω t 白 da t ぬ a = 司 ' t 剖 a 自k 凶5( ω o b s 司 =1 叩O 仙 t i t l e " 食料費の幾何平均の推移"; p l o tGM*Y4̲ch=Sl̲ SexIhaxis=AXIS3v a x i s = A X I S 4 ; run, q u i t ; ODSPDFCLOSE; [参考プログラム] 擬似ミクロデータの整理にあたり,統計情報研究開発センターの周防節雄氏のプログラム ( h t ω : l I mie : h t v .e : k .U'h voe : o . a c .;of,∞nfidentiallsuoh2014112 1.htm1)を,プログラム①~@として用いた。 448
業種で見る中小企業の収入 チーム名 大企業との比較 :FEG̲Freshers チームリーダー:野田斉 チームメンバー:山内健太、立花潤 (株式会社金融エンジニアリング・グループ) 要旨 中小企業勤務者のうち、大企業勤務者と比較して高収入かっ時間的余裕を持つ者の割合 を業種別に集計した。結果として、就職・転職活動における業界選びの参考となる知見が 得られた。 キーワード:企業規模、世帯実収入、中央値、野菜・海藻、健康保持用摂取品、旅行 1 . はじめに 就職・転職時の企業選びにおいて、企業規模は無視できない項目である。一般的には「大 企業 J であるほど高収入である、福利厚生が厚い、安定しているといったイメージが持た れている。「大企業病(大手病)J といった言葉も就職活動時にはよく聞かれ、世間の大企 業への選好度合いは大きい。しかし、日本圏内の実に 99%以 上 は 「 中 小 企 業 J であり、こ れらの企業に対して過度の偏見を持つことは好ましくない。そこで、本稿では中小企業の 中でも大企業と比べて遜色のない収入を得ていて、かっ時間的な余裕のある生活を送って いる人の割合 (QOL1が高い人の割合)を業界別に調査する。一口に中小企業といっても、 どの業界であれば適切な収入と労働時間で生活できる確率が高いかを知ることは、就職・ 転職活動においても参考になると考えられる。 2 . 収入の現状 まずは世間で持たれているイメージの通り、中小企業勤務者の収入は大企業勤務者のそ れと比較して本当に低いのか確認する 2。図表 2・ lは世帯主の年齢階級ごとに世帯月収の中 央値をグラフ化したものである。(本稿では収入としてデータ中の f Y o u t o 0 0 3 (各世帯の実 収入)J を使用している 3 )この図を見る限り、全ての年齢階級で世帯主が中小企業勤めの 0 場合の世帯月収は大企業勤めの場合を下回っている。 1 QOLとは Q u a l i t yofL if eの 略 語 で あ り 、 個 人 の 人 生 の 質 、 生 活 の 質 を 指 す 。 人 間 ら し い 生 き 方 が で き て い る か 、 人 生 に幸福を感じているかという観点の言葉であり、単純に収入や財産などの生活水準を指す言葉ではない。従って本稿で は 、 収 入 に 加 え て 労 働 時 間 を 考 慮 し た 場 合 に QOLという言葉を用いる。 2 本稿では社員数が 5~499 人の場合を中小企業、 1000 人以上の場合を大企業としている。大企業に 500~999 人規模を 含めない理由は、一般に超大企業(大手企業)と認識される企業は 1 000人 を 超 え る 規 模 だ と い う 想 定 の 元 、 中 小 企 業 ‑4人 規 模 の 企 業 は 零 細 企 業 と し て 、 中 小 が収入や時間面でそれらの企業に優るかどうかを調査するためである。また 1 企業には含めていない。 3 本来であれば世帯主個人の収入で分析するべきだが、データから正確に世帯主個人の収入を把握できないことから、 世帯収入を使用している。 1 449
次に次章 i
3
.産業別の高収入確率 J では、中小企業勤めであっても大企業に優る収入を
得ている者が、どの業界に多く属しているのかを確認する。
図表 2・1
企業規模完'
I
j 収入推移の比較
7
0
0
,
0
0
0
600
,
000
震m ∞日
入 400,
∞
日
月 30凪∞口
収 2∞
,
∞o
ー園田中小企業
1
0
0
,
0
0
0
̲ーー大企業
o
劃
;"þ>ややややや争~争~
V
9.t9a
叶.必分
)
i
寸必
,
,
,
‑
,
c
ず~~~ダ; '?"'~ .f>~ ~~ ",<:>~ ",,,,~ <o<:>~ <o"'~
年齢
3
. 産業別の高収入確率
まず中小企業でありながらも「大企業と比べて高収入」という状態の定義として、大企
業の実収入の中央値を超えれば「高収入」であるとする。中央値は大企業の年齢階級ごと
に算出 4し、中小企業と大企業で同一の年齢階級同士を比較する。そして各階級で大企業を
2
0歳未満"から可O
上回った人の割合を業種ごとに求める。また、対象とする年齢階級は "
歳 ‑64歳"までとしている。この方法によって、各業界で「大企業と比べて高収入」になる
ことのできる確率を推定する 50
図表 3
・1は集計の結果である。
図表 3・1 業界別高収入比率
順位
集界
1
2
3
4
5
6
電気ガス熱供給水道
7
8
9
1
0
1
1
1
2
1
3
1
4
複合サービス事業
高年収比率(冒) 高年収者数(人}
67
,
2
5
9
.
9
57
.
4
4
3
.
3
4
2
.
7
4
2
.
3
鉱業
教育学習支媛
金融保険
不動産
情報通信
3
8
.
6
3
5
.
7
医療福祉
3
1
.
7
2
9
.
2
サービス業
製造
2
5
.
8
2
5
.
6
2
4
.
9
2
3
.
6
2
7
.
3
2
8
.
5
卸売り小売
建設
飲食宿泊
運輸
不詳
業界全体
1
1
7
20
952
550
154
1
,
796
509
1
,
8
5
1
6,
305
920
1
2,
040
6,
6,
075
224
2,
550
2
1,
265
6
1,
326
(24歳 未 満 =284679.51) (25 歳 ~29 歳= 395026.07) (30 歳 ~34 歳=
428615.90) (35 歳 ~39 歳= 490612.
44
) (40 歳 ~44 歳= 536533.
47
) (45 歳 ~49 歳= 577023.80) (50 歳 ~54 歳=
622720.55) (55 歳 ~59 歳= 596912.52) (60 歳 ~64 歳= 393320.21) (不詳=472963.68) である。単位は円/月。
s確 率 を 推 定 す る と し た が 、 こ こ で は つ ま り 、 「 大 企 業 と 比 べ て 高 収 入 」 だ と さ れ る 人 数 の 割 合 を 産 業 別 に 算 出 す る と
いうことである。
4 大企業の実収入の中央値はそれぞれ
2
450
この表は企業規模が中小であっても、大企業の実収入の中央値を超えている人(高収入 の 人 ) の 比 率 を 示 し て い る 。 高 収 入 比 率 が 50%を 超 え て い る 業 界 は 、 全 体 の 傾 向 と し て 大 企業よりも中小企業のほうが高収入ということになるが、これは直感に反する結果である。 この結果を信じるのであれば、これらの業界(電気・ガス・熱供給・水道業、鉱業 6、教育 学習支援)への就職を狙ってみるのも良いだろう。 高年収比率が 40%台の業界(金融保険業、不動産業、情報通信業)は傾向として大企業 よりも低収入であるが、この集計結果では上位に位置していることから、他業界との比較 に お い て 高 収 入 に な る 確 率 が 高 い と 言 え る 。 そ れ に 対 し て 高 収 入 比 率 が 20%台 の 業 界 ( 製 造業、卸売り小売業、建設業、飲食宿泊業、運輸業)に属した場合は、集計結果によると 高収入になる確率が低いと言える。 4 . r 働きすぎ」の懸念 収入が大きければ良いという訳でもなく、得られる収入に対して業務負担が過多であれ ば、余裕のある生活を送れているとは言い難い。特に、高収入であるほど長時間労働をし ている可能性も考えられる。そこで新たに労働時間の指標を導入し、中小企業の高収入者 が大企業に比べて長時間労働をしていなし、か検証する。しかし労働時間を示す変数はデー タに含まれていないため、労働時間指標を新たに作成する必要がある。本稿では「野菜指 標 J と「旅行指標 J の 2つを作成した 70 まず「野菜指標 J に つ い て は 式 4 ‑ 1によって求める。 式 4・1 健康保持用摂取品への支出額 野菜指標= 野菜・海藻への支出額 野菜への支出が少なく(分母が小さし、)、健康保持用摂取品への支出が多い(分子が大きい) 場合にこの指標の数値は大きくなる。したがってこの数値が大きいほど、野菜の出費に対 して健康保持用摂取品の支出が大きいということである。野菜指標の値が大きい状態を本 稿では「野菜を食べる時聞がないので、栄養を摂る手段を健康保持用摂取品に置き換えて )。 さ ら に こ れ を 「 野 菜 を いる J と 解 釈 す る ( つ ま り こ の 指 標 は 「 小 さ い j ほど好ましい 8 調理する時聞がないために仕方なくサプリメントを服用している」と解釈することで、「野 菜指標」を「時間に余裕があるか」の指標としている。比較のために大企業内で野菜指標 . 11)、これを基準とする。そして中小企業に勤める個人の野菜指 の平均を計算し(平均は 0 標値が、この平均値より下回れば野菜指標による基準を達成したとする。 ‑ 2によって計算する。 次に「旅行指標」は式 4 式 4・2 旅行指標=宿泊費+パック旅行費 6 鉱業についてはサンプル数が少なく、高年齢層に偏っていたので信頼できる結果ではない。 7 分析したデータは全国消費実態調査(の擬似ミクロデータ)であるため、データのほとんどが収入と支出に関する項 目である。そこから時間に関する指標を作成する方法はいくつも考えられるが、本稿では比較的豊富な 食料"と 教 養娯楽"に関するデータを活用することを考えた。 8 し か し 健 康 保 持 用 摂 取 品 へ の 支 出 額 が 0の 場 合 は 、 こ の 指 標 の 値 も 0に な る 。 こ の 状 態 は 「 十 分 に 野 菜 を 摂 れ て い る のでサプリメントは必要なし、」のか、「健康意識が低く、十分に野菜を摂れていないにも関わらずサプリメントも服用 していなし、 J の か 区 別 が つ か な い 。 よ っ て こ の 指 標 が 基 準 を 下 回 る こ と に 大 き な 意 味 は 無 い が 、 少 な く と も 基 準 を 上 回 ってしまうことは好ましくない。 3 451
これは単純に時間がある人ほど旅行に行くと仮定することで時間指標に成り得ている。 こちらも比較のため大企業の平均を求めている ( 5 7 3 9 . 2 0円)。旅行指標の値が大企業平均 よりも上回れば、旅行に行く時間的余裕があると言えるので基準達成とする。 これらの時間指標を使って、中小企業の高収入者の中で「大企業と比べて時間に余裕が 1は業界別の高収入比率(図表 3・1)をグ ある 9人 J の比率を業種ごとに算出する。図表 4・ ラフ化したもの、図表 4̲210、図表 4 ‑ 3はそれぞれ野菜指標と旅行指標による高収入者の時 間指標達成率のグラフである。また図表 4・ 4は各比率における順位の変動を業界毎にまと めたものであり、順位の比較の際に参照願いたい。 まず野菜指標を導入した場合、図表 4・ 1 , 4・ 2を比較すると、順位の変動は各所に起きて いるが、特に「不動産業 J の変動が顕著である。順位が最下位に落ちている上、指標達成 率自体も約 35%程であり、他業界が 60%を越えている中で一際低い数値である。この結果 から、不動産業は高収入になることと引き換えに長時間労働をする必要があることが推察 される。同様に「教育学習支援業 J も大きく順位を落としている事がわかる。また図表 4・ 2を見ると、不動産業界を除いて時間指標達成率はおおむね 70%を超えている。これは一 般に高収入だからといって長時間労働をしている(働きすぎている)という懸念はなく、 むしろ高収入である人ほど労働時聞が短い傾向を示唆している。この理由として、例えば 高収入な人ほど優秀であり、効率的に業務を遂行した結果、労働時聞を短く抑えることが できているといったものが考えられる。 次に旅行指標を導入した場合、野菜指標と同様に「不動産業」と「教育学習支援業」は 大きく順位を落としている(図表 4・ 1 , 4・ 3 )。特に不動産業は指標達成率が約 50%と、他業 界(おおむね 60%以上)と比較して低い数値である。したがって収入と引き換えに労働時 聞が増加していることが推察される。また旅行指標を導入した場合に顕著な結果として、 「金融保険業」が順位を下げていることが挙げられる。「電気・ガス・熱供給・水道業」も 1で当該業の高収入者数を見ると非常に小さい数値である。 順位を落としているが、図表 3・ そのためサンプル数が少ないことで変動が大きく出たと考える方が自然である。 以上の結果をまとめると、不動産業は高収入となるにあたって「働きすぎ」の印象は拭 えない。教育学習支援業、金融保険業にも同様のことが示唆される。そしてほとんどの業 界では高収入者の時間指標達成率が高いため、高収入であるのは長時間働いているからと いうことではないと言える。 S 大企業と比べて長時間労働をしていない、余暇時聞を確保できるという意味。 , , 10 サンプル数の問題上、「鉱業 J は図表 4 ・ 24 ‑ 34・ 4から抜け落ちている。 4 452
図表 4・1 業界j j l j 高収入比率 電気ガス熱供給水道 鉱業 教育学習支援 金融保険 不動産 情報通信 複合サービス事業 医療福祉 サービス業 製造 卸売り小売 建設 1 飲食宿泊 運輸 1 i o w w ~ ~ ~ ~ m M W WO W ~ 図表 4・2 業界別高収入者の時際指標達成率{野菜指標} 情報通信 飲食宿泊 電気ガス熱供給水道 金融保険 建設 医療福祉 複合サービス事業 サービス業 製造 運輸 ι 卸売り小売 教育学習支援 不動産 1 o w m ~ ~ ~ ~ m M 図表 4・8 業 界j j l j 高収入者の時雨指標達成率{旅行指標) 飲食宿泊 運輸 情報通信 複合サービス事業 建設 製造 卸売り小売! 医療福祉 f 教育学習支媛 サービス業 金融保険 不動産 電気ガス熱供給水道 o w m ~ ~ 5 453 ~ ~ m M
図表 4・4 各比率での順位 .界 高収入比率 野菜指標達成率 銀行指標達成皐 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 3 1 2 4 1 3 1 7 6 8 9 1 1 5 2 1 0 1 3 9 1 1 1 2 3 4 8 1 0 6 7 電気ガス水道熱 教育学習支援 金融保険 不動産 情報通信 複合サービス事業 医療福祉 サービス業 製造 卸売り小売 建設 飲食宿泊 運輸 5 . 5 2 高収入かつ時間に余裕がある確率 最後に、総合的に見て QOLの高い生活を送れる可能性が高い業種を調査する。つまり 高収入になる確率と時間に余裕がある確率の同時確率(高収入かっ時聞に余裕がある人の、 全体数に対する比率)を算出する。ここでは時間指標において、野菜指標と旅行指標の両 方を達成した場合に、「時間に余裕がある」とする。 結果を図表 5・1に示した。大企業と比べて高収入であることに加えて 2つの時間指標を 導入したため、図表 3‑1 の結果とはかなり違っている。前章で見たとおり、時間指標を達 成する確率が低い不動産業は下位にランクしている。図表 3・1で高収入になる確率が低か った業種(運輸業や卸売小売業)も下位となっている。それに対して、どの指標でも成績 の良かった「情報通信業」が 29.04%で首位となった。 1 0人のうち 3人は、同業種の大企業 に勤めている平均的な人たちより、ゆとりのある生活を送ることができると言える。 図表 5・1 業 界 別 高 QOL比率 順位 業界 高 QOL比寧(略} 骸当者数(人) 情報通信 2 9 . 0 1 , 233 437 297 2 8 1 1 7 7 1 , 0 2 2 7, 5 1 9 3, 870 209 3, 2 6 . 3 2 2 . 5 2 2 . 1 1 9 . 7 1 9 . 7 2 教育学習支媛 3 複合サービス事業 4 金融保険 5 飲食宿泊 6 医療福祉 7 製造 8 建役 9 サービス業 1 0 不動産 1 1 運輸 1 2 卸売小売 1 3 電気ガス熱供給水道 1 7 . 0 1 6 . 3 1 6 . 1 1 4 . 9 1 4 . 8 1 3 . 8 1 0 . 5 1 5 . 8 1 6 . 4 不詳 業界全体 6 454 54 1 , 5 9 8 2 4 2 3, 1 8 298 1 2, 3 5, 2 5 3
6 . おわりに 本稿では、初めに中小企業を収入という観点で大企業と比較した。次に時間の指標とし て野菜指標と旅行指標を導入することで、中小企業の高収入者が長時間労働をしていない かを調べた。最後に高収入かっ時間に余裕のある中小企業労働者の割合を求めた。その結 0パ ー セ ン ト が 大 企 業 と 比 較 し て 余 裕 の あ る 生 果として、情報通信業の労働者のうち約 3 活を送れているという結論に至った。加えて不動産業は高収入である反面、長時間労働で あるという結論も得られた。 また本分析では野菜指標と旅行指標を作成したが、使用する変数を恋意的に定めた事 で分析の幅を狭めてしまったのではなし、かという懸念がある。クラスター分析など、大量 の変数をモデルに組み込むことが出来る分析手法を用いれば、収入に対して特徴のある変 数を抽出できたと考えられる。この点は本分析の今後の課題としたい。 以上 7 455
付録 規定課題 1)産業符号・性別クロス表 a )単表純 1クロス表 産業符号 鉱業 建設業 製造業 電気・ガス・熱供給・水道業 情報通信業 運輸業 卸売・小売業 金融・保険業 不動産業 飲食后・宿泊業 医療・福祉 教育・学習支援業 複合サービス事業 サービス業(他に分類されないもの) 不公務 詳(他に分類されないもの) 合計 男 3 2 . 1 3 4 5 . 6 6 8 222 5 4 7 1 . 2 3 5 2 . 0 8 3 472 40 50 3 7 1 1 . 0 5 9 3 2 1 1 . 8 1 6 3 . 6 5 6 9 . 7 0 4 2 9 . 3 8 1 女 9 1 7 3 3 2 0 1 3 9 32 270 8 9 3 1 0 6 1 3 0 1 . 5 9 1 2 . 6 4 6 合計 3 2 . 1 4 3 5 . 8 4 1 222 547 1 . 2 3 8 2 . 2 8 4 5 1 1 40 82 6 4 1 1 . 1 4 8 324 1 . 9 2 2 3 . 7 8 6 1 1 . 2 9 5 3 2 . 0 2 7 7 6 . 3 4 6 1 7 . 8 3 7 698 2 . 0 2 0 3 . 8 5 2 6 . 6 4 4 1 . 4 47 144 158 1 . 0 2 2 3 . 1 1 0 9 8 1 5 . 8 4 2 1 0 . 6 9 1 31 .204 9 2 . 0 0 0 2) 経 常 収 入 お よ び 食 料 費 分位点 20% 40% 60% 80% 左:経常収入のヒストグラム 右:食料費のヒストグラム 8 456 3 1 510 6 590 104 1 0 7 810 269 1 1 326 430 4 . 8 0 6 8 . 0 0 0
1 ) 男 女 別 ・ 経 常 収 入 お よ び 食 料 費 の 5分位分布 表3 日巳町司~、,、 5分 位 2 3 4 5 5分位数 310, 5 3 1未 満 310, 5 3 1以上 404, 883以上 5 0 1, 1 8 1以上 635, 875以上 計 男 1 5, 494 1 8, 617 1 9, 095 1 9, 359 1 9. 435 92, 000 女 4, 506 1 , 377 百 十 女 2 0, 000 1 9, 994 9 1 1 2 0, 006 640 1 9, 999 002 567 20, 000 1 8, 0 0, 000 l 計 3, 1 9 6I 1 9, 999 , 903I 20, 000 1 1 , 268I 20,0 0 1 948I 1 9,998 685I 20,003 8,000I 100,000 2 ) 男 女 別 ・ 経 常 収 入 ・ 食 料 費 に つ い て の 3重 ク ロ ス 表 経常収入 5分位 男 2 3 4 5 計 女 2 3 4 5 言 十 男女計 5, 827 5,1 3 0 2,9 1 1 1,906 1, 029 1 6,803 2, 46 2 3 7 1 243 68 53 3,1 9 6 1 9,999 表4 食料5分位 3 2 3,974 2, 79 8 4,5 0 1 3,978 4,3 0 1 4,395 3, 233 4, 082 2, 087 3, 48 1 1 8,734 1 8,097 994 565 399 235 225 216 134 1 5 6 1 5 2 9 6 1 , 903 1 , 268 000 20, 0 0 1 20, 4 1 , 8 3 1 2,996 4, 294 4, 903 5, 026 1 9, 049 314 2 1 1 164 1 4 3 1 1 7 948 1 9, 998 5 1, 064 2,012 3,198 5,2 3 1 7,813 1 9, 317 172 1 6 1 63 140 1 4 9 685 20,003 3 ) 男女別・経常収入別に食料費を常用対数変換した平均値の比較 表5 経常収入 5分位 男 2 3 4 5 計 女 2 3 4 5 計 世帯数 1 5, 494 1 8,617 1 9,099 1 9,356 435 1 9, 92, 000 4,506 1,377 9 1 1 640 567 8,000 食料 常用対数平均 4,7389 4,7832 4,8368 4,8826 4,9335 4, 8395 4,6713 4,7 8 1 1 4,7813 8617 4, 8774 4, 4,7325 幾何平均 54, 815 60,702 68,675 76,313 85,803 69,103 46,914 60, 409 60, 437 72,728 75. 405 54, 013 9 457 計 1 5. 494 1 8,617 1 9,099 1 9,356 1 9, 43 5 92, 000 4,506 1,377 9 1 1 640 567 8, 000 100,000
付 録 規 定 課 題 の SASプログラム I * p r o cimport で読み込んだ上で * 1 p データを縦に結合 * 1 datad a t a . d ̲ a l l; s e t data.d1̲5000 data.d5001̲10000 data.d10001̲15000 data.d15001̲20000 data.d20001 25000data.d25001 30000data.d30001 32027; run, 1 * 1 0万人比のウェイトを作る * 1 p r o cmeansdata=data.D̲ALLsum; varweight; ー : ); outputout=weightsum(drop= run, dataweightsum2(rename=(weight=weight̲sum)); s e tweightsum; run, datadata.D ALLw ; r e t a i nweight̲sum2; mergedata.D̲ALL weightsum2; i fweight̲sum=.thenweight̲sum=weight̲sum2; e l s eweight̲sum2=weight̲sum; new̲weight=weight1weight̲sum*100000; dropweight̲sum weight̲sum2; run, 1 *規定課題 1 * 1 datad a t a . k i t e i 1; s e tdata.D ALLw ; i fS1̲Sangyou="VV"thenS1̲Sangyou="99"; . ); S1̲Sangyou2=input(S1̲Sangyou,8 keepS1̲SexS1̲Sangyou2new̲weightweight; run, p r o cformat; 1 0 458
valueSex 1 = "男" 2="女" valueSangyou 1 = "農業" 2="林業" 3="漁業" 4="鉱業" 5="建設業" 6="製造業" 7="電気・ガス・熱供給・水道業" 8="情 報 通 信 業 " 9="運 輸 業 " 10="卸売・小売業" 1 1 = "金融・保険業" 12日 不 動 産 業 " 13="飲食庖・宿泊業" 14="医 療 ・ 福 祉 " 15="教育・学習支援業" 16="複合サービス事業" 17="サービス業(他に分類されないもの) " 18="公務(他に分類されないもの) " 19="その他(非就業を含む) " 99="不詳" run, h 加 bg= h=nu aa.uwu tdntu pu o r p iF. 噌 Anu ・胃 ・唱A P l &lu LAm ea ta ucn u 凶.閉山 内岨 c l a s sSl̲SexS1̲Sangyou2; t a b l eSl̲Sangyou2="産 業 符 号 "ALL="合計",S l ̲ S e x = ' "性別 "ALL="合計"; formatSl̲SexS e x .Sl̲Sangyou2Sangyou.; run, 1 1 459
・胃A F パ 司 ea ‑F Anu 4L 団 m &IMFU aunu ‑ よ ︐ . p L V M 出 g= h=nu M M .悶 加 aa.uwH tdna n v v n r ‑ ・ c l a s sSl̲SexSl̲Sangyou2; varnew ̲weight; 日産業符号"ALL="合計 " )*new̲weight,Sl̲Sex="性別"ALL=" t a b l e<Sl̲Sangyou2 合計"; formatSl̲SexS e x .S1̲Sangyou2Sangyou.; run, 1 *規 定 課 題 2 * 1 datad a t a . k i t e i 2; s e tdata.D̲ALL̲w; keepYouto004Youto038weight; run, p r o cu n i v a r i a t e data=d a t a . k i t e i 2; varYouto004Youto038; weightweight; outputout=gobunni p c t l p t s=20406080 p c t l p r e=p004̲p038̲ run, datadata.hyou2; x=0 . 2 ; y=310531 .0652; .02133; z=49701 output; x=O. 4 ; y=404883.1333; z=63146.23316; output; x= 0 . 6 ; 1 2 460
y=501180.8646; z= 76055.14362; output; quoo nuoo QU 円 404 EU qAnu 民 00 75 unu q d ︒ 円 aunu yz ︒ 円 ‑ ‑ = 0 . 8 ; x= output; = l a b e lx "分位点" y="経 常 収 入 " z="食料費" formatxp e r c e n t 8 .ycomma7 .zcomma6.; run, t i t l e" 表 2 ", = p r o cp r i n tdata data.hyou2noobsl a b e l; run, t i t l e; p r o cu n i v a r i a t e data= d a t a . k i t e i 2; varYouto004Youto038; run, = p r o cgchartdata d a t a . k i t e i 2; vbarYouto004I = type p c t midpoints =75000 225000 375000 525000 675000 825000 975000 1125000 1275000; run, p r o cgchartdata= d a t a . k i t e i 2; vbarYouto038I type= p c t midpoints=1000030000500007000090000110000130000150000170000; run, 1 3 461
戸規定課題計/ datad a t a . k i t e i 3; s e tdata.D ALL w ; keepYouto004Youto038new̲weight81̲8ex; run, datad a t a . k i t e i 3 s; s e td a t a . k i t e i 3; i fYouto004>=635875.2793thenbunnrui=5; e l s ei fYouto004>=501180.8646thenbunnrui=4; e l s eifYouto004>=404883.1333thenbunnrui=3; e l s eifYouto004>=310531 .0652thenbunnrui=2; bunnrui=1; e l s e i fYouto038>=93035.80288thenbunnrui2=5; e l s eifYouto038>=76055.14362thenbunnrui2=4; e l s eifYouto038>=63146.23316thenbunnrui2=3; e l s ei fYouto038>=49701 .02133thenbunnrui2=2; bunnrui2=1; e l s e run, p r o ct a b u l a t e = data d a t a . k i t e i 3 s format= comma7.; c l a s sbunnrui81 8ex; varnew̲weight; 計 ")*new̲weight, 81̲8exALL="計"; t a b l e{bunnrui=" 5分 位 "ALL=" format81 8ex8 e x . ; run, p r o ctabulate data= d a t a . k i t e i 3 s format= comma7.; c l a s sbunnrui281 8ex; varnew̲weight; t a b l e{bunnrui2=" 5分 位 "ALL="計"ド new̲weight,81̲8exALL="計"; format81 8ex8 e x . ; run, 1 4 462
戸規定課題 4 * / p r o ct a b u l a t e data=d a t a . k i t e i 3 s format=comma7. c l a s sbunnrui81 8exbunnrui2; varnew̲weight; t a b l e (81̲8ex吋bunnrui= "経常収入 5 分 位 " ALL = "計,,) ALL = "男女計 "士 )new̲weight,bunnrui2="食料 5分 位 "ALL="計"; format81 8ex8 e x . ; run, /会規定課題ゲ/ datad a t a . k i t e i 5; s e td a t a . k i t e i 3 s; logYouto038=log10(Youto038); run, p r o ct a b u l a t edata=d a t a . k i t e i 5out=kika; c l a s s81 8exbunnrui; varYouto038logYouto038; weightnew̲weight; t a b l e81̲8ex*(bunnrui="経常収入 5分 位 "ALL="計,,),Youto038*(sumwgt="世 帯数,,)吋'=comma7.1ogYouto038 吋mean="常用対数平均,,)吋' = 6. 4; format81 8exs e x .; run, datakikaheikinn; s e tkika; kikaheikinn=10付 logYouto038̲mean; run, 1 5 463
マイナス金利下におけるローン事業の発展性と 疑似ミクロデータに見るローン利用者の行動特性 (参加カテゴリー:B) 内田晃秀 筑波銀行営業企画部 Akih i d eUchida MarketingPlanningD i v i s i o n, Tsukubabank, L t d . 要旨 パブ ル崩壊後に本格的にとられた本邦金融政策は経済を安定化させ成長軌道に補正する意味で大 きな役割を果たした。一方でそれらの政策の副次的効果が銀行経営やこれまでのピ ジネスモデ、ノレに負 の影響を与えている。低金利下で預貸金利ギャップが縮小し、事業性融資や住宅ローンの利鞘が縮小 している状況下で、銀行はこれまで以上に顧客への理解を深め採算性確保の可能性が残る無担保の個 人ローンに対する事業を研究し拡大する必要がある。 独立行政法人統計センターの作成した「教育用疑似ミクロデータ」を分析および仮説と検証の結果、 0代に至るまで借入需要は旺盛であるという カードローン等無担保ローン利用者は 20代前半から 5 結果が得られた。特に教育や自動車関連の使途だけでなく、交際費や教養娯楽への支出も順相闘が高 いことから若年層のローン利用を牽引していると考えられる。これらの分析結果は銀行の個人ローン 事業の進むべき道の糸口として示唆となるだろう。 1.バブル崩壊後の金融政策と銀行の対応 (1)パブ、ル崩壊後の金融政策と市場金利 1990年代初頭から日本経済はバブル経済の崩壊による不良債権の増加、デフレスパイラルおよび 円高が相五に進行する悪循環へ突入しインフレ率や経済成長率は低下した。これに対応し日本銀行は 1990年 8月時点では 6%で、あった政策金利を段階的に引き下げ、 1998年 9月には 0.25%とゼロ近 999年に無担保コールレート(オーバーナイト)をゼロ近傍 傍へ引き下げることとなった。さらに 1 へ誘導するという「ゼロ金利政策Jを導入した。時の判断から 2000年 8月にはゼロ金利政策を解除 001年 3月には操作目標を日本銀行当座預金残高とする するも、米国 1Tバブル崩壊の余波を受け 2 「量的緩和政策」を導入した。その後、危機的経済情勢の後退に伴い 2006年には「ゼロ金利政策 J および「量的緩和政策」は解除された。 2010年にリーマンショックの発生に伴い、「包括緩和政策」の開始により社債、 ETF、 J‑RE 1Tなどの金融商品も買い入れ対象とすることでイールドカーブの押し下げとリスクプレミアムの 圧縮を図った。 現安倍政権下では、いわゆる 3本の矢の一つ「デフレ脱却と持続的な経済成長の実現のための政 府・日本銀行の政策連携について」が示され 2013年 4月に異次元緩和「量的・質的金融緩和」の導 入、次いで 2016年 1月には「マイナス金利付き量的、・質的金融緩和」を導入した。これにより現 1 464
在も続く日本銀行当座預金 . . . . 0 . 1 %、インフレ率 2%の「物価安定の目標 J とマネタリーベースの拡 大による大規模な金融緩和が行われており、 1 9 9 3年初の国債 5年国債金利 4.239%および 1 0年国債 金利 4 .877%は 2 0 1 6年 4月 2 8日時点の 5年同・ 0.206%および 1 0年同 ‑ 0 . 0 8 2 %までに下落している ( 図 1‑1)。また、両時点の l年国債の金利をゼロとした場合のイールドカーブを比較すると、大 きくフラットニングしていることがわかる(図 1‑ 2)。 ( 図 1‑ 1) 5年および10年国償金利の推移 5凹 4 . 0 0 3回 ー‑5$ 国国 21 A S ‑ ‑展領軍国 ‑ー叩匁 回 。 . 1曲 2 1 F S F J d F S F d F S F 4 9 4 9 4 F 4 9 4 言 d p d F d F 4 9 5 P j j j d F S F S F . , 回 データ出典:財務省国債金利情報 ( 図 1‑ 2) z 時点のイールドカーブ (1年国債基隼) 2 . 5 0 2 . 0 0 1 .50 噌 目 ・ n u n u (ま}震 M明圃串圃 0.50 0 . 0 0 1年 2年 3年 4年 S年 6年 7年 8年 9年 10 年四年四年 0 . 5 0 データ出典財務省国債金利情報を基に加工 (2)ゼ、ロ金利政策の導入およびマイナス金利付き量的、・質的金融緩和と邦銀に与えた影響 パブ、ル経済の崩壊以後、前述の低金利政策下において貸出金利と預金金利の差である利鞘が縮小傾 2 465
向にある中で邦銀は発生した多くの不良債権を償却すべくバランスシート調整に主要行・地方銀行と に経営資源の傾斜配分を余儀なくされる(図 1‑3) 。近年では 1~3% 台での推移となり、銀行を取 り組まく不良債権の問題は解決したと考えられる。 ( 図 1‑3 ) 主要行および地方銀行の不良債権比率の推移 {金融再生法闘示債権) 9 . 0 0 8 . 0 0 7 . 0 0 i ヘ 、 6 . 0 0 1 ー←主要行 ー・ー地方銀行 ‑ s . 4 . 0 0 3 . 0 0 2 . 0 0 1 .00 0 . 0 0 〆 〆λJ/〆〆〆/〆〆〆〆〆〆〆〆〆/〆〆〆〆〆 令 や 令 や : f . ' ~+令や令令令令帝令令やや令令令:f.'令やや データ出典.金融庁 『平成 27年 3月期における金融再生法開示債権の状況等』 不良債権の問題と向き合う途上で、その処理に充てる原資としての収益が圧迫される状況が進行し ていた。それは、市中金利が下落するのに合わせて貸出金利も下落傾向にあるが、本来パラレルで、あ るべき経費としての預金金利が下限(ゼロ)に近傍し推移せざるを得ない(預金がマイナス金利とな らなし、)としづ状況である。つまり、銀行は両金利をパラレルに推移させたい意図に反し、貸出金利 だけが下落を続け、預金金利がゼロ近傍に張り付いたままとなることで、本来の利益の源泉である貸 出金利ー預金金利(以下、預貸金利スプレッドと呼ぶ)=利鞘を圧迫する状況が続いているのである。 2007年 10月の預貸金利スプレッドを 100%とすると 2016年 2月には 56%となっており、銀行の基 礎的な利鞘は約 10年間で概ね半減している状況にある(図 1‑4)。 日本銀行でも上述の通り「マイナス金利付き量的、・質的金融緩和」政策の継続でマイナス金利の 幅を今後も拡大する可能性がある状況下にあり、利鞘の縮小はトレンドとして続くことを想定せざる をえない。 3 466
( 図 1 ‑4) 預金金利および貸出金金利と預貸金利スプレッドの割合の推移 100% 2 . 5 0 90% 80% (宰)由時ザ遺制帽b u司柄拘昆付制限 70% nunu 2 . 0 0 60% 50% 40% ー←(左軸)新規貸出金利{長期} 30% n ー←(左軸}定期預金金剥 { 1 0 百万円以上、 1年} 0. 50 ‑ー(右軸 )07 年を 10 聞とした預貸スプレッドの割合 20% 10% ぷやシ・鴻や料か料命令料心事1料や少シメや料心会科命令ふ.~' データ出典:日本銀行『時系列統計データ』 (3)地銀のビジネスモデ、ルの主柱である個人ローンスタンス 銀行として利益の源泉で、ある預貸金利ギャップの縮小という困難な状況下にあって、リテール事業、 とりわけ個人ローンが存在感を増している。個人ローンは住宅ローンに代表される有担保ローンと、 カード、ローン、教育ローン、自動車ローンなどの無担保ローンに大別される。 住宅ローンは低金利の影響を受け一般的な法人向け貸し出しと同様に低金利での運用を迫られて いる。一方でカード、ローンをはじめとした無担保ローンは、個人の利便性を追求していることから、 銀行としては発行にできるだけ顧客の手間を省く仕組みを構築するために金利を確保できる、つまり 顧客ニーズに弾力的に対応しているがゆえに利鞘が確保できる商品であると換言できる。 1年の割賦販売法1および平成 2 2年の貸金業法等2の改正により銀行カードローンの果たすべ 平成 2 き役割は一層高まっただけでなく、より顧客に密着したリテール金融を行う契機ともなった o 銀行の 貸出金におけるカードローンの割合はごく少ないが、利便性およびリスクの対価としての金利が相応 ために収益に与えるインパクトは少なくない。 「マイナス金利付き量的、・質的金融緩和」が継続され、一層のマイナス幅拡大が行われる可能性 がある限り、市場金利は押し下げられイールドカーブはフラットニングを続けるだろう。この状況下 1 個別信用購入あっせん業を行う場合は経済産業省へ登録を受ける必要があり、各種要件を満たし同省の審査を経なければならない。 2 改正以前は多くの貸金業者が出資法の上限である年利 29.2%と利息制限法の上限である年 15‑20%の間(グレーソーン金利)で貸し付けを行うこ とが問題視されていた。平成 22年に貸金業法等が改正され出資法の上限金利は 20%に引き下げられた。また貸し付け残高が年収の 1 1 3を超えられな いとする総量規制もその際導入された。 4 467
では、いかに個人向けカードローンのニーズをつかむか、個人のライフイベントを金融行動から解明 し資金需要を解明するか、さらに「マイナス金利付き量的、・質的金融緩和」政策下で単体での利鞘 確保が難しくなった住宅ローンの収益的な補完としてカードローンのクロスセルをいかに追求する かは銀行のビジネスモデルを探る上でも目下の課題となる。 2 . 疑似ミクロデータ分析による銀行ビジネスモデルの補完 (1)個人ローン利用者の基礎調査 本編においては独立行政法人統計センターの作成した「教育用疑似ミクロデータ J (以下、ミクロ データ)を使用した。なお集計用乗率を重みとして使用している。このミクロデータ上で示される「土 地家屋借金返済J>0を住宅ローン等利用者、「他の借入金返済+分割払・一括払購入借入金返済J>0 をカードローン等無担保ローン利用者と便宜的にみなす。また資産形成層の動向に焦点を当てるため、 60歳以上は基本的に分析から除外している。 銀行の顧客として個人ローン契約の主体となるのは 20代 ' " " 5 0代までの資産形成層が中心である。 個人ローンの利用を伸ばすためには、資産形成層の動向をよく理解しなければならならず、その年代 毎に傾向を探る必要もある。 (2) ミクロデータの実支出割合からの分析 母集団全体の支出の状況を概観してみると、食料、住居など生活するうえで必要な消費支出および税 金などの非消費支出をまとめた実支出は 20代前半では高いものの、それ以降は下落し、 30代後半で は 43%となっている。一方、預貯金、借入金の返済、保険掛金などの実支出以外の支出は逆の割合 となることから 30代後半で最高の 57%となる(図 2‑1)。 ( 図 2‑1) 実支出割合の比率 ‑実支出割合 圃実支出以外の支出割合 60% 57% 55% 55% ‑圃 56% ‑置圃 50% 45% 40% 35% 30% 歳 ‑ 25歳 ‑ 30歳 ‑ 35歳 ‑ 40歳 ‑ 45歳 ‑ 50歳 ‑ 55歳 20 n = 2 3, 3 8 36 0歳以上は除く、また不詳は集計から除外している。集計用乗数利用有 5 468
(3) 実支出以外の支出の内訳 実支出以外の支出の大部分は各年代とも大部分を預貯金が占めるが、実支出とそれ以外の割合で黍離 が大きくなる 30~40 代は土地家屋借金返済=住宅ローン等の返済が多くなっていることがわかる。 また、特徴的であるのは他の借入金返済+分割払・一括払購入借入金返済=カード、ローン等無担保ロ ーンがどの年代を通しでも、一定の割合を占めており住宅ローン以上に身近なファイナンスとして定 着していることがわかる(図 2‑ 2)。 ( 図 2‑ 2) 実支出以外の支出割合 10 0% 狙そ由他 95% ロ財産踊入 他的借金+分割払・一 90~施 括払鵬λ借 λ童逼済 囚土地軍屋借金返済 85% E 有価値券購入 80% ‑保険鍋壷 75% ‑預貯金 70% 20 歳‑ 25 篇‑ 30織 ‑ 35 歳‑ 4 0 j 議‑ 45歳 ‑ 5 0 i 議‑ 5 5飽 n=23, 383 60歳以上は除く、また不祥は集計から除外している。集計用乗数利用有 (1)住宅ローン等利用者とカードローン等無担保ローン利用者の状況について 一般的にカードローンなどの無担保ローンは住宅ローンに比べ少額であることに加え、審査が早く手 軽に申込できることから、 20 代より利用者が多く借入機会の増加に伴い、 35 歳以上 ~40 歳未満ま でにはカードローン等無担保ローンの利用者はピーク近くまで一気に上昇する。一方住宅ローン等利 用者は年齢を重ねるに従った、結婚や子育てなどのライフイベントに伴い、 40歳以上 45歳未満まで の聞に徐々に増加している。住宅ローンの場合は金額が大きく年間の返済額もまとまった額となるこ とから相応の年収が必要となることも影響しているといえよう。(図 2‑ 3) 6 469
( 図 2‑ 3) 年代別住宅ローン等利用者および カードローン等無担保ローン利用者数 70 , 000 000 6 0, , 000 50 ミ40, 0∞ ー+ー食宅ロ四ン等利用者 援 ‑ <30,0∞ 帽ーーカードローン等無担保ローン利用者 2 0, 000 , 000 1 0 。 2 0 歳‑ 住宅ローン等利用者 2 5歳 ‑ 30 歳‑ 3 5 銭‑ 40 議‑ 45 歳‑ 50 怠‑ 5 5怠 :n=272 , 807 60歳以上は除く、また不詳は集計から除外している。集計用乗数利用有 カードローン等無担保ローン利用者:n=351, 151 60歳以上は除く、また不詳は集計から除外している。集計用乗数利用有 (2) 住宅ローン等利用者像の仮説 ローン利用者の属性を意識し商品性やプロモーション、マーケティングに生かすことは、販売を促 進するうえで最も重要である。今般の分析に当たり、より焦点を絞った分析とするため事前に仮説を 立てそれを証明し利用者の行動特性を解明する方法を採用した。 【住宅ローン等利用者像の仮説】 ①住宅ローン利用者については収入に順相闘がある ②住居が賃貸であることと逆相関となる。 ③居住者は複数であることが想定されるので食費や公共料金の支払が一定程度順相関する。 (3) 住宅ローン等利用者像の仮説の検証 住宅ローン利用者の行動特a性を探索するため、住宅ローン等利用者(土地家屋借金返済)と直接また は間接的に因果関係の存在が推定される複数の収支項目に対し相関分析を行った。下の図は各年代の 相関係数を算出し、年代毎に相関係数を配置したものであり各収支項目に対し年代を追うごとに相関 係数がどのように推移するのかを図示したものである。相関係数の検定結果はいずれも有意水準を 0 . 0 5 とし帰無仮説を棄却しうる値のみを使用した。したがって棄却できないデータに関しては同系 列でもプロットしていない。 7 470
( 4 ) 住宅ローン利用者の傾向 0 " ' " ' 4 0代では相関係数の 住宅ローン等利用者の傾向として、 2点があげられる。 1点目の傾向は 2 0代後半に近づくにつれトレンドとしてゼロへ近づいているということ 絶対値が大きいのに対し、 5 である。他の項目に関しでも有意な相聞がみられないことから年を経るにつれて年収が増加すると同 時に、ライフスタイルや家族構成の多様化により画一的な支出が減少する傾向にあるといえる。 2点目の傾向は表示した各収支項目は直接または間接的に因果関係の理由付けが可能であるとい うことである。例えば住宅ローンの返済がある人は持ち家であるから、一般的な傾向として地代家賃 はないと考えられるので、顕著な逆相関となっている。また、年間収入が高ければ住宅ローンを組む 動機や審査結果にも影響するだろう。電気代とガス代がゼロ付近を軸と考えると対照となっている点 もオーノレ電化や IHの普及が影響していると考えることもできる。住宅ローンがあり、世帯が 3人以 上となり子供を持つ世帯となると広い世代で食費も弱い相闘を維持することが当然と考えられる(図 2‑4)。 (5) 仮説検証の結論 このように 20~40 代は相対的に相闘が確認でき、かっ住宅ローン利用との因果関係が一定程度解 明できる支出であることから、顕著な相聞は表れこそしないが、概ね方向性は正しいことが分かつた。 ( 図 2‑ 4) 年代別住宅ローン等利用者の各収支項目との相関 目 日40 0 . 3 0 0 . 2 0 0 . 1 0 0 . 0 0 童 a a010 . i ! . 0 . 2 0 司 0 . 3 0 0. 4 0 50 ‑ 0. . 0 . 6 0 歳 25 3 0 i 議 35歳 40歳 45歳 5 0 i 議 55議 n=23, 383 60歳以上は除く、また不詳は集計から除外している。集計用乗数利用有。有意でない相関はプロットしていない。 8 471
(6) カードローン等無担保ローン利用者像の仮説 住宅ローン利用者と同様、より焦点を絞った分析とするため事前に仮説を立てそれを証明し利用者 の行動特性を解明する方法を採用した。 [カードローン等無担保ローン利用者像の仮説 1 ①住宅ローンに比ベカードローン等無担保ローンは自由に利用できることから年間収入とは逆 相関にある。 ②教育ローン、自動車ローンなど目的型の無担保ローンが存在するため教育や自動車関連を使 途とする支出と順相闘がある。 ③加齢に伴い、世帯のライフイベントや交際にかかる支出も多くなることで自由になる資金が なくなる 40代以上でカードローン等無担保ローンの利用が多くなるかもしれない。 (7) カードローン等無担保ローン利用者像の仮説の検証 カード、ローン等の無担保ローン利用者の各収支項目としても 2点の傾向がある。 1点目の特徴は年 間収入と順相闘が確認できるという点である。無担保ローンは通常の日常生活と関係のある消費支出 に充てられ収入が支出に追いつかないため、年間収入との逆相闘が想像された。実際には相対的に高 ) 慎相聞を 5 0代以上も維持している。 い1 2点目の傾向は支出に関して相対的に突出した相闘がみられないことである。特に金融機関で一般 的に用意している教育ローンや自動車ローンが基本的な使途としている教育費用やそれに準じた仕 送り金、自動車関連費用が一定の順相聞を維持していることから商品設定の妥当性が確認できる。 3点目の傾向は、各項目の相関が 2 0代から 5 0代まで住宅ローンに比べ大きく変化がない点であ る。住宅ローン等利用者の場合、相関係数はゼロ付近へ収飲していくのに対し、カードローン等無担 . 1 5付近へ収飲する。つまり年齢を重ねても需要が存在し続けているということ 保ローン利用者は 0 である。また前掲利用者数の図 2‑5で明らかとなった 1 2 0代から傾きが住宅ローンに対して急で ある、言い換えれば若年から需要が多い」という点から考えてみても符合する。教養娯楽に関して 2 0代後半では有意水準が 0 . 1 1となったことからプロットしていないものの、 0 . 6 0 1という強し、相関 係数が算出された。また交際費に関しては住宅ローン等利用者でも一定の順相関は見られたが、カー ドローン等無担保ローン利用者の場合にはより若年が高い相関があることも特徴的であることから 若年のカードローン等無担保ローンの利用者を牽引していると考えられる。 なお、教育に関して 2 0代前半で高い1 ) 慎相関となっていることについては統計的な P値は有意だが 本稿での説明が難しく別に検討を要すると考えられる。 (8) 仮説検証の結論 年間収入とは順相聞にあり、高収入であれば借入をしないと結論付けるのは早計である。使途はそ れぞれであり、ライフイベントに合わせた借入を行っている。また、 40代以上よりも若年の方が新 たに借入を開始する傾向がある。 9 472
( 図 2‑ 5) 年代別カードローン等無担保ローン利用者の各収支項目との相関 0 . 5 5 ー←年間収入 『・ー食料 ー企ー自動車等維持 4 5 0. 0 . 3 5 章 一 : a目 ‑ 標 0 . 1 5 0 . 0 5 + . 0 . 0 5 2 0 怠 25 歳 30"‑ 35 趨‑ 40 鐘‑ 45 愈四 50 倉田 路島町 n=23, 383 60歳以上は除く、また不詳は集計から除外している。集計用乗数利用有。有意でない相関はプロットしていない。 (7)まとめ パブ、ル経済の崩壊以後の経済情勢に対応したゼロ金利政策量的緩和政策、および近時のマイナス金 利付き量的・質的緩和政策等は、日本経済を安定化させ成長軌道に補正する意味で大きな役割を果た した。一方でそれらの政策余波が図らずも銀行経営やこれまでのビジネスモデルに負の影響を与えて いる。 低金利下で預貸金利ギャップが縮小し、事業性融資や住宅ローンの利鞘が縮小している状況下で銀 行ではこれまで以上に顧客への理解を深め採算性確保の可能性が残る無担保の個人ローンに対する 事業を拡大する必要がある。 住宅ローン等利用者は土地家屋を保有していることと、年間収入・家賃地代などの因果関係が直 接・間接的に順・逆相闘が読み取れる。 一方カードローン等無担保ローン利用者は 20代前半から 50代に至るまで借入需要は旺盛である。 教育や自動車関連の使途だけでなく、交際費や教養娯楽への支出も順相闘が高いことから若年層のロ ーン利用を牽引していると考えられる。 これらの分析結果は銀行の個人ローン事業の進むべき道の糸口として示唆となるだろう。 (了) (参考文献) 「非伝統的金融政策の実践と理論』日本銀行 2 0 1 4 1 0 473
付録規定課題
1) 産 業 符 号 ・ 性 別
クロス表
表1
a
)単純クロス表
性別
産集符号(改}
04鉱 寮
05箆段耳障
崎製造察
07憶気・ガス・勲供給・水道業
同情報通信業
四
9
"
,
;
;
湿
槍
業
10卸売・小売"
刊金融・保険象
12不動産業
旬飲食腐・宿泊霧
14̲
1i.'福祉
15敏宵・学理支援象
16複合サービス事象
17サービス調書{他に分頬されないもの}
183
量窃{他に分担さおないもの}
w
̲
不詳
省計 (
A
L
L
)
性別
合計
2
唱
N
b)10万世帯比でのクロス表
t
{此L
)
N
N
2
Sum
Sum
1
0
0
k
(
i
n
匂}
1
0
0
k
(
l
n
t
g
)
集計周乗率
集計用乗率
3
3
2
,
1
3
4
,
1
4
3
9 2
5
,
6
6
8 1
7
3 5
,
8
4
1
2
2
2
2
2
2
5
4
7
5
4
7
1
,
2
3
5
,
2
3
8
3 1
2
,
0
8
3 2
0
1 2
,
2
8
4
4
7
2
3
9
5
1
1
4
0
4
0
5
0
3
2
8
2
3
7
1 2
7
0
6
4
1
1
,
0
5
9
,
1
4
8
8
9 1
3
2
4
3
2
1
3
1
,
8
1
6 1
0
6 1
,
9
2
2
3
,
6
5
6 1
,
7
8
6
3
0 3
9
,
7
0
4 1
,
5
9
1 1
1,
2
9
5
担9,
3
8
1 2
,
6
4
6 3
2,
0
2
7
7
,
3
4
6
6
1
7,
8
3
7
6
9
7
2
,
0
2
0
,
8
5
2
3
6
,
6
4
4
1
,
4
4
7
1
4
4
1
5
8
,
0
2
2
1
3
,
1
1
0
9
8
1
5
,
8
4
2
6
9
1
1
0,
2
0
4
3
1,
9
2,
0
0
0
3
1
5
1
0
6
5
8
9
1
0
4
1
0
7
8
1
0
2
6
9
1
1
3
2
6
4
3
0
4,
8
0
6
8
,
0
0
0
クロス表
"
.
禽
S
場
3
) 男女別・経常収入および食料費の 5分位分布
経常収入
食料品
Sum
SUml
男│女│
鰻常収入 5分位フラグ【文字列】
15,
494 4,
506
川 310,
531未 満
~_310,531 以上
~ 404
,
883以上
時~501 ,181 以上
国
:
̲
6
3
5
,
875以上
合計 ~L)
18,
617 1
,
377
9
1
1
19,
095
19,
359
640
19,
435
567
92,
000 8,
000
‑
‑
‑
1
男
古
E
16,
803
18,
097
18,
734
19,
049
19,
317
92,
000
3,
196
1
,
903
1
,
268
948
685
8,
000
食料 5分位【文字列】
市~,701 未満
2
̲
4
9
,
70
唱以上
146以上
3̲63,
4̲76,
055以上
~_93,036 以上
合計 (
ALL)
4
7
4
4) 男女別・経常収入および食料費の 5分位分布 表4 一一一一一一一一一 Sum ‑ ‑ ‑ ‑ ‑ 1 食 事 ' 1 ‑1 1 : 食斜 21食 事 ヰ 31 食科 4 1食斜 5 1 雄創 健常収入 S分位フラグ 4 陸 回 同 旨 出 量 針 tιu a 権常収入 5分位フラグ 匝 国 同 旨 出 量 計t 札 L 】 合計 ( A L L ) 8 2 7 3, 9 7 4 2, 5, 7 9 8 5, 1 3 0 4, 5 0 1 3, 9 7 8 2, 9 1 1 4, 3 0 1 4, 3 9 5 1 , 9 0 6 3, 2 3 3 4, 082 1 , 0 2 9 2, 0 8 7 3, 4 8 1 1 6, 8 0 3 1 8, 0 9 7 1 8, 7 3 4 , 8 3 1 1 2, 9 9 6 4, 2 9 1 4, 9 0 6 5, 0 2 6 1 9, 0 4 9 1 , 064 2 , 012 3, 1 9 8 5 , 2 3 1 7 , 8 1 3 1 9, 3 1 7 2, 4 6 2 994 565 3 7 1 399 235 2 4 3 225 2 1 6 68 1 3 4 1 5 6 53 1 5 2 9 6 3, 1 9 6 1 , 9 0 3 1 , 2 6 8 1 9 , 9 9 9 20 , 000 20 , 0 0 1 314 2 1 1 1 6 4 1 4 3 1 1 7 9 4 8 1 9 , 9 9 8 1 7 2 1 6 1 63 1 4 0 1 4 9 6 8 5 2 0, ∞3 5) 男女別・経常収入別に食料費を常用対数変換した平均値の比較 表5 世帯数 │ 食料常用対数 Sum 1 T 一面雨量証一│ Mean 性別 際常収入 5分位フラグ t 陸 ー 出 ー 置 き 針 { 刈 ‑ 1 . . ) 1 5, 494 , 6 1 7 1 8 1 9 , 0 9 5 3 5 9 1 9, 1 9, 435 9 2, 000 4 . 7 3 8 9 4 . 7 8 3 2 4 . 8 3 6 8 4 . 8 8 2 6 4 . 9 3 3 5 4 . 8 3 9 5 54 , 8 1 9 , 7 0 4 60 6 8, 6 7 2 3 1 3 7 6, 7 9 3 85, 1 0 3 69, 4, 5 0 6 , 3 7 7 1 9 1 1 640 567 8, 000 4 . 6 7 1 3 4 . 7 8 1 1 4 . 7 8 1 3 4 . 8 6 1 7 4 . 8 7 7 4 4 . 7 3 2 5 , 9 1 3 46 , 405 60 , 4 3 9 60 72, 730 75 , 4 0 7 , 013 54 健常収入 5分位フラグ 2 E 3 4 5 合計 (ALL) 食品量制和司 自白叩ー 曲曲。‑ 四 回D‑ 岡 田 0‑ 関 c c c ‑ 4 C C c n‑ U I 且 2 . 0 2 . 6 3 . D 1 . 1 経鰭l 血λs 分f 量コラタ t 切 ーJ 三里 4 7 5 ID 5 I D
付録規定課題の S ASプログラム 1)産業符号・性別 クロス表 a ) 1 0万人比(男 9 2千 、 8千)で案分した集計用乗率 r 1 0 0 k ( i n t g ) 集計用乗率を算出 P R O CT 油U 凶T E D A T A = W O R K . Q U E R YF O RA P P E N DT A B L EO O O D0 0 0 8 1O O k( in tg)集計用乗率、; V A R"男、"女、 " C L A S S"性別、 1 0 R D E R = U N F O R M A T T E DM I S S I N G : C L A S S"産業符号(改)川 I O R D E R = U N F O R M A T T 印 M I S S I N G : *行ディメンション* 1 T A B L E1 '産業符号(改) • n * F = C O M M A1 2 . A L L )" }* F = C O M M A1 2 .. A L L = ( L A B E L = "合計 ( /キ列ディメンション * 1 '性別.n * F = C O M M A1 2 .* N * F = C O M M A1 2 . A L L = ( L A B E L = "合計 ( A LL )" }* N . t . 生 日1 ] 'n * F = C O M M A1 2 .* S u m * F = C O M M A 1 2 . * i n tg)集計用乗率.n * F = C O M M A1 2 . •1 O O k( R U N : 2 )経常収入および食料費 P R O CT 組U L A T E D A T A = W O R K . Q U E R Y ̲ F O R ̲ A P P E N D ̲ T A B L E ̲ 0 0 0 D ̲ 0 0 0 8 V A R"経常収入、"食料、; T A B L E1 *行デ、イメンション* 1 P 2 0 * F = C O M M A1 3 . P 4 0 * F = C O M M A 1 3 P 6 0 * F = C O M M A1 3 . P 8 0 * F = C O M M A1 3 .• 1 *チJ Iディメンション * 1 ,経常収入.n * F = C O M M A1 3 . .食料.n * F = C O M M A1 3 . W E I G H T"集計用乗率、; R U N : ヒストグラム P R O CU N I V A R I A T ED A T A = W O R K . S O R T T e m p T a b l e S o r t e dN O P R I N T: V A R"経常収入、"食料、; H I S T O G R A M: R U N :Q U I T : O D SG R A P H I C SO F F : R U N :Q U I T : 476
3
)男女別・経常収入および食料費の 5分位分布
P
R
O
CI
組U
L
A
T
E
D
A
T
A
=
W
O
R
K
.
Q
U
E
R
Y
̲
F
O
R
̲
A
P
P
E
N
D
̲
T
A
B
L
E
̲
0
0
0
D
̲
0
0
0
9
F
O
R
M
A
T
=
G
O
M
M
A
1
2
V
A
R"性別 2川 "j号、"女川;
G
L
A
S
S "経常収入5分位フラグ【文字~IJl 市 I
M
I
S
S
I
N
G
:
G
L
A
S
S "性別、 I
O
R
D
E
R
=
U
N
F
O
R
M
AT
T印 M
I
S
S
I
N
G
:
*行ディメンション *
1
T
A
B
L
E1
'経常収入5
分位フラグ【文字列 1'
n
*
F
=
G
O
M
M
A
2
0
A
LL
)"
}*
F
=
G
O
M
M
A
2
0
.,
A
L
L
=
{
L
A
B
E
L
=
"合計 (
O
R
D
E
R
=
U
N
F
O
R
M
A
T
T
E
D
1
*列ディメンション *
1
S
u
m
*
F
=
G
O
M
M
A
2
0
.
*
(
'
男
,n
*
F
=
G
O
M
M
A
2
0
.
.
女
,n
*
F
=
G
O
M
M
A
2
0
.)
W
E1
G
H
T"
1O
O
k(
i
n
tg)集計用乗率、;
R
U
N
:
旭U
L
A
T
E
P
R
O
CI
印 DT
A
B
L
EO
O
O
D0
0
0
9
D
A
T
A
=
W
O
R
K
.
Q
U
E
R
YF
O
RA
P
P
V
A
R"男、"女、;
G
L
A
S
S"食料5分位[文字~iJ l 、 I O
R
D
E
R
=
U
N
F
O
R
M
AT
T
E
DM1
S
S1
N
G:
0
R
D
E
R
=
U
N
F
O
R
M
A
T
T印 M
I
S
S
I
N
G
:
G
L
A
S
S"性別市 1
T
A
B
L
E1
*1Tデ、ィメンション*
1
'食料5
分位[文字列 1'
n
*
F
=
G
O
M
M
A
1
2
A
L
υ
"
)*
F
=
G
O
M
M
A1
2
.,
A
L
L
=
{
L
A
B
E
L
=
"合計 (
1
*列ディメンション *
1
S
u
m
*
(
'男 n
.
女
,n
)
W
E
I
G
H
T"
1
0
0
k
(
i
n
t
g
)集計用乗率、;
R
U
N
:
4) 男女別・経常収入・食料費についての 3重クロス表
食料常用対数を算出
P
R
O
CS
Q
L
:
G
R
E
A
T
ET
A
B
L
EW
O
R
K
.
Q
U
E
R
Y
̲
F
O
R
̲
A
P
P
E
N
D
̲
T
A
B
L
E
̲
O
O
O
D
̲
O
O
O
GA
S
S
E
L
E
G
T1
*食料常用対数 *
1
(
L
O
G
1
0(
t
1
.'食料 '
n
)
)F
O
R
M
A
T
=
G
O
M
M
A
3
2
.
2
0A
S'食料常用対数 n,
食品幾何平均を算出
P
R
O
CS
Q
L
:
紐L
E
S
̲
0
0
0
4A
S
G
R
E
A
T
ET
A
B
L
EW
O
R
K
.
Q
U
E
R
Y
̲
F
O
R
̲
S
T
A
B
S
U
M
M
A
R
Y
T
S
E
L
E
G
T1
*食品幾何平均 *
1
(
1
0林 t1
.'食料常用対数̲
M
e
a
n
'n
)A
S '食品幾何平均 n,
これを基に集計表を構築
P
R
O
CT
A
B
U
L
A
T
E
D
A
T
A
=
W
O
R
K
.
Q
U
E
R
Y
̲
F
O
R
̲
A
P
P
E
N
D
̲
T
A
B
L
E
̲
0
0
0
D
̲
0
0
1
2
477
V A R"世帯数、"食料常用対数、"幾何平均 " n ; O R D E R = U N F O R M A T T E DM I S S I N G ; C L A S S"性別、 I C L A S S"経常収入5 分位フラグ市 I O R D E R = U N F O R M A T T E DM I S S I N G ; *行デ ィメンションホ/ T A B L E1 .性別, n *( '経常収入5 分位フラグ n A L L = { L A B E L = "合計 ( A LL )" } ) , 1 *列デ ィメンションザ '世帯数 ' n * F = C O M M A 7 . * S u m * F = C O M M A 7 '食料常用対数, n * F = C O M M A 3 2 .4 * M e a n * F = C O M M A 3 2 . 4 W E1 G H T" 1O O k( i n tg)集計用乗率、, 折れ線グラフ作成 P R O CS O R T 分位フラグ D A T A = W O R K . Q U E R Y ̲ F O R ̲ S T A B S U M M A R Y T A B L E S ̲ 0 0 0 4 ( K E E P = "経常収入5 、"食品幾何平均、 w性別、) O U T = W O R K . S O R T T e m p T a b l e S o r t e d 分位フラグ、; B Y"経常収入5 R U N ; S Y M B O L l I N T E R P O L = J O I N H E I G H T = 1 0 p t V A L U E = N O N E L 1N E = l W I D T H = 2 C V=̲ S T Y L E ̲ S Y M B O L 2 I N T E R P O L = J O I N H E I G H T = 1 0 p t V A L U E = N O N E L 1N E = l W I D T H = 2 C V=̲ S T Y L E ̲ L e g e n d l F R A M E A x i s l S T Y L E = l W I D T H = l M I N O R = ( N U M B E R = l 478
A x i s 2 S T Y L E = l W I D T H = l M I N O R = ( N U M B E R = l T I T L E : T I T L E l "折れ線グラフ". P R O CG P L O TD A T A=W O R K . S O R T T e m p T a b l e S o r t e d P L O T '食品幾何平均 n* "経常収入5 分位フラグ% =吋生男1 ] " / V A X I S = A X I S l H A X I S = A X I S 2 F R A M E L H R E F = 3 4 C H R E F = L T G R A Y A U T O H R E F L V R E F = 34 C V R E F = L T G R A Y A U T O V R E F L E G E N D = L E G E N D l R U N :Q U I T : (了) 4 7 9
主催:S ASユーザー会世話人会 代表世話人 大橋績瞳 中央大学 世話人 伊藤陽一 小野潔 北海道大学 岸本淳司 九州大学 ARO次世代医療センター 堺伸也 イーピーエス株式会社 (氏名 5 0音順} 株式会社インテック 坂巻英一 周防節雄 兵庫県立大学 菅波秀規 興和株式会社 高橋行雄 B i o 5 t a t研究所株式会社 野原賢一 独立行政法人統計センター 松岡湾 日本メディア株式会社/ 1 1 頂天堂大学臨床研究支援センター 宮内亨 独立行政法人統計センター 八木章 近畿大学元教授 山之内直樹 第一三共株式会社 協賛 (掲鵡 5 0音順} イーピー工ス株式会社 工イツーヘルスケア株式会社 FMDK&lJapan株式会社 クリンクラウド株式会社 スタットコム株式会社 株式会社タクミインフォメーションテクノロジー T I 5株式会社 DOTインターナショナル株式会社 日本メディア株式会社 協力 5A5I n s t i t u t eJapan株式会社 SASユーザー総会事務局 千1 60・0022 東京都新宿区新宿6‑27 ・5 6 新宿スクヱア 5F TEじ03 ・5 77 4 ‑ 7018 受付時間:1 0 : 0 0 ‑ 1 7 : 0 0(平日 1 2 : 0 0‑ 1 3 : 0 0 、土・日・祝日を除く) E ‑ m a i l :s a s u s e r ̲ e n t r y @ s e m i n a r . j p 論文集 2016年 7月2 1日初版第 1刷発行 S A Sユーザー会 S A5I n s t i t u t eJapan株式会社 発行 :