SASユーザー総会論文集 1998年

>100 Views

April 21, 25

スライド概要

WEB を利用した企業情報システムの構築法 菅野崇
SAS/IntrNetソフトウエア導入のための成功要因 -組織的観点からのアプローチー 櫻木晃裕
SCLプリプロセッサ 竹内敬治
SASを用いた統計解析学習支援システムの構築 古隅弘樹
SPDS (Scalable Performance Data Server) V2.0の紹介 斎藤宏
西暦2000年対応について 鈴木一彦
アソシエーションルール抽出プログラムの試作 谷岡日出男
大規模なカテゴリー・データのクラスタリング手法 中林三平
神経線維腫症1(NF1)の臨床症状の相互関連に 関する研究 縣俊彦
SAS/DATAステップによる群逐次計画における棄 却限界値及び必要症例数の算出 宇野一
臨床試験における探索的な統計解析 高橋行雄
多項目×多種検定における多重性の調整 坪田邦広
4係数ロジスティックモデルのリパラメトリゼイションとその応用 肥田英明
中間解析におけるα消費関数と検定統計量についての検討 本田圭一
スペクトルデータの解析におけるPLS回帰とノンパ ラメトリック回帰 三輪哲久
統計関連 Tips and Techniques 小野裕亮
医療機関の治験事務局における受託臨床試験管 理システム作成の試み 安藤永一
盲検下での症例数の再計算のためのEMアルゴリ ズムを用いた分散推定プログラムについて 鍵村達夫
簡易帳票作成システム SAS to Excel 症例一覧 表モデル V1.2 藤本浩
SAS/IntrNetを活用した臨床試験解析報告書作成 の試み 矢島勉
臨床試験集計解析システム[CLINCL]の紹介 山本典子
臨床試験データ管理におけるデータ出力プログラムの汎用化 吉井時秋
SAS Pharma Technology Process -クリニカル・データウェアハウスと SAS/PH-Clinical ソフトウェア- Peter Villers
ニューロTAA 小野潔
シカゴ穀物相場の季節性と変動要因(ファンダメンタルズ)から穀物相場の因果論的接近を試みる 黒川厚
スワップ・レートに基づく金利期間構造とその予測 性に関する一考察 …日米両市場における実証分析を通じて… 宮村幸夫
債券市場のボラティリティ分析(Ⅰ) 江口敦
債券市場のボラティリティ分析(Ⅱ) 山田雅章
無制限複数回答形式のアンケート調査データの 入力と処理方法 有馬昌宏
データベース・マーケティングのカスタマイズ技法 ~コンクエスト戦略対応の分析事例~ 緒方維文
大学生の実演芸術鑑賞構造とその時系列変化 古賀広志
名古屋都市圏郊外における土地利用の変化 後藤順久
財務パフォーマンス分析の新しい視点 - SAS/INSIGHT 及び NNA の効果的活用法として - 陶山博太
ニューラルネットワークによる乳幼児のアトピー性 皮膚炎発症予知の検討 高橋幸一
大病院における外来患者増加要因の解析 田久浩志
PROC TRANSPOSE 活用方法に関する一考察 三島徳雄
1年生の目で見直すSASシステム ― SASシステ ムのプログラミングは難しい? 山橋愛子
Windows版SASシステムとJMPソフトウェアのデー タ互換 佐藤元昭
ファイナンスにおけるハザード・モデル 青沼君明
SASによる信頼区間の計算 浜田知久馬

profile-image

SAS言語を中心として,解析業務担当者・プログラマなのコミュニティを活性化したいです

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

第 17回 日 本 SASユーザー会総会 および研究発表会論文集 1998年 7月 2日(木) 3日(金) r‑.J

2.

SASは、株式会社 SASインスティチュートジャパンの畳録商標です。 SASSyst巴m,SASSystemを構成するプロダクト群は、 SASI n s t i t u t eI n c . の登録商標です。 その他、本論文集に記載されている会社名、製品名は、一般にそれぞれ各社の商標または登録商 標です。 本論文集の一部または全部を無断転載することは、著作権法上の例外を除き、禁止されています。 本論文集の内容を実際に運用した結果の影響については、責任を負いかねます。

3.

目 次 ‑システム WEB を利用した企業情報システムの構築法...・ ・..…………………………… 3 H 菅野崇(古河インフォメーション・テクノロジー株式会社) S A S / l n t r N e tソフトウェア導入のための成功要因……………………………… 1 5 一組織的観点からのアプローチー 樫木晃裕(横浜国立大学) 山登洋行(株式会社 S ASインスティチユートジャパン) SCLプリプロセッサ……………………………………………………………・・・ 25 竹内敏治(株式会社三菱総合研究所) SASを用いた統計解析学習支援システムの構築…...・ ・..…………………… 2 9 H 古隅弘樹(神戸商科大学) SPDSC S c a l a b l eP e r f o r m a n c eD a t aS e r v e r )V 2 . 0 の紹介……………………… 3 9 斎藤宏(株式会社 S ASインスティチュートジャパン) 平田学 西暦 2 0 0 0年対応について………・…...・ ・ ‑ … . . . ・ ・ ‑ … ・ … . . . . ・ ・‑…………… 4 9 H H H 鈴木一彦(株式会社 S ASインスティチユートジャパン) ‑データマイニング アソシエーションルール抽出プログラムの誌作……………...・ ・..…………… 5 5 H 谷岡日出男(株式会社金融エンジニアリング・グループ) 大規模なカテゴリー データのクラスタリング手法……...・ ・..………………… 6 3 E 中林三平(株式会社金融エンジニアリング・グループ) H

4.

‑統計 神経線維腫症 1(NF1)の臨床症状の相互関連に関する研究…………………… 71 鯨俊彦(東京慈恵会医科大学) 浅尾啓子 豊島裕子 清水英佑 新柑員人 大野良之(名古屋大学) 高木虞文(統計数理研究所) 稲葉裕(11慎天堂大学) 削修平(川│崎医療福祉大学) 大塚藤男(筑波大学) SAS/DATAステップによる群逐次計画における……..,・ ・..…………………… 7 7 H 棄却限界値及び必要症例数の算出 宇野一(武田薬晶工業株式会社) 臨床試験における探索的な統計解析…………………………………………… 103 高橋行雄(日本ロシユ株式会社) 多項目×多種検定における多重性の調整……………………………………… 111 1 平田邦広(日本シエーリング株式会社) 4係数ロジスティックモデルのリパラメトリゼイションとその応用……………… 117 肥田英明(塩野義製薬株式会社) 田崎武信 中間解析における α消費関数と検定統計量についての検討………………… 127 本田圭 (塩野義製薬株式会社) :甫狩保則 スペクトルデータの解析における PLS回帰とノンパラメトリック回帰…………… 137 三輪哲久(農業環境技術研究所) 高橋渉(農業研究センター) 二宮正土 VuNguyen‑Cong 川│口裕男(富山農業技術センター) 南山恵 統計関連 T i p sa n dTe c h n i q u e s '… . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 4 9 小野裕亮(株式会社 S ASインスティチユートジャパン) 岸本淳司

5.

‑医薬 医療機関の治験事務局における…..,・ ・ . . … … . . . ・ ・..………………………… 1 6 1 受託臨床試験管理システム作成の試み H H 安藤永一(有限会社電闘システムズ) 古川雅純 ( I B R DJAPAN株式会社) 後 藤 果 志E 盲検下での症例数の再計算のための EMアルゴリズムを用いた……………… 1 7 1 分散推定プログラムについて 鍵村達夫(日本ペーリンガーインゲルハイム株式会社) 出本敏靖 簡易幅票作成システム "SASt oE x c e l 症例一覧表モデル V l . 2 "…………… 181 藤本浩(株式会社電通国際情報サービス) SAS/lntrNetを活用した臨床試験解析報告書作成の試み…………………… 183 矢島勉(持田製薬株式会社) 水留稔 萩野篤司 舟喜光 臨床試験集計解析システム[CL lNCLJの紹介………………………………… 1 9 1 山本典子(有限会社アーム) 臨床試験データ管理におけるデータ出力プログラムの汎用化………………… 197 吉井時秋 ( I B R DJAPAN株式会社) SASPharmaTechnologyProcess . . . . . . . . . 一 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203 ークリニカル・データウェアハウスと SAS/PH‑Clinical ソフトウェアー P e t e rVi l 1e r s(SASI n s t i t u t eI n c . ) LeeEvans 翻 訳 鈴 木 真 弓 ( 株 式 会 社 SASインスティチユートジャパン) ‑金融 ニューロ TAA ‑ . . . . . . . . . . . … ・ ・ … ・ ・ ・ ・ ・ ・ ・ ・ … ・ ・ ・ ・ ・ ・ ・ ・ ・ … ・ ・ ・ ・ ・ ・ ・ ・ ・ … ・ ・ ・ ・ ・ ・ … ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ …. . 2 1 1 小野潔(株式会社二ッセイ基礎研究所) シカゴ穀物相場の季節性と変動要因(ファンダメンタルズ)から……...・ ・..…… 221 穀物相場の因果論的接近を詰みる H 黒川厚(フジフューチャーズ株式会社) 鈴木二郎 関口宗己 吉野清美 琶入恵美 [ [ [

6.

スワップ・レートに基づく金利期間構造とその予測性に関する一考察………… 2 5 1 …・日米両市場における実証分析を通じて…… 宮村幸夫(株式会社金融エンジニアリング・グループ) 債券市場のポラティリティ分析(1)………・・………………………… ・ ・ ‑ … 263 H H 江口敦(東海インターナショナル証券株式会社) 債券市場のポラティリティ分析 ( 1 1 ) …………………………………………… 2 7 1 山田雅章(東海インターナショナル証券株式会社) ‑調査・マーケテインク 無制限複数回答形式のアンケート調査データの入力と処理方法…………… 277 有馬昌宏(神戸商科大学) データベース・マーケティングのカスタマイズ技法……………………………… 285 コンクエスト戦略対応の分析事例 緒方縫文(株式会社工フ・工ム・アイ) 大学生の実演芸術鑑賞構造とその時系列変化………………………………… 2 93 古賀広志(神戸商科大学) 有馬昌宏 杉江淑子(滋賀大学) 名古屋都市圏郊外における土地利用の変化…………………………………… 3 0 3 後藤順久(日本福祉大学) 財務パフォーマンス分析の新しい視点………………………………………・ー 313 ‑ S A S / I N S I G H T及び NNAの効果的活用法として一 陶山!専太(有限会社企業行動デザイン研究所/帝京短期大学) ニューラルネットワークによる……………………...・ ・..……………………… 3 2 1 乳幼児のアトピー性皮膚炎発症予知の検討 H 高橋幸一(森永乳業株式会社) 早j 華宏紀 冨田守 大病院における外来患者増加要因の解析...・ ・..………………………...・ ・ . .3 2 7 H 田久浩志(東邦大学) 定本清美 鈴木荘太郎 IV H

7.

‑その他 PROCTRANSPOSE活用方法に関する一考察………………………………… 333 三島徳雄(産業医科大学) 1年生の目で見直す SASシステム……………………………………………… 3 4 1 ‑ SASシステムのプログラミングは難しい?ー 山橋愛子(有限会社電助システムズ) Windows版 SASシステムと JMPソフトウェアのデータ互換………………・…一 355 佐藤元昭(株式会社 SASインスティチユートジャパン) │ チ ユ ‑ 1 ‑ ‑)7ル 1 ファイナンスにおけるハザード・モデル・・………………...・ ・..………………………・ 363 H 青沼君明(株式会社東京三菱銀行/東京大学) SASによる信頼区間の計算…………………………………………………………… 375 浜田知久馬(東京大学) V

8.

システム

9.

日本 S A Sユーザー会 (SUG I‑J) WEBを利用した企業情報システムの構築法 菅野崇 古河インフォメーション・テクノロジー株式会社 技術部 Howt ob u i l dab u s i n e s si n f o r m a t i o nsystemw i t hWEB TakashiKanno SystemTechnologyDepartment,FITECC o r p . 要旨 SAS/lntrNetソフトウェアと JavaScriptを利用しブラウザ上で SASシステム上の C/Sシステ ムと同等のユーザインターフェースを実現するアプリケーション構築方法を記述する。 Hht ワ キ S A S / l n t r N e t、ノフトウェア、 JAVA、J a v a S c r i p t 1 . はじめに 今日、外部環境が流動的に変化する状況の下、多くの企業では「情報化戦略の立案 Ji 情報系シス テムの強化と有効利用」が大きな関心事になっている。その現れとして「データウェアハウス (DW)の 構築と企業活動への応用」としづ話題は関心の高さの端的な例であるο 本論文で、は、 DW の利用方法について、現在と将来を簡単に検討した後、システム構成法としての クライアント・サーバ型システム (C/S)について、情報のオープン化ツーノレとしての TCO( T o t a ! C o s t so fO w n e r s h i p )を考察した。また、問題の解決方法として i S A S / l n t r N e tソフトウェアの利用」を a v a S c r i p tを用いて C/S、ンステムと同等のユーザインクーフェースを実現するアプリケャー 取り上げ、 J ション構築方法について説明を行弘最後に、上記方法における九、くつかの課題」について言及し、 考察を進めて iSASシステムおよび JAVAでつくる情報系システム」について展望を記す。 2 . 企業における情報化 3‑

10.

各種の規制緩和やボダーレスが進む中、企業の直面する経営環境は従来想像できないほどの変 化に見舞われている。それらは「異業種の市場参入や国際的価格競争」など、によって「企業競争の 激化」として説明が行われている。 従い、「環境の変化を素早く読み取り、意思決定を正しく下す」ことは非常に重要な問題であり、「情 報を有効に活用した経営」は重要なテーマになっている。 いわゆる、情報系システムの重要性の増大と捉えることができるc 情報系システムの使命 企業内における情報活用を促進する ・具体的な事実、情報の裏付けをもって意思決定を支援する 特定の個人スキルに依存する業務を一般化する 一方、マスコミの世界ではキーワードとして「アジャイル」とか「リアルタイム経営」としづ言葉が頻擦に 出現し、これらを具現化する一つの出来事として「データウェアハウス (DW)の構築と経営活動への 適用」としづ話題が多くの企業人の関心を集めている。 3 . データウェアハウス、情報系システムとしての展開 ところで、 D Wとはどのようなシステムを指すのか。 その概要を整理すると、従来から 1昌えられている「情報系のシステム」そのものであることが分かるの デ、ータウェアハウスの目的 基幹系システムの資産を有効利用して新しい価値を生み出す . 創造性、生産性を向上し、競争優位を生み出す これらと共通な活動は古くから知られており • MIS:ManagementI n f o r m a t i o nSystem ・ DSS:DecisionSupportSystem 経営活動に積極的にコンピュータ情報を利用しようとする諸活動で、ある。ではなぜ、今、話題の中心 にあるのか。それは、ハードウェアの性能向上と強力なミドルウェアの出現があってこその話て〉あるが、 D Wシステムのフレームワークが明確であるとしづ点は見逃してはならない点である。 データウェアハウスのフレームワーク J情報編成 目的目 I 時系列情報 一貫性をもった情報定義 読み込み専用情報 これらの環境の整備により、現在、 D' v Vとして、情報系のシステムとして、多くの成功事例を見ること ができるようになったからと考える C 4

11.

4 . データウェアハウスのシステム構成法 O Wの成功事例の多くは、システムのタイプとして C/Sを採用している。これらは非常に負荷の高い、 レガシーなシステムでは不可能と考えられていた処理を、サーバとクライアントで機能を分散し、連 携処理を行うことで、最も、ンステムとしてパフォーマンスが発揮できるように設計、実現することに起 因している。一般的に「大量のデータの分類・集計・数値計算」はサーバ側で、実施し、「アウトフ。ットの 情報表現、ユーザインターフェース機能」はクライアント側で行うように実装している。 これらの手法で「旧来から追求していたビジネスインテリジ、エンスを獲得する、色々なバリエーション の情報システム」を手に入れることが可能となった 今、話題となっている f O a t a M i l l i n gの問題」も、近 O い将来、成功事例として報告されるであろう。 ところで、 O Wも情報系システムの一つで、ある C その使命に立ち戻って考えてみるならば、以下のような二つの側面を検討する必要があるc 特定領域の情報化:高度に専門化された領域の支援 一般的な領域の情報化:情報の共有化、オーフ。ン化としウ領域の支援 C/S型のメリットは「システムの調整によって、その最大の効力を獲得できるようになること」と説明した c しかし、クライアントの調整作業とは、「情報の共有、オープン化」としウ観点で捉えるならば、大きな デメリットとして作用する。 今 、 TCO の問題が徐々に大きな関心事になりつつある。この問題は、一般に、クライアントの管理に 関する費用とし、うことで、認識されるが、前述の問題はほぼ同じ事柄を指している。 これらの考察の下、本節では以下のような課題を提起する。 課題: 今後、直面する課題は fOataMining等の専門家の作業を支援するシステムと情報のオープン化を支 援するシステムの共存の中において、システムの一貫性を保ちながら TCO 等の問題を解決するシ ステム構成方法の確立」である。 次節おいて、本節の課題の回答として fSASシステムと WEBシステムの連携を実現する SAS/lntrNe tソフトウェアの導入」を提案する。また、 C/Sシステムで、手に入れたユーザインターフェースを SAS/I n t r N e tソフトウェアで実現する方法について、事例を交えながら説明を行う。 5 . SAS/lntrNetソフトウェアと JavaScriptで作るシステム、その構築方法 ‑5

12.

まず、 SAS/CONNECTソフトウェアを用いた C/S型と SAS/lntrNetソフトウェアを用いたイントラネット 型のシステム構成の違いを説明する c ( 図 1 ) 区 至 言 日 サーバー クライアント SAS!COトINEC │ィントラネット型 l サーバー クライアント 図 1:ネットワーク環境で、 SASを利用する形態 C/S型はクライアント・サーバ双方に SASシステムがあり、クライアント・サーバ問の通信は SAS/CON が持つ。 NECTソフトウェアで行う。プログyラムは全てクライアントイ l 操作者からの操作があった H 寺、クライアント側の SASシステムは、サーバに実行させるためのフ。ログ P ラムを SAS/CONNECTソフトウェア経由で、サーバ側の SASシステムに送り、実行させる。実行した結 果は SAS/CONNECTソフトウェアを用いてクライアントflI J ! の SASシステムに戻す。クライアント側の S ASシステムは送られた結果を元に画面・ファイルへの出力あるいは印刷などを行う。 イントラネット型はサーバ側にのみ SASシステム(アプリケーションサーバー)があり、クライアント側に はブラウザのみがある。クライアントとサーバの間には WEBサーバがあり、ブローカーとしづ CGI(Co mmon Gate l n t e r f a c e )のプログラムが置かれている。アプリケーションサーバーと WEBサーバは同 ーのマシンでもよいが、プロク、、ラムは全てアプリケーションサーバーが持つ。 処理が要求されてからクライアントに結果が表示されるまでの一連の処理の流れは、ブラウザからの 要求が f ¥ l l EBサーバ→ブローカー」と経由してアプリケーションサーバーに渡される。アプリケーショ ンサーバー上で、処理が実行され、結果はトITML ( I ‑ ly p e J i e x t Markup Language)形式で「ブ、ローカー → WEBサーノ " Jを経由してブ、ラウザへ返され、表示される。 インタラクティブ、な処理を実現するため、ブラウザ上で表示される画面のボタン・入力フィールドとい った GUI(Graphical User l n t e r f a c e )部品はトITMLの FORMを使う c 入力された値のチェックなどの簡単な処理は毎回サーバに実行させると処理が冗長になるので、 J a ‑6‑

13.

v a S c r i p tを用いてブラウザ、上で実行させることにする J 次に具体的な例を挙げてどのように処理させてしてかを手 ) I [ 員を追って説明するr ブラウザからアプリケーションサーバー上のフ。ロクーラムを実行するには次のような URLへアクセスす るc リスト 1 (URL) http://webse工ve工Icgi‑bin/b工oke工 ? se工V 工ce=default& p工og工a r n = f工tec.af.test.s cl&pa工al=hello ここでの webserverは WEBサーバのホスト名あるいは URLである。 brokerは WEBサーバ上のブPローカ』ーで、これにパラメータを与えているω この例では service、̲program、paralがパラメータであるe s e r v i c eとし、うパラメータには実行させたいプログラムのあるアプリケーションサーバーを指定するじ フ守口ーカーは broker .c f gとしウ設定ファイルとs e r v i c eノξラメータで、使用するアフ。リケーションサーバ ーを決定するc ̲programは実行させるプロク ラムの名前である。この例では日 t e cライブラリ上の a fカタログ 内にある t e s tとしづスクリーンコントロール言語で書かれたフ。ログラムを指定している。 e e フ。ロクーラムがパラメータを受け取るにはスクリーンコントロール言語では次のようにする c リスト 2 (スクリーンコントロール言語リスト) 1 ENTRY optional= list 8 ; 2 INIT: ; 3 spa工al = GETNITEMC(list,"pa工al" ) フ守口ーカーから渡されるパラメータは一つの SCLリストにの場合は l i s t )に全て格納されるυ3行目で そのリストから paralパラメータの値を取り出し変数 sparalへ代入している。例えば上の例の URLで h e l l o Jが代入される。 呼び出すと sparalには I 次は出力を説明するc ブ、ローカーから呼び出されたプログラムはファイノレ参照名 I' v VEBOUTJに出力することによってブPラ ウザへデータを返すことができるc し、くつか方法があるが、 { 5 1 ]を三つ挙げる。 例 1:SUBMITを{吏う リスト 3 (スクリーンコントロール言語リスト) 1 CONTROL as工s; 2 SUBMIT; 3 Content‑type:text/htrnl ‑7‑

14.

4 5 くHTML>くHEAD> 6 くTITLE>テストく /TITLE> 7 く /HEAD> B く BODY> く BR> 9 パラメータ pa工a11ま 10 &pa工a1く BR> 11 ですな。 12 く /BODY>く /HTML> 13 ENDSUSMIT; 14 工 c = PREVIEvl('FILE', 'WEBOUT'); 15 工c = PREVIEW('CLEAR'); l行目は SUBM1T内の文字列の改行位置をそのままにするためのものであるc この指定がないと SA Sがし、くつかの改行を不要とみなして取り除いてしまうことがある。 3 ' " ' ‑ '1 2行目がブラウザへ返す HTMLである。 3、4行目はブラウザに返したがデータが HTMLであることを知らせるために必要である。 J O行目のように 1&変数」の形で書かれた部分は対応する変数の値で置きかわるc 14行目でブ、ラウザへ出力しているc この方式の長所は HTMLをそのままに近い形でプログラムソース上におけることである。 ただし文字 1&Jを簡単には書けないとか、一行の長さをあまり長くできないなどの欠点があるじ 全般的にはこの例 lの方法の方が下記の例 2の方法より使いやすい。 :ファイル出力命令を使う 例2 リスト 4 (スクリーンコントロール言語リスト) 1 fid = FOPEN(' WEBOUT', 'A'); 2 工c = FPUT(fid, τContent‑type:text/htm1'); 3 工c = FWRITE(fid); 4 工 c = FWRITE(fid); 5 工c=FPUT(fid, 'く HTML>く HEAD>'); 6 工c = FWRITE(fid); 'TITLE>テストく /TITLE>'); 7 工 c=FPUT(fid, く B 工c = FWRITE(fid); 9 rc = FPUT(fid,く /HEAD>, ); 10 工c = FWRITE(fid); 11 工C ニ FPUT(fid, 'く BODY>'); 12 工 c = FWRITE(fid); 13 工c = FPUT(fid, ソ f ラメータ pa工a1は く BR>'); 14 工c= FWRITE(fid); I 'く BR>'); 15 工 c = FPUT(fid,pa工a1 I 16 工c = FWRITE(fid); 17 工 c=FPUT(fid, 'ですな。, ) ; 18 工c = FWRITE(fid); ‑8‑

15.
[beta]
'</BODY>く /HTML>');

19c = FPUT(fid

20c = FWR
工TE{fid);

21c = FCLOSE{f
工d
);

この例は上記の {
j
J
I1と全く同じ動作をする。

l行目でいiEsOUTを 1
1
;
[
1し、て」し、る,
FPUTで文字をブラケザ ''‑rUjJしているυI川 '
1
¥
I
T
Eを実行するまでは改行されないので長い行を出
力したい時は F
PL
iTを繰り返して最後に円 ¥
'
Rl
TEを実行するc

2
1行目は WEBOUTを「閉じて」し、る。

例 lと逆にこの方法の長所は長い行を出力できる、文字 I&Jを比較的容易に使用できることであるc
欠点はソースが長くなり、見にくくなることである。

︑し

CGIを呼び出す URLは長くなることが多く、文字 I&Jも多用するためこちらの方法の方が使いや寸ー
︑
r

どちらの例もブラウザ上に「パラメータ para1は&paral ですな。」と表示する c (&para1は変数 paral
の値)

リスト 5 はリスト 23 で、説 l~l した内容を組み合わせたもので、あるc

リスト 5 (スクリーンコントロール言語リスト)
1 /安プログラム名目工 tec.af.test.sclJ */
2 ENTRY opt工onal= 1工st 8;

3 IN工T:
4

spa工a1

二

GETN工TEMC( 1工st,"pa工a1" )
;

5
6

CONTROL as工s;

7

SUBMIT;

8 Content‑typ巴 :text/html
9
10 <HTML><HEAD>
11 <T工TLE>テスト </T工TLE>
12/HEAD>
13 <BODY>
14 パラメータ pa工alは
く BR>
15 &pa工a1<BR>
16 ですな。
17 </BODY></HTML>
18

ENDSUBMIT;

19c = PREVIEW(F工LE" ' WEBOUT');
工C
PREVIEW('CLEAR');

20

二

21 RETURN;

9‑

16.
[beta]
このプログFラムを上.記のリスト lの URLで呼び出すーと、 SAS/lntrNetソフトウェアを使った「ブラウザ上
にパラメータで与えた文字列を出力するアプリケーション」として動く。
次はパラメータを URLではなく GUIを使って与える方法の例を示す。
この節の先頭で記したように HTlvlL上で GUIを使うには FORMを使う。
1
)スト 6 (HTML リスト〕

l く!一一
2 このフオームは

3 http://webse工ver/cgi‑bin/b工oke工? se工vice=default& prog工am=fitec.af.test.
scl&paralニ hello
4

とほぼ同等の動作をする

5 一一〉
6
FORMACTION="/cgi‑bin/b工oke工 " METHOD="POST">

7

く

8

く INPUT TYPE="hidden" NAME=" se
工vice" VALUE="default">

9 く INPUT TYPE="hidden" NAME=" program" VALUE="fitec.af.test.scl">
ユO く INPUT TYPE="text" NAME="pa工a1">
11

く

INPUT TYPE="submit" VALUE="実行">

12

く

/FORM>

7行目は FORMの始まりを宣言するとともにサブ、ミッ卜された時に実行する CGIのプログラムを指定し
ている。
8、9行目はす『で、 i
こ決まっているパラメータを記述している。これはブラウザ上には表示されない。
1
0行目はブ、ラウザ上にテキストフィールドを表示しているο ここに与えられた文字列はこの例だと I
p
a
ra1Jパラメータの値となるC
1
1行目はブ ラウザ上にボタンを表示している。このボタンが押されると FORMの内容がサブ ミットされ
る
。
F

P

リスト 6の場合テキストフィールド、が未入力かどうかのチェックはアプリケーションサーバー側でやらな
ければならない。しかし、そのたびにサーパを呼び出したのでは効率が悪い。そこで、 javaScriptを
利用してブラウザ上で、テキストフィーノレドの未入力チェックを行う例を示す
O

リスト 7 (HTMLリスト〕
l くHEAD><TITLE>JavaScriptの例く /TITLE>
2
3

く

SCRIPT language="JavaSc工ipt">

く 1一
一

4

function ck(){

5

if(document.forml.paral.value

6

,
="
"
)
{

document.fo工m1.5ubmit()

7
8
9 ‑‑>

10

く

11

く BODY>

/SCRIPT></HEAD>

12

く FORMACTION="/cgi‑bin/b
工oke
工 " METHOD="POST" NAME="fo
工m1">

13

く

INPUT TYPE="hidden" NAMEニ
" se工V工ce" VALUE="default">

‑10

17.
[beta]
14

く

15

くI
NPUT TYPE="text" NAME="pa工alf
l
>

INPUT TYPE="hidden" NAME=" p工og工am" VALUE="fitec.af.test.sc1">
INPUT TYPE="button" VALUE="実行" onc1ick="ck()">

16

く

17

く /FORM>

18

く/
BODY>

12~17 行自はリスト 5 の 7~12nl二!とほぼ同等であるが、それに加えて 12 行目で FORM 全体に If

orl
l
11
Jとしづ名前を付け、 16行目で、直接サプ、ミットを行わず;こ I
ckOJとしづ JavaScriptのファンクション

を呼び出すボタンにしているc
2行目はそれ以降から </SCl
¥IPT>まで、が javaScriptであるとし、うことを宣言している。

3行目と 9行目は javaScriptに対応していないブラウザのためのものである。
4~8 行目がファンクション I ckOJの記 i
主である。

5行目の I
d
O
C
l
l
l
l
lE
'n
t.
f
o
r
l
l
l
l
.par
a1
.v
a
l
l
lE
'J
は「このページ内の f
o
r
l
l
l
lフォーム内の paral の値」としづ立

味である。
6行目で f
o
r
l
l
l
lフォームをサブデミットしている。

このファンクションによって「テキストフィールド、 para1に値が入っている時のみサブ?ミットする」としづ機
能を実現している c

次は SAS/GRAPHソフトウェアで作成したグラフをブラウザ上に表示する方法を考えるc
S.AS/GRAPHソフトウェアは作成したグタラフを GIF形式ファイルに保存することがで、きるC そのファイ

ルをブ、ラウザ上に l
i
v
l
Gタグで表示すればよいが、今回は一時的なファイルを作成せずに直接ブPラ
ウ
ザ上;こ表示する例である。
リスト 8 (スクリーンコントロール言語リスト)
1 /合プログラム名 Ifitec.af
.graph.sc1J */
2 ENTRY optiona1= 1ist 8;
3 INIT:
4
5

SUBMIT CONTINUE;
goption gsname= webout

6

gsfmode=rep1ace

7

dev=gif

8

gp工o1og='Content‑type: image/g工f
' 'OAOA'x;

9
10

/台以下グラフを書く処理(省略) り

11

12

ENDSUBMIT;

13 RETURN;

4 行目で CONTINUE を指定することによって 5~11 行目を直接 SASì こ実行させているC
5~8 行目は GIF 形式グ、ラフを作るためのオフoションを指定しているc

5行目でグラフの出力先をブラウザにしているc
‑11

18.
[beta]
7行目は作成したグラフを GIF形式で出力することを指定している c
8行目はブラウザに出力データが GIド形式のイメージであることを知らせるために必要である。

このプログラムを HTML上で
リスト 9 (HTMLリスト)
く IMG SRC="http://webse
工V 巴工 /cg
工ー b工n/b
工oke
工?

s巴工 vic巴=default& p工og工am=fitec.a

f
.g工aph.scl">

のように記述して呼び出すと、ブラウザ上にグラフが表示されるつ
上記方法を利用するとサーバ上に一時的なファイルを作成しなくてすむので、重複しないファイル
名やファイルの消去のタイミングpなどを考慮、しなくてすむとしづ利点がある。

実際のアプリケーション上で、はページの一部としてグラフを表示することが多い。このような場合、グ
ラフだけを変更するのにページ全体を再表示するのは非効率的である。そこで、グラフ(あるいはイ
メージ)のみを変更するアプリケーションを JavaScriplを使用して実現する方法を示す c
リスト 10 (HTML リスト)
l くHEAD>
2 く SCRIPT language="JavaSc工工 pt">
3 く!
4

function agif(
){

5

document.工mg.sc工="aaa.giftl

6
7

function bgif(
){

8

document.img.sc工二 "bbb.gif"

9

10 一 一 〉
11 </SCRIPT></HEAD>
12 <BODY>
13 <IMG SRC="aaa.gif" NAMEニ "imgl">
14 <HR>
15 く FORM>
)">
16 <INPUT TYPE="button" VALUE="aaa・9工fの表示" onclick="ag工 f(
17 <INPUT TYPE="button" VALUE="bbb・gifの表示

1
1

oncl工 ck="bgif()">

18 </FORM></BODY>

1
3行目では始めに Iaaa.gifJを表示させている。
4~9 行自は JavaScript で書かれた二つのファンク、ンョンで、 I a
g
i
f
O
Jは 1
3行自のイメージを Iaaa.gifJ

に変更する。 IbgifOJは行目のイメージを Ibbb.gifJに変更する。

1
6、1
7行目でそれぞれ「日以 fOJとIbgifOJを呼び出すボタンを用意している c
これで、ボタンを押すことによってイメージが変更される。
.A

n
F

19.

変更させたしものがイメージではなくグラフならば 5、8行目の GJFファイルをグラフを作成するじ RL に変更すればよい c ここまでで S八S / J n t r N e tソフトウェアと j a v a S c r i p tを利用し、入力、出力、クーラフ出力を行一うアプリケー ションの作成方法について説明した c アプリクーションサーバー上ではスクリーンコントロール言語 や Dt ¥T A .ステッフ。を利用したフ。ログラムが利用で、きるので大抵のバックグラウンドの処理は行える ま C v a S c r i p tで、ある t E度の処理は可能て、ある c これらを組み合わせれば比較的柔 たプラウザ側でも.Ia 軟に動的な WEBシステムが構築可能となるc 6 . 評価と課題 Sf ¥S/lntrNnソフトウェアと J日 刊 S c r i p tを利用して構築したイントラネット型のアフ。リケーションは c/S 型と比較して以下のような利点がある ・ システムのメンテナンス・更新等が容易 全フ。ロク、、ラムがサーバ側に存在するのでソ《ージョンアッフ。のたびにアプリケーションを全クライ アントに配布したりしなくてすむ c ・ ・ クライアントの環境を容易に用意できる クライアント側には対応したブラウザだけがあればよい o ( t h i nc l i e n t ) 他のイントラネットのシステムと統合しやすい。 HTMLがベースなのでリンクを利用して容易に他のシステムを呼び出したり、呼び出されたりで きる c 逆に以下のような問題もある。 • C/S型に比べて GUJのレイアウトを自由に構成できない。 日TML上の FORMや TABLEを使用するしかないので G UJのレイアウトに限界がある0 ・ どんな種類のブラウザでも使える訳ではない J a v a S c r i p tに対応していないブラウザも存在する。また J a v a S c r i p tも進化の激しい言語である。 ブ、ラウザの対応ノくージョンの違いによっても期待する動作とは違うケースが多々ある。 結論として、ある程度ユーザのコンピュータ環境の推定ができる分野、例えば企業イントラネットにお いては、 SAS/lntrNetソフトウェアと J a v a S c r i p tの組み合わせによるシステム憐築は c/Sに負けない ユーザインターフェースを提供し、かつ多くのメリットを提供することができると考えるが、よりオープン になった時は次の方策を検討する必要があると考える その方法については第 7節で説明する。 O 7 . SASシステム +JAVAで作る情報系システムの展望 1 3一

20.

第 6節で挙げた問題などを解決する一つの方法として iSASシステムと jAV . A を使った、ンステム」が 考えられる c jAVAを使う場合のしくみは図 2のようになるc E歪 量 日 │ィントラネット型│ サ lSAS ι サ クライアント クライアント 図 2:SASとJ a v a で、構成するシステム jAVA アプレットを使用する場合はイントラネット型のシステムになり、 jAVA アプリケーションを使用 する場合は C/S型のシステムになる。 双方とも SASシステムのサーバとの通信は専用のクラスを用いる。(米国 SAS社で SAS/lntrNetソフ トウェアの一部として製品化済みである) ここで jAVAアプレットを jAVAアプリケーション、またはその逆にするのは比較的容易である。従い 同時に C/S型とイントラネット型の双方のシステムが開発可能で、ある。 また、 HTMLを使う場合と比べて jAVAアプレットの方が柔軟なレイアウトの GUIを作成可能であり、 C/Sと比較しても何も遜色のないアプリケーションを構築でき、かつ、 HTML のもつ特長を継承する こともできる。 a v a S c r i p tと違ってコンパイルしたものを使うのでプログ、ラムソースの機密性も高い。 また、 j しかし、そのパフォーマンスと、日本語関係の問題は依然完全に解決した訳ではないのしかし、今後、 よ り C/S的な利用方法(インタラクティブ、な処理)が求められている分野においては検討に値する方 法である。 ] ‑ [ 参考文献 萱野真一郎 iSASシステムで構築するイントラウェアハウス」 ソフトパンク株式会社「月刊イントラネット J1997年 5月号'"10月号 ム 噌E ・ A4

21.

日本 S A Sユーザー会 (SUG I‑J) S A S / l n t r N e tソフトウェア導入のための成功要因 一組織的観点からのアプローチー 0樫 木 晃 裕 * 山登洋行料 *横浜国立大学大学院国際開発研究科博士課程 料 株 式 会 社 SASイ ン ス テ イ チ ユ ー トγャ ハ 。 ン コンサルティング部 コンサルティングサービスゲループ 1 S u c c e s s f u lf a c t o r st oi n t r o d u c eS A S / l n t r N e ts o f t w a r e ‑Anapproachfromo r g a n i z a t i o naspects * HiroyukiYamato* * A k i h i r oS a k u r a g i *GraduateschoolofInternationalDevelopmentStudies,YokohamaNationalUniversity * *ConsultingServiceGroup1,ConsultingDepartment,SASInstituteJapanLtd. 要旨 SAS/lntrNetソフトウェアを導入することにより、業務フ。ロセスを効率的、効果的 に変化させることが可能となるが、さらに、成果を上げていくためには、情報システ ムのみならず、組織的な要因にも焦点を当てていく必要があると考える。そこで、本 論文では、具体的な事例を調査・分析することにより、 SAS/lntrNetソフトウェアを 有効活用していくための要因について検討を行う。 キーワード: SAS/lntrNetソ フ ト ウ ェ ア 業 務 効 率 化 情 報 共 有 目的意識の向上 1 .研究の背景 w w w技術の急速な進展の中で、多くの企業組織では、イントラネットの構築を通じ て情報を共有することは、既に一般化されている。そして、これらの情報を有効に利 用することで、多様化する顧客の状況や目的に対応して顧客満足を向上し、さらには 業績目標の達成に繋げていくことが趨勢となってきている。 米国からは、 SAS Institute が提供する SAS/lntrNet を利用することによって、業 務の効率化、意思決定の迅速化を行っているという例が報告されている。たとえば、 Danish Institute of Agricultural Sciencesでは、大量の HTMLファイルを自動生成 することで、情報配信の効率性を飛躍的に高めている。また、 NationalSemiconductor では、意思決定者に対して製造情報をリアルタイムに配信することが可能になり、戦 略的意思決定の質的向上とプロセス変革が達成されている。 咽 Pム にU

22.

2 . 研究の位置づけ SAS/lntrNet を導入することによって、業務フ。ロセスを効率的、効果的に変化させ ることが可能であることは、前述の導入事例からも理解される c そして、さらに SAS/lntrNet を有効に機能させて成果を上げていくためには、情報システムのみなら ず組織的側面からの影響要因にも焦点を当てていくことが必要である。 そこで、本研究では、実際に SAS/lntrNet を導入活用している株式会社デ、ィーシー 5億円、従業員数 1 ,1 5 8名、本社東京都:以下 DCカード)の事例研 カード(資本金 2 究を行う。現在の業務プロセスを調査・分析することで、 SAS/lntrNet のより一層の 有効活用を図り、さらには将来的な業務プロセスへ移行するための要因についての検 討を行う。 従来の業務プロセス i 州将来の業務プロセス i 今回の調査研究 ・成功要因分析 ・導入プロセスモデル 図 1 本研究の位置づけ 3 .研究の目的と意義 本研究の目的としては、大きく 2つをあげることができる c 第 1は 、 DC カードに対して、システム導入時の現状の業務プロセスを調査・分析す ることで、 SAS/lntrNet を、より効果的に活用していくために必要な要因を抽出し、 それを提示することである。そして、そこから得られた要因を概念化・一般化するこ とで、今後、 SAS/lntrNet を導入・利用する企業に対して、効果的に活用していくた めの指針を提供することができると考えられる。 第 2は 、 SAS/lntrNet 導入プロセスのモデルを提示し、 DC カードの事例を通じて定 性的に検討を行う。現在、企業がシステムを導入・利用する際、技術的な視点からの アプローチが中心であり、それを利用する個人の価値観や組織環境からの視点で捉え ることはあまり多くないといえるこそこで、本研究では、顕在的要因である情報シス テムによる効率化と、潜在的要因である情報共有や目的意識の向上といった観点から 構成される複合的モデ ルに基づ、いて、企業体を統合的に捉えることで、より実践的な 研究を志向しているつ 0 ハ 1よ

23.

4 .研究のフレームワーク 4 . 1 成功要因分析 情報システムを導入すれば、即座に成果を得ることができるのではなく、組織環境 面での要因も重要になってくる 3 山 登 (1 9 9 7 ) の研究では、情報系システムを導入す る際には次の 6つの要因が大きく影響を及ぼすことが分かつた。(1)経営トップがシス テム導入の際にイニシアティブをとるなどの「経営トップの役割」、 ( 2 )ユーザのスキ ルや、ンステムに対する認識を向上させるための「教育及びサポート体制」、 ( 3 ) ユーザ の利用度を促進するための何らかの「規則」、 ( 4 )ユーザがシステムを利用して成果に 繋げた際、それを評価に結びつける「評価システム」、 ( 6 )システムを活用していくた 6 )システムを利用する際、負のバ めに有効な組織内の価値観としての「組織風土」、 ( イアスがかかりにくい「組織構造」である。 そして、今回の S A S / I n t r N e t導入に関しでも、同様の組織的要因が影響すると考え られる。そこで、本研究においても、これらの要因を考慮、に入れて調査を行う c 4 . 2 導入プロセスモデル 一般的には、情報システムを導入し、運用可能になった時点で、そのシステムの目 的は達成されたと考えられやすい。しかし、現実には、その後、いかにして成果に結 び付けていくかということが重要であり、本研究では、 S A S / I n t r N e t を導入すること により、「業務の効率化」、「情報共有」、「目的意識の向上」という 3つの効果に繋げて いくべきであると考え、図 2(こ示す導入フコロセスモデ、/レを構築した。 SAS l In t r N e t導入 期待される成果 図2 導入プロセスモデル 17‑

24.

SAS/lntrNet を導入することによって、一般的に考えられる効果は業務の効率化の 推進であるつ具体的には、 ( 1 ) システム導入による「時間の短縮」、 ( 2 ) 多くの組織成 員が必要に応じて、蓄積されているデータ(情報的経営資源)を入手することが可能 3 ) 各自が経営活動において必要な情報に適宜、アク になる「経営資源の有効活用」、 ( セスすることによる「意思決定の質的向上」などから構成される。 次に考えられる効果として、情報共有の推進があげられる。これは、 ( 1 )部内コミュ ニケーション、 ( 2 )部門間コミュニケーション、 ( 3 )外部とのコミュニケーションに大 別できる。共有される情報は、共有される範囲が拡大するに従い、より機能性が増加 するものの、情報管理という点では、考慮すべき点が増大すると考えられる c 最後に、あげられる効果として、組織成員の目的意識の向上がある。具体的には、 ( 1 )組織成員が目標を通じて組織に対して積極的に貢献する「コミットメント」、 ( 2 )組 織成員の仕事や所属組織に対する意識「職務満足」、 ( 3 )製品やサービスを通じて顧客 の目的に貢献することで顧客に喚起される意識「顧客満足」の 3 つの意識を向上する ということである。 以上のように、 SAS/lntrNet を導入することにより、業務の効率化、情報共有、目 的意識の向上という 3つの効果が考えられる。さらに、これらの効果が、有効に進展 することで、次元が変化していくと考えられる。業務の効率化は、単なる時間の短縮 や経営資源の節約だけでなく、業務プロセスそのものに変化を及ぼすことになる(1業 務プロセスの変革J )。また、情報共有が進展することにより、情報ネットワークの構 造が変化し、「コミュニケーション範囲の拡大Jに繋がるコそして、目的意識の向上は 組織成員の仕事、組織や顧客に対する意識の変化だけでなく、仕事を通じての新しい 「価値創造」に影響を及ぼすことになるといえる。なお、これらの要素は相 Eに関連 していることを念頭に置かなければならない。 5 .調査概要 本研究では、 DCカードに対し、 1998年 4月 28 日と 5月 7 日の 2回のヒアリング調 査を行うことにより、成功要因の抽出と、前述した SAS/lntrNet 導入プロセスモデル の検討を行った。第 l回目の調査では、 DCカードシステム部の須原利光氏、株式会社 インテックの高木秀樹氏、山本克巳氏の 3名から実際にシステム構築した現場の意見 を伺った。第 2回目の調査では、 DCカードシステム部の北村勝弘部長、西谷俊明課長、 須原利光氏の 3名から、システム部門の位置づけや今後の方向性などについて伺った。 DC カードでは、業務の性質上、事務処理を円滑に行うために、長年、情報化を進め てきた。以前は、営業などユーザ部門のニーズは比較的定型的で、あったが、経営環境 の変化にともない、ニーズ、は多様化してきた。それに対応するため、 4~5 年前から、 超並列処理機を中心として情報システムを再編し、 SAS、表計算ソフトなどを利用して、 ユーザ自らデータを利用できる環境を整備してきた。だが、現在においては、ニーズ ' Eム o o

25.

が更に多様化してきたため、 1 9 9 7年 4月に D Cネットという企業ネットワークシステ ムを整備するに至ったのである。 C カードの企業特性として、グ、/レーフ。企業としてのフランチャイジー ( F C ) また、 D の存在があげられる。 F C各社は、地域に密着し、個人を対象とすることが多く、また、 C 各社のニーズを満たすことが困難 規模も多様なため、画一的な情報を提供しても、 F C を含めた、一層の情報化を進めるために、イントラネットを構 で、あった。そこで、 F 築することとなり、その中で、 SAS/IntrNet を一つのツーノレとして利用することとな ったのである 3 当初の目的の 1っとしては、 3 0 数社の F C に対して、イントラネットを通じて情報 提供を行うことがあげられた。その理由としては、 F C の経営者に対し、経営の指針と なる情報を提供する必要があったからである。だが、外部に対し、イントラネットの 仕組みを構築するには当初リスクがあったため、テストの意味を含めて、社内におい て、コーポレートカードに関するシステムを試作的に構築することとなった。 このシステムでは、今まで紙ベースで行われていた業務を、イントラネット上で共 有することになり、大幅な省力化が期待されている。従来は、顧客である企業に関す る情報を毎日、印刷して関係部署に配布していたので、あるが、新システムに移行後は、 ユーザが必要な時に必要な情報を入手することが可能となるのである。 そして、このシステムを構築したことから、システム部門としては、 SAS/IntrNet に対する技術的な確認を行うことができたので、今後は、 F C 向けや営業部門をはじめ とする各部門に対する、より高度な情報提供を行う方向に向かっている。 6 . 成功要因の分析 先述した情報系システム有効活用の影響要因を考慮した上で、今回行った調査で、は、 D C カードが効果的に情報化を進めていく中で、影響を及ぼしている要因として、経営 トップの役割、システム部門の役割、ユーザ部門の意識、そして、各部門聞のコミュ ニケーションという 4つを抽出することができた。 │経営 M の役割 / l ¥、 ユーザ部門の意識い ー│システム部門の役割 図 3 導入時における成功要因 i EA 唱 円ud

26.

6 . 1経営トップの役割 D Cカードでは、情報システムが企業の基盤となっているため、組織成員の情報シス テムに対しての関心が高いわけであるが、とりわけ、経営トップの情報システムに対 する意識が高いことが、システムを有効活用していくための第 1の要因としてあげら れる c システム部門の提案内容が検討途中であっても、常務会(役員説明会)討議に 付議することができ、役員説明会では即座にその議案について協議が行われ、意思決 定が下されるという。このように経営トップが高い関心を持ち、イニシアティブをと っていくことは、システム部門にとっては、高い成果が期待されるという厳しい面も あるが、企業の情報化を円滑に進めるためには重要な要因になってくるといえる c 6 . 2システム部門の役割 経営トップの理解を背景として、システム部門では、「実際に動くシステムを作って 試してみる」という考え方が定着している。情報技術、ユーザニーズが共に多様化し た現在、失敗を恐れて、システム構築の計画に時間をかけすぎるよりも、実際にシス テムを構築してトライアル・アンド・エラーを繰り返し、そのような中で、ユーザの アイデアを汲み取りながら、納得のいくシステムを作り上げていくということの方が、 結果として、効率的なのである。今回のコーポレートカードに関するシステムも、干 のような価値観を基にして、作られていったといえよう。 6 . 3ユーザ部門の意識 一般的に、企業内で情報共有を進めてし、く場合、部門間でコンフリク卜が発生し、 部門内で情報をクローズしてしまうなどの理由から、情報の共有化が進まない場合が 多いさ D Cカードの場合は、これとは逆に、情報開示には抵抗がなく、各部門から情報 を共有したいという要求が強く出されてくるという。このような背景には、長年培っ てきたオープンな組織風土が重要な役割を果たしていると考えられ、このようなユー ザ部門の高い意識は、情報システムを有効活用していくために欠かせない要因である といえる 3 6. 4 相 Eコミュニケーション ユーザ部門、システム部門それぞれの意識の高さに加え、積極的に相互コミュニケ ーションをとっていることが注目に値する。システム部門は、ユーザの抽象的なニー ズを吸い上げ、システム化していくという姿勢を持っており、営業や F Cを交えた情報 交換会を設けたり、教育やヘルプデ、スクの設置などに重点を置いている。これらが直 接的な効果に繋がることは多くないのであるが、意思疎通を図り、相互の認識のギャ ップを埋めていくという意味で、このようなコミュニケーションは極めて重要である といえよう。 nノu n u

27.

7 .導入プロセスモデルの整合性 ここでは、ヒアリング調査に基づく定性的分析で、本論文で提示した SAS/IntrNet 導入プロセスモデ、ルの整合性について、業務の効率化、情報共有、目的意識の向上と し、う観点から検討を行う c 7 . 1 業務の効率化 業務の効率化については、今回のシステム導入において、最も効果が期待される分 野であり、以下の結果が確認された。システム導入によって汎用性の高い情報の共有 量を拡大し、各人が必要に応じて情報にアクセスすることは情報的経営資源を有効活 用することになり、時間的な短縮が可能になる c DC カードではコーポレートカードに関する情報を、従来、紙に印刷して関係部署に 配布していたものを、 SAS/IntrNet によるシステムに移行することにより、資料を作 成する作業が省力化されることにより、作業時聞が短縮されることになる。また、社 内システムを利用できる者なら、このシステムに直接関係なくても、データにアクセ スすることが可能になり、情報的経営資源の利用度は増大するごまた、意思決定の面 では、今まで、紙ベースであったため、定型的になりやすかったものが、利用者のニ ーズに合わせて、情報を入手することが可能になり、結果として、意思決定の質の向 上に繋がると考えられる。 このように、業務の効率化において、時間の短縮、経営資源の有効活用、意思決定 の質的向上を達成していくことにより、将来的には、営業部門などにおいて、組織レ ベルで、の業務プロセスそのものの変革が喚起されていくといえるご 7 . 2 情報共有 今回のシステム導入において、情報共有の推進も多くの効果が期待される分野であ り、以下の結果が確認された F Cに対する情報開示は、今回のシステム導入の主要目 的であるこつまり、外部とのコミュニケーション拡充が重要な課題なのである。だが、 情報共有される範囲が広いということは、どのような情報を開示し、また、どうのよ うな情報を開示してはいけないのかという企業の判断が必要となり、情報管理という 観点から運用面、技術面において、考慮、すべき点が多く存在すると考えられる c そこ で、今回は、コーポレートカードに関するシステムを導入することによって、まず、 社内において、情報共有の仕組みをつくることとなったのであるこ 部門内コミュニケーションに関しては、システム導入により、部門内で必要な情報 を共有するノウハウが蓄積され、必要な情報を共有することが可能となる。また、部 門間コミュニケーションに関しては、従来から部門を超えたニーズがあり、システム 導入により、部門問の情報共有のレベノレが向上していくと考えられる。 以上のように、部門内コミュニケーション、部門間コミュニケーション、外部との 4hA nL

28.

コミュニケーションという 3つの視点から情報共有を推進していくことにより、コミ ュニケーションの範囲の拡大が喚起されてし、く。特に、 F C との情報共有を進めていく ことにより、 D C カードと各 F C との関係が密接となり、情報交換が活発化していくこ とが期待できる。 7 . 3 目的意識の向上 SAS/lntrNet を導入することにより、業務の効率化、情報共有を進めていく重要性 が確認できたが、本研究においては、組織成員の目的意識の向上という観点にも注目 したい。情報システムを導入する際、このような視点からのアプローチは多くないと いえる。また、情報システムとこれらの潜在的要因を統合していくことは非常に困難 であるが、企業が目的を達成し、期待する成果を得るためには、重要な概念、になると 考える。ここでは、目的意識として、コミットメント、職務満足、顧客満足の 3点に 注目する。 まず、コミットメントに関しては、顧客に関する情報に適宜、アクセスすることが C 可能になることで、仕事に対する取り組み意識や行動の変化を引き起こす。例えば、 D カードの場合では、企業環境が変化し、新規顧客の獲得から、既存顧客の退会を回避 することに重点をシフトする必要があるが、そのような環境変化に対応したシステム を構築していくことにより、ユーザ各人の企業環境に対する認識に変化がもたらされ ることになる。そして、積極的に環境適合に基づいた行動を選択することで、各人の 達成動機が喚起・継続され、(1)仕事そのものに対するコミットメント、 ( 2 )所属組織 に対するコミットメント、が大きな変化を起こすのである。 次に、職務満足について考察する。ニーズの高い情報を部門内や部門聞において共 有していくことで、組織における一体感が喚起される。さらに、仕事に対するフィー ドパック体制が確立することで、各人の仕事の満足度が向上する。つまり、情報共有 が進展することによって、組織の中での自分自身の位置づけや貢献度が、次第に明ら かになるといえ、自分自身が仕事の成果をコントロールできると意識する、いわゆる 「自己効力 ( s e l f ‑ e f f i c a c y ) J( B a n d u r a,1 9 7 7 ) に作用し、行動を規定する。 最後に、最も重要な課題として、顧客満足について言及する。システム導入により、 各人は必要な情報を的確に入手できることにより、顧客に対し、的確な情報を提供す ることで、顧客の意思決定に貢献することが可能となる。そして、結果として、顧客 の目的達成を通じて、顧客満足を高めていくことができるといえる。ただし、顧客の 目的を達成する主体はあくまでも顧客自身であり、情報を提供する側の役割や限界を 超えてしまうことは回避しなければならない。 そして、このように各人のコミットメントや職務満足、顧客満足に対する認識が高 まっていくことにより、各人の仕事、組織、顧客に対する認識やアイディアが相互作 用し、新たな価値を倉リ造することに繋がっていくであろう。 つ ヮu

29.

8 . まとめ 本研究では、 DC カードの事例を通じて、 SAS/IntrNet を有効活用するための要因を 分析してきた。 D Cカードが SAS/IntrNetを導入してから、時間がそれほど経過してい ないため、具体的な成果が出てくるのは先のこととなるが、導入フ。ロセスを分析した ことで、導入時における影響要因を抽出できたことは意義があったといえる。また、 今後、 SAS/IntrNet を更に活用していく中で、導入プロセスモデルにおいて提示した 効果を考慮に入れながら展開していくことの重要性が明らかになった。特に、顕在的 な業務の効率化だけでなく、潜在的な効果の情報共有や目的意識の向上について考慮 していくことが、より高い成果に結びついていくことを強調したい。 9 . 今後の展望 今回の研究では、ヒアリング調査に基づく定性的な分析を行ったが、 SAS/IntrNet を有効活用していくための要因を深く分析していくためには、アンケート調査などの 定量的分析を行って、本研究との理論的統合による精轍化を進める必要があると考え る。また、数ヵ月後、数年後と時系列的に分析していくことも必要となるであろう。 なお、ここでは、 SAS/IntrNet を有効活用するためのフレームワークとして、経営行 動モデルを提示する。 B:組織特性 │情報システムト+一...., A :システム特性 l 成 果 ト → │ 満 足 ト ー │ モ ラ ー ル 向 上 卜 →j 期待される成果 : 能力×モティベーション C :個人特性 図 4 経営行動モデル このモデ、ルで、は、組織的特性と組織成員の個人的特性という要因の影響が仮定され るc ここでは、 3つの分析次元からの検討を必要とする。第 1は、「情報システム特性」 次元である。これは、導入した情報システムがどのような特性を有するのかという視 点からのアプローチである。第 2は、「組織環境特性」次元である。導入されたシステ ムの運用において、どのような組織環境の特性を有するのかという視点からのアプロ ーチであり、組織風土の概念を援用する c 第 3は、「個人特性」次元である。これは、 導入されたシステムを有効に機能させるために、「個人の成果」という視点からアプロ ーチし、個人特性としてモティベーションの概念を援用する。 n ノ qu

30.

このモデルは、第 1に、将来的に期待される成果に対してそれぞれの独立変数がど のように影響しているか、第 2に、独立変数相互の関係がどのような構造にあるのか を、分析・検討することを特徴としている。 独立変数は、システム特性、組織特性、個人特性の 3つである。独立変数は、それ ぞれに下位の構成概念を持ち、この構成概念を操作化することで、分析のための調査 票を設計することが可能になる。個人特性は、本来、能力×モティベーションの乗法 的変数であると考えられるが、個人の能力を操作化することは多くの困難をともなう ために、より慎重な検討が必要である。 この経営行動モデルを検討することによって、組織環境という広い視点から、今後、 S A S / I n t r N e t活用の際における要因を深く解明し、各要因の関連性などを明らかにし ていきたい c 謝辞 本研究を進めるにあたって多くの方々のご指導、ご協力を仰し、だc 特に調査に快く 応じていただいた株式会社デ、イーシーカードの北村勝弘氏、西谷俊明氏、須原利光氏、 株式会社インテックの高木秀樹氏、山本克巳氏には、この場をお借りして厚くお礼を 申し上げたい c 参考文献 [ l J B a n d u r a,A . :" S e l f ‑ e f f i c a c yT o w a r daU n i f y i n gT h e o r yo fB e h a v i o rC h a n g eぺ ~Psychological R e v i e w j ,8 4,p p 1 9 1 ‑ 2 1 5 ( 1 9 7 7 ) .H .S t r i n g e r,R .A .Jr . [ 2 JL it w i n,G 二 ~Motivation a n do r g a n i z a t i o n a lc l i m a t e j, H a r v a r dG r a d u a t eS c h o o lo fB u s i n e s sA d m i n i s t r a t i o n ( 1 9 6 8 ) 9 7 8 ) [ 3 J野中郁次郎他: ~組織現象の理論と測定j ,千倉書房(1 9 8 5 ) [ 4 J坂 下 明 宣 : ~組織行動研究L 白桃書房( 1 [ 5 J樫 木 晃 裕 : ~ワーク・モティベーションにおける自己効力の有効性研究 j ,産能大 学大学院経営情報学研究科修士論文(1 9 9 7 ) [ 6 JS A SI n s t i t u t eI n c . :" T h eI m p a c to fW e bT e c h n o l o g yo nE n t e r p r i s eD e c i s i o n S u p p o r t Systems ぺ ~A S A SI n s t i t u t eW h i t ePaped ,S A SI n s t i t u t eI n c .( 1 9 9 8 ) [ 7 J S A SI n s t i t u t eI n c .:" S e r v i n gu pS A Sa p p l i c a t i o n so nt h eW o r l d¥ Vi d eWebぺ ~SAS c o m m u n i c a t i o n s j ,3 Q,p p 4 ‑ 7,S A SI n s t i t u t eI n c .( 19 9 7 ) [引佐藤修他: ~エンド、ユーザコンヒ。ューティングj ,日科技連 ( 1 9 9 6 ) . H . : ~Organizational P s y c h o l o g y ( 3 r de d i t i o n ) j ,P r e n t i c e ‑ H a l l( 1 9 8 0 ) [ 9 J S c h e i n,E 9 9 6 ) [ 1 0 J田尾雅夫他: ~コンヒ。ュータ化の経営管理j ,白桃書房(1 [ l l J V r o o m,V .H . : ~Work a n dM o t i v a t i o n j ,J o h nWiley&Sons I n c .( 19 6 4 ) [ 1 2 J山 登 洋 行 : ~新情報システム導入・活用における影響要因の探究j ,産能大学大学 院経営情報学研究科修士論文(1 9 9 7 ) A性 nノμ

31.

日本 S A Sユーザー会 (SUG I‑J) SCLフリフロセッサ 竹内敬治 社会情報システム部 株式会社三菱総合研究所 SCLP r e ‑ p r o c e s s o r K e i j iTa k e u c h i S o c i a lI n f o r m a t i o nD e p t . n c . M i t s u b i s h iResearchI n s t i t u t e,I 要旨 本論文では、 SCL (スクリーンコントローノレ言語)で開発した SCLプリプロセッサを題材 として、 SCLの機能の一端を紹介する。 キーワード: SAS/AFソフトウェア、 SCL 1 はじめに SCL (スクリーンコントローノレ言語)は、非常に豊富な機能をもっているが、 SAS/AF ソ フトウェアの一部として提供されていることもあって、必ずしも正当に評価されていない。 本論文は、 SCLで開発した SCLプリプロセッサを題材として、 SCL機能の一端を紹介する。 2 SCLの歴史 SCL言語は SASシステムパージョン 5において画面制御用の言語として開発された。当 時はサブミットする DATAステップや PROCステップへ受け渡すノ 4ラメタの表示・入力やサ ブミット制御用の言語であった。 しかし、パージョン 6では大幅な機能拡張が続いている。パージョン 5では、画面定義と SCLプログラムが一体であったが、パージョン 6では SCLエントリとして切り離され、つい でイベントドリブン型のアプリケーション開発が可能となり、最近のリリースではオブジェ クト指向言語としての体裁を整えた。 phu n4

32.

現リリースでは、画面表示とはまったく関係しない一般的なオブジェクトの作成も可能と o n t r o lL a n g u a g eーの名称は、かつての SASの 正 式 名 称 ‑S t a t i s t i c a l なっており、 SCL‑ScreenC An a l y s i sS y s t e mーと同様に、その意味を失いつつある。 3 SCL利用のメリット SASシステムの DATAステップ +PROCステップの構造は、データ処理や統計解析でのス テップパイステップのプログラムには良く合うが、複雑なデータ構造を扱うのは苦手である。 、 PL l Iに似た言語構造を持ち、より汎用的なプログラムを記述すること それに対して SCLは ができる。リスト構造が用意されていることもあって、複雑なデータ構造を扱う処理も得意 である。 DATAステップで記述した方が適切な処理が途中に介在する場合には、 DATAステ ップを SCLから簡単にサブミットできる。 SCLと DATAステップを組み合わせて利用する ことができる点も、 SCLの特長である。 SCLを利用する今ひとつのメリットは、オブジェクト指向プログラミングが可能であるこ とである。適切にクラス定義を行うことで、構造が明確でメンテナンスしやすいプログラム を書くことができる。 一般的なオブジェクト指向言語として SCL を使用する場合には、非表示オブジェクトを 定義する。 BUILDプロシジャで CLASSを作成するときに、親クラスを SASHELP.FSP.OBJECT として、メソッド及びインスタンス変数を定義していく。 SCLのクラスが主にウィジェット であるため、画面上で設定していく形式になっているが、非表示オブジェクトの場合にも画 面上で設定しなければならないのは煩雑である。 メタクラスを利用して、 SCLプログラムの中でクラス定義することもできるが、その場合 には、動的な定義とになる。 ともあれ、 SCLを、アプリケーション画面作成のためだけに使用するのは宝の持ち腐れで あるとは言える。 4 SCLプリプロセッサ SCLでプログラムを開発する場合、 SCLデ、パッガはあるものの、実行環境でも機能するデ バッグライトを書き込んでおくと開発効率が向上する。これを自動化するのが SCLプリプロ セッサである。 SCL自身で開発された SCLプリプロセッサは様々な機能が実装でき、とても 便利である。ここではその機能の一端を紹介する。 4 . 1 定型処理自動書き込み 例えば、 SCLリストを操作する関数 g e 佃i t e m n( li s t ,k e y )等を使用するときには、 k e y という名前の要素が l i s t内にないと異常終了してしまうので、 i fnameditem( li s t, k e y ) = Ot h e n (エラー処理) という行を自動的に追加することで、異常終了を回避できる。 b ハ η4

33.

4 . 2行 番 号 出 力 ログに実行中の行番号を表示したり、エラーメッセージ中に自動的に行番号を追 加することができる。行番号をカウントするための変数を作っておき、その値を挿 l i n e 再等の特定文字列を、行番号に置き換えるような処理も簡 入するだけである。 # 単である。 実行中の行番号の表示は、大量の出力を伴うので、マクロ変数によってその出力 を制御する必要がある。 i fsymgetc("DBG ̲L別 E")="Y"t h e nc a l ls e n d ( ̲ ̲ S E L F ‑ 'W R lTELOG',行番号); のような行をすべての実行行の後ろに自動的に挿入できる。 コメント行や、複数にわたる命令文の処理は必要である。 I 実行行の後ろ」と書 いたのは、セミコロンをトリガーにできるからである。 4 . 3変 数 値 i f "などで始まっていない行は、代入行と解釈でき、 s c a n 行中に、"="が含まれ、 " 関数で変数名を取得して、 i f s 戸n getc("DBG̲ VAR")="Y"t h e nc a l ls e n d ( ̲ ̲ S E L F , ̲IWRl TELOG", l a b c = " l l a b c ) のような行を挿入して、マクロ変数を Y にしたときのみ変数値を出力させること ができる。 SCLプログラム実行前に、マクロ変数の値を変更することで、ログ、出力を制御す ることができるが、プログラム中にエラー処理ルーチンでマクロ変数値を変更する ようにしておけば、エラーを検出した時点から詳細なログ出力を開始することもで きる。 4.4リターンコードチェック SCL 関数で、リターンコードが通常はゼロになるものは、 c l o s e Oなど数多い。こ れらの関数を使用する場合に、リターンコードを格納する変数名を統一しておけば、 自動的にリターンコードをチェックして異常の場合にエラー処理させることができ る 。 例えば、 z e r o = c l o s e ( d s i d ) ; のようにコーデイングしておき、 i f z e r o ^ = Ot h e nc a l ls e n d ( ̲ ̲ S E L F ‑,エラー処理); などの行を挿入する。 4 . 5ラベル出力 メソッドの開始・終了毎に、メッセージを出力するようにしておけばメソッドの 実行状況をトレースできる。 内 ︐ ー ワG

34.

m e t h o d、e n 伽l e 出o dキーワード、があったときにメッセージ出力命令を挿入すればよ し 、 。 i fs y m g e t c ( " D B G ̲ L B L " ) = " Y "t h e nc a I ls e n d ( ̲ S E L F ‑ ‑ > " W R I T E L O G ぺa b c l l "を開始しま す) 4 . 6実行環境によって処理を変える あるメソッドが、オブジェクトのメソッドとして実行される場合と、単なるサブ ルーチンとして実行される場合とで、処理を変えたい場合がある。 SELF変数の値 をチェックする命令を加えればよい。 i f SELF=.出e n サブルーチン処理 e l s e メソッド処理 4 . 7サブ、ミットブ、ロックの除外 SCLプログラムに一律に上記のような処理を追加すると、サブミットブロック内 の DATAステップが動かなくなるので、 s u b m i tと e n d s u b m i tとの間では挿入処理を行 わない。 5 SCLプリプロセッサの実装 SCLエントリを SCLプログラムで SOURCEエントリのようにオープンすると、 SCLエン トリの頭にある制御用コードが邪魔になり、うまくない。そこで、外部ファイノレに‑J3..保存 CLエントリをオープンし して、処理を行い、できあがったソースプログラムを、実行用の S て読み込み、コンパイノレ、保存する処理をマクロ化する。テスト用プログラムを自動的に実 行するようにするのも簡単である。ソースプログラムのパージョン管理機能も簡単に追加で きる。 プリプロセッサから出力されたプログラムは、オリジナノレプログラムの数倍の行数となっ ている。 S CLの仕様上の制約で、あまり大きなプログラムはコンパイノレできないので、適当 にエントリを分割していく必要がある。 プリプロセッサで大きく膨らんだ S CLプログラムであるが、実行速度の低下は問題にな らないほど小さい。一般的にはファイノレ1/ 0の時聞が支配的だからである。 6 終わりに SCLは非常に機能が豊富な言語であるが、あまり知られていないように思われる。本論文 は 、 S CLの機能の一端を、プリプロセッサを題材として紹介したものである。 SCL言語に対 する理解を深めていただければ幸いである。 00 9

35.

日本 S A Sユーザー会 (SUG 1‑J) SASを用いた統計解析学習支援システムの構築 古隅弘樹 経営学研究科経営情報科学専攻博士後期課程 神戸商科大学 A ComputerAssistedLearningSystemf o rS t a t i s t i c a lAnalysesbyUsingSAS ト ‑ ji r o k iFuruzumi GraduateSchoolofBusinessAdministration KobeU n i v e r s i t yofCommerce 要旨 SAS を用いて統計解析の学習を支援するシステムを構築した.本システムは学内ネットワーク ( E t h e r n e t LAN)での利用を想定しており.wwwにおける CGIの技術を用いたプログラミングによっ てインタラクティブなやり取りを学習者と行える仕組みになっている.統計解析における計算部分に は SAS を用いており,将来的には計算結果の解釈や学習過程での進捗管理などに対する知的な 支援も考えている. hhi ワ キ 学習支援 統計解析 CAL CGI LAN WWW 1.まえがき マルチメディア,ネットワークとし、った新技術の進展によって,多様な教育の在り方,形態,方法が 研究・検討されている.これらの技術の進展による学習環境の変化は無視で、きなくなってきており, それらに対する対応が求められている. 著者は,ネットワーク環境における学習支援システムの構築としづ研究テーマの中で、統計解析学習 に対する適用を修士論文研究で、行った.今回の発表は,システムの主軸となる計算部分で SAS を 用いて実装を試みたことに関するものである. 2 . 現状 一般に SAS などの統計解析ノ《ッケージは,その価格的な問題などから個人的に所有していること は稀である.それ故に,それを使用できる環境は制限され,閉じたものとなっているのが現状である. 実際に神戸商大における計算機システムは基本的に 2 4 時間稼働しているものの,それらを利用で ー 2 9

36.

きる端末室や演習室の利用可能な時間帯はかなり制限されている.このことから学生が計算機を使 いたいときに使えなし立しづ問題もあり,このことによって SASシステムの利用に関してもかなり制限さ れているのが現状である. 3 . システムの要件と設計 本システムはこのような時間的・場所的な制約を解消するために, WWW上で構築を行った. w ww 上で禾リ用で、きるアプリケーションを作成することによって,次のようなメリットが考えられる. ・移植性が高く,幅広いフ ラットフォームで、導入可能. ・ユーザ側の機種依存性が低い. o • wwwが利用可能な環境ならどこからでもアクセス可能. また,現段階では学内 LAN からのアクセスによる利用のみを想定した実装であるものの,将来的 に公開することができれば, WWW を利用可能な環境が整っていれば,自宅や旅行先とし、った学外 からの利用も可能になる.また,計算に使用する統計解析パッケージの使い方を知らなくても, Web ページ上での簡単な操作で統計解析を実行できるようなインターフェイスの実装が必要であるといえ る.さらに, SASによる計算結果を表示するだけでなく,その結果に対する解釈 lも日本語で表示する ことができれば, SAS の使い方が分からない人にも,分析結果の読み方が分からない人にも学習支 援が可能である.これを実現するためには,統計解析に関する知識を蓄えたデータベースもしくは 知識ベースの構築が必要となってくる. このシステムは w wwから SASを利用することになるため, WWWサーバプログラムと SASシステ ム聞でインタラクティブ、なやりとりを行い,ダイナミックにその計算結果を得ることが必要となる.このこ とを実現するためには次の 2つの実装方法があるとし、える. lつ目は SASプロダクトの lつである S A S / l n t r N e tソフトウェアを使用して, CGI(CommonGateway I n t e r f a c e )フ。ログラムからアフ。リケーションブローカを通じて SAS アプリケーションサーバで実行する 方法である(松井, 1 9 9 7 [ 2 J ) .2つ自の方法も CGIを使う方法であるが, CGIで解析実行用の SASプ ログラムを生成し,リモートパッチによる実行結果をサーバ間で、やりとりする方法で、ある. なお, SASシステムがインストールされている計算用の WSサーバでは w wwサーバプログ、ラムで、 ある HTTPDが稼働していないため, W W Wサーノくとなるマシンを独自に立ち上げる必要がある.ど ちらの方法を取っても Web上で、夕、、イナミックに SASシステムを活用できるが,前者に関してはシステ ム管理上の問題で、実験することがで、きなかったため,今回は後者の方法による実装を行った. これらのことから本システムの概観を図 l に示す.また, CGI プログ、ラムが本システムの構築にお いて最も重要な部分である.その具体的な役割は図 2に示すように,内部処理のほぼ全体を担って . 1節において述べている. いる.CGIプログ、ラムの処理内容の詳細は, 4 学習の進める際に重要な役割を果たす機能の lっとしてヘルプ機能が上げられる.とりわ け重要な用語に関してはヘルプ機能の充実が学習の進捗に具合に大きく影響するものと考え l 原データが固有に持っている知識のサポートは困難であるが,それをサポートしないならば,各種統 計量やデータに付随する形式的情報から,半自動的に適切な処理を施すことは可能である.(南・水田, 1 9 9 2 [ 1 ] ) ηd n u

37.

ることができる.このことはI‑ITMし文書中に出現した重要用語に対するへ/レプページへの ノ、イパーリンクによって実現可能である. 4 . システムの実装について 本システムを構築したサーバのフ。ラットフォームは UNIXで,表 lに詳細を示す.ユーザに対して 提示する分析結果のレポートを作成する際に,各統計量の値の計算を SASシステムトを使用して行 っている. 表 1システムの環境 S o l a r i s 2 . x SPARC NCSA‑1 .5 . 2 a Perl5 SAS6 . 1 2 Prolog Ethernet(10BASE5) OS CPUtype HTIPD CGIs c r i p t 統計解析パッケージ 知識記述言語 ネットワーク 図 3 に示すようなサーノく/クライアント型の構成をとっている.計算用サーバは富士通 S‑4/1000E で,その上で、統計解析ノミッケージ( S A S )が稼働している . wwwサーバは SunSPARCstationIPXで , その上で w wwサーバプログラムであるI‑!i寸 PD,CGIの記述・実行のための Perlが実装されてい る.クライアントである X 端末やドC では, W W Wブラウザが使用可能である.これらのサーバとクラ イアントは学内 L A N ( E t h e r n e t )で、接続されている.ユーザは,学内であれば LANに接続している PC や X端末が設置してある各端末室,演習室などから接続が可能である. 4 .1 . CGIプログラムによる処理の流れ 本システムにおける CGIプログラムの役害I 1を図 2で示したが,各々の処理内容および、その順序に ついては次のようになってしも. 1.ユーザからの入力情報の受け取り ユーザ側(ブ、ラウザソフト)から発行されたフォーム情報を wwwサーバプログラムから標準入 力として受け取る. 2 .フォームデータの変数への取り込みとアッブロードデータのファイルへの保存 ユーザ側からの入力情報は MIME のマルチノミー卜によってエンコードするようにしているの で,これのデコードを行ない,変数への取り込みおよびユーザからアッブロード、された統計デ、 ータを w wwサーバのファイル、ンステムに保存する. 3 .アッブロードデータに関する前処理 ユーザの使用環境によって日本語の漢字コードが異なってくるため,日本語コードの検出と 変換を行なう必要がある.今回利用する SASシステムが対応している日本語コードは EUC であることから,本システムで使用する漢字コードはすべて EUCに統一してある.また,ユー ザがアッブロード、可能な統計データのファイルタイプは,現在テキストファイノレの CSV(コンマ ‑31一

38.

区切り),タブ区切り,空白区切りの 3種類である.統計パッケージの実行プログ、ラムの方で、は CSV形式のファイルを読み込む設定にしているため, CSV以外の形式のファイルを CSV形 式に変換して保存しなおす. 4 .統計解析の対象となるデータファイル肉の変数情報の検出 A Sデータセットの作成 アッブロードデータから変数名,データ型,レコード数などを検出し, S に必要な情報を得る. 5 . SAS実行用のソースコードの生成 ユーザからの入力情報や変数情報から,統計解析手法にあわせて, S A Sシステムの実行に 必要なソースコードを生成しファイルに保存する. 6 .計算用サーバへの転送 分析に使用する S A Sシステム実行用ソースコードと統計データを, T C P / I Pを用いて計算用 サーノ〈へ転送する. 7 . SASのリモートでの実行制御 T C P / I P経由で S A Sシステムをリモートパッチにより実行し,処理結果をファイノレに取り込む. 使用した統計データは,再利用を可能にするために,パーマネントなデータセットとして各ユ ーザごとに用意したディレクトリに保存する. 8 .計算結果の転送 S A Sシステムによる計算結果であるリストファイルおよび、グラフの保存された画像ファイルを T C P / I Pを用いて wwwサーバへ転送する. 9 .計算結果の取り込み S A Sシステムによる計算結果から必要な情報を取り出し,変数として取り込む. 1 0 .知識ベースに対する問い合わせの実行 知識ベースに対する質問事項を作成し,問い合わせを行ない,その結果を変数として取り込 む. 1 1 .H TML文書の作成と 1 )ダイレクション これまで、の処理結果を HTML文書として整形し,その他の必要なリソースへのリンクをはる. ブラウザでの表示がサポー卜されていない画像フォーマットのファイノレは G I Fフォーマットに 変換する.で、きあがった応答用のI‑ITML文書は,用意した各ユーザディレクトリにファイルと し文書 して一旦保存した後,サーバリダイレクションの仕組みを用いて,その保存した HTM しへのリダイレク、ンョンをブ、ラウザソフトに通知する. の UR これらの処理過程における w wwサーバと計算用サーバのやりとりの詳細を図 4に示す. なお,サーバにおける諸処の C G Iフ。ロセスで、生成された不要なファイルのガ一ページコレクション は , C G Iプログラムとは独立に稼働している管理プログラム(クーロン)が行う.これは,セキュリティレ ベルの向上と, C G Iプログラムのレスポンスタイムの短縮が目的である. 4 . 2 . 使用方法とページ構成 wwブラウザを用いて本システムの開始ページにアクセスする.ここでユーザ名 まず,ユーザが w n r ω η ︒

39.

を入力し,統計解析手法を選択する.もし分析に使用したいデータがあれば,ここでローカルディレ クトリのファイル名を指定する.次に使用するデータを選択する.ユーザがデータを用意していなくて もサンプルデータをあらかじめしてつか用意している.ファイルがうまくアップロードされていて,統計 パッケージで、もうまく読み込まれているなら,このユーザに対してのみ使用可能な個人データとして 登録・保存される.それぞれのデータの内容もここで参照できる. 次に最初に選択した各分析手法のページに移る.ここでは分析の手順や説明がなされる.ここか ら実行させたい手順を選択することで,その計算結果や結果の見方を解説するページが表示され る. 重要な用語については,オンラインヘノレフ へのハイノミーリングになっている.ハイパーテキストの G 落とし穴として,リンクへジャンプ。した際に話題の本筋から外れ,そのまま戻ってこないとし、うことが挙 げられる.これは,リンクへのジャンフ。によってページが上書きされてしまうことに原因があると考えら れるそのため,話題の本筋から離れるべージ(データの確認やヘルフ。など)へジャンプ。する際にこれ らを新しいウインドウに表示することでこの問題を回避している.また,各分析ページはフレーム機能 を用いることで,メニューに戻る手間を省いている. 本システムのホームページ及びヘルフ ページ例を図 5に,回帰分析を行った場合のページ例を 0 図 6に示す. r o l o gを使用している.今回の知識ベースの実装は,動作確認程 知識ペースの記述言語としては P 度のレベルで、はあるが,計算結果の数値の評価基準に関して lF‑THENJレー/レによるものを実装し ている.実際には, P r o l o gで記述したソースフ ログラムをコンパイルによって実行可能なモジュール o を作成し, CGIプロク、、ラムから呼び出せるようにしている. 5 . まとめと今後の課題 wwwとし、うオープンな環境で統計解析の学習を支援するシステムを構築した.システムの実装 においては,操作方法の分かりゃすいインターフェイスを実装することで,統計解析パッケージの使 い方を知らない学習者でも,インターネットホームページからの簡単な操作で、分析・学習が可能にな った.機会があれば SAS/lntrNetを用いた実装を行ってみたい. また,計算結果に対する解釈や説明を挿入したり,ヘルフ。ページへのリンクを文書中に埋め込む ことによって,ある程度は理論の分からない学習者でも,学習を行なうことが可能になった.この解釈 の説明に関しては,解析結果の説明に関する知識の部分をルールによる表現方法を用いて知識ベ ースを構築して, CGI プログPラムとやりとりを行なった.これにより,システムの抽象化・柔軟化を図っ ている. 学習者にとっては,大学の計算機資源を利用するにあたって,時間的・場所的な制約が大きかっ たが, WWWからのアクセスが 2 4時間可能になったことで,これらの制約を解消することができた. さて,ここで現状での課題を以下に列挙する. ‑知識ベースにおける知識の整理と拡張 今回は計算結果に対する評価の部分で知識ベースを利用しているが,各学習項目を整理 ‑33一

40.

し,分析手順や解析手法選択のコンサルテーションなどへ利用目的を拡張し,システムへ の実装を検討する.知識ベースを様々な機能に適用していきたい.また, Webページ上に おける知識ベースとのインタラクティブ、なやりとりを実現したし立考えている. ‑個人適応機能への対応 個々のユーザに対して専用のデ イレクトリを作成し,前回にどこまで進んだといった情報を それぞれに格納しておくことはできるものの,学習における理解の度合品、った進捗状況の 管理を行なうし、わゆる個人適応機能への対応を考えたい. ‑パスワードの導入 現在はユーザ名の入力のみで官、証を行なっている.パスワードの導入は可能であるが,ユ ーザの使いやすさを損ねるとし、うことと,システム管理者に負担をかけるとしづ問題が考えら れる.しかし,インターネット上で、公開する場合には,セキュリティの問題も含めてパスワー ドの導入の検討が必要である. .HTML文書における数式表現 現在の HTMLパージョンで、は数式の表現をサポートしているが,それを表示するブラウザ ソフトが未対応である.統計解析における数式表現は非常に重要な問題であるので,この aTeX2HTMしとしづユーティリティを使用して,ヘルフ。ページ全体を記述 ことに関しては L した L a T e X文書をけTMLに変換することで数式の表示を可能にしている.しかし変換(特 に数式表現の画像への変換)に時間がかかり過ぎるため, Webページにおけるダイナミック な数式表現ができないとしづ大きな制約がある.将来的なブラウザソフトの対応に期待した いところである. ‑ブラウザソフトのキャッシュの問題 CGIプログラムの出力はブ、ラウザのキャッシュにしか残らなし、(キャッシュにも残っていなけ れば再実行が必要である)ため,現在は出力結果をファイルに一旦保存してからサーバリ ダ、イレクションによる参照を行なっている.しかし,キヤツ、ンュの更新に関する問題などが解 決できてない. ‑本システムの評価実験の実施 学部生を対象に評価実験を行ない,本システムの有用性や学習に対する効果の評価を行 ない,これをもとにプログ、ラムの不具合の修正やインターネットへの公開を検討する. 他に技術的な問題も存在するが,以上が問題点であり今後の課題である. ‑34‑

41.

参考文献 [ l J 南弘征,水田正弘, I 多変量データの解析手l j 慣に関するExp e r t SystemJ,第 60回日本統計学 会講演報告集, pp245‑247,1992 6回日本 SASユーザー会総会および研究発表論文集, [ 2 J 松井陽子, ISAS/lntrNetの紹介j,第 1 pp419‑438,1997 J, [ 3 J 竹内啓,市川伸一,大橋康雄,岸本淳司,浜田知久馬, ISASによるデータ解析入門[第 2版 J 東京大学出版会, 1994 [ 4 J 竹内啓,芳賀敏朗,野沢昌弘,岸本淳司, ISASによる回帰分析 J,東京大学出版会, 1996 [ 5 JS h i s h i r Gundavaram著,田辺茂也監訳, (株)ユニテック訳, IWEBMASTERクイックリファレン スJ,オライリージャパン, 1997 [ 6 J StephenS p a i n h o u r,V a l e r iQuercia,田辺茂也監訳, (株)ユニテック訳, ICGIプログラミングJ, オライリージャパン, 1996 [ 7 JL a r r yWall,R a n d a lL .Schwartz 著,近藤嘉雪訳 IP巴r lフ。ログ ラミング J, ソフトノ〈ンク, 1993 [ 8 J 仲林清,小池義昌,丸山美奈,東平洋史,福原美三,中村行宏 rwwwを用いた知的 CAlシ I J80‑D‑IINo. 4pp906‑914,1997 ステム CALATJ,電子情報通信学会論文誌, Vo. • • 学習者 ー www サーバ ブラウザから統計解析学習 学習者とのやりとりを行なう a 仁¥量= 匙 t : ! .. ! ‑ : " . . . . . . . ̲ 一 一 旦 竺 竺 竺 q ,: 1 ~一一一一 ・学習支援 . 容易 計算用サーバ 統計 I~ッケージが入っている 計算を行なう 図 1 システムの概観 υ 民 nd

42.

島 也 、 F可弘サーバ聞の 、例y通信制御 ••• . ・ ・ ・ 臨時 学官者との通信 ‑ • 結果レポートの作成 ¥ 統計パッケージの 実行制御 人工知能とのやりとり 図2 ¥ CGIプログラムの役割 クライアント/ユーザ www サーバ [ ほ x ‑ 端末、 P C ] ] [ 同 b凶 e l Iev凹 u 』 崎 e . 加 ko加 be山 u 』 応 c . 前 a 仏.伊] c 、 I HTTP 学 内 LAN ( E t h e r n e t ) ‑統計データ ・結果を保存 計算用サーバ [0肌 kobe肌 a c . j p ]1 1 パッケージ 図 3 システムの構成 ρ o qd

43.
[beta]
TCP/I
P

www
サーバ

計算用サーバ
[
ono.kobeuc.ac.jp]

[
b
e
l
l
e
v
u
e
.
k
o
b
e
u
c
.
a
c
.
j
p
J
実行制御

l ::1

H・‑
H
.
I
.
H・‑・・惨 (

)
..
・
.

CGI 0グラム

SAS

処理の流れ

計算

E転 送

fデータセット

l計 算 結 果
HTML
ファイ jレ

図 4 W W Wサーバと計算用サーバのやりとり

m
a

議通量
叫

何h
・&di. V ̲ 0
;
0

α品 園 田 副

三 6 ぶ基金卓司.~

~

0
1
: l
i

ζ 凪 加 訓 同 園 日 制 盟 国 抽 阿 . . . . ,

3
坐:竺竺竺ゴt
竺竺臥ド匂//b

el.l..叩山山

「 摺 欄 間 由 同 ー ・7
寝間間町o:E

0
'
:Ed ~'''''l
…叫~流品
4 3
ι
6 1
r
.
潤

1

~:

首

正

ζ"‑‑

~

事

コ
轟

…

門 橋 』 崎 抽 ‑ ‑

1levue抽 出 8 .G)pl
叩

草草笠主二之三塁呈

stulhe切 削ω 〆

回 国Eミヨ回

統拍手析学習封重システム onlhe¥V¥¥IW

陶伝記盟監査~IJ,:車工'"帽細2 器量雪量!E

ユ一角地崎期て宇舶を入力「一一一一

童図譜分析

骨折アロン‑;;.1('の指定

開 也 抽 出 回 nyu
臥咽脇白砂田.

。データ直ll:

,

V ヒストダラム

v 舷布包

v タフ λター分析

、,基調節出量

j
、,相関西宮行J

~クロス集計

v

v重
風
俗
:
l
t
l
1
i v事国防折

v主成分骨折

v困干骨日

v配置化 I
:
a

vn
l
:f
ヒmlD v敏 iH:;lv;l
1

.
.
.
.
.
f
t
量化Il;
O

いグつ刀切宜酎 τ
1
τ.
r""'II"遣盤韮iW)
1
こ畢司、て.申防軍喧:,<Flll',室勤を

元~I:I'分骸骨::":

乎
1
.
'
1
す会こと

i貯層説肋可健明書創立星望盟蛙笹ある~'"車線図畢と噛酎1

る.
予府民として 1
;
以下めようになる

骨折子 ‑
!J7ァイル司l
oa;立もしあればs

染

ν=60+~l 町 + h2I2+
.
.
.+b~,

,

分析データファイル司 7庁ーマットの竜王ヨE
乱')':'ー"、 1
"
'

上J
e<7.>式カもわかるように.照沼痩初重み附す創刊直で予揖組主を惇でい

。

→号自主宣量胞として
1
駒込む、,読み込まない

)
)
{
̲
!
軒 セ 1<レ タ}目指定
データ由自明 I

・コンマE切リ v タフE切り v A自I&I
Jリ

:
l

・
闇
.
圃It'E;.;<:;

t
t

J

竺竺二

~"Irc.N n
:
,
.
Q
<
"
,

、目"

2押容な月 1
$8(.
月'"時

Pi一 一

ηH
,
>
6.
.
.

図 5 システムのホームページ(左)とヘルプページ(右)

,
!晶品Q.'.:J,~

ワ
t
べu
n

44.
[beta]
四割耽叩闘は柑C闘訓岨,TIn隠忍持認と~r:蓄な羽kJ謡i
被
"
, p1

両 面 均 胸w G > 恥 同 剛 健 剛

恥

向帽加岬

Ld.̲

:
4

zr

C

抽 帽 当 時 事 活 断 山I

̲

有6

乏二主選住ニ

‑型監並立
金ム三金
‑型監話在
金主主!
l
主主

菅野
.9'I晴間ζついて
・回附祈唱D V

2

、

-~I 以下で‘鼠箆率訟と謹!1l率重量をi鐙尺して「解

析実行』ボタンを押してくださ L
邸時宜跡践鵠罰

企 r・堕監逝一機.

三三空包こi

I硲

企主主!'2

安

から隔世ねる

1
)
'
(
0

場 合 也 左g月号酔頁目をタ h タもてくどさか
・茸窓寧唖を理現内閲していて $
;
1
野からM古される方1.1.左の

務寝室詠筋量買

唖自に舵官刀 tt:;~ ,.:.'方をクリックして<1<さい
え

暁

る
:
よ

陸工

長引鴻滅:機「一一……

"
"
"

v
.
‑I H
.
.
.

品 品 d"

巨
'
" Ed鴎 Vi.
o
・G> C

立〆

。
何
'
T
1
'
"
l
l
1
"
j
!
t
I
:
I
;
匂r

,
.
:
$ ~益滋
M

二

S竺笠 <I'!~

匹
句
,

ー
ー
‑

二二

脂,

ムi
ゑ
‑畷脳血
主主重立与

乏二主選髭竺ニ之蓮司

易量

盛呈

‑ZLL‑
凶
i幽
ム山=ぷ,.一i

i
蚕γ,.長孟示

‑回艶宣1
L
主
:
i
?
t
̲

j

晴
1̲:

樋 3

雇蚕語長孟工蚕lII!l工三長110
l 型空ÌS?~

,
'jL‑7

‑国野渡益査

エ

告を時

由晴宣均車高じ

1

・間砂崩司~.

I~",

TT
且

μ主

1
柵

i
1
l
r
f
t
.
Jl
'
:
‑
:
>.
1
1
噛肘る鳴がら・モデ両前

温 蝿 寄 付 猿 引 開 ιている

1
I

F
:
;

モヂルの時制語調叫開園と同<1".

鮎 ・ ← ワ ー ド ァ 灘 その置叫咽は趨醤....""
.
.
.
四 割 問 帽 う ち.
1
1~
ーーー壱E
一味琵醤 l
考聾聾悼のを圏麗と目薗闘で・・司暗担別措ぎを喪むてい
仁
主主d.
奇 咽 舟 平 沼 田 岨 際 捕 と 哨 九 制...
ほ血出

i

仁

l圃犠.,.叫"...町制時ツキ., 3各, 1
1
1
曜語Ilot"金属!I 1
.
・巨~~;;!!''íth~1 と日闘で8"'-'(;唖蜘畑 <!'U\している.これらの醐 f:

j
, 抑 制 叫 .O
.
(
W
)
!
J I

工A ~選挙 IH;藍E鍍堅手の 03110回国哩政凪畑町問削日ツ'"お広

鬼o
f

で盟 l'可.眠燈動植の封砲とむ司聞で8~働句大H 帽

、,

侮

苧f

函一一一一一!一一付

E

上の註 韮盟主て廿.モデルのあて隠ま肌聞す制純8
覗
自
主

! Iされてし唱.
I

b

h

一i

露両面設「盟副血
f,雨量;
;
T
元 ぷ 百 五;
‑
1

!
.
.1 1‑0ぷ

主笠の項目料品貯の亘謹盟世帯同.‑
車
R田 l
l
l
!
l
弔1.8.9.割高‑
Os2田知拍

喝 , . ‑ '{4~1 t11同区四する帽唖凪曹砲とれる,館相。平方軍国総軍克秘と [
l
四一一‑‑'‑;;'"お i
略括払その曲調邸側1.1臨畦E
画 担1
I
D
1
S
P
'
l
'
B
)
I
.
)
/
<ラフ'" [
l
'

f遍通量語「雨戸量生金盃丞~両面1.

‑圭ニ2ニE

~望室芝 府間百円,,),信護霊&'(X¥)で d 弘司売を行芯 q
凶AStLqt幅線が上帽帽~,晴樹晶表の盟

I
言
亙
正
.
.
偏
.
.
.
.
.
.
.
.
卯
均i
同
認
一
.
.
w
I
75
一

計算結果の滋み方
思

思工

[面遍「雨泌副百通竪ー
1

輔

直
義1
t
i

・臨匙

四 :
RUTD
呼韮ム1ft

町
ル

,

五三室主主 J凶kLf:l.
JNtn'&.CcoI

SASによる計算結果
♂

,
.
す

ー
←
一
一
ぷ
与
一
一
一
一
一
一
一

必主ヰム阜4

‑魁畳滋主

t
;(
s r;&潜

凶@曲両首SIadY

1
;
‑

刷臨喰伊略章
v

m""

F
開副抽..情

ケよf語。岡山 ̲.!<L畑 町 ト 司 Ilbellevue抽 出 直 , lP/'
町 山 山 田 圃i
i1
:

; e . j ・ 』 岡 両 品 同 町 ト 埠 泊ellevue同 刊 ca
e lP/vvv叩 山 町 四 1
1
1
;
:
1

:~岡崎叶山中追加印

6企し Vj
e
,
.
. (b con‑前山内四句,

'
;
'
!
;
i
・
/
3
.
,
&:
J
品 ι

駅
可
量

A

I ,j~ 品。p 、ι

磁溢溢溢歯蹴滋函組副』幽温岨晶画画幽・・・・..温

地恒

払忠弘

一一帯

崎
国

一
一
一
一
一
一
一
司
…
,
岨
叩
s
.
n
1
'
i
T
i
1
I
.
明 rl関野怪盗遜盟睡ょ挙制手当
手当逼

.
{
g
!
!
監
滋1
L

凶悪j立 とJ

‑旦塁昌三

‑旦盤笠
経工

エ
巴

!~~-.o)ニj

雪
も

‑王二三こ
とごQ

山静主)

簿価+

戸ヘルプ

e

‑正二三二

r

準型量逮Z

よ型連

o
̲

う . 柑

t/furu%Wl.i
l

t
d
:

包豆工

これから実掃のデ 宅を用いて E
堕且Eを宇宙らてい S零苛

し
"a

義

世

"珪宮
べ
宜・'"の量害拡キh ワペ~ FI
<
t
. '~1~7竺ニ守、の '1νクに率勺 聾
明D
IIiしいつインド議
ていもクリヲクするとヘルブ",̲河も〒J
吋 輔!
"
Z
‑
.
.
. 閉じないでメインウぜンドウの幽ζ置いてお含 叶

・・・・
町 山

対
.{g!!鎚笠 m

海

田
曙

・

幡町唱

2護主

ーム出わ

陶 ぜ 』 岬y 舛
'f

,"首肌

塑塑警務鯛l!1
1

一一一一一ー

…

Jr"",,,,,,品 阜 Lo F日 :pIlbellevue抽 出 c ac jp!'
4
tJ回国,:jN8w'Coo
I

与

回あま祈ベ巴ジの使い方
‑型量逝
担呈工

町同"'"恥@曲

面, '
ヲ
'1陪 園

盟点ナ~,,"iI

二 十

cb 泊町miØlbと…一一~ーームぷ'_._-~

司
E ぶ ' l 企 ι 必,;j; r;&織

原司{

,
.
,
時 .
'
由Jo.
""伽酔明/ル山間@抽出 ,
・ JP/vvv山Ifuru;:岨~I

f
':r.'!岡拘取・. I
如w お 醐 @ 曲

抽臼'..V町

‑
.
i
1

♂
4
. ~ -a公 ι ぶふ H~ιi 祖霊草
ン f~id

隣 綿 織 蹴 蕊 将 軍 部 悶 欄T間関白iIil

~

じ

1舎を興してい否 このことからモデJレへのあて健全りがよくな l
'
S
也1
ぃ 乙 " . ' い え る 1 ‑ ‑ :
F

一
一

.
.
!
.
.J
‑
J、
.
/
<

図 6 回帰分析における表示例

ι
i

i
'弘 品 訪 日 、

qu

o
o

45.

日本 S A Sユーザー会 (SUG I‑J) S P D S (Scalable Performance DataServer) V 2 .0の紹介 斎藤宏平田学 株式会社 SASインスティチュートジャパン 営業本部 営業支援グループ An Int r 0 duc t i0 n t 0 SP0S Ver 5 j 0 n2 .0 H i r o s h i S a it o & Manabu Hi rata S a l e s D e p a r t m e n t、 S A S In s t it u t e J a p a n L t d, . 要旨 データウエアハウス構築に有用なプロダクトである SPDS について、その機能を中心!こ解 説する。 キーワード: データウエアハウス、 S M P、高速化 1.はじめに SPDS(Scalable Performance Data Server) は 、 1 9 9 6年末初期バージョンが商品化さ れた。 V1 .1 以降はパフォーマンス関連での改善・機能追加、及びサポートするプラット フオームの拡張等がなされてきた。 最新パージョンである V2.0 では主に SQL パススルー文への対応、セキュリティ面での改 1での評価版機能の正式サポートを中心に対応されてきている。 善 、 V SPDSは、データウエアハウス環境におけるデータサーバとしての役割を担うことになり、 大容量データ環境下でのデータアクセスの高速化を保証する。 またユーザにとってみれば、ウエアハウス環境における構築・管理・分析という各フェー ズにおいて、 S A S言語および S A Sの持つ各種機能が利用できるというメリットが得ら れることにもなる。 η Qd ︒

46.

さらに SPDS においては、ユーザ id/パスワード設定による認証によるセキュリティ管理 を可能にする。 1化及び多重化が可能となり、ひいては処理の高速 また 8 M P対応によりチータ処理の並夢1 化を可能なものとする。 2.SPDSの適用対象領域 (1)現行 8 A 8ユーザ、 8 A 8を高度に利用しているユーザ (2) 全社及び部門データウエアハウス構築予定ユーザ (3) データ量の増大及ひ.ハードウエア拡張・リプレイスが特に見込まれるユーザ 3.SPDSの設計思想 (1) 8 A 8データセットとして一貫して扱える。 (2) 8 A 8アプリケーションに対するデータアクセスの互換性保持。 (3) とにかく検索を早くする。 (4) 高い信頼性の確保。 4.プロダクトの歴史 ( 1)開発公式発表 96年 4月 (2) 初期正式パージョン (8UN版) 96年 11月 (3)ベータパージョン (AIX版) 9 7年 7月 (4) ベータバージョン (NT版) 9 7年 9月 (5)バージョン 2 . 0ベータ (8UN、 NT、 HP、 A IX) 97年 11月 (6) バージョン 2 .0正式版 (8UN、 NT、 HP) 98年 5月 (7) 今後の予定* ベータ (AIX) 98年中 ベータ (Digital U N IX) 9 8年中 *今後についてはあくまでも予定。 5.プロダクトの特長 (1)現行 8 A 8システムとの親和性が高い (2) 8 M Pを利用した処理の高速化 (3) ビットマップインデックスへの対応 (4) 大容量ファイルが作成可能 ‑40

47.

(5) セキュ 1 )ティ対応 (6) その他 6.詳細説明 (1)現行 SASシステムとの親和性 現行 SASと同様のデータアクセスを実現するため、 SPDS用エンジン b n a m e機能によるファイルアクセスが可能 を開発した、これにより Ii となり、 SASの各種機能が利用可能となった。 1)SPDS用 I i b n a m eエンジンの開発 SASの基本思想は I i b n a m eエンジンにあるといっても過言ではない。 I i b n a m eエンジンを通じて、データセット・力タログ・ユーティリティ 等のファイルへのアクセスを行なう。 SPDSでも発想は同じである。他方 SQL文によるデータアクセスも可能で i b n a m eエンジンの各種詳細オプション指定により、 SPD はあるが、 I サーバ上にあるファイルへのアクセスを可能とする。 2) クライアント・サーバモデル I i b n a m eエンジンは、 SPDS上の 3つのコンポーネントとともに 動作する。 ネームサーバは、構成定義により物理パスの論理化をサポートする。 SPDサーバはユーザ認証を行し、かつ、 SPDサーバ I i b n a m eプロキシ(以後 プロキシと呼ぶ)へのアクセスを許可する。 プロキシは、サーバ上の SASファイルへのアクセスエージェント となる。 ‑ネームサーバ、 SPDサーバコンポーネント ネームサーバと SPDサーバは別スレッドで動作する。 SPDサーバは認証後、各ユーザ毎にプロキシを立ち上げ処理を継続 する。 以後クライアントからの要求はそのプロキシが実行する。 ‑プロキシコンポーネント プロキシもマルチスレッドアプリケーションである。 通常 2つのアプ 1 )が起動されている。 1つは I i b n a m eエンジンの ソケットを監視し、他方!ま管理者用ソケットを監視している。 4 1

48.

(各要求を常時監視しているといえる。) またこれらに加え随時 SPDサーパの要求によりアプリが立ち上がる。 3) 対データウエアハウス データウエアハウスにおいて特に重要なのは、大容量データのハンド リングをいかに効果的に行なえるかということである。 SPDSは特にこの領域における利用に効果的である。 bnameエンジンによりまた SOL文を組み合わせることで効果的な それは Ii データ抽出・加工ができるからである。 役割としては、検索・抽出は S Q Lを利用し効率的に行い、その後の データ加工は Ii bnameエンジンを通じて S A S言語 (Dataステップ、 procステップ)により実行する。 両方の組み合わせで効果的処理を構成することが可能となる。 (2) S M Pを利用した処理の高速化 S A S開発サイドでのテストおよひ.ユーザサイトでのテスト経験をもとに、 並列処理の実装は以下の機能に着目して行なっている。 • SOLパススルーにおける where文の評価を実施。処理効率の最適化を自動的 に行なう。 ‑テーブルにデータを追加時に発生するインデックス更新処理の並列処理化 .複数インデックス作成時のインデックス生成処理の並列化 • proc sortまたは Dataステップ byステートメント利用時の処理並列化 .複数テーブルアクセス時のデータ読み込みのパイプライン処理 (3)ビットマップインデックスへの対応 (4) 大容量ファイルが作成可能 2G超ファイルのサポート。 (0Sの制約に依存せず、ハードの制約のみ となる) SPDサーバデータは、コンポーネントファイルの集まりである。 おのおののファイルは 1つ以上のディスクファイルから構成される。 1)メタデータコンポーネントファイ jレ(MDFファイル) 2) データページコンポーネントファイ jレ(DP Fファイル) 3) インデックスコンポーネントファイル (IDX、AUX、 HYBファイル) ‑42‑

49.

プロキシは M D FとD P Fを使いデータセットを格納する。 I D X、AUX、HYBはインデ ックス利用時関連情報が格納される。 (5)セキュリティ対応 )ティのサポート。 オブザベーションレベル、変数単位でのセキュ 1 dごとにもたれる。 プロキシプロセスは SPDユーザ i またこれは、ユーザにより異なるプロキシが起動されることを意味 している。 データセキュリティの基盤は SPDユーザ i dとなる。 S A Sクライアントが Ii b n a m eエンジンにてサーバ接続時にはユーザ i d、 パスワード、 A C Lグループ等のオプションを確認し SPDサーバに接続 される。 ユーザ i d等が正しければ、 I i b n a m eエンジンによるアサインは成功する。 アクセスの仲介を行なうプロキシプロセスは、ユーザ i dとA C Lグループ のもとで動作する。各ユーザは 5種類の A C Lグループを保有可能である。 (AC Lグループは SPDサーバパスワードデータベースに事前に定義される) A CL ( A c c e s sC o n t r o lL i s t ) A Cしは SPDS内の各ファイルに対して定義される。 各ファイルは、ユニバーサルなアクセス権・グループアクセス権・ユーザごと のアクセス権を与えることができる。 また各ファイルは、 SPDサーバユーザ i d及び A C Lク、ループをもっオーナが 存在する。 アクセス権には以下のものが存在する r e a d 読み出し権 w ri t e 書き出し権 a l t e r ファイル名変更、削除、更新権 またイン子、ツクス生成権・データセット内の変数 関連情報をもっメタデータ変更権 c o n t r oI A C L情報の更新権 ディフォルトでは各ファイルオーナは、すべての権利を所有するがファイル オーナ以外はなにも権利をもたない。 セキュリティの設定は各ファイルについて先の 3 レベルで設定される。 バ τ μ qu

50.

ユニバーサル アクセス権が以下で指定されていないユーザへの適用 グループ A Cしグループに対する適用 ユーザ 各ユーザに対する適用 尚 A Cし等の指定を簡易に行なう PROCSPDOは現在評価版として提供 される。 (6) その他 ・インクリメンタルバックアップ・リストアツール提供 .テーブルリスト表示モジュール ‑インクリメンタル orフルバックアップモジュール .インクリメンタル orフルリストアモジュール • UNIXのツールも利用可 • ODBC/JDBC/lntrNetサポート及び C言語インタフェース対応 .ログ取得機能対応 ・テーブル圧縮機能対応 7.現状 S A Sファイルアクセスとの性能比較 現行 S A S環境下でのファイルアクセス性能と SPDSの比較を以下試みた。 結果としていずれもケースでも SMP対応による効果がでているものと思われる。 ベンチマーキングテスト結果 環境 サ ‑1¥ S U NUItra4000 8way クライアント I BM760EDThinkPAD 検索ファイル容量 1.3Gbyte 検索条件 SAS SPDS 1検索条件 2分 2 0秒 4 2秒 インデックスなし 1検索条件 12.7秒 1 .7秒 インデックスあり 2検索条件 21 .6秒 6 .4秒 インデックスあり 4検索条件 3分 4 6秒 7.7 秒 インデックスあり 一44 備考

51.

8.評価版機能 ( V 2 . 0 ) • SPDS経由での oracleアクセス対応 (SQLパススルー対応) .テーブル暗号化 9.今後の予定されている追加機能 • MDDBファイルへの対応 .スタースキーマ対応 10.SAS言語記述例 (1) SAS システムと SPDSとの接続例 Ii bname spds sasspds ,t estspds' serverニh o s t .port user‑ user name password='pass̲word' j 主 spds 任意のライブラリ名 sasspds SPDSのエンジン指定(固定) testspds SPDSサーバーで、定義したライブラリ名 h o s t .port host user name ホスト名 port SPDSサーバーに害 り当てられたポートの名称、または、番号 SPDSサーバーで、定義したユーザー名 pass̲word SPDSサーバーで、定義した上のユーザー名に対応するパスワード I J (2) SPDSを利用したプログラム例 • SASデータセットのデータロード(インデックスの作成を含まない)例 data s p d s .sample; set Ii b r e f . loaddata; r u n ; proc copy in=rebref out二 spds memtype=data; select sample; r u n ; rhU A U τ

52.

‑インデックスの作成例 proc datasets lib=spds; modify sample(bitindex=key1)); index create key1; index create key2; index create key3; quit; ‑パラレルデータロード(インデックスの作成を含む)帝IJ data spds.sample; Hu v a n H ︐ . set Ii bref. I oaddata(obs=O); proc datasets Iib=spds; modify sample(bitindex二 key1)); index create key1; index create key2; index create key3; quit; Hu v a n H ︐ . e data=rebref. I oaddata; proc append base二 spds.sampI ‑データの検索例 data subset; set spds.sample; Hu v a n H ︐ . where key1 二 'XXXX'; ‑データの検索 (SQL パススルーによる)例 proc sqI; connect to spds(dbq='testspds' host='host name' server='port' user二 'user̲name' passwd='pass̲word'); *from connectuion to spds from sample (select * select where key1 ニ, XXXX'); disconect from spds; ‑46‑

53.

quit; ‑データのソート(パラレルソート)例 proc sort data=spds.sample(sorttype二 qui ck); by sortkey; run; 1 1.おわりに いままでデータウエアハウスのデータサーバとして、 S A Sデータセットを用いるにはい ささか抵抗があったと言わざるをえない面がある。 それはセキュリティとパックアップ機能の脆弱さとも言い換えられる。 今回ご紹介させていただいた SPDSは、それらの弱みを十分力パーした商品といえる。 OLTP の世界を得意とする DBMS と比較したとき、機能面での遅れは指摘されると思うが、 データウエアハウス環境において頻繁に発生するテーブルジョイン及びデータ加工を考慮 する時、 S A S言語の強みが発揮されるものと思われる。 今後のプロダクトの発展・普及を期待しつつ、本紹介を終わりにしたいと思う。 12.参考文献 1) Scalable Performance Data Server Release2.0 Document 2) Scalable Performance Data Server Product Notes いずれも SAS Institute Inc.による ウ A‑I

54.

日本 S A Sユーザー会 (SUG I‑J) 西暦 2 0 0 0年対応について 鈴木一彦 力スタマーサポート部 株 式 会 社 SASインスティチュートジャパン AboutYear2000c o m p l i a n t KazuhikoS u z u k i CustomerSupportDepartment td . SASI n s t i t u t eJapanL 要旨 現在、各企業は 1年半後に迎える西暦 2000年において安定したシステム運営を 提供すべく、総力を上げコンビュータの西暦 2000年問題に取り組んでいる。 UNIX環境の西暦 2000年問題も含めて、 SASシステムにおける 本論文では、 PC, 西暦 2000年対応について述べる。 lANT キ ー ワ ー ド : SASYEAR2000COMPL 1 . はじめに 例えば、債務における借金と利息の計算などは、 日付に影響されるため誤った計算結果となる。 現在、多くのコンピュータ製品は 1999年 1 2月 3 1 日以降使用できなくなるという問題を抱えている。 それらは、 2000年を 1900年と誤った判断をするこ とで、全ての日付計算に影響を与えることである。 この問題の電要性としては、システム日付は多く のアプリケーションソフトウェアで、用いられている。 特に経過時間計算などがこれに該当する。 例えば、現在の年齢を算出する場合、現在の日 付値から個人の誕生日を減算することで計算でき る。しかし、システムが 2000 年を処理できない場 合 、 2000年 l月 1日には 1960年生まれの人の年 齢は 40歳ではないとし、う誤った計算結果となる。 また、アプリケーションで、用いられている変数の中 でし、くつかの変数は日付に依存している場合が ある。 4 9 2 .PC環境における影響について 最初にハードウェアとオベレーティングシステム について考えてみる。 PC(Personal Computer)は 、 RTC(th巴 R e a l Tim巴 C l o c k )と呼ばれるチップ。で、システム日付を格納し、 このシステム日付はオペレーティング、ンステムによ って更新され参照される。この構造とチッフ。は、 1 0 年以上前から変更されていない。その結果、 RTC の西暦を示すフィールドは、現世紀から次世紀へ 進む時に自動的に更新されるかどうか不明とし、う 問題がある。 オペレーティングシステムは、システム始動時に RTCから日付を得る。そしてこの RTCにおけるフ

55.

時にオペレーティング?システムは RTC へ現在日 付を更新できるようになる。 仮に、もしもシステム日付を共有している PCの 1 台が次世紀を正しくハンド、リングで、きない場合、結 果として全てのシステムに危険性があると言える のではなかろうか。 次に稼動しているアプリケーションソフトウェア のテスティングに関してであるが、まず、西暦の切 り替えが可能であるか確認しなければならない。 多くのベンダーは、 Webサイトで西暦 2000年のホ ームページを公開している。その Webサイトで該 当するソフトウェア、オベレーテイングシステムの 西暦 2000年対応状況を知ることが可能である。 ィールドは、 PC の BIOS(Basic l n p u t Output S y s t e m )によって更新され読み込まれる。 従って、この BIOSは、オペレーティング、システムと RTCとの中間的役割を果たすことになる。 し、くつかの BIOSは、世紀の変わり目の後に正しく 日付を更新できなくなるといわれている。それ以 外に OOSから OATEコマンド、を使用し、手動で日 付調整が必要となる場合もある。 では、これらの問題を持っているマシンの判定方 法であるが、 BIOSに西暦 2000年ハンド、リング問 題が存在するかどうかは、その PC上でテストすれ ばよい。仮に2台あるいはそれ以上の PC を同時 期に同ベンダーから購入していたとしても、それら の BIOS は違っているかもしれなため個々にテス ティング することが、唯一西暦 2000年対応保証へ の道となる。 具体的なこれらのコンポーネントのテストであるが 比較的容易である。それは西暦 2000年テストのた めのソフトウェアが、しばしば無料で提供されてい るからである。 以下のアドレスから無料でシステム B I O Sの西 0 0 0年対応の有無をテストするためのプロ 暦2 グラムが提供されている。 ーデルコンピュータ h t t n :I / w w w ̲ d e l l . c o m / s u n n o r t l P 一 富士通 h t t n :I / w w w ̲ f u i i t s u ̲ m ̲ i n l h v n e r t e x t J 2 0 0 0 1 日本アイ・ビー・エム httn:llwww . i b m . c o ̲ i n / a d 2 0 0 0 / i n d e x 2 . h t m l 西暦 2000年問題 h t t n : / / w w w ̲ v e月 r2000̲coml h t t n ' l l w w w ̲ T I s t l ̲ m m l h t ml/vmark2000̲html ノベル h t t n : / / w w w ̲ n o v e l l ̲ c o m / n 2 0 0 0 1 また、 PCの日付を 1999年 1 1 : 5 9 : 0 0P . M . Iこセット しシステムを数分後、システム日付が正しくハンド、 リングされていようがなかろうがリブートし、その 後、システム日付が正常であるか確認することで ある。 次に、アプリケーションソフトウェアについて考 えてみる。 PC 上に存在するソフトウェアは、日付 エラーに影響されやすく、過去に購入し使用して いるアプリケーションの多くは、西暦 2000 年対応 ではなく、対応するために特別なソフトウェア・アッ プグレードが必要となる。また、多くのカスタムメイ ド・アプリケーションは、西暦 2000年を考慮せずに コードが書かれており、新しい西暦のハンドリング、 を可能とするために大規模なコードの書き換えが 必要となるケースが多い。 次にシステム問でシステム日付値を共有した場 合について考えてみる。 システムがブー卜された時に、オペレーティングシ ステムは、 BIOSを通して RTCに対し d a t eコーノレ を発行する。システム日付は、その時点でオペレ ーティングシステムにより使用可能となり、現在日 付をアプリケーションから参照可能となる。また同 3 .UNIX環境における影響について UNIX環境における西暦 2000年問題は、西暦 2 桁を扱える関数、ユーティリティ・プログラムであ る。各メーカーは、この対応として以下のように該 当するリリースレベノレ単位にパッチを用意してい る 。 3 . 1西暦 2000年対応済のバージョン OS パージョン AIX S o I a r i s HP‑UX OIGITALUNIX 4 . 2 . 1以降 2 . 6以降 11 .x 4.00以降 日経オープンシステム 9 8年 4月号調べ Fhu n u

56.

3 . 2I¥ ' Yチ適用により西暦 2000年対応となる J、ーンヨン OS パージョン AIX S o l a r i s HP‑UX DIGITALUNIX 3 . 2 . 5, 4 . 1, 4 .1 .5 1 . 1 . 1vB, 1 . 1 .2, 2 . 3, 2. 4 ,2 . 5 1 0 . x 2 . 0以降 例えば、 YEARCUTOFF=1920 と指定した場合、 1 9 2 0年から 2019年までの 1 0 0年間となる。 従って、 20 から 99 までの範囲は、 1920 年から 1 9 9 9 年までを表し、 00 から 1 9 までの範囲は、 2000年から 2019年までを表すと解釈される。 但し、このシステムオフ。ションの出荷時の値は西 暦 1999年まで、となっており、西暦 2000以降に対 応するためには設定値を変更する必要がある。 4.4システムオプションの設定、使用例 8年 4月号調べ 日経オープンシステム 9 このシステムオプションは、 SAS システムの CONFIGファイルあるいは、 SASプログラム中で指 定することができる。 尚、この変更を全ての SASシステム利用者へ反映 したい場合は、 CONFIGファイルへ追加することを 推奨する。 4 .SASシステムの西暦 2 0 0 0年対応 について SAS システムの各プラットフォーム上での西暦 2000年対応について述べる。 . 0 3, 6 . 0 4 およびメインフレーム版 まず、 DOS 版 6 5 . 1 6, 5 . 1 8は対応していない。 また、 SAS システムの日付機能を活用していない アプリケーションをユーザーがシステム開発時に 作りだすは可能である。従って、ユーザープログ、ラ ムの中には、西暦 2000年対応とはいえないコード が存在していることを否定することはできない。 4. 4. 1 SASシステムの c o n f i gファイルへ追加す る場合 • OS/2, Windows, UNIX環 境 YEARCUTOFF 1920 4 . 1 対応済リリース番号 • SASシステム リリース 6 . 0 7以降 (各プラットホーム共通) MVS, VOS3, MSP環 境 YEARCUTOFF=1920 • 但し、前提条件として稼動する OSが西暦 2000年に対応し ていること。また、稼動する OSが SASシステムのリリースの動 作条件を満たしていること。 AXP/VMS環 境 VAX/VMS, SAS 起動時のコマンド、へ /YEARCUTOFF=1920 と指定するか、あるいは DEFINESAS$CONFIGで 害1り当てられたファイノレへ YEARCUTOFF=1920 を追加する。 4 . 2 未対応リリース番号 ・ メインフレーム版 SASシステム リリース 5 . 1 6, 5 . 1 8 VM/CMS環 境 SYSPROFSASファイルへ YEARCUTOFF=1920と 指定する。 DOS版 SASシステムリリース 6 . 0 3, 6 . 0 4 ・ 4 . 3SASシステムオプションの設定について Macintosh環境の場合 西暦 2000年対応のための SASシステムオプシ ョン YEARCUTOFFが提供されている。 西暦 2桁表現の扱いは、このシステムオブρション に指定した西暦年から 100年聞が対象となる。 YEARCUTOFF 1920 ー ム RU

57.

SASシステムを利用できる様にサービスを提供し なければならない。 4. 4. 2 SASプログラム中で指定する場合 以下に、西暦 2000年二桁表現のデータを含む 日付値を読み込むプログラムの例を示す。 CONFIG ファイノレと SAS フ。ログラム中の双方で YEARCUTOFF システムオフ。ションを指定した場 合には、 SASプログラム中のシステムオプ、ンョン値 を優先する。 6 . 参考文献 T e c h n i c a lS u p p o r tR e p o r t574Year2000FAQ 日経コンピュータ 9 8年 4月号 ‑ SASシステム使用の手引き SASI n s t i t u t eI n c SASI n s t i t u t e] a p a nL t d . 西暦 2000年対応関連 URL OPTIONSYEARCUTOFF=1920; h t t n : / / w w w .P.白鳥 c o m / i a o anJa / v e a r 2 0 0 0 . h t m l d a t at e s t ; i n p u td a t e ; i n f o r m a td a t eyymmdd6.; c a r d s ; 001014 .H p .. c o m / p .o f t w 丹r f '/ v f 'H r 2 0 0 0 / h t t n : / / w w w .p p r o cp r i n td a t at e s t ; f o r m a td a t eyymmdd10.; 二 TA n u ︐ . 上記のプログラムを実行した際の以下のような結 果が得られる。 OBS DATE 2000‑10‑14 4. 4. 3SASシステムオプション YEARCUTOFF 設定値の確認方法について 以下のステートメントを実行することにより、現在 設定されている YEARCUTOFFの値を表示するこ とができる。 PROCOPTIONSOPTION=YEARCUTOFF; RUN; 5 . おわりに 西暦 2000年まで残すところ、約 1年半である。 現在、 SASテクニカノレサポートへ西暦 2000年に関 して問い合わせが数多く寄せられている。 ユーザーの中には、これから対策を開始するとこ ろもある。 SASインスティチュートジャパンのカスタマーサポ ート部は、西暦 2000 年以降もユーザーが安心し Fhu nd

58.

データマイニング

59.

日本 S A Sユーザー会 (SUG 1‑J) アソシエーションルール抽出プログラムの試作 谷岡日出男 数理研究部 株式会社金融エンジニアリング・グループ PrototypingAssociationRuleMiner HideoTanioka MathematicalE n g i n e e r i n gD e p t . F i n a n c i a lE n g i n e e r i n gG r o u p .I n c . 要旨 アソシエーションルール抽出法として著名なアプリオリアルゴリズムを忠実に実行する S A Sプ ログラムを作成し、判別問題へ応用するために 3点の機能付加を試みた。 第 1にルールの結 論部を固定すること。第 2にルールの条件部に 2値以上のカテゴリ数を持つアイテムを許すこ と。最後にルールの条件部の条件複合レベルを制限すること。 以上の機能付加によりアソシ エーションルールを判別ツリーによるルールの補完として実用的に用いることが可能となった。 、 .A S S O C I A T I O N、A P R I O R、C L A S S I F I C A T I O NT R E E キーワード. 1.はじめに アソシエーションルール抽出法は、簡便性、結果の理解のし易さ、大規模データへの対応とい った点で優れたデータマイニング手法である。しかしながら、その第一の目的が多数の商品ア l、わゆるバスケット分析)に向けられているため、適用範囲がマー イテム聞の同時購買分析 ( ケティング分野のほんの一部分に偏ってしまうおそれがある。その他の用途、例えば特定の商 品購入や貸付債権の不良他にいたる因果分析などに用いる場合、分析結果の山を築いてしまい、 新たに「分析結果のマイニイング」が必要となるなと問題点も認識されつつある。このような 問題点を解決した上で因果分析などに応用できればより一層利用されるものと考えられる。こ の目的のためには通常、判別ツリ一生成法を用いることが多いが、半iJ別ツリーの欠点として、 分析対象と分析目的にも依存するが、確信度が非常に高いルールであっても出現率が一定以下 のものはルールとして抽出できない点がある。この欠点を補うものとしてアソシエーションル ールは有力なツールである。このような応用のために、基本的アルゴリズムであるアプリオリ に若干の改良を加え、 SAS上で実行可能とするプログラムを開発したので報告を行う。 55‑

60.

2. アソシエーションルール アソシエーションルールとは、 rAが出現した場合は B も出現しやすい」といったことを表わ C o n d i t i o nP a r t ) または左辺部 ( L e f tHand S i d e )、B を結論 すルールである。 A を条件部 ( C o n c l u s i o nP a r t ) または右辺部 ( R i g h tHandS i d e ) などと呼び、 rA →BJなどと表わす。 部 ( 条件部 A は (A1かっ A2) といった複合条件も許される。結論部 B も (B1かつ B2) といっ た複合も許す場合があるが、本稿では結論部の複合は考えないものとする。全体に対する A と B の同時出現率をこのルールのサポート(支持度)と呼び、 A が出現した場合の B の条件 付出現率をこのルールのコンフィデンス(確信度)と呼ぶならわしがあり、以下本稿でもこの ならわしに従い「サポート J (または「支持度 J )、および「確信度」と呼ぶ。 3 . アプリオリアルゴリズム アプリオリは米 IBM社アルマデン研究所のR.Agrawal等によって開発された、「現在最も広 く引用されている基本的な逐次アルゴリズム J (喜連川 1997) である。その処理概要をここに 簡単に説明しておく。 目的:最小サポート s、最小確信度 cを持つ A→Bの形式のルールをすべて抽出すること。 フェーズ 1 :最小サポート sを満たす k個のアイテム組合せ (A1かつ A 2…かつ A kという 形式のアイテム組合せ。長さ kのアイテムセットとも呼ぶ。)をすべて抽出する。 (k=lえ…最 大アイテム数) フェーズ 2 :フェーズ 1で抽出された k個のアイテム組合せ (k> 二 2 ) から条件部と結論部を 可能な限り構成し、その中て、最小確信度 cを満たす構成をアソシエーションルールとしてすべ て抽出する。 アプリオリアルゴリズムの特徴はフェーズ 1の k個のアイテム組合せを得る際、計算上爆発的 組合せが起きないように、うまく逐次抽出する点にある。まず k=l の場合、各アイテムが最 小サポート sを満たすかどうかを調べ、最小サポート sを満たすアイテムのみを選択し、満た さないアイテムは今後の計算から除外する。これは最小サポート sを満たす k=2 以降のアイ テム組合せに含まれる各アイテムは k=l で最小サポート sを満たすことが必要条件となるか らである。次に kニ 1で選択されたアイテム同士のすべての可能な組合せを行い、最小サポー トsを満たすもののみを k=2 で構成するアイテム組合せとして残し、満たさないものは捨て る。以下同様の手順で最小サポート sを満たす k個までのアイテム組合せすべての組合せを得 ることカ5できる。 F﹁U n L O

61.

4. アプリオリアルゴリズムを実行する SASプログラムの作成 まず、アプリオリアルゴリズムを忠実に実行する SAS プログラムを作成した。若干使い勝手 が悪いが、アルゴリズムに従い、フェーズ 1(マクロ SUPPORT)、フェーズ 2 (マクロ CONF) に分けて作成した。 指定方法は以下のとおりである。 ] [フェーズ 1 %SUPPORT(DATA=入力データセット名, MINSUP=最小サポート条件, OUTSUP=最小サポー ト条件を満たすアイテム組合せ出力データセット名) ] [フェーズ 2 %CONF(INSUP=フェーズ 1で得られた最小サポート条件を満たすアイテム組合せデータセッ ト名, MINCONF=最小確信度条件, OUTCONF=最小サポート最小確信度を共に満たすアソシ エーションルール出力データセット) 1 'はそのアイテムが存在し、それ 分析データには分析したいアイテム変数のみを文字変数(値 ' 00件の D M送付 (DM1‑DM5) 以外は存在しないの意味)として入力しておく。実行例として、 5 と世帯構成 (SETA I)と商品購入 (YESNO) との関係を分析してみる。 /*実行例 (1 )分析データ準備*/ data d m s a m p ; l e n g t h dm1‑dm5 s e t a iy e s n o$ 1 ; s e t bunseki.dmdat500(keep=dm1‑dm5 s e t a iy e s n o ) ; fsetai in ( 'w ')then setaiニ' 1 '; e l s es e t a iニ , , i r u n ; p r o cp r i n t data=dmsamp(obs=10);run; / * O B S D M 1 D M 2 D M 3 D M 4 D M 5 S E T A I Y E S N O TITI‑‑nununununununu 2 3 4 5 6 7 8 9 1 0 * / /*実行例 (1) [フェ ズ 1]* / %support(data=dmsamp, outsup=outsup1, minsup=O.05) / * t ‑ n左大アソシエーションル ルの抽出 VER1.2 by H.T(FEG) 1997/B/27,1998/4/23 ~左大大 === [フェーズ 1] 支 持 度 の 計 算 ‑ ‑ ‑ ηi p h u

62.

分析データセット名 = d m s a m p ,分析アイテム数 = 7 ,トランザクション数 = 5 0 0 最小支持度 = 0 . 0 5 サポート出力デ タセット名ニ o u t s u p 1 ア イ テ ム セ ッ ト 組 合 せ 数k = 2 実行中 = 3 実行中 ア イ テ ム セ ッ ト 組 合 せ 数k = 4 実行中 ア イ テ ム セ ッ ト 組 合 せ 数k 0 . 0 5 ) を満たすアイテム組合せ検索終了(該当件数 = 3 9 ) 最小支持度 ( 結果はデータセット o u t s u p1 に保存しました。 1 *実行例 (1 )サボ 卜出力データセット * 1 p r o cp r i n td a t a = o u t s u p 1 ; r u n ; O B S 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2 0 2 1 2 2 2 3 2 4 2 5 2 6 2 7 2 8 2 9 3 0 3 1 3 2 3 3 3 4 3 5 3 6 3 7 3 8 3 9 問1 M 2 M 3 D M 1 D M 2 D M 3 D M 4 D M 5 S E T A I Y E S N O D M 1 D M 1 D M 1 D M 1 D M 1 D M 1 D M 2 D M 2 開2 D M 2 D M 2 D M 3 D M 3 D M 3 D M 4 D M 4 D M 5 S E T A I D M 1 D M 1 開1 D M 1 D M 1 D M 1 開1 開1 D M 2 D M 2 D M 2 D M 2 D M 3 D M 3 D M 2 D M 3 D M 4 D M 5 S E T A I Y E S N O D M 3 D M 4 D M 5 S E T A I Y E S N O D M 4 D M 5 S E T A I D M 5 S E T A I S E T A I Y E S N O D M 2 D M 2 D M 2 D M 2 D M 3 D M 3 D M 4 日 間4 D 問3 D M 3 日 間4 D 問4 日 間4 D M 4 D M 3 D M 4 D M 5 S E T A I D M 4 S E T A I D M 5 S E T A I D M 4 S E T A I D M 5 S E T A I D M 5 S E T A I C O U N T S U P P O R T 1 7 5 1 7 4 1 2 7 1 1 2 6 6 2 1 2 6 0 7 0 6 0 6 5 4 2 7 1 3 0 5 9 5 5 4 1 8 0 3 2 5 8 3 5 5 3 3 9 4 8 2 6 3 4 3 0 3 5 2 8 3 0 3 6 2 6 2 9 2 9 3 2 3 1 2 6 2 9 2 5 2 7 0 . 3 5 0 0 . 3 4 8 0 . 2 5 4 0 . 2 2 4 0 . 1 3 2 0 . 4 2 4 0 . 1 2 0 0 . 1 4 0 0 . 1 2 0 0 . 1 3 0 0 . 0 8 4 0 . 1 4 2 0 . 0 6 0 0 . 1 1 8 0 . 1 1 0 . 0 8 2 0 . 1 6 0 0 . 0 6 4 0 . 1 1 6 0 . 0 7 0 0 . 1 0 6 0 . 0 7 8 0 . 0 9 6 0 . 0 5 2 0 . 0 6 8 0 . 0 6 0 0 . 0 7 0 0 . 0 5 6 0 . 0 6 0 0 . 0 7 2 0 . 0 5 2 0 . 0 5 8 0 . 0 5 8 0 . 0 6 4 0 . 0 6 2 0 . 0 5 2 0 . 0 5 8 0 . 0 5 0 0 . 0 5 4 。 K A L L N O B S 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 QU え u

63.

/*実行例 (1) [フ工ーズ 2]*/ う i c o n f ( i円s u p = o u t s u p 1, o u t c o n f = o u t c o n f 1, m i n c o n fニ0 . 5 ) 大大大アソシエーションルールの抽出 V E R 1 . 2b yH . T ( F E G )1 9 9 7 / 8 / 2 7,1 9 9 8 / 4 / 2 3 大大大 二二二[フェーズ 2} n 在信度の計算‑‑‑ サポ 卜計算済みデ タセット名 = o u t s u p 1 ,トランザクション数 = 5 0 0 最小確信度 = 0 . 5 ,確信度出力デ タセット名二 o u t c o n f 1 最小確信度 ( 0 . 5 ) を満たすアイテム組合せ検索終了(該当件数 = 3 5 ) 結果はデ タセッ卜 o u t c o n f 1に保存しました。 1 )アソシエーションルール最終出力データセット*/ /*実行例 ( p r o cp r i n td a t a = o u t c o n f 1 ; r u円; O B S R U L E S U P P O R T C O N F 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2 0 2 1 2 2 2 3 2 4 2 5 2 6 2 7 2 8 2 9 3 0 3 1 3 2 3 3 3 4 3 5 M 5→ D M 1 D M 4& D M 5→ D M 4 D M 3& D D M 1 &D M 5→ D M 4 M 5→ D M 1 D M 2& D M 5→ D M 2 D M 1 &D D M 4& D M 5→ D M 2 D 阿4& D M 5→ D M 3 M 1 D M 5→ D M 4→ D M 1 D M 2& D M 5→ D M 4 D M 2& D 阿5→ D 阿2 D M 4→ D M 1 D M 3& D D M 4& S E T A I→ 聞 1 E T A I→ 聞2 D M 4&S M 3→ D M 4 D M 1 &D D M 5→ D 阿4 E T A I → 聞2 D M 3& S D M 2& D 阿4→ D M 3 M 1 D M 4→ D E T A I Y E S N O→ S D M 4& S E T A I→ D 問 M 4→ D 問 D M 1 &D M 4→ D M 2 D M 3& D D M 2& D M 3→ D 阿4 M 4→ D 阿2 D M 1 &D Y E S N O→ D M 2 D M 5→ D M 3 D M 2& D M 4→ S E T A I M 3→ S E T A I D M 2& D D M 4→ D M 3 D M 3& S E T A I→ D M 4 阿2& D M 3→ D M 1 D M 2→ D M 4 D M 1 &D M 3→ D M 2 D M 1 &D Y E S N O→ 開 1 0 . 0 5 8 0 . 0 5 0 0 . 0 5 8 0 . 0 5 6 0 . 0 5 6 0 . 0 5 2 0 . 0 5 0 0 . 0 8 4 0 . 0 7 0 0 . 0 5 2 0 . 0 8 2 0 . 0 7 2 0 . 0 5 8 0 . 0 5 8 0 . 0 7 2 0 . 0 7 8 0 . 0 6 2 0 . 0 6 4 0 . 1 3 0 0 . 0 6 8 0 . 0 5 4 0 . 0 7 2 0 . 0 6 4 0 . 0 6 4 0 . 0 7 0 0 . 0 6 4 0 . 0 7 0 . 0 5 8 0 . 0 6 2 0 . 1 1 6 0 . 0 5 4 0 . 0 6 0 0 . 0 7 0 0 . 0 6 0 0 . 0 6 0 0 . 7 4 3 5 9 0 . 7 1 4 2 9 0 . 6 9 0 4 8 0 . 6 8 2 9 3 0 . 6 6 6 6 7 0 . 6 6 6 6 7 0 . 6 4 1 0 3 0 . 6 3 6 3 6 0 . 6 3 6 3 6 0 . 6 3 4 1 5 0 . 6 2 1 2 1 0 . 6 2 0 6 9 0 . 6 0 4 1 7 0 . 6 0 4 1 7 0 . 6 0 0 0 0 0 . 5 9 0 9 1 0 . 5 8 4 9 1 0 . 5 8 1 8 2 0 . 5 8 0 3 6 0 . 5 6 6 6 7 0 . 5 6 2 5 0 0 . 5 5 3 8 5 0 . 5 5 1 7 2 0 . 5 4 2 3 7 0 . 5 3 8 4 6 0 . 5 3 3 3 3 0 . 5 3 0 3 0 0 . 5 2 7 2 7 0 . 5 2 5 4 2 0 . 5 1 7 8 6 0 . 5 0 9 4 3 0 . 5 0 8 4 7 0 . 5 0 0 0 0 0 . 5 0 0 0 0 0 . 5 0 0 0 0 。 L H S R H S M 5 D M 4& D D M 3& D M 5 D M 1 &D M 5 D M 2& D M 5 D M 1 &D M 5 阿5 D M 4& D D M 4& D M 5 D M 5 阿4 D M 2& D D M 2& D M 5 D M 5 D M 3& D M 4 D 阿4&S E T A I D M 4&S E T A I D M 1 &D M 3 D M 5 E T A I D M 3&S D M 2& D M 4 D M 4 Y E S N O D M 4& S E T A I D M 1 &D 阿4 D M 3& D 阿4 D M 2& D M 3 D M 1 &D 阿4 Y E S N O D M 5 D M 2& D 阿4 D M 2& D M 3 D M 4 D M 3&S E T A I D M 2&D M 3 D M 1 &D M 2 阿1& D M 3 D Y E S N O D M 1 D M 4 D M 4 D M 1 D M 2 D M 2 D M 3 開1 D M 1 開4 開2 D M 1 D 阿1 D 阿2 D M 4 D M 4 D M 2 D M 3 D M 1 S E T A I D M 3 D M 3 D M 2 D M 4 D 阿2 D 阿2 D 阿3 S E T A I S E T A I D M 3 D 阿4 D 阿1 D M 4 D M 2 D M 1 Qd RU

64.

5 . プログラムの拡張 次に、以下のようにプログラムを拡張した。 [フェーズ 1] (1)結論部を特定アイテムに指定するオプション (RHSニ結論部アイテム変数名) (2)最大アイテム組合せ数を設定するオプション (MAXCOMB=最大組合せ数 k) (3)同じアイテムの別カテゴリを表わすアイテムグループの中ではいずれか 1つのアイテム のみをアイテム組合せ対象とするオプション (ALT=Y/N) [フェーズ 2 ] (1)結論部を指定するオプシヨン (RHS=結論部アイテム変数名) フェーズ 1の ALT ニY オプションを用いる場合、同じアイテムの別カテゴリ定義を表わすアイ テム変数は変数名にアンダスコア(一)を含みアンダスコアの左側は同じ文字列であることを 前提としている。例えば、アイテムを以下のように定義すると、 AGE̲で始まる 3つのアイテ SEI̲Fは作成 ム変数 AGE̲18, AGE̲30, AGE̲50と SEI̲で始まる 2つのアイテム変数 SEI̲M, されるアイテム組合せの中にはいずれか 1つのアイテムのみ組合されるように制限が付けられ る 。 ( a l tは a l t e r n a t i v eの略) アイァム変数名 AGE 18 AGE 30 AGE 50 SEI M SEI F 作成方法 二 1 8thenAGE̲18=' l ' ; ifage< e l s eAGE 1 8 = '; 二 3 0thenAGE̲30=' l ' ; i fage< e l s eAGE 3 0 = '; i fage< 二 5 0thenAGE̲30='1 ' ; elseAGE 50ニ '; m 'thenSEI ̲ M=' l ' ; i fs e i ニ' e l s eSEI M='; i fs e i = ' fthenSEI ̲ F=' l ' ; e l s eSEI F='; 以下、拡張機能の実行例を示す。 /*実行例(2 )データ準備本/ d a t ad m s a m p 2 ; s e td m s a m p ; 「 巴n a m ed m lニd m ̲ ld m 2 = d m ̲ 2d m 3 = d m ̲ 3d m 4 = d m ̲ 4d m 5 = d m ̲ 5 ; r u n ; 意味 年齢 18歳以下 年齢 30歳以下 年齢 50歳以下 性別=男 性別=女 ρhv ハU

65.

/本実行例(2) 拡張機能[フェ ズ 1J * / %support(data=dmsamp2, outsup=outsup2, minsup 二0, r h s = Y E S N O, maxcomb=3, a l t = y ) 本 / 交 交 交 ア ソ シ ヱ ションルールの抽出 V E R 1 . 2b yH . T ( F E G )1 9 9 7 / 8 / 2 7, 1 9 9 8 / 4 / 2 3 交交交 [フェ ズ 1J支 持 度 の 計 算 ‑ ‑ ‑ === 分析デ タセット名ニ d m s a m p 2 ,分析アイテム数二 7 ,トランザクション数 = 5 0 0 最小支持度 = 0 ,最大アイテム組合せ数 = 3 ,ルールの結論部 =YESNO 択一オプション=有効,サポート出力データセット名 = o u t s u p 2 アイテムセット組合せ数 k = 2 実行中 = 3 実行中 アイテムセット組合せ数 k 0 ) を満たすアイテム組合せ検索終了(該当件数 = 2 3 ) 最小支持度 ( 結果はデータセット o utsup2に保存しました。 本 / /本実行例(2 )サポート出力データセット*/ p r o cp r i n td a t a = o u t s u p 2 ; r u n ; / * M 1 O B S S U P P O R T K A L L N O B S ︐ U 4 内U 4 内U 4 内U 4 内U 114lt4E dBE4l 4Ea‑‑snノ ﹄ 内 ノ ﹄ 内 ノ ﹄ 内 ノ ﹄ 内 ノ ﹄ 内 〆 ﹄ 内 ノ ﹄ 内 〆 ﹄ ︽ ノιη 〆 ﹄ 内 〆 ﹄ 内4 ︐ ・ ‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑ 門 Ma仏 nHunkua仏 y a仏 Y 内〆﹄ a仏 ynHV 内〆﹄ nHvnHvalnhυnkunhυnMU 内〆﹄ n h υ M 目 n kunhunノ﹄ n h u Fhua斗 Runtqu つι ? ﹄ 凋 仏 マ RυRυRυnU 凋仏マ q u a斗 RuntRυququntqV4l ququntnt ‑ a斗 4141nU4Inu‑‑nununununununununununU YESNO YESNO YESNO YESNO YESNO C O U N T ︽U nHU H n H V H ︽U H ︽U H ︽U H ︽U H ︽U H ︽U H ︽U ︽U H ︽U H ︽U H ︽U nHU H ︽U H ︽U H ︽U H ︽U nHunHunHunHU H ψaT l n口 qunu‑‑ntqua斗 F h u n h υ 守 l n口 qunU13ntqu 4111114ie141441111111ntntntつιJ'r 守 S E T A I YESNO S E T A I YESNO S E T A I YESNO S E T A I YESNO S E T A I YESNO YESNO S E T A I S E T A I S E T A I S E T A I S E T A I M3 F h u 凋仏マ 7a つι R υ ?﹄ nU1snununtqu 凋仏マ R v a斗 R υ q u a斗 守 l q u q u R u n 口 I 守 lη41lnhυ4IRυ7aqun 口 quRunt 凋 仏 マ 内 正 つ ι l q u 1 ・ 唱l 4 1 4 1 づ 内正 11111111 h u n h υ 11つι q u a斗 F D M1 D M2 D M3 D M4 D M5 S E T A I YESNO D M1 D M1 D M2 D M2 D M3 D M3 D M4 D M4 D M5 D M5 S E T A I D M1 D M2 D M3 D M4 D M5 M 2 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 /*実行例(2 )拡張機能[フェーズ 2J * / %conf(insup=outsup2, outconf=outconf2, m i n c o n f = 0 . 2, r h sニY E S N O ) 本 / 交交交アソシエーションルールの抽出 V E R 1 . 2b yH . T ( F E G )1 9 9 7 / 8 / 2 7,1 9 9 B / 4 / 2 3 交交交 [フエ ズ 2J確 信 度 の 計 算 ‑ ‑ ‑ === サポ ト計算済みデータセット名 = o u t s u p 2 ,トランザクション数 =500 ルールの結論部 =YESNO ,最小確信度 = 0 . 2 ,確信度出力デ タセット名 =outconf2 最小確信度 ( 0 . 2 ) を満たすアイテム組合せ検索終了(該当件数 = 6 ) 結果はデータセット o u t c o n f 2 1こ保存しました。 * / り ρ 1i

66.

1 *実行例 (2)アソシエ ションルール最終出力データセット * 1 p r o cp r i n td a t a = o u t c o n f 2 ; r u n ; O B S 2 3 4 5 6 R U L E S U P P O R T C O N F 日 間 4&S E T A I→ Y E S N O 0 . 0 3 2 0 . 0 1 6 0 . 0 2 6 0 . 0 3 4 0 . 0 3 8 0 . 0 4 8 0 . 3 3 3 3 3 0 . 3 0 7 6 9 0 . 2 4 5 2 8 0 . 2 3 9 4 4 0 . 2 3 7 5 0 0 . 2 1 4 2 9 日 間 5&S E T A I→ Y E S N O 日 間 3&S E T A I→ Y E S N O D M 1&S E T A I→ Y E S N O D M 2&S E T A I→ Y E S N O D M4→ Y E S N O L H S R H S 日 間 4&S E T A I D 阿 5&S E T A I D 阿 3&S E T A I D M 1&S E T A I D M 2&S E T A I D M4 Y E S N O Y E S N O Y E S N O Y E S N O Y E S N O Y E S N O 6 . おわりに プログラムの拡張により、アソシエーションルール抽出法を判別問題に利用することが簡単に できるようになった。なお、作成したプログラムは BASESASの機能のみで書かれており、 紙面の都合上プログラムの全容を本稿に掲載することはできないが、当社ホームページ ( http://www . f e g . c o . j pl)からテキスト形式でダウンロード可能となっているはずである。(本 稿作成時は、約 4 00行のプログラムである。) 参考文献 喜 連 川 優 (1997) iデ ー タ マ イ ニ ン グ に お け る 相 関 ル ー ル 抽 出 技 法 」 人 口 知 能 学 会 誌 Vol12, No. 4 , pp513‑520 62‑

67.

日本 SASユーザー会 (SUGI‑J) 大規模なカテゴリー・データのクラスタリング手法 中林三平 株式会社金融エンジニアリング・グループ 代表取締役社長 C l u s t e r i n gA l g o r i t h mf o rVeryL a r g eC a t e g o r i c a lDataSets SampeiN a k a b a y a s h i P r e s i d e n t .F i n a n c i a lE n g i n e e r i n gG r o u p .I n c . 要旨 大規模データのクラスタリングは、データ・マイニングを行う場合の基礎的なアプローチの一 つである。大量のデータのクラスタリングにあたっては、計算量の関係から k‑means 法が現実 的な手法である。しかし、 k‑means法においては距離定義を明確に行う必要があることから、 基数尺度で表現できる属性のみが対象とされてきた。これに対して、 Huang(1997 ) は k‑mode法 と呼ばれる名義尺度属性による効率的なクラスタリング手法を提案した。この手法においては、 サンプル聞の距離をカテゴリーの不一致をベースとした、いわゆるハムの距離に近い概念で定 義しているが、その正当性については疑問が残る。本稿は、その距離定義を相互情報量により 定義することを通じて、より明確な名義尺度属性によるクラスタリングの手法を提案する。 キ ー ワ ー ド : データマイニング、クラスタリング、 SAS/IML 1 問題の背景 データ・マイニングにおいては、大量のデータを分割し、特徴のある「セグメント」を抽出す るという作業が頻繁に発生する。分割に際して、判別の対象となる属性が明確にされている場 合(教師付き学習)には決定木の生成などの手法が利用されるが、属性の類似性を尺度として グループを生成する(教師なし学習)場合には「クラスタリング」の手法が利用されることに なる。 クラスタリングの手法については、非常に多くの手法がこれまでに提案されてきている。各 種の統計的なクラスタリング手法は、対象とするサンプル聞に何らかの意味での「距離」を定 義することにより、適切な基準を設けることで頬似したサンプルを寄せ集めていくという考え l u s l e r参照)。一方、データ・マイニングに関わり 方を基本としている (SAS/ORの procc の深い機械学習の分野では、必ずしも数値的な「距離」に依存しない概念クラスタリングとい n c lStc] l ] l , 1 9 8 : 3 )。 う手法が提案されている (Michalskia しかし、データ・マイニングにおいては、大規模なデータを分析対象とすることが通常であり、 数卜 数百万件のサンプルを効率的に処理するアルゴリズムでなければ実用には耐えない。さ らに、サンプルを記述する属性のうち、かなりのものが名義尺度として定義されているのが現 63‑

68.

実である。間隔尺度または順序尺度で与えられているものを擬似的な名義尺度に直すのは、適 c l i s c r e t i z at i o n ) を行えば可能であるが、名義尺度を間隔尺度に変換するの 切なカテゴリー化 ( は、非常に大きな努力を必要とする(不可能とは言わないが)。 この 2つの点を解決するために、これまでデータ・マイニングの世界では様々な努力が行われ てきたが、ここで提案する修正 k‑mode法はこれらの問題に対する解を与えるものである。 2k ‑ m e a n s法について k‑means法は、 SASの p r o cf a s t c l u sとして提供されているため、馴染みが深い子法である。 いくつかのバリエーションが存在するが、最初に提案されたのは約三十年前である (MacQueen, 1 9 6 7 )。この手法は次のような操作をサンプルに対して施すことにより、全体を k個のクラスタ ーに分割する。 1 ) k個の初期値(シード)をデータ空間からランダムに選択する 2)各サンプルについて、 k個のシードとの「距離」を計算する 3)各サンプルをもっとも r R e離」の近いシード(の属するクラスター)に割り当てる 4) サンプルを割り当てられた各クラスターの「平均」を新しいシードとする 5)上記のステップ 2以降を繰り返し、シードが移動しなくなるまで繰り返す ここでの「距離」は、通常ユークリッド距離が利用される。 SASで k‑means法を適用する r o cf a s t c l u s内では属性の正規化などは行われないため、事前に p r o cs t a n d a r dなど 場合には、 p p r o cf a s t c l u sは収束 により尺度を適正に修正しておく。基本的には、 k‑means法は収束する ( の保証があるアルゴリズムを利用している)。しかし、初期値によっては異なる結果が与えら れることがある。 k‑means法の最大の特徴は効率性である。 k‑means法の計算量は、 o(tkmn) である。 ここで、 tは繰り返し計算の回数、 kはターゲット・クラスターの数、 mは各サンプルの持つ 属性の数、 nはサンプルサイズである。つまり、サンプルサイズに関しては線形の計算量であ p r o cc l u s t e rでサポートされているような手 る。これに対して、通常の階層的クラスタリング ( 法群)の計算量は、 o(n2) である。したがって、分析対象のサンプルサイズが極めて大量に なる場合には、 k‑means法に類似した手法が現実に利用可能なものとなる。 しかし、 k‑means法の問題は、サンプルとシードとの聞の「距離」を計算するというステッ プと、新しいシードをクラスターの平均(もしくは重心)として計算するというステップにあ る。平均という概念が意味を持つためには、属性は間隔尺度でなければならない。 3 力テゴリー・データの表記 カテゴリー・データとして、ここで、は通常の名義尺度属性のみを持つデータを考える。連続 変数(間隔尺度もしくは順序尺度)については、適宜「カテゴリ一化」が行われているものと する。(カテゴリ一化固有の問題についてはここでは検討しない。また、連続変数をカテゴリ 一化することによる誤差の問題については、現在、名義尺度と数値尺度の統一的なクラスタリ ングのアルゴリズムを試行中であり、稿を改めて発表する)。 = on ) は属性 A j (j 1I Dm) を持つ。各属性の取りうる伯は傑々な 各サンプル X r (r=lt ‑64‑

69.

ものであるが有限である(例えば、 「性別」という属性は、男/女/不明という値を取りうる とする)。この属性の変域を D O M (Aj) と表現する。各変域に含まれるカテゴリー値は、 階層などを持たないものとする。(例えば、 「管理職」と「部長」が同一カテゴリーの異なる カテゴリー値としては存在しなJ.,¥)。 X r .j } (つまり、属性値の集合)として表現される。 Xr=Xsという表 各サンプル X rは { 記は、 X r . j = X s, j( f o ra l lj ) を意味する。 4k ‑ m o d e法について Huangによる k‑mode 法は次のようなアルゴリズムである。まず、サンプル聞の「距 i s s i m i l a r i t yという用語を用いている)は次のようにして定義される。 離 J (Huangは d EE Bノ ︐ ︑'EA ︐ ︐︑ d ( X r, Xs)=2 . :j=110mδ(Xr, jX s . j ) ただし、 δはクロネッカーの記号であり、 δ(Xr, j Xs, j ) ニo =1 i fX r . j = X s, j j 八= Xs, j i f Xr, つ ま り (1)で定義される「距離」は、 2つのサンプルの各属性を比較した時に、カテゴリ ー値が「不一致」となる個数である。この場合には、各属性におけるカテゴリー値の発生頻度 については配慮、されていない。しかし、例えば、債権不良化の分析を行う時に、 「債権状態」 という属性があり、正常/不良というカテゴリー値があったとする。不良の発生確率は通常極 めて低く、 2つのサンプルが不良であるということで一致したとすると重要視したい。これを 修正するために、 Huangはカイ自乗距離と呼ぶものを定義している。 d x(Xr , Xs)=2 . :j=llorn(Nr, j +Ns, j ) / ( N r, j 犬N s, j )犬 δ(Xr, j Xs, j ) ( 2 ) ただし、 Nr, jは全体サンプルの中で、 Aj=Xr, jとなる件数、 Ns, jは Aj=Xs, jとなる件数 を示す。 この修正はある程度リーズナブルではあるが、必ずしも意図した結果を反映できるものでは ない。例えば、全体で 10件のサンプルのうち正常が 9件、不良が l件であったとする。 2つ のサンプルを比較した時、 (2)式に表れる「ウェイ卜」は次のようになる。 X r,j=正常、 Xs,jニ正常 (9+9) / (9*9) =0.222 X r,j=不良、 Xs,j=正常 (9+1) / (9*1) 二1. 111 X r,j=不良、 Xs,j二不良 (1+1) / (1*1) =2.000 一見、予期したように不良が一致するケースについてはウェイ卜が高まる。しかし、この距 離尺度自体が「不一致」の尺度であり、上記の 3番目のケースについてはクロネッカーの δが ゼロという値を取るため、全体の距離に対しては大きな影響を与えない。 とりあえずは、以仁のような r~巨離」定義により 6 5 k-modc 法は進む。具体的なアルゴリズム

70.

は k‑means法とほぼ同様である。 1 ) k個のシードを(若干工夫して)属性空間から選択する 2) 1式もしくは 2式に基づき各サンプルとシードとの距離を計算する 3)各サンプルをもっとも í~8 離」の近いシードに割り当てる 4) 各シードの位置をクラスター内のサンプルから、各属性の最大頻度を持つ属性値の組 み合わせとして定義する 5)上記のステップ 2以降をシードが移動しなくなるまで繰り返す 上記のアルゴリズムの中で注意すべきはステップ 4である。ここでは、シード自休がカテゴ リ一変数(つまり、一つの属性に対しては一つの伯しか持ち得ない)という定義を保持し続け ている。したがって、データの持つ属性の状況(属性数および各属性のカテゴリー数)によっ ては、目的とするクラスター数 kとのバランスにより融合された kが発生する可能性もある。 (特に、バイナリのカテゴリーが多い場合には問題が発生する)。 以上のように、 k‑mode法自体は極めて優れたアイデアであるが、次に述べるような問題も含 んでいる。 1)不一致の尺度と一致の尺度とは表裏一体の関係にはない 2)クラスターの重心の計算に「最大頻度」を採用することにより、離散空間上のシード しか定義されない(算定可能クラスター数の問題、クラスターの不連続性、クラスタ ーの不安定性などが発生する) 5 相互情報量の導入による修正 k ‑ m o d e法 カテゴリカルなモデルを想定した時のデータ聞の類似性、近接性についてはよりダイレクト な尺度が存在する。その中で、もっともポピュラーであり、かつ、理論的根拠が明確なものは u l l b a c k の判 エントロビーに基づく尺度であろう。例えは、相互情報量(相対エントロビー、 K u l l b a c k ‑ L e i b l e r の距離)は 2つの分布の近接性を表現するものとして利用可能であ 別関数、 K る。これは一つの属性分布に関しては次のように定義される。 dαr, j Xs, j ) =2 :vεDOM (Aj) Pv, j * l o g σv, j/Qv, j ) ( 3 ) ただし、 Pv, jは X rの属性 jに関するカテゴリ一分布であり、 X rが純粋なカテゴリ 一変数である場合には、特定の v にのみ lが与えられ、その他のカテゴリーはゼロで ある。 Qは Xsに対応する。 自然な拡張系として、多数の属性分布についてのサンプル聞の相互情報量は次のように定義 される。 d ( X r Xs)=2 :j=lto'" 2 :vεDOM (Aj) Pv, j * l o g ( P v, j / Q v, j ( 4 ) ここで、 X rを各サンプルとし、 Xsをシードとしてみよう。 P jは X rが j番目の属性に 関して持つシードが純粋なカテゴリ一変数である(各属性について、カテゴリ一変域内の唯一 ‑66一

71.

の値のみを持つ)場合を考える。 4式を計算すると、 X r,jニ X s,jとなる属性について は式が定義出来るが、それ以外の状態では計算値は定義されない。ここで 4式を変更し、次の ようにする。 d(Xr Xs)=2 :j=1. 1m P v . j * l o g ( P v . j / Q v .j ) 0 ( f o rv [ { P v j = A j } ) ( 5 ) なお、上式においては、 P v . jは常に 1となる。 つまり、 X rの属性 jについてのカテゴリー値のみを計算対象とする。 X r . j: t :X s . j となる場合 には任意の大きな値 M を与えることとする。これにより、 5式は計算可能となり、カテゴリー 値が一致している数が多いほど(かつ、稀にしか発生していないカテゴリーが一致するほど) 距離は近いものとして定義される。 また、シード (Xs)が純粋なカテゴリ一変数ではなく、カテゴリ一分布を持つ変数として 定義されている状態においても、 5式を適用することが可能である。下記のアルゴリズムにお いては、イタレーションの回数が 2以上の場合には、シードは純粋なカテゴリ一変数ではなく、 カテゴリ一分布として表現されることを前提としている。 さて、上記の準備を整えた後で、クラスタリングのアルゴリズムを整理してみよう。 1)適切なシードを純粋なカテゴリ一変数として選択する 2) 5式により各サンプルと全てのシードの距離を計算する 3)各サンプルをもっとも近いシードに割り当てる 4) 各シードの位置を割り当てられたサンプルからカテゴリ一分布として計算する 5)ステップ 2に戻り、シードの位置が動かなくなるまで繰り返し計算を行う 初期の k個のシードの選択方法であるが、分析対象データを母集団とし、各属性別のカテゴ リ一分布に対して、一様乱数を発生させることにより決定する方法で十分である。ただし、同 ーのシードがアロケートされないようなチェックは必要である。 6 SAS/IMLによるコーディング事例 実際にこのアルゴリズムは、 SAS/IMLにより極めて簡単に表現できる。ただし、サン プルが非常に大きい場合には、メモリーの制約によりデータステップにより記述する必要があ るであろう。コーデイングの事例を添付する。 なお、事前のデータ準備として各サンプルは行方向にフルに展開されているものとする。す なわち、 D O M (Al) [[DOM (A2) [[... [[DOM (Am) という並びで、各 属性について反応するカテゴリーについては 1が立っており、その他はすべてゼロであるとす る。また、同様に、全サンプルの各属性についてのカテゴリ一分布は計算済みであり、かっ、 各属性のカテゴリー数も定義されているとする。 ハ む ー ワ

72.
[beta]
Sam]
ll
cC
o
c
l
ef
o
rR
e
v
i
s
e
c
lk‑mo【l
eMethodf
o
rC
a
t
e
g
o
r
i
c
a
lC
l
u
s
t
e
r
i
n
g匂
【初期シードの設定事例]
]
lr
o
ci
m
l
:
/
*Numbero
fTargetC
a
t
e
g
o
r
i
e
sり
k
=
l
O
;
大
/I
】o
p
u
l
a
t
i
.
onc
l
i
s
t
r
i
b
u
t
i
o
nり
lo
p
d
i
s
t
:
u
s
e]
/
*rowv
e
c
t
o
rり
r
e
a
da
l
li
n
t
oc
l
i
s
t
;
c
l
o
s
epO]
ld
i
s
t
:
u
s
ecatnum:
/
*Numo
fC
a
t
e
g
o
r
i
e
sf
o
rEachA
t
t
r
i
b
u
t
eり
r
e
a
da
l
li
n
t
ocnum: /
*rowv
e
c
t
c
rり
c
l
o
s
ecatnum;
cmax=ncol(cnum);
/
*Numbero
fA
t
t
r
i
b
u
t
e
s匂
cnum=llI
cusum(cnum、
)
'
; /
*P
o
i
n
t
e
r*
/
n
m
a
x
=
n
c
o
I
(
c
l
i
s
t
)
;
/
*T
o
t
a
lLengtho
fV
a
r
i
a
b
l
e
s
り
s
e
e
dニj
(
k
.
n
m
a
x
.
O
)
;
dol
p
=
lt
ok
:
/
*l
t
e
r
a
t
i
o
nf
o
rA
I
ISeeds*
/
l=
lt
ocmax;
/
*I
t
e
r
a
t
i
o
nf
o
rA
l
lA
t
t
r
i
b
u
t
e
sり
dok]
is=cnum[kp];ie=cnum[kp+1
]
:
/
*C
a
t
e
g
o
r
yP
o
i
n
t
e
r
:S
t
a
r
tandEndり
c
c
l
i
s
t
=
c
u
s
u
m(
d
i
s
t
[
i
s
:
i
e
]、 ) 、 / *D
i
s
t
r
i
b
u
t
i
o
nw
i
t
h
i
nA
t
t
r
i
b
u
t
eり
rand二 u
n
i
f
o
r
m
(
O
)
;
/
*RandomNumberり
i
d
=
l
o
c
(
r
a
n
d
>
c
d
i
s
t
)
[
l
]
;
/
*S
e
l
e
c
t
e
rCategoryり
s
e
e
d
[
I
p
.
i
d
]
=
l
;
e
n
d
:
e
n
d
:
sr
e
q
u
i
r
e
df
o
rSEEDり
/
*Warning!D
u
p
l
i
c
a
t
i
o
nChecki
sn
o
tI
n
c
l
u
d
e
d& Outputi

大
/

qUl1
;

【相互情報量の計算事例]

p
r
o
ci
m
l
:
k=l
O
:1
日r
gem=l
O
; /
*ParametorsR
e
q
u
i
e
c
l*
/
u
s
cs
e
e
d
:
/
*S
e
e
c
l*
/
r
e
a
da
l
li
n
t
os
e
e
d
:
c
l
o
s
es
e
e
d
:
.D
ata大
/
l
l
s
es
a
m
p
l
e
;
/
*S日mplp
r
e
a
da
l
li
n
t
od
a
t
;
ll
e
;
c
l
o
s
esamJ
nmax=nrow(dat); /
*SampleS
i
z
e大/
c
a
t
二j
(
n
m
a
x
.
l,
O
)
: /
*OutputV
e
c
t
o
rf
o
rThisl
t
e
r
a
t
i
o
nり
dolp=lωnmax;
[l
p
.
]
=
l
)
;
i
d
=
l
o
c
(
d
at
le
at
[d
at
[l
,
l
]i
c
l
,
]k,1
]
;
denom=
r
e]
d
is
t
=
c
h
o
o
s
e
(
s
e
e
d[
.
i
d
]
>
O,
denom*
l
o
g
(
d
e
n
o
m
/
s
c
e
d
),
l
a
r
g
e
m
).
[+
]
;
】]
=
d
i
s
t
[く
:
>
]
;
c
a
t
[
l
]
e
n
d
;
q
u
i
t
:
参考文献
Huang,Zhcxue:ηAFastC
l
u
s
t
e
r
・
i
n
gAlgorithmt
oC
l
u
s
t
e
rVeryLargeC
a
t
e
g
o
r
i
c
a
lDataS
e
t
s
c
q
u
i
r
e
dthroughI
n
t
e
r
n
e
t,h
t
t
p
:
/
/
w
w
w
.
c
s
i
r
o
.
a
u
i
nDataM
i
n
i
n
g
",papcra
J
J
l
, R
.E.:"AutomatedConstruetiono
fC
l
a
s
s
i
f
i
e
a
t
i
o
n
s
: ConeeptuaI
M
i
c
h
a
l
s
k
i
.RS.andS
t
β]
r
a
n
s
a
e
t
i
o
n
sonPat
t
.
e
r
nA
n
a
l
y
s
i
s
C
l
u
s
t
e
r
i
n
gv
e
r
s
u
sNumericalTaxonomy",IEEET
andMaehincI
n
t
.
e
l
l
i
g
e
n
e
e
.ら(
4
)
.1888,p
p
.3
:9
G・l
tlO

68‑

73.

統計

74.

日本 S A Sユーザー会 (SUG I‑J) 神 経 線 維 腫 症 1 (NF 1) の 臨 床 症 状 の 相 互 関 連 に 関 す る 研 究 将俊彦,浅尾啓子,豊島裕子、清水英佑(慈恵、医大環境保健医学教室) ,大野良之(名古屋大予防医学教 室),高木慶文(統計数理研究所),稲葉裕(順天堂大衛生学教室),柳修平()1崎 医 療 福 祉 大 学 保 健 看 護 学 科)、新村長人(慈恵医大皮膚科)、大塚藤男(筑波大皮膚科) A study of reciprocal relationships among clinical symptoms of neurofibromatosis type 1 . Toshihiko Agata, Keiko Asao, Yuuko Toshi皿a, Hidesuk巴 Shi皿izu(Dept. of Public Health &Env ironmental Medicine, Jikei University, School of Medicine), Yoshiyuki Ohno(Nagoya Universi t y ),Hirofu凹 iTakagi(National lnstitute of Mathematical Statistics), Yutaka Inaba(Juntendo h University), Shuhei Ryu(Kawasaki University of Medical and Welfare), Michihito Niimura(J ikei University School of Medicine), Fujio Ohtsuka(Tsukuba University School of Medicine) 要己 神 経 線 維 腫 症 lの患者の臨床症状(皮膚症状は灯工イ・レ斑、レツクリンク。ハウセツ斑、 皮 膚 の 神 経 線 維 腫 : 全 身 、 同 : 顔 面 、 調 漫 性 神 経 線 維 腫 、 悪 性 神 経 鞘1 重、中枢 神経症状は痩輩、知能低下、脳または脊髄腫蕩、整形外科的症状は長管骨変形、脊住変形、 神 経 症 状 、 脊 髄 腫 場 、 眼 科 的 症 状 は 虹 彩 小 結 節 ) に つ い て SPEARMANの 順 位 相 関 係 数 を 求 め 、 その有意性を検討するとともに、因子分析、クテスター分析により相互関連を検討し次の結果を得 た。 14臨 床 症 状 の 順 位 相 関 係 数 で み る と 、 多 く の 臨 床 症 状 が 有 意 な 相 関 を 示 し て い る 。 ま た ウ γン斑、 因 子 分 析 の 結 果 で は 4 因 子 が 抽 出 さ れ 、 第 1因 子 に 因 子 負 荷 が 高 い の は 小 川 ク リ ン fハ 皮 膚 の 神 経 線 維 腫 ( 全 身 、 顔 面 ) な ど で あ り 、 第 2因 子 に 因 子 負 荷 が 高 い の は 脳 ま た は 脊 髄 腫 蕩 、 脊 髄 腫 湯 、 神 経 症 状 で あ る 。 第 3 因 子 に 因 子 負 荷 が 高 い の は カ 7工・オ・レ斑、窪輩、知能低下 である。第 4 因 子 に 因 子 負 荷 が 高 い の は 長 管 骨 変 形 、 脊 住 変 形 、 虹 彩 小 結 節 で あ る 。 ク ラ ス タ lは 因 子 分 析 の 第 I因 子 と 対 応 し て い る 。 取 り 込 ま れ る 変 数 の 内 、 調 分析の結果ではクラスタ 漫 性 神 経 線 維 腫 、 虹 彩 ノ ト 結 節 は 1‑ R 2 比が大きい。クラスタ 2は 第 2因子に、クラスター 3は 第 3因 子 と 対応している。これらを考慮、して、診療連携、患者の予後予測等を行って行く必要があろうっ 日 、神経線維腫症 1、 皮 膚 症 状 中 枢 神 経 症 状 整形外科的症状、眼科的症状、 キーワード順位相関係数、因子分析、》ラスター分析、 目 的 : 昭和 4 7年 7月 に 難 病 対 策 要 綱 が 策 定 さ れ て 2 0年 以 上 が 経 過 す る が 、 同 要 綱 で は 、 行 政 対 象とする難病の範囲を①原因不明、治療法未確立であり、かつ、後遺症を残すおそれの少なくない疾 こ著しく入手を要するために家庭 病、 ②経過が慢性にわたり、単に経済的な問題のみならず介護等 l の負担が重く、また、精神的にも負担の多い疾病 と定義している。そして、①調査研究の推進、② 医 療 費 の 自 己 負 担 の 解 消 、 ③ 医 療 施 設 の 整 備 、 を 3本 柱 と す る 対 策 が 進 め ら れ 、 さ ら に は 平 成 元 年 か ら は 、 ④ 地 域 に お け る 保 健 医 療 福 祉 の 充 実 ・ 連 携 、 平 成 8年 度 か ら は ⑤ Q O L向 上 を 目 指 し た 福 祉 施 策 の 推 進 、 の 5本 柱 で 対 策 が 進 め ら れ て い る 。 そ し て 、 特 定 疾 患 治 療 研 究 対 象 疾 患 は 平 成 6年度末で、 ベ チ ェ ッ ト 病 な ど 37疾患(群)が指定されており、 29万 人 が そ の 対 象 と な っ て い る た め 、 難 病 患 者 の 多 く は 医 療 費 公 費 負 担 の 対 象 と な っ て い る 九 神 経 線 維 腫 症 1 (以下 N F 1) は 東 京 都 を 除 い て は 公 0年 5月より公費負担対象疾患となった。 N F lは 費負担対象疾患とはなっていなかったがヘ、平成 1 出生 3000‑4000'こっき 1の発生があり.5).6) 、日本にも 4万前後の患者がし、ると想定されているマ〉。 最 近 の 諸 外 国 の N F lの研究では、小児黄色肉芽腫・!j、児漫性白血病との関連 8)、 ア ジ ア 太 平 洋 地 域 、 ト に お け る 遺 伝 学 的 研 究 9)、喉頭部の神経線維腫症 10) 、 小 児 横 紋 筋 肉 腫 ・ 出 生 児 損 傷 と の 関 連 1 リ ー ゴ で の 地 域 調 査 12) 、 認 識 カ や 知 能 と の 関 連 13) 、 イ ス ラ エ ル で の 家 系 内 発 症 や 有 病 率 の 研 究 1 4) . 1 日 、 チ ュ ニ ジ ア で の 調 査 1o) 、 白 血 病 と の 関 連 17) 、 臨 床 免 疫 学 的 調 査 1 8) 、 褐 色 細 胞 腫 の 家 系 内 集 積 に 関 す る 研 究 19) 、 小 児 癌 と の 関 連 20) 、 ウ エ ス ト 症 候 群 と の 関 連 2 け な ど に つ い て 研 究 が 進 め ら れ 、 病 気 本 体 の 解 明 が 進 ん で い る 。 ま た 、 日 本 の 全 国 疫 学 調 査 22) 2 3) に よ り 、 家 系 内 発 症 24) や、 Q 0 L 25) と の関連などの解明も進められている。 N F 1は皮膚神経線維腫、力 7ェイ・レ斑、虹彩小結節、脳脊髄腫主義、骨変化などを特徴とする常染色体 性優性遺伝性疾患で、その遺伝子は打ーニングされ、 17q11 .2に 座 位 し て い る こ と が 知 ら れ て お り 3) 、癌 抑制機能などの特徴があることが解明されてきているがへ前述の皮膚症状、中枢神経症状など多彩な 臨床症状の相互関連を明らかにすることは、患者予後の予測、診療連携の意味からも重要なことであ る。今回これらの臨床症状の相互関連を検討し、興味ある知見を得たので報告する。 ー ワ t

75.

表 1. 1 4臨床症状の順位相関係数(相関係数、有意性、標本数のIi買) 0.07954 0.39556 1.00000 0.65569 0.24081 0.10457 ‑0.09086 0.0055 0.0001 0.0 0.0001 0.0001 0.0005 0.0020 1217 1030 1329 1238 1075 1092 1160 0.05582 0.31093 0.65569 1.00000 0.28070 0.09985 ‑0.04275 0.0552 0.0001 0.0001 0.0 0.0001 0.0011 0.1512 1 1 8 1 1004 1238 1300 1042 1058 1129 0.00725 0.17451 0.24081 0.28070 1 .00000 0.11459 ‑0.05172 0.8147 0.0001 0.0001 0.0001 0.0 O .0002 O .0985 1048 903 1075 1042 1022 1022 1137 υ ハ 凋品マ nonυ 39404 ハυ η ζ n υ 内 dnυ 11 マ' 1 a n u n V 1 h nunυ ・ ハυ ‑ n u nu' ﹄ ・ ︽ U ハ υ 凋品マ 内ロハ υ no nU 凋品マ n υ 凋品守内 dnuuaA守 ハυ lnυ 内 dnυ nunuTl'l ' 守' 's n υ ハυ ・ ︽ U ‑nυ 41 ︒ ︒ 邑 U ハυ ︽ u Juqι 勺ι R U 勺ι ι F h J U H ︽V 内ノ﹄﹃︐︐内 H u nノ﹄ Ay n u n u t z o J u n V ︽V 441 h J U H ︽M ・ F 4EE 4 4 a H ‑‑nu ・ ‑︽ U ‑ n υ ハ υ ・︽ FhJW44S M 内 MFhJU 内ノ﹄ n w︾ H ﹃︐︐ 4E‑nノ﹄ 内U BSFhJU n 3 n u n U η ζ F h J U 守1 n a n u ' I A 件 TaTl ︽ nu‑ U ・ n υ U ︽ I 守 ''FhJW 内 ノ ﹄ 内 h 守 u H ︽V H ︽V RJunun30uqLau 凋斗ハ υ ハ υnunU4i n u n u ‑ ‑ n ヨ ハ υ 噌1 ・ハ υ‑ 41 nunu n υ 邑 マ' 1 1 A Y R J w ' t 630744 ︽ U ハ υ ・ 痘筆 ‑nυ'nυ ハ υ マ' o o n 3 0 J M 司i n 3 Runu 守 ''nu ハ υ ・ 内 FhJwnυ O 内 0 1 内 d マハ U 4 1 JunU41 邑 ・ 0 内 11RU Ay n v R U 41nuTl l n υ ハυ a伶 ‑nυ ハ υ 703 862 846 775 799 868 0.00968 0.07293 ‑0.03374 ‑0.06495 0.06480 0.05792 ‑0.04746 0.7665 0.0392 0.2949 0.0454 0.0563 0.0845 0.1376 944 800 966 949 868 888 980 内 ︽ 内 fnυ ・ nu 内 o o ハ υ U ︽ ‑nυ ハ υ ・ RU41Ru nuunυAU Tinu‑‑ F 守 ハ υ ︽ 1 U ・ U守 ι T l 守︐ υ 内ロ ハU ハ u H ︽ vnw ︒ ハ υ ‑ハυ nnMnw︾ ︽ H v 041 qL 内 nu B31 E n υ 0.1774 8 4 1 守 a伶 nU 凋 0 内 11Tl nonO4l nU 守F 4 l nu ‑nυ ハ υ 0.04582 O .1215 j 内 n U F U 守 内u H 内M h 内 ︽ 一v 内 ︽ リ vnuJU4la nυnO4l nu‑ ‑nυ ハ υ O .05483 0.0100 守 u n w︾ ﹃ ︐ ︐ ︽ h nud‑‑nJι 'IRuod nυnuu 0.09253 O .1014 nu n3n3RU O 0・ l ・υl 内 内 内︒ハ 0 内 au ハ υ ・ ‑ハυ n υ ハ υ Tl 食U R u nυau守 内 ζ 勺Jvnuod V n w︾ ︽ H ハ υ ハ υ ・ ・ハυ 4 1 A吟 唱 l nununu マ' n v o d ‑‑nU ハ υ 1・ハυ ・ ︽ ︾ 日 4 l a h u nノ﹄ h ︽u ︽ unw H n w︾ 内 hunwW Runu nu‑ ‑nu nu ︾ υ υ ︽ u‑‑anw H 内ロハ ハ nO ハ υ U ︽ a伶 n u ‑ ‑ ・ ‑ハυ ︽ U 1 FhU414t Runu 30B Fhdn u ︒ 令 ・ ‑nυ nu 1 ︾ υ 0.3655 0.0890 637 763 762 677 690 755 凋 ︽ 凋崎氏 u n 0 4 1 6 ハ υ ・ ・ハυ υ ハ ・ 守 内ロハ ‑ハυ 内 ζ ハ υ n n M H ︽M 守 jηζ ・ハυ ・ 内︒ ハυ ハυnuu ハ υ ハ υ 1 nu nu U ・ n V 4﹄守 j hU4EE4E' nu ‑︽ ハ υ ハ υ ‑ハυ ハ υ j 守 nu ‑ハυ 守 内︒ υ ヨ ' ー 内 ζηζ ︽ U nun ハ υ ・ 内口内ロハ a A守 内 ζ ‑ハυ ハ υ nuqJ﹄ 凋 U FhJWRM 内ノ﹄ nun ヨ nu 内 n 3 1 a ハυ マ' n u f l 内 ・ nu ‑ハυ ハ υ 守 j 0 内 3 mO 内 04l nuJunノ ﹄ 内 M M j 守 nu ハ υ ハ υ 邑 内 ︽ 一 守 j ︽ U ・ nu nu ・ U nu 1 AY 1 1 4 ﹄ V H ︽v nuJU I M 内 M 内ノ﹄ 4EEFhlu R U G J U A吟 守 0.6708 754 ζ ハυ 4 i U nuuno 内 0.01637 ‑0.03450 ‑0.06195 0.0738 勺ベ vq441 nu‑ H 内U FhJW 内ノ﹄ nnM41l 内︽一v nO ハ υ ハ υ n ヨ ︽U 4 1 ハ υ ・ 0.06480 0.0970 h u o 0.06012 0.0020 マ︐ T l R U ζ 内 ︽ 4 1 U n n M H ︽v nuJu q4nu RU 1 ︾ ・ハυ 内︒ 守 F a A守 n u u n w nhuwFhv 内 unw︾ 内 M H M 内 ζ nu ハ υ ・︽ ハ υ M 内 M nノ ﹄ 内 M M a仏マ a 宮 内 h u 内 u nノ ﹄ 内 M h M j 邑 nu 守 ハ υ ︽ hU4la41l AY R U ワι 内u ﹃︐︐ 4 E E h q4RU nu ハ υe U ・ 内︒ 守 ''Ruoo noaA守 a A守 FhJWRunu ・︽ ハ υ ハ υ ハ υ 内 ‑nu nu ハ υ nノ ﹄ 内 h 内M u M nO 内 口 内 也 氏Jwqunw h u H ︽V 0.12229 0.9559 虹彩小結節 0.00202 神経症状 0.05636 0.0438 1 脊髄腫蕩 ﹄ ︒ ︽ U 脊柱変形 O .06867 O .0283 長管骨変形 no U ︽ n O 守 FFhJUFhJU a伶 守 F n υ a FhdnU4 nunυ nunu n υ 悪 性 神 経 鞘i s I O .8900 脳 ま た は 脊 髄H 重傷 903 0.07954 0.05582 O .00725 ~ 0 5476 0.09433 0.0001 0.0055 0.0552 0.8147 0.0750 0.0015 1289 1015 1217 1181 1048 1058 1130 0.29617 1.00000 0.39556 0.31093 0.17451 0.05767 ‑0.07975 0.0001 0.0 0.0001 0.0001 0.0001 0.0831 0.0141 904 947 小川ケリンゲハゥ ‑0.00478 ‑0.08271 知能低下 1004 濁漫性神経線維1 重 1030 皮膚の神経線維腫:顔面 1061 皮膚の神経線維腫:全身 1015 0.29617 0.0 rン斑 1.00000 力7 1 .: t ・ レ 斑 症1 2 線維腫 悪性 濁漫性神経 小川ケリング皮膚の神経線維腫 神 経 鞘1 重 .顔面 m ハウザン斑 :全身 力7 1 . t : レ . ヴ I ワω

76.

脳または長管骨 力7 r .才・レ斑 ¥r y i (ン斑 小レヲヴリング J 変形 脊柱変形 0.17195 ‑0.00478 0.00968 0.06582 ‑0.00587 0.00284 0.00202 0.0001 0.8900 0.7665 0.0386 0.8645 0.9282 0.9559 1105 8 4 1 944 988 848 1008 754 0.00199 ‑0.08271 0.07293 0.15355 ‑0.02146 ‑0.00207 0.12229 0.9517 0.0283 0.0392 0.0001 0.5651 0.9520 0.0020 926 703 800 8 3 1 7 2 1 848 637 ‑0.00388 皮膚の神経線維腫:全身 皮膚の神経線維腫:顔面 l l 濁漫性神経線維f l l 悪性神経鞘f 痘筆 0.14680 0.07648 0.09868 0.06012 0.0438 0.2949 0.0001 0.0242 0.0015 0.0970 1137 862 966 1009 868 1032 763 O .00834 0.05636 ‑0.06495 0.05961 O .02897 O .07960 0.06480 0.7810 0.1014 0.0454 0.0606 O .3964 0.0111 0.0738 1114 846 949 992 859 1017 762 ‑0.03302 0.09253 0.06480 0.11701 0.16734 0.12627 0.01637 0.3001 0.0100 0.0563 0.0004 0.0001 0.0001 0.6708 987 775 868 9 0 1 7 9 1 915 677 0.02687 0.05483 0.05792 0.09301 0.07967 0.10076 ‑0.03450 0.3937 0.1215 0.0845 0.0046 0.0233 0.0020 0.3655 1010 799 888 925 8 1 1 938 690 0.04582 ‑0.04746 ‑0.00639 ‑0.01442 0.03282 ‑0.06195 0.0001 0.1774 0.1376 0.8389 0.6690 0.2891 0.0890 1155 868 980 1015 8 8 1 1045 755 973 695 令︒内︒ 内 守 内 ハ υ 守 W U ︽ ・ ︒ 内 υ ・n ハ υ ・ハυ ハ υ ︽F U ︽ U hJV ハ υ U ︽ ハ υqd U ︽ nJιaA守 U ︽ no ハ υnJιRM U ︽ ︽ ハ υ U 41 凋守 t E q J v e l ‑ ‑ ι FhJvau 凋 件 ︒ OOUR‑ν 858 ︽ 998 1 ハ υ 1‑nυ・ 925 899 649 0.13685 0.39571 0.09326 0.18516 0.58072 1.00000 0.01414 0.0001 0.0001 0.0036 0.0001 0.0001 0.0 0.7031 1025 836 973 1011 899 1109 729 0.02054 0.08081 0.04384 0.18329 0.03539 0.01414 1.00000 0.5761 0.0391 0.2484 0.0001 0.3680 0.7031 0.0 743 652 695 716 649 729 内 U ︽ 日 ・︽ ・ U ・ U 内 守 ︒ ハ υ O 内 守 Uno ハυ ‑︽ ハ υ 8 8 1 n wW4EE h u ζ 内 U ︽ 41 f d 内 n U 守 nO U ︽ 858 hu‑a 4 E E tEnu‑‑ Rd ハ υ ハ υ 00 ハ υ41 777 υ ・n U ︽ O .3680 859 守 I 守 4 1 4 1 ヨ︽U n o n f 守 U ︽ no nO ハ υ 1 0.03539 O .0001 U ︽ 0.58072 0.0 ︽ U ︽ Fhu nvGu nU U ︽ U ︽ ハυ 4 1 1 nJζι4ln U ︽ v H ︽ νn吋 ︒ベ ハυ ︒u ベw 守 w u︐ ︽ U nJι ・ 1.00000 0.0001 ハ U f 0.18797 0.0069 向︒︽ 0.09222 0.0001 凋守ハ υ 1 l 0.63658 0.6545 守 0.01529 d 内 q d nJι ハ υ 1・ハυ ︒Tfι‑ληU4 0GfuU ハ υ ‑nυ ハ υ 虹彩小結節 ハυ n υ ‑ Aυnυ ハυ n υ υ ハ 790 Rd Rd4l'lau f U ︽ ︽n ﹃ O 内 nO U Jι ︒ 唱 U ︽ no υ U ︽ FhJV RM ハ qJvnυ120unv fl‑qu‑ nυnυ OUR‑νGuauta η 4 H崎 氏 d R d n υ J マ守守J RJVRdouaunυ ︐ 内ぺ︾︽H V ︽ u 4 E E n ・内 0 ・ υ ‑Aυ ・n nuAυ 0.2484 9 5 1 1026 υ ハ 0.04384 0.0036 U ︽ 4l 神経症状 f ' 守 n U 守 つι λ 守 GU ‑ E E 内JZ﹄ 内 凶 ベ ハ υ 内︒守 f 凋守 nV1a 内 ︽ V M 内 U h u H υ η ζ ハ 0.09326 0.0069 nU041 n υ nuAυ 0.09222 0.0001 f U f 守 守 RuaA﹃ ei ︽ RJVQURd41RUGU 守 ' H 吟守︐ GU O G U 守 nJιaA ハ υ f 守 nu‑nυ ・ 0.27902 0.0 ・ハ υ ハU 脊髄1 重傷 ・ハυ ハ υ 1.00000 0.4457 nu‑‑ 0.02717 0.7684 nunυRdnυe ︐a マハ υqd nυnJιaa onvaunvGu n υ ハ υ ハυ ハυ ‑‑nυ 唱 ‑0.00956 ・ 脊柱変形 ︒U4 Rfd ofo n υハυ 0 0 0 0.40143 n υ 長管骨変形 小結節 0.06867 ‑0.03374 υ ハ 脳または脊髄腫湯 脊髄腫蕩神経症状 0.8960 Tl 知能低下 虹彩 知能低下脊髄f l l蕩 868 ワ I ハペu

77.

方 法 : 対 象 は N F 1の 第 2回 全 国 疫 学 調 査 に よ り 把 握 さ れ た 患 者 の 臨 床 症 状 で あ る 。 分 析 に 用 い た 症 状は、皮膚症状は抑ェ・オ・レ斑、レ y川ングハウセーン斑、皮膚の神経線維腫:全身、同:顔面、瀬漫性神経線維 腫、悪性神経鞘腫、中枢神経症状は窪章、知能低下、脳または脊髄腫蕩、整形外科的症状は長管骨変 形 、 脊 柱 変 形 、 神 経 症 状 、 脊 髄 腫 蕩 、 眼 科 的 症 状 は 虹 彩 小 結 節 の 14症状である。 検 討 方 法 は SPEARMANの 順 位 相 関 係 数 を 求 め 、 そ の 有 意 性 を 検 討 す る と と も に 、 因 子 分 析 に よ り 、 共 通 性 の推定、因子負荷量の算出などを行った。また、夕刊タ一分析により、症状の丹スター化も検討した。すべて、 SAS6.1 2 '6), ー B) を用いて解析した。 箇 果 : 表 1に 14臨 床 症 状 の 順 位 相 関 係 数 ( 相 関 係 数 、 有 意 性 、 標 本 数 の 1 ) 頂)を示す。多くの臨床症状 が有意な相関を示している。 表 2に 因 子 分 析 結 果 ( 因 子 負 荷 量 ) を 示 す 。 4因 子 が 抽 出 さ れ た 。 第 1因 子 因 子 負 荷 が 高 い の は 小 レ y灯ングハ ン 斑 、 皮 膚 の 神 経 線 維 腫 ( 全 身 、 顔 面 ) な ど で あ り 、 第 2因 子 に 因 子 負 荷 が 高 い の は 脳 ま た は 脊 髄 腫 蕩 、 脊 髄 腫 蕩 、 神 経 症 状 で あ る 。 第 3因 子 に 因 子 負 荷 が 高 い の は カ 7ェ・オ・レ斑、窪筆、知能低下で ある。第 4因 子 に 因 子 負 荷 が 高 い の は 長 管 骨 変 形 、 脊 柱 変 形 、 虹 彩 小 結 節 で あ る 。 各 因 子 の 説 明 劃 合 は 表 3 に 示 し で あ る 。 共 通 性 の 推 定 値 は 7.46に な り 、 皮 膚 の 神 経 線 維 腫 ( 全 身 、 顔 面 ) 、 脊 髄 腫 蕩 な ど で 高 くなっている。 w 表 2. 因子分析結果(因子負荷量) カ7 1・才・レ斑 小川ヴリングハウセ'ン斑 皮膚の神経線維腫:全身 皮膚の神経線維腫:顔面 濁漫性神経線維 1 重 悪性神経鞘腫 痘聖堂 知能低下 脳または脊髄腫蕩 長管骨変形 脊柱変形 脊髄 1 重蕩 神経症状 虹彩小結節 第 1因 子 第 2 因 子 第 3 因 子 第 4 因子 0.09831 ‑0.17497 0.55027 o .14850 0.56043 ‑0.12352 0.04779 o .38868 0.84103 ‑0.03065 ‑0.07725 0.03732 O .84086 0.00719 ‑0.08679 ‑0.02997 0.41637 0.25465 ‑0.08202 O .12622 O .3 8 8 0 1 0.26990 0.23952 ‑0.03422 ‑0.17798 ‑0.02291 0.75339 ‑0.10589 ‑0.04294 O .13640 0.79573 ‑0.04146 O .03594 0.70032 ‑0.03028 ‑0.08384 0.02609 0.29287 0.07482 O .55859 ‑0.04803 O .1 2 6 2 9 0.03206 0.78763 0.00420 0.83157 ‑0.03943 O .1 5 7 9 4 0.07850 0.79910 0.01287 ー 。1 8 1 2 9 0.22534 ‑0.10394 ‑0.11692 O .60057 一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一 表 3. 各因子の説明割合 第 1因 子 第 2 因 子 第 3 因 子 第 4 因子 2.156802 2.136734 1.606399 1.563357 表 4. 共通性の推定値(総計 =7.463291) 小 レ ' J ' JIJンゲ皮膚の神経線維腫 濁漫性神経 悪性 カ7 1 .才・レ斑 ハウセ'ン斑 :顔面 重 神経鞘 1 重 症筆 :全身 線維 1 0.365126 0.482696 0.715629 0.715528 0.260870 0.281939 0.611014 脳または 長管骨 虹彩 知能低下脊髄1 重湯 小給節 脊柱変形 脊髄 1 重湯 神経症状 変形 0.655361 0.499682 0.404072 0.639650 0.718032 0.677755 0.435939 ヮ I 4

78.

表 5にクラスタ 分析結果を示す。クラスタ 1には 5変数が取り込まれるが、漏漫性神経線維腫、虹彩小 結 節 は 1‑ R 2 比が大きくなっている。このクラスター 1は 因 子 分 析 の 第 l因子と対応している。クラスタ 2は 第 2因子に、クラスタ 3は第 3因子と対応している。 表5 . クラスター分析結果 R‑squared with Own Next 1 ‑ R寧 寧 2 C[uster C[osest Rati 1 一一一一ー一一一一ー一一ーーーーーーーーーーーーーーーーーー ー 変数 C[uster 。 小川ヴリングハウザン斑 0.4047 0.0290 0.6131 皮膚の神経線維撞:全身 皮膚の神経線維撞:顔面 濁漫性神経線維撞 0.7172 0.0115 0.2861 0.6516 0.0153 0.3538 O .1941 O .0449 O .8438 虹彩小結節 0.1923 0.0402 0.8416 C[uster 2一 一一一一一一一一一一一一一一一一一一一一一一一一一一一一一ーーーーーーーー 脳または脊積極蕩 脊髄腫揚 0.4714 0.0204 0.5396 0.7908 0.0632 0.2233 神経症状 0.7347 0.0661 0.2840 C[uster 3一 一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一一ーーーー 加工・才・レ斑 0.2422 0.0041 0.7609 窪量産 知能低下 C[uster 0.6621 0.0365 0.3507 0.6646 0.0099 0.3388 4‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑ 悪性神経鞘腫 0.1654 0.0383 0.8678 長管骨変形 脊柱変形 0.6770 0.5355 0.0483 0.0319 0.3394 0.4798 このように、多くの臨床症状は相関を示し、因子分析と、クラスター分析ではほぼ同様の分類結果が得 られた。これらの分類は皮膚科、脳外科等の診療科でまとまったクラスターを示すわけでもなく、部位別症 状(皮膚症状、中枢神経症状、整形外科的症状、限科的症状)でクラスターを構成しているとも言い難い。 よって、これらクラスター分析、因子分析の結果を参考に患者の予後予測、各診療科の連携を検討して行く 必要があろう。 箇論 :NFlに つ い て 、 臨 床 症 状 は 相 互 関 連 が あ る こ と が 示 さ れ 、 14症 状 は 4つに分類された。 RU ηt

79.

文献 9 9 6 ; 4 3 : 1 6 8 ‑ 1 7 2 . 1)国民衛生の動向・厚生の指標 1 9 9 6 ; 1 9 0 : 2 1 0 ‑ 2 1 1 . 2 )新 村 異 人 . 神 経 皮 膚 症 候 群 . か ら だ の 科 学 1 9 9 2 ; 5 0 : 1 6 8 ‑ 1 7 5 . 3 )新 村 虞 人 . Recklinghauzen病 、 日 本 臨 床 1 4 )大 塚 藤 男 . 神 経 皮 膚 症 候 群 の 圏 内 外 研 究 の 概 要 . 厚 生 省 特 定 疾 患 皮 膚 ・ 結 合 組 織 疾 患 調 査 研 究 班 9 9 7 ;1 ‑ 2 . 神 経 皮 膚 症 候 群 分 科 会 平 成 8年 度 研 究 報 告 書 1 . Neurofibro皿atosis t y p e 1i nN o r w a y . A clinical prevalence study 5 )Bjlrnstad A,HeibergA based o n a small p r o j e c t . Tidsskrift for D e n Norske Laegeforening 1996;116:3108‑10 ta l . Characterization o fs i x mutations i ne x o n3 7o f neurofibro皿atosist y 6)Upadhyaya M, e 日e ricanJournal ofMedical G e n e t i c s . 1996;67:421‑3 p e 1g e n e .A r 7 )豚俊彦,他.非回答集団を考慮、した N F lの 有 病 率 推 計 . 厚 生 省 特 定 疾 患 皮 膚 ・ 結 合 組 織 疾 患 調 査 研 究 班 神 経 皮 膚 症 候 群 分 科 会 平成 8年度研究報告書、 1 9 9 7 ; 8 ‑ 1 2 . . Juvenile xanthogranulo田a, neurofibro皿atosis, and juvenile 8)Zvulunov A,Barak Y, Metzker A e u k e皿i a . World statistical a n a l y s i s . Archives o f Der皿atology 1 9 9 5 ; chronic 田yelogenous l 1 3 1 :9 0 4 ‑ 8 . ta l .C o皿parison o f insertion r a t eo fL 1 retroposon i n t o intron 3 0o ft h e 9)Shirakawa T, e neurofibromatosis t y p e 1g e n ei ns e v e n Asian a n d Pacificpopulations. Japanese Journal o fH uman Genetics 1996;41:209‑14 t al .L aryngeal involve皿e n ti n pediatric neurofibro皿atosis: a case report a n 10)Masip M J, e dreview o ft h el i t e r a t u r e . Pediatric Radiology 1 9 9 6 ; 2 6 : 4 8 8 ‑ 9 2 . t al .A ssociation o f childhood rhabdo皿 yosarcomawith neurofibro皿atosis type 1 1 1 ) Yang P, e 9 9 5 ; 1 2 : 4 6 7 ‑ 7 4 . and birth d e f e c t s . Genetic Epide皿iology 1 ta l .V o n Recklinghausen neurofibro皿 atosis i n Lome,T o g o . Medecine Tr 12)Tchangai‑Walla K, e opicale 1995;55:185‑6 t al .C ognitive function a n d acade皿 i cperfor皿a n c ei n children with neurofibro 13)North K, e .D evelop皿 e n t a l Medicine &Child Neurology 1 9 9 5 ; 3 7 : 4 2 7 ‑ 3 6 . matosis t y p e1 t al .N eurofibromatosis type 1 ( N FI )i nI s r a e l if a m i l i e s : linkage analysis 14)Elyaki皿 S, e a s a diagnostic t o o l . American Journal o f Medical Genetics 1994;53:325‑34 . .N eurofibro皿atosist y p e 1i nI s r a e l : survey o f young a d u l t s . 1 5 )Garty B Z, Laor A,Danon YL Journal o f Medical Genetics 1 9 9 4 ; 3 1 : 8 5 3 ‑ 7 . t al .T ype 1neurofibromatosis i nT u n i s i a :6 6c a s e s . Annales d e Dermatologi 1 6 ) Gouider R,e ee td e Venereologie 1 9 9 4 ; 1 2 1 : 1 8 5 ‑ 9 . M,Fitchett M . Neurofibromatosis a n d childhood leukae血 i a/ly 皿p hom 17)Stiller CA,Chessells J a : a population‑based UKCCSG s t u d y . British Journal o f Cancer 1994;70:969‑72 t al .T he clinico‑i回目 unological survei11ance o f neurofibro皿a t o s i s . Minerva M 18)Gerosa P, e edica 1994;85:221‑9 t al .F amilial pheochro皿ocytoma associated w i t h von Recklinghausen's d i s e a s e . 1 9 ) Ogawa T, e Internal Medicine 1 9 9 4 ; 3 3 : 1 1 0 ‑ 4 . ,e t al .N eurofibromatosis type 1a n d childhood c a n c e r . Cancer 1993;72:2746‑54. 2 0 ) Matsui 1 ta l . Neurofibromatosis type o n ea n d West s y n d r o m e : arelatively benign assoc 21)Motte J, e i a t i o n . Epilepsia 1 9 9 3 ; 3 4 : 7 2 3 ‑ 6 . 2 2 )勝 俊 彦 他 . レ ッ ク リ ン グ ハ ウ ゼ ン 病 と 結 節 性 硬 化 症 の 疫 学 研 究 の 現 状 . 厚 生 省 神 経 皮 膚 症 候 群 9 9 4 : 8 ‑ 1 4 . 調 査 研 究 班 平 成 5年 度 研 究 報 告 書 1 中間報告 厚生省神経皮膚症候群 2 3 )牒 俊 彦 他 . 神 経 皮 膚 症 候 群 全 国 疫 学 調 査 ・ 第 1次 調 9 9 5: 5 ‑ 9 . 調 査 研 究 班 平 成 6年 度 研 究 報 告 書 1 2 4 )豚 俊 彦 他 . 神 経 皮 膚 症 候 群 の 家 系 内 発 症 に 関 す る 研 究 . 厚 生 省 神 経 皮 膚 症 候 群 調 査 研 究 班 平 成 6年 度 研 究 報 告 書 1 9 9 6 : 5 ‑ 1 0 . 2 5 )豚 俊 彦 他.NF1患 者 の QOLと 臨 床 症 状 に 関 す る 基 礎 的 研 究 . 厚 生 省 特 定 疾 患 皮 膚 ・ 結 合 9 9 7 :1 8 ‑ 2 3 . 組 織 疾 患 調 査 研 究 班 神 経 皮 膚 症 候 群 分 科 会 平成 8年 度 研 究 報 告 書 1 1 9 9 4 ;1 4 8 ‑ 1 4 9 . 2 6 )牒俊彦.やさしい保健統計学.東京:南江堂 . 5 1 ‑ 1 6 0 . 2 7 )際俊彦.基本医学統計学.東京:中外医学社 .1997;20‑22,1 o l u皿e2 . Cary NC:SAS Institute I n c . 1 9 28)SAS/STAT U s e r 'sGuide,Version 6 ,Fourth Edition, V 6 4 1 ‑ 1 6 6 0 . 9 6: 7 7 3 ‑ 8 2 2,1 7 6

80.

日本 S A Sユーザー会 (SUG I‑J) SASjDATAステップによる群逐次計画における棄却限界値 及び必要症例数の算出 0宇 野 一 武田薬品工業株式会社 医薬開発本部統計解析部統計グループ DATAstepMACROstocalculatec r i t i c a lvaluesandsamples i z e f o rgroupsequentialdesigns HajimeUno B i o s t a t i s t i c s, PharmaceuticalDevelopmentDivision TAKEDAChemicalIndustries, LTD. 要旨 今回 γ クロ化を行った中間解析に対する方法,及び,棄却限界値等の具体的な算出に用いられる Recl l r s iv eI n t e g r a . t i o l lについて整理し,作成したマクロの使用方法について述べる. キーワード: 中間解析,群 j~ 次計画,繰り返し有意差検定, α消費関数, R e c u r s i v eI n t e g r a t i o n 1 はじめに 中間解析を伴う臨床試験について,近年いろいろなアプローチが盛んに研究されている.特に, 「群逐次計画」は,中間解析の実施をうながすために最もよく適用されており, I 繰り返し有意差検 定」の枠組みで支とめられる中止規準を試験の中止・継続の判断材料としている実例が多い I 繰り 返し有意差検定」に関する方法論について述べられている文献た けで、も膨大な数にのぼるが(松井ら ( 1 9 9 7 ) ),棄却限界値等の具体的な算出方法という基礎の部分について詳細に述べられているものは あセり多くない.実用上は E a . S tや PESTなど 山市販のソフトウェアを購入し所定のパラメータを入 力サることによって,棄却限界値,必要症例数.平均症例数などを得ることができる ( CyT e lS o f t w a r e C o r p o r a t i o l l( 1 9 9 2 ), Emerson( 1 9 9 6 ) ) . しかしながら,ソフトウェア化されてし、るものは比較的単純 な手法が中心になっており,より権雑な問題に対応しようとする場合には,自ら計算プログラムを組 基礎的な手法の具体的な計算方法を整理しておくこ む必要が生じることとなろう.その場合に,宝、r とが役に立つホのと忠われる.モこで,今回は,繰り返し有意差検定の実施に関する具体的な数値計 ‑77‑

81.

算 ω方法を述べ,さらに,棄却限界値・必要症例数・八 S N等の算出マクロを DATAステップl こより 作成したのでその使用方法について紹介する. 今回紹介するマクロ 1 1,中間解析の回数 1 1既知,各中間解析毎の情報量(例えば症例数)の増分 が等しいとしづ仮定を置いて棄却限界値,必要症例数等を算出するものとなっている.実際の解析段 階では,このような仮定は成り立たないことが普通で、あるので,解析回数ぺ吻平析時点をあらかじめ決 めておく必要 ωな し W 消費関数を利用するアプ'ローチ ( La .na .ndDeMets( 1 9 8 3 ) ) が用いられるのが 一般的である. しかしながら,川消費関数を用いるアプ'ローチについても,計画段階つまり症例数の 設定にあたっては,解析回数,解析時点を固定する必要がある.その際,各中間解析毎の情報量(例 えば症例数)の増分が等しいとおくことがよく用いられる方針である .α 消費関数を用いるアプロー チでは,最大情報量(例えば最大症例数)が固定されたもとでは,実際の解析が計画時に想定した解 析時点通りに行~_)れなかったとしても,試験全体の第一種の過誤確率を保持した中止規準を構成でき る.支た,こ ωとさ試験全体の検出力などは計画と一致しないが,その差は僅かで、あることが指摘さ れている ( La .na .ndDeMets( 19 8 9 ),Kima .ndDeMets( 19 9 2 ) ) . これより, α消費関数に基づ、くアプ ローチについて、計画段階では,各中間解析毎の情報量(例えば症例数)の増分が等しいとおいて,症 例数の設定を行って忠実用上は差し支えなく,今回紹介するマクロも,計画用として利用する限り実 用可能なマクロであると考えられる. 以下では, ヰミず今回作成したマクロに関連する方法論について簡単な整理を行い, DATAステッ プによる具体的な計算結果を Pocock( 19 7 7 )の例を用いて確認する.また,それらの計算を汎用化し たγ クロ (GSM,LANDEl,LANDE2)の使用方法を紹介する.最後に,今回作成したマクロを利 用して上記の L a . na . l l dDcMets( 19 8 9 ),Kima .ndDeMets( 1 9 9 2 )の指摘について若干の検討を行う. 2 例と表記法 2 . 1 例 八群, [ i群の 2群聞の平均値の差の比較を考える ( P o c o c k( 1 9 7 7 ) ) . 各群のデータは,互いに独立 に平均 J ' o A , 分散(既知 )σ2の正規分布,平均/'‑3,分散(既知 )σ2の正規分布にそれぞ、れ従うものと する.支た,両群併せて'21/.例(各群1/.例)集積される毎に解析し,最大 K回ω解析を行う(すなわち 各群で n K例集積される支で行う).. j ‑ 1回目の解析時点から i 回目の解析時点までに観測される患 i j, XB i j, ( j= 1,・ぺ'/1.)とする. 者の応答を XA XAij~ N ( / " A, σ2 ),X8ij~ N ( J " 8, σ2 ), ( ' i= 1ぃ ・ ・, K,j= 1ぃ ・ ・, n ) . 2 . 2 使用する統計量 ; .‑1回目から i回目的解析時の間に得られる 2 1/.個のデータから作られる統計量みを, ︒ ︒ 九三 JU(XAi‑X8i)/V 2 r r, ヴ t

82.
[beta]
と
つjる.ここで,支A
iニ乞 j
'
=
1XAり/
1
.
, XBi=

ε
;
二lXSり/11.である .Ziは
, i=1
,
.
.
.
, Ktこ対して独

o
(
/
/
'
Aー /
I
S
)
/必σ ,分散 1
) にしたがう.また,簡単のために,
立同一な正規分布(平均 f
t
J
.=f
o
(
/
/
Aー /
'
B
)
/
h
σ
?

(
1
)

h
;~ N
(ム 1
),

(
2
)

ん;
=ZZJ?

(
3
)

とおくと,

と表わされる. さらに, これらんの和,

は平均 t
J
.i
,分散 iU
)正規分布にしたがう.
2群 U)平均値 U)比較を各群1/.仔J
i
集支る毎に解析する問題を考えていたが, このように置き換える

ことにより, 平 均 ム 分 散 lの正規分布から l回データが得られる毎に解析する問題に帰着される.

;および ,
.
ti
'を用いて記述する.
以下, こU) h

J云)
2
.
3 試験全体を通じて帰無仮説が棄却される確率 (
11 ://A ‑
1,
/sU)両 f
s
l
̲
j
検定を考える. (これは F
lo :ム =
帰無仮説 :I
lo://A =//'8,対立仮説 :1
0、1
1
):ム
‑
1
‑0とする U)と同じ.)各 z回自の解析時の棄却限界値を Ci,
(
i

二

31K

>一<>一

kk

υ
ι
J

i
t
‑l
川e
ド︑

川川川川

< I.'K

1ぃ
・
・,
K) とし,

loを棄却する ,(
'
i=1,
.."K‑1)
=
> 試験を中止し I
・
ー,
K ‑1)
=
> 試験、を継続寸刀、(i= 1,
l
oを棄却する?
=
> l
loを受ずでする?
=
> I

(
4
)

とすると, こ ω 一連 U) 解析において,帰無仮説が棄却される確率 I~K は以下のように表わされる,
K
'
'
a
︐
︑

P
r
{
[め│三 。
γ
│ぬ│三
l一 P
r
ベ
{
[バ
l[
<
(
円1
('1

九
斤
品
,

γ・
・ ο
r
[δ,
'
K
[三 C
K
}

('2 (J

(
5
)

(/,川!

ω
)!イ)K が試験全 1体本 ω 第一種ωi過晶誤の~確司
d徒'{完
'i率(い
rα}' ) となり, 対立仮説のもとで
帰無仮説山中〉とでは, 上記 U
は
, 上記 U)!'Kは検出力 (
1‑!
i
)となる.

2
.
4 途 中 の 中 間 解 析 時 ま で で 帰 無 仮 説 が 棄 却 さ れ る 確 率 (J>;)
前節では,最終解析時点 jイにおいて帰無仮説が棄却される確率を考えたが,途中の解析時点。
回目)支でで帰無仮説が棄却される確率 (
1)
i
) についても, 同様に定義する.

P
r
{
[桁│三1') [
S
2
[2
'
:
.
.
.
υ
γ
[
5
'
;
[三 c
;
)
j‑ P
r
{
[,
"
'
1[<1
'
)ω
nd[
ぬ[<('2 nd ・
・ イ1.'1/(1. [
S
;
[<C
;
)
.
(
!
'
r

('2 (
I
'
/
,

(
/
,

‑79‑

(
6
)

83.
[beta]
2
.
5 解析する時点で帰無仮説が棄却される確率 (
π
;
)
前節 U)'
2つ1
1
. 過去の解析時点、で帰無仮説が棄却される確率も含めて考えていたが,ここでは過
去 ω解析時点では帰無仮説が棄却されず,かつ,現在の解析時に帰無仮説が棄却される確率を考え
る.言い換えると,直前の解析支でい ‑1回目支で)は棄却限界値以内に収まり,今回収回目で)初

trJ

cc

︑
︑e z z

>一<

7‑7

・

tpJ

czulczu
dd

L‑L
︑L J r
Ill
‑
‑一

<<<

H

2z
c2c
c

NGH

111
一
一‑

7
7
L7
LL

︑
川
I{l
l
ff

i

‑)
pz

7171

ιιιfi

tf i
f r‑
‑ ‑

くくくけ﹂

ll‑‑
c
rr‑

rrrli

pAPAPAhuvι'

3

引い引U 引い一一

7
r
i

1lJUJzi1
3Q
us‑‑

めて棄却限界値を越える確率として.向 (
e
x
i
tp
r
o
b
a
b
i
l
i
t
y
)を定義する.

(
7
)

マクロ化を行った 2つのアブローチのまとめ
繰り返し有意差検定の実施のために,まず,帰無仮説ωもとで,上式の PKが「公称通りの試験全

n
)J となるような棄却限界値の列 (C1,
c2ぃ
・,
CK)を求めることが必要
体で、の第一種の過誤 ω確率 (
となる.そのよ合な列は無限に存在し,それらの定め方についていくつかの方法が提案されている.
今回マクロ化を試みたのは,

• onep
a
r
a
m
e
t
e
rb
O
l
l
n
d
a
.
r
i
e
s(WangandT
s
i
a
t
i
s
(
1
9
8
7
)
) (マクロ名:GSM)
‑α 消費関数 (
La
.
na
.
ndDeMets(
19
8
3
)
) (マクロ名:LANDEl,
LANDE2)
以上 U)2つのアプ ローチに対してで・ある.前者は,各中間解析に用いる棄却限界値のヲj
JQ ,
c2ぃ
・,
CK
a

の聞の関係を lつのパラメータを通じて定めるもので, Pocock (
1
9
7
7
)や
, O
'BrienandFleming

(
1
9
7
9
)で、提案されている方法ふ包含するアブ'ローチでおる.このアプローチは,実際の解析を計画
した通りに行う必要がある.一方,後者については,試験の第一種の過誤と情報量との関係を表わす
の消費関数を定め,これに基づき各解析時点で、の棄却限界値を逐次的に定めるアプ ローチで,解析回
J

数,解析時点をあらかじめ定めておく必要がなく,前者に比べより柔軟なアプローチといえる.

3.1 oneparameterboundaries (WangandTsiatis (1987))
このアプローチ 1
1,棄却限界値の亨j
J(11
.
'
2,
.
.
.,
r
:K U
)聞に以下の関係式を設定するもので、ある.
(
'
i(
入
)= Cw xけ.(C
山?入は定数).

(
8
)

入は bound
a
.r
ys
ha
.p
epa
.r
a
.
me
t
e
rと呼ばれ, 0
.
0から 0
.
5の問で任意に設定できる. o
n
ep
a
ra
.m
eter
.
r
i
e
sという名前はこれに由来する.これから,以下の式を満足する C山を求め,棄却限界値
bounda

7J]
c1,
(
'
2,
.
.
.
, cKを得る.
の3

!
'
K
l
l
l
o

1‑P
r
{
I,
"
h
l<C山 口:
n
r
lI
ぬ1
<Cw2λ 山 d .
.
. ndI
S
'
K
I<CwKλI
l
Jo
}
n
u
n
o

O.

(
9
)

84.

七た,入=0 . 5,入=0 . 0と設定することにより,それぞれ, Pocock( 1 9 7 7 ),O'Brien, an dFlem an g, an dT s i , at i s i l l g ( 1 9 7 9 )で提案されている棄却限界値 ω列 ω聞の関係式に一致する.ちなみに, W, ( 1 9 8 7 )では,この onep , am meterbound , ar i e sU)中で, ASN (AvemgeS , am pleNumber:後述するが, 平均的に何回 ω解析を必要とするかという値)が一番小さくなるような入を 最適"としており,い くつかの状況における 最適"な入を彼ら ω T , ab l eに与えている. C :y ' l ' d t 土U)中間解析用のソフトウェア EaStU ) D e s i g l lmoduleで、札こ ωonep , ar , am eterbound‑ , ar i e sを採用しており,入を 0 . 0 0 0から 0 . 5 0 0支での問て。任意に設定することが可能である (CyTelS o f t ‑ w, ar ecorpmtion( 19 9 2 ) ) . このソフトでは, ASNに相当する値は(期待サンプルサイズという形で) 出力されるが, ASNを最小とする入は自動的には与えられないので,そのような入を用いたい場合に は , W,anga . n dT s i , at i s( 1 9 8 7 )の T, ab l eを利用するか,試行主告呉的に入を求める必要がある. 3.2 α消費関数 (LanandDeMets (1983)) , (:2γ •. , ('K を求めるにあたり,上記のように仁 1 , ('2 ,... , C Kの聞に何らかの関係式を設定するほ (;1 かに ,1 ' 1, 1 1, . . . ,1 'KU )ダJ I (同じ事で、あるが, π1, J T 2ぃ ・・バ K の列)を指定する方法がある.添え字は 各解析時点を表わすれので、あるが,これらの指定にあたっては解析時点,解析回数を定めることが必 要となる.実際 U )解析段階で、は解析時点はあらかじめ定めておいたとしても,その通り行われること は難しい.そこで ,1 ' 1, 1 ' 2ぃ ・, I ' Kの値を陽には定めずに,解析時点の情報量の関数形として与えて おくというアプローチが n消費関数に基づくアプローチで ある. o消費関数 1 1,ある解析時点主主でに消費する αを,その解析時点における情報量 qo三t三 1 )の 非減少関数川 ( 1 .)で, 0 ' ( 0 )= 0,n ( l )二げを満たすものとして定義される(図 1).ここで, π i α( I ' i )一 α( l .i‑l, ) ( 1 0 ) n (ん ). ( 1 1 ) I ' i で、あり, 0 消費関数を事前に定めておけば,任意の解析時点における叫ん) ( =F'i )を解析時点の情 報量に基づき事後的に定めることができ,解析回数 Kも事前に定めておく必要がないことが特徴 で、ある.ここで, . 1 0 ニ Oで・あり,んは,第 i回目 ω解析支でに得られる情報量 v ;の試験全体で 得られる情報量 U )最大値 Vmax(三 VK)に対する害iJ合 ,I . i 日/V , ・ ・ ・, K). 定義から, m日であるが = 1 L~1 J T i =川 1 )‑0(0)=刊で ある.ちなみに, / . はi n f o r m , at i o nf r , ac t i o nと呼ばれる ( L , an, andD eMets ( 1 9 8 3 ),DeMetsa .ndLa . n( 1 9 9 5 ) ) 事前に解析回数ぺJ 解析時点を定めずとも試験全体の第一種の過誤を制御で、きるという点で柔軟で 実用的なアプローチとして利用されているものであるが,計画段階で必要症例数を求める場合には, 解析回数,解析時点を想定しなければならない.通常よく用いられている方法が,情報量の増分が等 間隔で さいということが示されている ( ι La , 叩 na 乱 川 叩 且 . 1 凶 n I dDeMet 匂s( 1 9 8 的 9 ) ,町 K 〈 むim, an dDeMets( 1 9 9 2 ) η ).以下では,情 報量の増分 f 1等間隔, " 1=1/K, 1 .2=2/K ぃ・., 1 . ;二 ' ; / 1 ふ...とする.なお,計画段階の解析計画(解 ‑81一

85.
[beta]
析回数,解析時点)が計画通りに行われなかった場合について,今回作成したマクロを利用して若干

ω検討を行った ωで後述する(7節).
上記 ω定義を満たすα消費関数 v
t無限に存在し,マクロ化にあたっては,どのような消費関数
にヰ》対応できるようにとの配慮、から,支ず, α
(
1
/K),
u
(
2
/K),
.
.
.
, α(
K
/
K
) = αの列,すなわち,
1
)
1,
1
'
2,
・
・
・,
I
)
Kの列を数値として指定する方法を採用し, LAMDElを作成した.また. LANDEl

ωように全て ω時点について数値で指定するということの煩わしさを配慮して,以下の関数形から選
択する方法ふ採用し, LANDE2を作成した(図 2参照).

叩(/, )

α・l
o
g{
l+(
c‑ l
)
L
}, Pocock型?

(
1
2
)

αO
(
L
)

2‑2i
f
>(
Zo
./
2/0),

(
1
3
)

内
(
/
,)

α.(
'
1
,

O
'
B
r
i
e
nandFleming型
,

γ
(は正の実数)

(
1
4
)

従って, LANDEl,LANDE2し、ずれについても,指定された H,
J
乞一., J
)
Kあるいはα
(・)から,
1
)
1
1
1
10 =円 (
1
/K)

r
{
l5
'
1
l<c1IHo},
1‑P

l
ミ1
1
1
0=α(2/K)

1‑ P
r
{
I
S
1
1<C1 (川

I
)
K
l
l
l
o=内 (
K
/f
{
)

1‑P
r
{
1
8
1
1<(
'
1( 山

を満たす,

(
1
5
)

q,
(
'
2,
・
・
・,
('Kを f・
1から順番に算出していくことにより棄却限界値の列が定まることなる.

また,所与の棄却限界値の列を用いて上式 (
1
5
)の f
>
Kを帰無仮説のもとでなく対立仮説のもとで計算
することにより検出力が求められる.

4 計算方法:RecursiveI
n
t
e
g
r
a
t
i
o
n
以上から,棄却限界値等の算出にあたって,式 (
6
)の F
iω値を,帰無仮説のもと,対立仮説のも
とで具体的に求める必要があることがわかった.
まず,簡単のために, i=2,
l
当 =1‑P
r
{
I
S
¥
1<仁 1aud1
ぬ1<Cz
}
,

すなわち,

P
r
{
1ん1<1:1
ωu
l1
8
6
2
1<(
;
2
},
1+.
(
}
)
f
直を計算することを考える.

(
1
6
)

nL

00

86.
[beta]
補足.たたみこみ(稲垣 (
1
9
9
0
)
)

独立な 2つの確率変数 X,
Yω分布関数をそれぞれ,/"(:r.), (
;
(
1
1
)とすると, Zニ X+Y
O)分布関数
1
1(
z
)は
,

:
l

←

1
1(

F(z‑

で与えられる.また,密度関数を小文字で・表わすと,

心
ぃ‑ 心

h
(
z
)=

グ1
,
/
'
2
f士互いに独立で,

y
)
g
(
y
)
r
l
y=

(
z‑:
c
)
f
(
.
7
:
)

81三q ならば中止するとしづ制約があるので, S
1
¥,
Z
2の密度関数をそれ

‑
)
,ψ
(
.)と表わすと,ぬの密度関数,!
2
(・
)
は
,
ぞれ h(

州

=Zlh(u)ゆ(09‑ '11,‑ s)d

(
1
7
)

となる.ここで,Z
2は 平 均 ム 分 散 lの正規分布に従うので, ψ
(・)は標準正規分布の密度関数を表わ
している.これから,

唱Eム

06

CU

S
AV

の

F12

A

q

r
L

↑

fll↑

一
一

8

・︒台

3q

r
l

LrJ

一
一
︑

<

ゲん

υ

十

︑

<

r
L

r4L

v

P

続いて,一般の iについては1.C,i
'ニぬ ‑1 +Z
i,(
i= 2,
.
.
" K)が常に成り立ち , S
iー 1,Z
iは互いに
独立で, /
'
iは任意の 1について平均s,分散 1の正規分布に従うということから,ぬの密度関数五(・)
は
,

I
i
(
s
)=I

J
i 1(
'
U
)ゆ(
8'
/
1
, ‑

ー

s)山 ,(
i=2,
.
.
.
,K
)
.

(
1
9
)

J ‑C.
i
.
̲
1

ここで,h(ι
)=ψ(
1
1
.‑ s
)である.ちなみに,情報量の増分が等間隔であるとしづ仮定を置かない場
合は,式 (
1
9
)のψ
(
8‑'IL‑ s)の部分が,什こより変化することとなる.
このように反復的に求められた.ん(バ)から

回目の解析時支でに帰無仮説が棄却される確率 I'
i

1

が軍出できる.

P
r
{
I
.
S
'
l
l三q (
)
'
/
"1
ぬ│三 (;2 0'
,
/ .
.
.
ο
γ
1S';j三 ci
}
1‑P
r
{同 1<(
"
1ω/.(11
ぬ1
<C
2(J,nd ・
・ ω.
ld1
ふ1<c
i
}
1‑ J~;c; .
/
i
(
8
)山

1

(
2
0
)

f
f
Lf三ょ~ [
f
.
i1(
7
L)
ψ
(
ι ‑1/,‑ s)
d
'i
s
.
ー

l
J
.
(

同様に,試験全体を通じて帰無仮説が棄却される確率 P
Kは
, i
'=Kとして,
I
'
K

82
P
r
{
1ぬ l
三q ()'/, 1
1三C
201・・
・ U'I・1
8
K
Iと CK}
1一 P
r
吋
{
引:
11
リ
l1
<(
'
1山 d何
1
制
8
引1<c
h
2(1,山,
品刈うザ%川,

,

1 一 J~ご:I、 fK (s)ds

I
‑
f
f
L
、J
2
1
:
:
l
f
I
f
l
(
吋ψ
(
.
.
.
.

s
)山

一日‑

8
3

(
2
1)

87.
[beta]
さて,次に式 (
1
8
),の右辺の積分を数値的に求めることを考える.
C2を以下のようにそれぞれ細かく区切り,
与えられた積分区間 C1,

s={川一山

仁

+,
.
1 ‑C2+2h,
・
・,
‑h,
0,
h,
2h,
・
・,
C2‑ 2h
,
C2‑ h,
C2}

2

{
'
/
/
.
I一 川 ‑ q+1
,
‑C1+2
/,
.
.
.
,‑
1,
0,
1
,
2
/,
.
. C1‑ 2
/,
(
;
1‑ 1
,
(
;
1
}

包 =

勺

(
2
2
)

(
2
3
)

sのそれぞれの要素に対して,

ー
一

CIA(TL)ゆ(
s

)
d
v
.

(
2
4
)

を台形則により算出する.
そのようにして得られた h
(パ)にさらに台形則を適用し,

乙ムい)山

(
2
5
)

ω値を求める.
次回の積分,

j
に
!
:
二
i
;
九
j
j
に
二 J式州
υ吋
iの
M
州4
ミ

について

7ηLω 区切り方を前回 ω

tケ祁
榊

,パ吋の区切り方と同じにサす一ることにより,前回の積分の結果(んい))の

それぞれの値がその支支利用できる.従って.

刷
を同様 U)方法により求め,

=
1
二
州 いーは ‑
φ

l
:
!
.)
d
'
/
L
,

:
j

州 ds,

(
2
6
)

を求めることができる.支た,次の積分で・は.ここで求めたそれぞれの J
3(
s
)の値を利用していくと
し、うことになる.

5 計算例
5
.
1 棄却限界値の算出
上 ω計算方法を用いて,支ず,帰無仮説のもとで,PK
が「公称、通りの試験全体での第一種の過誤

ω確率 (ο)j となるよウな棄却限界値の安J
Iを実際に求めてみる.今, o
neparameterboundariesを
考え,

,,
.
.
.
, (:Kの聞の関係式として.式 (
8
)において,入二 0
.
5,すなわち,

('1 ('2

q=f
,
Lvf,
としづ関係を設定する.ちなみに、これは Pocock(
1
9
7
7
)の場合と同じになる.

‑84
←

88.

帰無仮説 U)むと(ム=0 )で【ゐを適当な範囲で変化させ,それぞれの場合について Plから l もま で算出した ι ω が下表で・ある. SASによる計算結果の例(両側検定の場合) [Pocock(1977)の T a b l e1参照l OBS Cw P1 P2 P3 P4 P5 217 218 219 220 221 2.177 6 2.17 2.178 2.179 2.180 0.029555 0.029481 0.029406 0.029332 0.029257 0.050277 0.050155 0.065799 0.065644 0.065489 0.065334 0.065179 0.078169 0.077988 0.077807 0.077626 0.077446 0.088444 0.088242 0.088040 0.087839 0.087638 2.287 2.288 2.289 2.290 2.291 0.022196 0.022138 0.022079 0.022021 0.021963 0.038177 0.038080 0.037984 0.037888 0.037792 0.050307 0.050183 0.060053 0.059907 0.059762 0.059617 0.059472 0.068195 0.068032 0.067869 0.067706 0.067544 401 402 403 4 40 405 2.360 2 . 3 6 61 2.362 2.363 2.364 0.018275 0.0188 226 0.018177 0.018128 0.018079 0.031653 0.0315 470 0.031488 0.031406 5 0.03132 0.041893 0.041786 0 0.04168 0.0415 474 0.041469 Q Q a Q S ? 5 0. 0 4 9 0.050163 0.057096 0 . 0 5 5 6 6956 0.056815 0 . 0 5 6 5 6 7 3 5 0.056 452 453 454 4 4 5 5 6 5 2.411 2.412 2.413 2.414 2.415 0.0155909 0.015865 0.015822 0.015778 0.015735 0.027685 0.027612 0.027539 0.0274696 0.027393 0.036751 0.036656 0.036561 0.03646 77 0.036372 0.044099 0.043987 0.043875 0.043763 0.043651 0.050275 0.050149 ~琵 0.049790 ‑ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ . . . . . . . . . . . . . . . . . . . . 328 329 330 331 332 ‑ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ . . .. . . . .. . . . .. . . . . . . ...•............................. g:g~88~~ 0.049812 0.049787 0.049663 Q Q a Q Q 8 3 0.0498 0.049770 これから,試行錯誤的に C山を変化させ , I ' Kが目標とする値(例えば 5%) になるように Cwを決 定することにより,式 ( 8 )より,棄却限界値の列 ( ( : 1, C zぃ・〆: K )が定まる. 5.2 検 出 力 お よ び 症 例 数 の 算 出 )を用いて, lJKを対立仮説(ム i0 )のもとで計算すること 上て・求めた棄却限界値の列(( ' い ・ ・ ・ 〆x により検出力が求支る.具体的には,ムをいろいろと変化させ f K ( S )を RβcursiveIntegration (4 節)によって求め, jk=1‑ff:κ f K (バ) d . ' ; .が目的とする検出力 ( 1‑/i)となるようなムを求めれ ば良い. SASによる計算結果の例 [Pocock(1977)の T a b l e2参照l n 両 { 同)5%,J イ = 5, (青Iiの表から ) C 山 = 2. ‑ 113 の場合の対立仮説のもと(ム i0 )での P jから l も(=1‑/1)ω 関係を示す. OBS Cw 6 . n P 1 P2 P3 P4 P5 488 489 490 491 492 2.413 2.413 2.413 2.413 2.413 1.387 1.388 1.389 1.390 1 .391 15.3902 15.4124 15.4346 15.4568 15.4790 0.15252 0.15275 0.15299 0.15323 0.15346 0.35693 0.35744 0.35795 0.35846 0.35898 0.54374 0.54440 0.54506 0.54572 0.54638 0.69151 0.69219 0.69286 0.69354 0.69421 0.79908 0.79968 0 . OB 0 0.80148 2.413 2.413 2.413 2.413 2.413 1.591 1 .592 1.593 1.594 1 .595 20.2502 20.2757 20.3012 20.3267 20.3522 0.20557 0.20585 0.20614 0.20642 0.20671 0.46549 0.46604 0.46658 0.46713 0.46768 0.67401 0.67461 0.67522 0.67582 0.67642 0.81430 0.81482 0.81534 0.81585 0.81637 0.89954 0.89992 0.90030 0.90068 0.90106 692 693 694 695 696 ‑ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ . . . . . . . . . . . . . . . . . . 85 8 8 o p

89.
[beta]
これから,例えば検出力 90%をとなるようなムは1.592となることがわかる.
さて,冒頭ω例に戻ると,ムは各解析毎に新たに観測される各群の症例数 nおよび想定される
/
I
‑
A‑/IB)と次の関係にあった.
差(

ム=必 (/tA一 同 )
/
.
.
J
2
σ
.
これを nについて解くと,

r

(占

7
f
.= 2

(
2
7
)

となり,今 ω例では,ム=1
.592,支た ,/1'A‑ /IB= 0
.
5
σ とすると,

n= 2
(1
.5
9
2
/
0
.
5
)
2= 2
0
.
2
7
.
解析回数 l
i全部で 5回 (
K
=
.
5
)で・あったので,この試験における必要症例数は l群あたり最大 111例
ということになる.ちなみに ,/1'A ‑ /1'B=0
.
5
σ のとき,中間解析を行わない固定サンプルデ、ザイン
(α=両側 0
.
0
5,
1‑j
l
'= 0
.
9
)を採用した場合の l群あたりの必要症例数は 84例である.

5
.
3 ASN(AverageSampleNumber)の算出
上の例で,同じ検出力を達成するのに必要とされる最大の症例数は,固定サンプルデザインに比
べ大きくなることが判った.ただし,その数字はあくまで・最終解析まで、行ったときの症例数であるの
で,実際に途中山解析で中止することになれば,症例数はもっと少なくなることが期待される.ここ
では,途中の中止も考慮、に入れて平均的に何回の解析が行われるか (ASN)を求める.最大 K回の解

/
'回 ω解析で試験が中止(あるいは予定通り終了)されるとすると,
析を行つものとし ,'
/
1
.
'
‑
,'
N

= 1XP
r
(
'
1
'= 1
)+2XP
r(T=2
)+
・
・
・ +K XPr(T= K)
1+Pr(T>1
)+P
r
(
'
1
'>2
)+..
+Pr(T>K ‑1
)
1‑P
r
(
S
I<(
'
I
)
}+{1‑P
r
(
S
j<C
lα7ld82<(
'
2
)
}+・・・+
1+ {

{
1‑Pr(81<(
'
1
υ:nr
!
.
.
.(
/
:
/
{
,
(
[SK
ー1
<CK‑I
)
}
1+(1‑1
>
1
)+(1‑(>2)+.・・+(1‑PK‑l).
となる. 支た.町二 P
r{ISd<C
[(LJu
i・
・
・
日
1
/
.
(
/
.1
8
‑1
1<C
i
‑
l
αnd1
8
i
l2
'
:'
i
}
(
=P
;‑ P
i
‑
l
)を用いて
i
も同じように表現できる.
1
.
1
ザN

= 1XPr(T=1
)+2XP
r
(
'
1
'=2
)+.
.
.+K XPr(T=K
)
2
x
π
1Xπ1+
2+・
・ +(
K‑1)XπKー 1+K X(1‑z
=
f
"‑1町)

(
2
8
)

以下に示すように,先ほどのムを求める際に,既に1>
1,
.
.
.,凡までが得られているため,実際に
J
iを用いた方が容易で
計算を行うとしい〉立場からは,何よりれ f

nhu

口
n

90.

例(つづき) Cw ム n P 1 P 2 P 3 P 4 2 . 4 1 3 1 . 5 9 2 2 0 . 2 7 5 7 0 . 2 0 5 8 5 0 . 4 6 6 0 4 0 . 6 7 4 6 1 0 . 8 1 4 8 2 P 5 = 1‑ s 0 . 8 9 9 9 2 J 1 . c . ,'N=1十 ( 1‑0 . 2 0 5 8 5 )十 ( 1‑0. 46 6 0 4 )十 ( 1‑0 . 6 7 4 6 1 )+( 1‑0 . 8 1 4 8 2 )=2 . 8 4 . これから,平均症例数は l群あたり 2 . 8 4x2 0 . 2 7= 5 7 . 5 となる. s J , I 0 . 0 5,1‑/ j=0 . 9 )を採用した場合の必要症例数 1群あたり 8 4例 固定サンプ'ル子、ザイン (α=両 i に比べて 1群あたり平均的には約 2 7例少なくなることが期待されることになる. 6 マクロの説明 • GS乱1...on巴 p n . r, l l T I 巴t e rb o u n d a r i e s • LANDEl..・α消費関数(各解析時点支で、に消費する αを数値で、指定) • LANDE2・・・ α消費関数(消費関数の型を指定) 5節の計算例では ,(}wを適当な範囲で 0 . 0 0 1刻みで‑変化させたので, αが丁度 5%とはなっていな かった.そこで,マクロ化にあたっては,二分法により C却を変化させαがマクロ引数として指定し た値となるように最適化するロジックとした (GSM).LANDEl,LANDE2についても,二分 法を適用し, (:1から CK支でを順次最適化した.支た.必要症例数等の算出にあたっては,f':..を指定 して検出力を算出する方法と,検出力を指定してAを算出する方法の 2通りを用意したが,後者につ いては二分 i 去を適用し,指定した検出力を達成するf':..を求めるものとした. 出力結果として,上記のように二分法を採用しているといことから,最適化過程の確認のため, 最適化 ω経過をオプ ション出力できるものとした.さらに,棄却限界値の夢J I , αの消費量のグラフを e オプション出力できるようにした. 1つ ωマクロについて,マクロ引数の詳細な指定方法と標準的な出力結果について 以下に,上記 ; 例示する. ヴt n o

91.
[beta]
6.1 マクロ使用方法 : G S M
/本==========マクロの機能と使用方法の説明===========牢/
/本前提:情報量の増分を等間隔と仮定
牢/
/
本
応答は正規分布
牢/
/
本
one para
皿巴七日 rb
oundari巴s
*
1
/牢ーーー一一一一一一ーーーーーーーーーーー一一一一一一 ーーーーーーーー一一一一
ーーー *
1
/本機能 1 :指定した任意の λ(0.0~0.5) について,試験全本/
/
本
体の第一種の過誤臼を満たす棄却限界値の亨)
1を *
1
/
本
求めること
り
/本機能~ :機能 1により求めた棄却限界値 U
)亨
J
I
に対し
り
/
本
指定した対立仮説の値(規準化したもの:ム) げ
/
本
に対応する検出力,八 SN等を算出すること
り
/本機能 :
1 :機能 lにより求めた棄却限界値の列に対し ,
*
1
/
本
指定した検出力を達成するム八 SN等 を 算 出 本 /
/
本
サーること
本/
/本機能別マクロ引数の指定方法一‑
ー一一一一一本/
.j]を指定することり
/本機能!のみ:POWER,DELTAともに W
μ
:
THETA;SIGMAは指定しても使用されない
り
POWER
に W
.j]を指定すること り
/本機能 1+~ :
μ 機能 l+:3 :DELTA
に W
.j]を指定すること り
/本ー一一一一一一ーー
一一一一一一一一ーーーーーー一一一一一一ーーーーーーーー一一一一一一一ー本/

G S M実行 i
i
?
J (機能 1+ど
)

*
*
*
*
* 指定方法 *
*
*
*
*

ス
GSM(5

1
本 KK

****キ

出力結果 1

0
.
0

:最大解析回数 (100以下)

り,

1
本 L
AMBDA :λONE PARAMETER BOUNDARIES *
1
/
本
0.0~玉 λ 豆 0.5
*
1
1
*
0.5 => Pocock,0.0=> OBF
*
1,
0
.
0
5 1
本 ALPHA :公称の臼(両側)
本1 ,
1
* POWER :検出力
*
1,
1
.2
1
* DELTA :6
.
*
1,
0
.
5 1
本 T
HETA :治療効果 ω差 (μA μB)
*
1,
1
.
0 1
* SIGMA :標準偏差
本1 ,
0
.
0
0
0
0
1
1本 EPS
:収東条件
*
1,
N
1
本 PROCESS:最適化過程 op (
Y
.
.
.出力)
本1 ,
N
1
本 GRAPH :グラフ表示。 p
(
Y
.
.
.出力)
本/

*
*
*
*
*

(棄却限界値の夢I
)
U
)出力)

各解析時点 ω両側臼と棄却限界値 (λ=0.0,収東条件=0.00001)
基準化した統計量
に対するじ (1)

基準化した統計量
に対するじ (2)

4.56161

基準化した統計量
に対する C (3)

3.22555

基準化した統計量
に対する C (4)

2.63365

2.28081

両仮J
I(t (
1
)

両側臼 (
2
)

両側代 (
3
)

両i~!) (x (
4
)

両側J
a (5)

.0000050762

.0012595

.0089056

0.025589

0.050007

**キ**

出力結果ど

基準化した統計量
に対する C (5)

(検出力, 6.,最大症例数,期待症例数の出力)

2.04002

実行時間
0:00:16.20

*
*
*
*
*

6.・検出力等 (λ=0.0,標準偏差=1.0, μ A‑IL B=0.5)
最大解析回数
5

6
.

l
' (1)

1.2

l
' (2)

0.00038745 0.063226

最大:症例数

n{
?
i
J
毎に解析

57.6

11
.52

l
' (3)

P (4)

0.29259

0.55754

平均解析回数

平均症例数

4.08626

47.0737

P (5) (検出力)

0.75336

実行時間
0:00:29.33

(注意)
棄却限界値ぴ )~IJI士いずれヰ〉基準化した統計量み(式 (2) 参照)に対するもの.ム標準偏差 ,
数 U) 関係は,式 (27) 参照.グラフ出力オフションにより出力される図を図:~ ,図 4に示した,

88‑

ILA一1
s
1

,症 i
?
i
J

92.
[beta]
6.2 マクロ使用方法 :LANDE1
/唯一 ===;::;;====γ クロの機能と使用方法の説明============げ
/雄前提:情報量の増分を等間隔と仮定
率/
/
本
応答は正規分布
本/
l
Jを指定する
本/
/
本
各解析時点までに消費する αの f
/
本
両側検定,帰無仮説の早期中止のみを考慮
本/
/
本 ー
ーーー一一一一
ーーーーーー一一
ーーーー一一一一 ーー一一本/
臼 ω要
J
I
を満たす棄却限界値の f
l
Jを求めること
り
/本機能 1:
/本機能~ :機能 l
により求めた棄却限界値 ω
f
l
Jに対し,
本/
/
本
指定した対立仮説の値(規準化したもの:ム) 本/
/
本
に対応する検出力, A S N等を算出すること
り
/本機能 :
1 :機能 lにより求めた棄却限界値の列に対し,
本/
/
本
指定した検出力を達成するム, A SN等 を 算 出 本 /
/卒すること
本/
一ー
本/
/本機能別 γ ク ロ 引 数 の 指 定 方 法 一 一 一
/本機能!のみ:POWER,
DELTAともに ~.j]を指定すること げ
/
本
:THETA,
SIGMAは指定しても使用されなし、
本/
/本機能 1+~ :
POWER に~.j]を指定すること
り
/本機能 1+:
1 :DELTA に~.j]を指定すること
り
/
本
ー
ー
一
一
ー
ー
一
一
ー
一
ー
ー
ー
一
一
ー
ー
ー
本/

し八 N i)EI実行例(機能 1+~)

}

*****

本**** 指 定 方 法

ス
LANDE1(5

*
/,
本/ ,
/
* A2
:~回目までに消費するは
*
/,
/
* A3
::
1回目までに消費する臼
本/ ,
/*A4
:4回目までに消費する臼
*
/,
/
本 A5
:f)回目まで に消費する臼
*
/,
/
本 A6
:O 回目までに消費する臼
本/ ,
/
* A7
:7回目までに消費する α
本/ ,
お回自主で1
こ消費する臼
本/ ,
/
本 A8
/
本 A9
:日回目までに消費する臼
本/ ,
/
本 A10
:10回目までに消費する臼
本/ ,
/
* POWER :検出力
*
/,
1.2
/
* DELTA : ム * /
,
0.5
/
* THETA :治療効果の差 (μA一 μB) */,
1.0
/
* SIGMA :標準偏差
*
/,
0.0000001 /
本 EPS
:収東条件
*
/,
N
/
* PROCESS:最適化過程
(Y...出力)本/ ,
N
/
* GRAPH :グラフ表示
(
Y
...出力) *
/

0.001
0.004
0.010
0.017
0.050

*****

基準化した統計量
に対する C (2)

両倶J(t (1)

両側 n (2)

.0010001

.0040000

最大解析回数
5

基準化した統計量
に対する C (3)

2.94042

3.29051

***ヰ*

(棄却限界値の f
l
jU)出力)

出力結果 1

基準化した統計量
に対するじ (1)

ネ*ネネ*

:最大解析回数(10以下)
:1回目の消費山

/本町
/
本 A1

出力結果~

基準化した統計量
に 対1
.る C (4)

2.66809

両側日 (3)
.0099999

両側臼 (4)
0.017000

基準化した統計量
に対する C (5)

2.53490

2.00824

両仰!日 (5)

実行時間

0.050000

(検出力,ム,最大症例数,期待症例数の出力)

0:01:17.06

*****

ム

ド(1)

ド(
2
)

ド(
3
)

l
'(
4
)

ド(
5
) (検出力)

1.2

0.018290

0.11154

0.29124

0.47269

0.75673

最大症例数

n{
?
I
J毎に解析

57.6

11.52

平均解析回数

平均症例数

4.10624

47.3039

(注意)

実行時間
0:01:23.92

棄 却 限 界 値 ω亨J
I
はいずれホ基準化した統計量ん(式 (
2
)参照)に対するもの.ム,標準偏差, μA ‑/IB,症 例
数の関係は,式 (27)参照.

‑89

93.
[beta]
6.3 マクロ使用方法 :LANDE2
/ド=========マクロの機能と使用方法の説明=====;;;;===;;;;=本/
/牟前提:情報量の増分を等間隔と仮定
本/
/
牟
応答は正規分布
牟/
Pocock型
, OBF型などの消費関数を指定する り
/
牟
/
車
両側検定,帰無仮説の早期棄却のみを考慮
牟/
/
牟
ー
ー
ー ー
ーーーーーー
ーーーーーーーーーーーーーー本/
/牟機能 1:選択した α 消 費 関 数 よ り 棄 却 限 界 値 の 列 を 求 め り
/牟ること
牟/
牟/
/牟機能::! :機能 l により求めた棄却限界値の ~Il に対し,
/
牟
指 定 し た 対 立 仮 説 の 値 ( 規 準 化 し た も の : 6) 本/
/
本
に対応する検出力,八 SN
等を算出すること
り
/本機能:¥ :機能 l により求めた棄却限界値 ω ~Il に対し,
牟/
/
本
指 定 し た 検 出 力 を 達 成 す る ム 八 SN等 を 算 出 本 /
/草すること
牟/
/本機能別 γ クロ号│数:の指定方法一一一一一一一一一一一ーザ
DELTAともに ~.~を指定することり
/本機能!のみ:POWER,
/
牟
:THETA,
SIGMAは指定してむ使用されない
り
/牟機能 1+
:
:
! :POWER に~.~を指定すること
り
/本機能 1+:1 :DELTA に~.~を指定すること
り
/本ーー一一一一一一一一一一一一一一一一一一一一一一一一一一一一ーーーーーーーーーーーーーーー
牟/

LANDE::!実 行 例 ( 機 能 1+:3) }
キキ***

指定方法

χLANDE2(5
1

キキキキキ

:最大解析回数 (10以下)

本/ .
本/
/
本
'P'...Pocock型 車 /
/
牟
'
0
'...0'Brien and Fleming型 本 /
/
牟
γ(
数値) ..臼× γ γ
牟/ .
0.05
/
牟 ALPHA : 臼 牟 /
,
0.8
/
牟 POWER :検出力
牟/ ,
/
本 DELTA :6
牟/ .
0.6
/
牟 THETA :治療効果 ω差 (μA一 μB)
牟/ .
1
.2
/
本 SIGMA :標準偏差
本/ .
0.0000001 /
牟 EPS
:収東条件
ザ,
N
/
本 PROCESS:最 適 化 過 程
(
Y
...出力〕 本/ .
N
/
本 GRAPH
グラフ表示
(
Y
...出力) 本/
/車問

1
* (t消費関数の選択

出力結果 1

キ*キ*キ

基準化した統計量
1
)
に対するじ (

(棄却限界値ω ~Il の出力)

基準化した統計量
に対するじ (
2
)

2.57583

キキキキキ

基準化した統計量
に対する C (
3
)

2.49197

基準化した統計量
に対するじ (
4
)

2.41083

基準化した統計量
に対する C (
5
)

2.33914

2.27551

両側日 (1)

両側は (2)

両{~!J 日 (3)

両側臼 (4)

両
イWlα(5)

実行時間

0.010000

0.020000

0.030000

0.040000

0.050000

0:00:57.72

**キ**

最大解析回数

5
最大症例数

72.1861

出力結果::!

A

(検出力, 6,最大症{?i]数,期待症例数の出力)

l
'(1)

1.34337
日例毎に解析

14.4372

0.10893

ド (3)

ド (2)

0.29974

平均解析回数

P(
4
)

0.50328

平均症例数

3.41332

49.2788

キキ*キ*

P (5) (検出力)

0.67473

0.80000

実行時間

0:01:59.79

(注意)
棄却限界値の列はし、ずれれ基準化した統計量み(式 (
2
)参 照 ) に 対 す る む の . ム 標 準 偏 差 ,jiA一μB ,症 例
2
7
)参照.
数の関係は,式 (

‑90
94.

7 解析計画の崩れについての検討 消費関数を用いるアブローチで n ,最大情報量(例えば最大症例数)が固定されたもとでは,実 (y 、 際ω解析が計画時に想定した解析時点通りに行われなかったとしても,試験全体の第一種の過誤確率 を保持した中止規準を構成でき,また,試験全体ω検出力に及ぼす影響も僅かであることが指摘され ている ( La .nandDeMets( 1 9 8 9 ),Kima . ndDeMets( 1 9 9 2 ) ) . この指摘について,マクロ LANDE2 の機能 1 : (ムから検出力を求める機能)を利用して,特に,最大症例数を一定に保ったもとでの解析 回数と検出力 ω関係の検討を試みた. 1群あたり ω最大症例数を 420伊,i J ( J l ' A‑ J I s ) /σ =0 . 2 2とし,最大解析回数を 2ム4, 5, 6, 7回に変 化させた場合の検出力の変化を下表にまとめた(図 5参照). 2回 5回 3回 4回 6回 7回 210 1 4 0 1 2 0 8 4 7 0 6 0 2 . 2 5 4 1 .8 4 1 1 .5 94 1 .4 2 6 1 . 3 0 2 1 .2 0 5 . 8 5 4 8 . 8 4 0 0 . 8 3 1 9 . 8 2 6 7 . 8 2 3 2 . 8 2 0 5 Pocock型 . 8 6 6 8 . 8 5 6 3 . αl 8 5 0 3 . 8 4 6 4 . 8 4 3 6 . 8 4 1 6 01 , 2 . 8 8 2 6 . 8 7 7 6 . 8 7 4 4 . 8 7 2 2 . 8 7 0 6 . 8 6 9 3 ( Y { ,3 . 8 8 7 5 . 8 8 4 7 . 8 8 2 7 . 8 8 1 2 . 8 8 0 1 . 8 7 9 0 .ndFleming型 . 8 8 7 9 . 8 8 4 1 . 8 8 1 4 . 8 7 9 5 . 8 7 8 1 . 8 7 7 1 O ' 8 r i e na 最大情報量一定下での検出力と解析回数の関係(マクロ LANDE2により算出した) 最大解析回数 1群あたり n例毎に解析 対応する6.の値 以上ω検討では,情報量ω増分は等しいという条件下ではあるが,少なくとも上記の設定におい ては.解析回数が計画時から変わったとしても,検出力の変化は数%程度であることが確認できた. また,この結果から,試験の後半にいくほど消費するαが大きい消費関数の方が検出力の変化がより 小さいことがわカミる(図 2,図 5参照). L iandG e l l e r( 1 9 9 1 )が什消費関数の望ましい性質を論じているが(松井ら ( 1 9 9 7 ) ),上記のような 解析回数の変更にとヰ〉なう検出力の変化がノトさいということも良さの尺度として考えることができる のではなし、かと思われる.上記 ω検討から,情報量の増分が等間隔とし、う制約下で解析回数を変更し た場合においては, O ' 8 r i e nandF l 巴m ing型や(1[3のような形の方がより検出力の変化は小さいとい うことが予想される.内消費関数モーのあのの最適性を論じることは一般に困難であるが,今後,解析 計画 ω変更に伴う検出力の変化という観点から,情報量の増分が不等間隔で、ある場合も考慮、したより 一般的な状況下での検討を課題としたい. 8 まとめ 今回 γ クロの作成に利用した Reclll"s i v eI n t e gr a . t i o nでは,独立増分構造が成立することが前提と なっている.独立増分構造と n 任意の異なる解析時点 i , j( i<j )について ,Z iと / ' jが独立で、あるこ J Iのように,各例について 1回の観測を行うとい とを意味する.今回用いた正規応答 U)2群間比較のfJ 9 1

95.

うような単純な状況では,独立増分構造が成立することは自明であり,その他の応答(二値応答やポ アソン応答など)で;<t:,適切な正規近似を用いれば紹介したマグロがそのまま利用可能である. 今回作成したマクロのバリデーションとしては,ソースのチェックと数種類の実行結果に対して 公表論文の数値との突き合わせしか行っていない.今回は行えなかったが,マクロの実用にあたって 考慮すべき点として,特に,計算誤差の評価が挙げられる. 1回の積分に含まれる誤差を小さくする ために,単純な台形則ではなく, A rmitagee tal . ( 19 6 9 )にならい 2次の Newton‑Cotes式を採用した が , R e c u r s i v eI n t e g r a t i o nでは l回の数値積分に含まれる計算誤差が伝搬し,最終的にどの程度の誤 差が含支れているのか非常に気になるところである. 数値積分を繰り返し実行することにより,計算時聞がどれくらいになるか関心があった.マクロ GSMにより,棄却限界値,検出力,ムを求めるまでの実行時間と解析回数の関係を図 6に示した. 今回作成したマクロでは,理論的な計算の流れを重視したので,計算効率への配慮は全く行わなかっ たが, I 棄却限界値のみ(機能 L)J,I 検出力まで(機能 l十 2)J,I ムまで(機能 l十 3)Jを求める のにかかる時聞は,解析回数 5回でそれぞれ, 2 3秒 , 2分 2 7秒 , 2 9秒,解析回数 1 0回でもそれぞれ, l分 1 0秒 , 1 2分 7秒 , 1分 2 1秒と,実用上耐えられるものであると思われる.今後,効率を考えれば さらなる計算時聞の短縮が期待できる.また,棄却限界値の算出については同様のプログラムが最近 報告されているので(浦狩,本田(19 9 8 ) ),これらも参照し,プログラムのパージョンアップを図り たいと考えている. 必要症例数,検出力 U)算出に関して,機能 i :に比べ機能 2の方が時聞がかかるのは,前者が指定し たム(必要症例数に相当)に対応する検出力を求めるのに対し,後者はマクロ変数として指定した検 出力になるようにムを二分法により繰り返し計算しているためで、ある.また, LANDEl, LANDE2 については, GSMに比べて,棄却限界値を求めるにあたって各解析時点毎に ( C ¥ぃ ・ ・, C : K各々につ いて)二分法による最適値を求めるロジックになっているので,機能 lに関する実行時間は多少長く なる.機能 2,機能 ; β 1について l は J :GSMと同じロジツクで 問でで、あると思われる. 今回作成したマクロは,情報量の増分が等間隔,両側検定,帰無仮説の早期棄却のみを考慮,応 答は正規分布,などかなり限られた状況設定 ω下に作成した.解析段階での使用も含め,もし実用化 を目指すのであれば今後これらの制限を広げていく必要があるが,多少の1 修穿正を施すことによりし、吋寸ず 詑 れヰ忠〉実現可能で 第一種 の UJ 過誤等を求めることヰも〉可能なのでで ,任意の S t o p p i n gb o u n d a r i e sから,それらの性能の評価 が行える.例えば,確率打ち切り法の第一種の過誤や第二種の過誤,ベイズ流アプローチの頻度論的 性質の評価が可能で・ある. なお,プ'ログラムソースに関しては,分量が多いということと, GSM,LANDEl,LANDE2 しγ 「れ七計算の核となる部分については同じであるため,マクロ GSMのみを本稿の付録として表 示した. 92‑

96.

今回紹介した γ クロ GSM,LANDEl,LANDE2のソースをご希望の方は,連絡を頂ければ電 子メールにてお送りいたし支す.お気づきの点等お教え頂ければ幸いです. 参考文献 [ 1 ] Armitage,P ., l !IcPhersonぅ C .K .andRowe、B.C .( 1 9 6 9 ) .Repeateds i g n i f i c a n c et e s t s叩 0na cc 叩 um¥ ft h eRoyalS t a t i s t i c a lS o c i e t yA132, 2 3 5 ‑ 2 4 4 . d a t a .Joumalo [ 2 ] CyTelSoftwareCorporation.( 1 9 9 2 ) .EaSt:A S o f t w a r ePackagef o rt h eDesignandI n t e r i mMonitoring e q u e n t i a lC l i n i c a lTr i a l s, CyTel,CambridgeMA. o fGTOUpS [ 戸 問 司 3 ] DeM 長e 凶 加t 匂s .D .1 .叩 dL叩a凡 n 1, K.K .( υ 1 9 9 5 ) ト .うThe叫 al p μ h a s p巴町吋 I l [ 叫f u r 町 t 間 1a ppro武 a 叫 c ht ω oi n t e r i mdataa n a l y s i s 'i n RecentAdvancesi nC l i n i c a lT r i a lDesignandA n a l y s i sT h a l l, P .F .( e d . ) .KluwerAcademicP u b l i s h e r s, B o s t o n . [ 4 ] Emerson,S .S .( 1 9 9 6 ) .S t a t i s t i c a lpacbgesf o rgroups e q u e n t i a lmethods. TheAmericanS t a t i s t i c ωn 5 0 .1 8 3 ‑ 1 9 2 . 1 9 9 0 ) .数理統計学.裳華房. [ 5 ] 稲垣宣生 ( [ 6 ] Ki凧K.andDeMets,D .L .( 1 9 9 2 ) .Samples 田 d e t e r m i n a t i o nf o rgroups e q u e n t i a lc l i n i c a lt r i a l swith immediater e s p o n s e .S t a t i s t i c si nMedicine11,1 3 9 1 ‑ 1 3 9 9 . [ 7 ] Lan,K .K .andDeMets,D.L .( 1 9 8 3 ) .D i s c r e t es e q u e n t i a lboundariesf o rc l i n i c a lt r i a l s .Biomet バka70, 659‑663 K .K .andD e . ¥ I e t s, D .1 .( 1 9 8 9 ) .Gro叩 seq四 n t凶 p r o c e d u r e s :c a l e n d a rv e r s u sinformationtime [ 8 ] Lan, S t a t i s t i c si nMedicine8,1 1 9 1 ‑ 1 1 9 8 .L i,Z . andG e l l e r,i . ¥ ' .1 .( 1 9 9 1 ) .Onthec h o i c eo ftimesf o rdata i o m e t r i c s47,7 4 5 ‑ 7 5 0 . a n a l y s i si ngroups e q u e n t i a lc l i n i c a lt r i a l s .B 1 9 9 7 ) .中間解析における統計的アプローチ:最近の理論的展開.日本計 [ 9 ] 松井茂之,宇野 一,小山暢之 ( 中間解析」講演予稿集. 量生物学会第 5回計量生物ピミナー(臨床の部) r [ 1 0 ] O'Brien, P .C .andFleming, T .R .( 1 9 7 9 ) .A m山 i p l et e s t i n gproceduref o rc l i n i c a lt r i a l s . Biomet 何回 35、 5 4 9 ‑ 5 5 6 . [ 1 1 ] PoC"ock, S .J .( 1 9 7 7 ) .Groups e q u e n t i a lmethodsi nt h ed e s i g nanda n a l y s i so fc l i n i c a lt r i a l s .Biometrika 64 1 9 1 ‑ 1 9 9 屯 1 9 9 8 ) .第 47回 関 西 S八 Sユーザー会. [ 1 2 ] 浦狩保則,本田圭一 ( [ 1 3 ] Wang,S .K . andT s i a t i s,A .A .( 19 8 7 ) . Approximatelyoptimalone‑parameterboundariesf o rgroup s e q n e n t i a lt r i a l s .B i o m e t r i c s43, 1 9 3 ‑ 1 9 9 ‑93

97.

¥) ,, α(t )=p ,, α(t )=p α t2 情報分散 図 1 α 消費関数 5 . 0 % ー‑Pocock 円U 司l Lqu 円 3 . 0 % 肝次次次 4 . 0 % J , , / '/ , I I 臼 '/ 2 . 0 % // / ; ノ , / , / 〆 1 .0% 0 . 0 % 0 . 0 一ーー 0 . 1 ‑ .. 一一一一 ー ‑ J 0 . 2 図~ ・・回圃困・ 0 . 3 ノ ./ " . , . 0 . 6 0 . 4 0 . 5 I n f o r m a t i o nf r a c t i o n 0 . 7 :LANDE2により指定可能な α消費関数の例 ‑94一 0 . 8 0 . 9 1 .0

98.

S t o p p i n gb o u d a r y I Z I 5 。。 5 k 図l :: γ クロのグラブオプションにより出力されるグラフ (その1) 算出された棄却限界値の列(基準化した統計量に対するもの) 可r p e1E r r o rP r o b a b 辺町 alpha 0 . 0 0 田 。 a 凪 皿 。 回 。 0 . 0 1 曲 。 。 k 図 4 マクロのグラブオフションにより出力されるグラフ (その 2) その lの棄却限界値の列を用いた場合の各解析時点と α の関係、 RU Qd

99.

0 . 9 0 . 8 8 0 . 8 6 検 出 力 0 . 8 4 一+ ‑ 3 次 ‑ a ー OBF型 一 合 一 2次 ~砂ー 1 次 一 謙 一 P型 2回 3回 4回 5回 6回 7回 最大解析回数 図~最大症例数一定下での最大解析回数と検出力の関係 (マクロ LANDE2により算出) 96‑

100.

最大解析回叡と実行時間〈機能 1のみ〉 01分 20抄 棄 去001分 00紗 限 界 1 直00分 40抄 男 出 時 00分 20秒 間 00分 00秒 2 3 4 5 6 7 8 9 10 最大解析回獄 一 一 最 大 自 由 主 三 計 画 福 盃i +2) 14分 00紗 I 1 険 12分 00抄 │ 2 1 0 一一一一一一一一一一一一一一‑ J 一 色 8 9 10 分∞秒! ↓08分 00秒 会06分 ∞ 秒 車 問00 秒 間 02分 00秒 00分 00紗 2 3 4 5 6 7 最大解析回叡 最大解析回叡と実行時間〈機能 1+3) 01分40抄 ? 引 分 E 20秒 桟 出 01分 00秒 力 算 00分 40秒 出 時 間 00分 20抄 00分 00紗 2 3 4 5 6 7 8 9 10 最大解析回叡 図 6:マ クロ GSMの実行時間 (λ=0.5,収東条件=0.00001) 実行環境 CPentium150MHzノート PC,HD1 .6GB[圧縮J.メモリ 72MB) ‑97

101.
[beta]
付 録 プ ロ グ ラ ム リ ス ト (GSM)

百IFιOELTA NE . ANOιPOWER NE

/牟牟牟牟牟牟牟傘牟傘傘宇宇宇宇宇宇宇牟宇牟牟牟牟牟宇牟傘宇宇傘字率傘傘字本字本字字本字宇宇宇宇宇宇/

%PUT %STR(/:;と検出力はどちらかを・に!);
也GOTO OUT

平逐次計画マクロ (equa11
y spaced)
/傘。 g
Iの算出
/
宇 GSM̲vOLSAS ====>棄却限界値の予J
/
傘
検出力の算出

金字骨子骨子

or

/
宇

/
:
; (症例数)の算出

/
宇 Test

:two‑si
de

/
宇 Class

:one parameter famiI
y

/
キ Response:Normal Xi‑N(O,I
)

/件特件特Il, α、 λの 指 定 → 棄 却 限 界 1
直の算出材料件/
OATA OAT
l
TSTARTニTIMEO

1
宇グリッドの Y軸の値
W
1
* グリッドの X軸の値
W
ARRAY NY(300 )
1宇次のグリッドの Y軸の値 W
ARRAY NX(300 )
1宇 次 の グ 1
)ツドの X軸の{直傘/
ARRAY ACC(
100) ; 1
宇
kth ACCEPT
傘/
ARRAY ERR(
100 )
1宇 kth l‑ACC(
K
)
傘/
ARRAY BNO(
100) ; 1
宇棄却限界値の事J
I
*
1

宇/

ARRAY Y(300 )

キ/

ARRAY X(300 )

*
1

/傘参考文献:Armitage et a
l
. (1969) JRSS:A

宇/

/
傘

Wang and Tsiatis (1987)
Pocock(1977)

/0・Brien and Fleming (1979)

宇/

/
キ

唱E
NO

J J ︐//'

/
宇

宇/
傘/
宇/

宇/

/宇牟牟本字傘宇宇宇宇宇キホホ傘宇牟本牟牟宇キキキキ宇宇キキキ字本字字本字率牟本牟牟宇宇キキ傘宇傘宇/

CALL SYMPUT(
'T
T
',TSTART
)

OPTIONS mprint mlogic nocenter Is=64 ps=25
州 ACRO GSM(
K
K

首T
HEN 也00

1
宇最大解析回数 (100以下)

傘1,

LAMBOA 1
宇 O
NE PARAMETER FAMILY

宇/

/
宇 O
.O~五 λ 豆 0.5

宇/

/宇ラベルキ/
也0
01
=
1 也TOιKK

LABEL BNO&1
よ基準化した統計量+に対する C(ι1)"
=
"両 側 α(ι1)"
LABEL ER陥 1
也E
NO

/辛口 5 => Pocock, 0.0=> OBF 宇 1 ,

1傘 両 側 α
宇 1,
1宇検出カ
キ
/
目
1キ 4
宇/
THETA 1
宇治療効果の差 (μA μB) 宇1,
SIGMA 1
傘得準偏差
キ1 ,
EPS
1ホ収東条件
*
1,
PROCESS 1
本最適化過程 op (Y 出力)ホ1 ,
GRAPH 1
傘 グ ラ フ 表 示 叩 (Y 出力)キ/
ALPHA
POWER
OELTA

/本初期値キ/
KK =晶 K
K
;

1
キ 繰 り 返 し 検 定 の 回 数 < 100 *
1

INC = 1
0
1 ; 1
宇微小区間の数(奇数にすること! !)キ/

圭)宇/
/本最適化(二分 j
/本初期条件宇/
AMAX =200
AMIO =100

/キ宇宇キホホ梓 1, マクロヲ!数のチェックキ宇梓件特傘梓宇/
/字削のチェックキ/
也I
F 晶KK GT 100 ORιKK LT 1也THEN 百00

AM1
N= 0
ERR晶
(K
K
)=0
/
キ START 宇/
00 UNTIL(ABS(
晶 ALPHA‑ERR(
ιKK)) LE 晶EPS)

也P
UT %STR(長大解析回数百 (
K附)は 100回以下に!)
;

字=::;==============:::========
宇 α く α(k) → C(I)をもっと小さく.

首GOTO OUT

也ENO

I
F ERR(
晶K
K
) LT 晶ALPHA THEN 00
AMAX=AMIO :

1
*ALPHA の チ ェ ッ ク ザ

AM1
0=(
A
M
IO+AM1
N
)12

百 IFιALPHA E
Q . ORιALPHA GE 1OR

ENO

ιALPHA LE 0 %THEN 也00

百PUT %STR(
α の 指 定 を 確 認 !)
;

字 α 〉 α(k) → C(I)をもっと大きく;

覧G
OTO OUT

I
F ERR(
ι
K
K
) GTιALPHA THEN 00
AM1
N=AMI0 ・

%ENO

AM1
O=(AM1
O+AMAX)12
ENO
キ次回の C(I)

/
キ LAMBOA の チ ェ ッ ク ザ
百 IFιLAMBOA E
日

OR 晶LAMBOAGT O
.5 OR

ZALPHA=AM1
0

品LAMBOALT O
.0 也THEN 百00
也PUT %STR(
λ の 指 定 を 確 認 !)
;

BNO(
1
)=ZALPHA

百GOTO OUT ;

H二 ZALPHAI1
NC;

也ENO

/
ホ X(
N
) く一一グリッドの X軸の値キ/

/
キ POWER <ー> OELTA のチェックキ/
品 IFιPOWER NE

1キ 1回目の棄却限界 i
直キ/
1キグリッドの幅宇/

00 1
=I TO 1
NC+1 X(1
)= Hホ (1‑1
) ;ENO
X(INC+I)= ZALPHA

ANO

(ιPOWER GE 1 ORιPOWER LE 0 ) %THEN 冒00

;
%PUT %STR(検出力の指定を確認!)
見G
日TO OUT
百E
NO

/
傘 Y(N) ← ー グ リ ッ ド の Y軸の値(定数除く)キ/
00 1
=
1 TO INC+l ;Y(I)=Exp(
ー(
X
(
I
)キ
ホ2
)1
2
) ;
ENO

出I
F 晶OELTA NE . ANO 晶OELTA LE 0 百THEN 首00

L
)=0
00 L=1 TO KK ;ACC(

%PUT %STR(/:;の指定を確認!)
;
国G
OTO OUT
也E
NO

N=INC+l

ENO

1傘 ERR(
K
)の初期化率/
1宇配列の大きさキ/

/
キ 1回目の解析時の αの計算キ/
/宇積分==> Newton‑Cotes (second order) 宇/
/キ端本/

‑98

102.
[beta]
ACC(I)= H 本 Y(N)
OATA RESULTl ;SET OATl

/本真ん中本/

/本量適化経過(不要デーヲセット)削除本/

00 B = 1 TO N/2‑1

1
F ABS(&ALPHA‑ERR
品K
K) GT &EPS THEN OELETE ;

ACC(
1
)=ACC(
1
)+Hホ (
2叫 (N‑2柑)+4叫 (N‑2時 +
1
))

TI
ME=TI
ME0‑
TSTART

ENO
/
ホ

N 実行時間の算出ホ/

O

本

1

LABEL TI
ME=・実行時間・

~N

ACC(
1
)=ACC(I)+2本Hホ Y(I)

/本定数倍ホ1
1
本計算結果の出力本/
ACC(
1
)=ACC(
1
).2/3/Sqrt(
2刊 1415926535897932385) ;
TI
TLE "各解析時点の両側 α と 棄 却 隈 界 値 ( λ =品LA
附 OA, 収
ERR(I)=I‑ACC(I) ;1
ホ 1から引く
・TYPE 1 ERROR RATE 本/東条件二品 EPS) "
+ OATA=RESULTl NOOBS
PROC PRI
NT S
=
'・
VAR BNOI‑BNO
/
牟 2回目以降の分布の算出 Recursive Integration *
1
品KK E
RRl ‑ ERR&KK TI
ME;
00 K=2 TO KK 牟
一一一一一一ーー
一一一一ー
.
FORMAT TIME TIME10.2;
/
ホ NEXT グリッドホ/
RUN
/
ホ k回目の棄却限界値 (Kの関数)本/
/ホ最適化過程も出力(オプション) .
1
NZALPHA=ZALPHA宇 (
Kホ叫 LAMBOA);

%IF 品PROCESS EO Y %THEN 覧00

/牟棄却限界値の夢1 (基準化した統計量に対して) 牟/

T
ITLE "最適化過程:両側 α ( λ =札 AMBOA,収東条件=品 EPS)

BNO(
K
)=NZALPHAIsqr
t(
k
)

/ホグリッドの幅本/

PROC PRI
NT S=・
+
' OATAニOATl

NH=NZALPHA/INC

VAR BNOl ERRl ‑ ERR&KK

RUN

/
ホ NX(N) <一一グリッドの X軸の i
直キ/
00 1
=
1 TO INC+l

NX(I)= NHホ (1‑1)

TI
TLE"最 適 化 過 程 棄 却 限 界 値 (λ=ιLAMBOA,収東条件=&EPS)
ENO

)= NZALPHA
NX(
1NC+1

PROC PRINT S='.' OATA=OATl

VAR BNOI ‑ BNO&KK

RUN ;

/本各 NX(
1
)に お け る 値 (densityの算出)本/
1
/ホ積分 Ne'l'tton‑Cotes second order *

也E
NO

/
ホ 1回目の棄却限界{直・マクロ変数への取り込み牟/
OATA NULL
SET RESULT
1

00 J=1 TO N
川浩牟/

HキY(N)キEXP(
ー
( X(
N
)‑NX(
J
)
)存率 2/2)12

XXX=ROUNO(BNO1
+
0
.5,1
)

( (‑X(
N
)‑NX(
J
)
)存率 2/2)12
NY(
J
)=NY(
J
)+ Hホ Y(N)牟 EXPー

(C
l・
.BN01)
CALL SYMPUT・

NY(
J
)=

/本真ん中村

CALL SYMPUT・
(C
M
'• XXX)

00 B = 1 TO N/2‑1
NY(
J
)=NY(
J
)+H本(
2牟Y(N‑2本
日
)

RUN

日
)‑NX(J))キ 212)
キEXP(‑(X(N‑2本
+4キY(N‑2本
日
+
1
)
牟EXPー
((
X(N‑2キB+1
)‑NX(J))キ 212))12
NY(
J
)=NY(
J
)+Hキ(
2牟Y(N‑2
牟
日
)
ホEXP(ー(‑X(N‑2本
日
)‑NX(J))本
牟 2/2)
+4ホY(N‑2牟日叶)
キEXP(ー(‑X(N‑2キ日+1
)‑NX(
J
)
)材 2/2))12;

/ホ棄却限界値の'9
1等のグラフ表示(オプション)ホ/
弘I
F 品GRAPH EO Y 覧THEN 先
日
日 :
OATA GRAPHI ;SET RESULTl
ARRAY ERR(
&
K
K
) ;ARRAY BNO品
(KK)
V=O ; A=O ;B
=
. ;1
=0
A=ERR(
1
) ;B=BNO(
1
)

ENO
/
牟

OUTPUT

00 1
=
1 TO &KK
V=I ; OUTPUT

ENO

O

キ/

RUN

NY(
J
)=NY(
J
) +2キ
H牟Y(
1
)キEXP(
‑(X(I)‑NX(
J
)
)キ
ホ2/2)12
HホY(
1
)キEXPー
( (‑X(
1
)‑NX(
J
)
)ホ
キ 2/2)12 ;
NY(
J
)=NY(
J
) +2キ

.5 ・k・
)
axisl label=(f=centxi h=1

N 定数倍率/
NY(
J
)=NY(
J
)

V二
本

(h=1
.0 f=centxi
)

,,=3

2/3/S0RT(
2キ3
.1415926535897932385)

ENO

m
lnor‑none

/
牟 k回目の解析時の αの計算キ/
/キ積分・ Newton‑Cotes second order *
1

maJor=none

order= 0 t。品 KK
I
ength=60pct

ACC(K)= NH キ NY(
N
)
axis2 label=(f=centxi h=I.5 ・
I
Z1
'
)

00 B =1 TO N/2‑1
2牟NY(N‑2
牟
日
)+4牟NY(N‑2キ
日
+
1
)
)
ACC(
K
)=ACC(
K
)+NH牟(

v=(
h
=
l
.0 f=centx)

ENO

1
)
minor=(n二

ACC(
K
)=ACC(
K
)+2キNH牟NY(
1
)

order=O to &cm
offset三 (OcmφOcm)

ACC(
K
)=ACC(
K
)キ2/3/S0RT(
2牟 3
.1415926535897932385)
ERR(
K
)=I‑ACC(
K
) ;1
キ1から引く・ TYPE 1 ERROR RATE 牟/

I
ength=59pct

,,=3
/キ次の積分のために入れ替えキ/
00 L=I TO N ;X(
L
)=NX(
L
) ; Y(
L
)=NY(
L
) ;H=NH ; ENO

.5'alpha
'
)
axis3 label=(f=centxi h=1
v=(
h
=
l
.0 f=centx)

ENO 牟

一一一一一

1
)
m
inor=(
nニ

一一一一一一

OUTPUT

/
ホ

EN日 本ニ===;;:===========================•

order=O to 0.05 キ/
offset=(
O
c
m
.Ocm)

RUN

1
ength=59pct

,,=3

99‑

103.
[beta]
/
本 2群の場合 1群あたりの伊l
数牟/
N̲PAR̲k=2本 (SIGMA傘 DELTA/THETA)**2;

/本棄却隈界{直の苦',) (基準化した統計量に対して〕傘/

N グリッドの幅ザ

title f二 centx • Stoppin且 boudary'

HニZALPHA/INC

proc gp1
ot DATA=GRAPH1

/
傘 X(
N
) <一一グリッドの X軸の値傘/

plot b 傘 v /vaxis=axis2 haxis=axisl
symboll
run

.0 1
=
1 c=black w=1
i=join v=DOT h=1

DO 1
=
1 TO INC+I
X(I)=
H傘(
1
‑
1
) 1
* 正の部分 V
XB(I)= ‑ H傘(ト1) ;1
傘負の部分傘/

qujt

END

/救各解析時点における α 救/

X(INC+l)= ZALPHA

ti
tl
e 干=centx • Type 1 Erγor Probabi1i
t
y
'

XB(
1NC+l)=‑ZALPHA

proc gp1
ot DATA=GRAPH1

/
救 Y(
N
) <一一グリッドの Y軸の{直(定数除<l *
1

plot av /vaxi
s=axi
53 haxi
s=axis1
symboll

.0 1
=
1 c=black w=1
i=join v=DOT h=1

DO 1
=
1 TO INC+l

*
2
1
2
)
Y(
1
)=Exp(
ー
( X(I)ーDELT
A
)*

run :

YB(
1
)=Exp(
‑(XB(I)‑DELTA)救 柁 1
2
)

qUlt

%END

END

/
傘 ERR(
K
)の初期化 V

1****紳 紳 m
. POWER. 6. 症例数の算出 紳材料件特/
1
*
*(
1
) P O W E Rを 指 定 → A を算出 (6は欠斑l
で箔定)紳/
百I
FDELTA EQ

DO L
=
I TO KK

ACC(L)=O

END

/
本 1回目の積分 NewtonCotes second order 傘/
ACC(1
)
=H 牟 (
y(
N
)+YB(
N
)
)

ANDPOWER NE .THEN %DO

21
DO B = 1 TO NI

DATA DAT2

1
傘グリッドの X紬の値・正 V
ARRAY XB(300)
1牟グリッドの X紬の値・負 V
ARRAY Y(300 )
1
傘グリッドの Y軸の値・正 V
ARRAY YB(
3
0
0
)
1
傘グリッドの Y 軸の値・負傘/
ARRAY NY(300 )
1
*次のグリッドの Y紬の{直.l
E*
1
ARRAY NX(300 )
1
傘次のグリッドの X 軸 の 値 .l
E *1
ARRAY NYB(
3
0
0
)
1傘次のグリッドの Y軸の値・負 W
ARRAY NXB(
3
0
0
)
1
敬次のグリッドの X紬の値・負 V
ARRAY ACC(
100) : 1kt
h ACCEPT
傘/
ARRAY ERR(100 )
1
* kth lACC(K)
救/

ACC(1
)=ACC(1
)+H傘(
2Y(N2時)+4Y(N2寧
日 +1))

ARRAY X(300 )

1
)=ACC(
1
)+H傘(
2YB(N2B
)+4*YB(N2救日叶))
ACC(
END
ACC(
1
)=ACC(
1
)+2H牟 (
Y(
1
)+YB(
1
)
)
ACC(
1
)=ACC(
1
)13/Sqr
t(
2
*
3
.1415926535897932385)
ERR(
1
)=1‑ACC(
1
)

1
* 2回目以降の分布の算出 W
傘 ー
ー
一
一
ー
ー
ー
ー
ー
ー
ー
一
一

DO K=2 TO KK

ーーー一一一ーーーーーー一一ー‑

1
*NEXT グリッド傘/

TSTART=
品TT

NZALPHA=ZALPHA傘 (
K料品 LAMBDA)

/
傘 k回目の棄却隈界値 (Kの関数)傘/
/救初期値傘/

1
* グリッドの幅 *1

NH=NZALPHA/INC

1字解析回数(繰り返し検定の回数)
傘/
ZALPHA =
 Cl ;1* DATA RESULTl から引用する
り
I
NC= 1
0
1
舟 微 小 区 間 の 数 ( 奇 数 に す る こ と ! !) *
1
N=INC+l
:1
本配列の大きさザ
KK

二 郎K

/
傘 NX(N) <

グリッドの X紬の値傘/

DO 1
=
1 TO INC+l
NX(I)= NH傘(1‑1)
NXB(
1
)=‑NH傘(1‑1)

/傘最適化ルーチン
N 初期条件傘/

(二分法) *
1

END
NX(
1NC+1
)= NZALPHA
NXB(
1NC+1
)=‑NZALPHA

AMAX =200
AMID =100

/傘各 NX(
1
)における値:積分 NewtonCotes *
1

AMIN = 0
ERR(
ι
K
K
)=
1

DO J=1 TO N

/救正部分 NX .NY *
1

/
牟 START 救/

DO UNT1
L(ABSP
( OWERERR(
品KK)) LEEPS)

NY(J)=H救 Y(N)*EXP(‑( X(N)‑NX(J)+DELTA)宇陀 1
2)/2

救
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
*P(KK) > P O W E R ‑. 6 をもっと小さく.

NY(
J
)=NY(
J
)+H救 YB(N)

END
傘 P(KK) く

POWER

1
2
;

傘E
XPー
((
X
B(
N
)‑NX(
J
)+DELTA)**2/2)

o

日 B = 1 TO N/2‑
1

I
F ERR(品K
K
) GT 品POWER THEN DO
AMAX=AM1
D
AM1
D=(
A
M1
D+AMIN
)1
2

2傘 Y(N‑2傘 B
)
NY(
J
)=NY(
J
)+H牟 (
*EXP(‑( X(N‑2牟
日
+4傘Y(N‑2本
日
+
1
‑
)

)‑NX(
J
)+DELT
A
)傘*
2
/
2
)

*EXPー
((
X(N‑2寧
日 +1)‑NX(
J
)+DELTA)本 *
2
/
2
)
)1
2
:

・ 4 をもっと大きく.

I
F ERR(品K
K
) LT 品POWER THEN DO

NY(
J
)=NY(
J
)+ H傘 (2*YB(N‑2時 )

本EXPー
( (XB(N‑2*日 )‑NX(
J
)+DELTA
)本
字2
/
2
)
+4牟YB(N‑2本
日 +1)
*EXP(ー(
X
B(N‑2本
日+1
)‑NX(
J
)+DELTA)字
率2
/
2
)
)1
2

AM1
N=AM1
D
AMID=(
A
M
ID+AMAX)/2
END

*次回の C(I)
DELTA=AM1
D ;1
* 対立仮説の値: 6 (ドリフト分) 牟/

END
NY(
J
)=NY(
J
)+2傘H牟 Y(
1
)

/本両群の分散,もとの差本/

*EXP(ー (
X(
1
)‑NX(
J
)+DELTA)敬志 2
/
2
)1
2
NY(
J
)=NY(
J
)+2州本 YB(
1
)

SIGMA=
品SIGMA : THETA=
品THETA

本

‑100‑

EXP(
‑(
X
B(
1
)‑NX(
J
)+DELT
A
)*
*
2
1
2
)1
2

104.
[beta]
J
)=NY(
J
)本2
/3/S0RT(
2本3
.1415926535897932385)
NY(

目

/本負部分 NXB,NY日本/
NYB(
J
)=H
キY(N)本EXP(
ー
( X(
N
)‑NXB(
J
)+DELTA
)字
本2
/
2
)12
NYB(
J
)=NYB(
J
)+HキY
B(N)
本E
XP(ー (
X
B(
N
)‑NXB(
J
)+DELT
A
)本 位 /2)/2
DO B = 1 TO N/2‑1
NYB(
J
)=NYB(
J
)+H寧 (
2
寧Y
(N‑2本
日 )
ホE
XP(‑( X(N‑2キ
日 )‑NXB(J)+DELT
A
)*
*2/2)
+4叫 (N‑2時 +
1
)
字E
XP(
‑(X(N‑2時 +
1
)‑NXB(
J
)+DELTA
)紳 2
/
2
)
)1
2
:
NYB(
J
)=NYB(
J
)+H傘(
2叫 B(N‑2
傘
日 )
ホE
XP(
ー(
X
B(N‑2時 )‑NXB(
J
)+DELT
A
)仲 2
1
2
)
+4傘YB(N‑2キ
日+
1
)
字EXPー
((
X
B(N‑2傘日+1)‑NXB(
J
)+DELTA)傘
キ2
/
2
)
)1
2
:
目

END
NYB(
J
)=NYB(
J
)+2
傘H
傘Y(
1
)
字E
XP(ー (
X(
1
)‑NXB(
J
)+DELT
A
)キ
傘2
1
2
)/2 :
NYB(
J
)=NYB(
J
)+2キHキYB(
1
)
字E
XP(
‑(
X
B(
1
)‑NXB(
J
)+DELT
A
)*
*212)12
NYB(
J
)=NYB(
J
)傘2
/3/S
日RT(
2ホ3
.1415926535897932385):
END

/
傘 Pkの 1
直傘/
ACC(K)= NH 傘 (
N
Y(
N
)+NYB(
N
)
)
DO B = 1 TO N/2‑1
ACC(
K
)=ACC(
K
)+NH傘 (
2ホ NY(N‑2時 )+4
キ N
Y(N‑2柑 +1))
ACC(
K
)=ACC(
K
)+NH傘 (
2州 YB(N‑2
時 )+4
州 Y
B(N‑2時 +1))
END
傘(
NY(1
)+NYB(I))・
ACC(
K
)=ACC(
K
)+2傘NH
ACC(
K
)=ACC(
K
) 13/S
日RT(
2
ホ3
,1
415926535897932385)
ERR(
K
)=l‑ACC(
K
)

/キ次の積分のために入れ替え W
DO L=1 TO N
X(
L
)= NX(
L
)
Y(
L
)
ニ NY(
L
)
XB(
L
)=NXB(
L
) : YB(
L
)=NYB(
L
)
HニNH
END
END 宇
OUTPUT

一一一ー一

一一一一一一一一一一一一.

/キ不要デ‑'> (最適化経過〕の削除本/
DATA RESULT2: SET DAT2A
[
F ABS(&POWER‑ERR&KK) GT &EPS THEN DELETE
RUN
/ホ出力本/
T[TLE "{:,と倹出力等 (λ=&LAMBDA, C (
1
)=&Cl, 標 準 偏 差
=&S[GMA) "
/キ量適化過程も出力本/
百[
F &PROCESS EO Y 也THEN 百DO
PROC PR[
N
T S=・
+
' DATA=DAT2A
VAR KK DELTA ERR1‑ERR&KK MAXN N PAR K AST ASN T[ME
FORMAT T[ME TIME10.2
RUN
%END
/キ最適化過程非出力傘/
也[
F &PROCESS NE Y %THEN 弘DO
PROC PR1
NT S
=
'・
+ DATA=RESULT2 NOOBS
VAR KK DELTA ERR1‑ERR&KK MAXN N PAR K AST ASN T[ME
FORMAT TIME TIME10.2
RUN
首E
ND
百E
ND :
/
*
* 1
1ノ

/傘(?) d.を指定→ POWERを算出 (POWER欠測で指定〕
百[
F &POWER EO . AND 晶DELTA NE . %THEN %DO

キ/

DATA DAT2
川 グ リ ッ ド の X軸の{直・正 V
ARRAY X(
3
0
0)
ARRAY XB(
3
0
0
)
1
キ グ リ ッ ド の X軸の{直・負傘/
ARRAY Y(300 )
1傘 グ リ ッ ド の Y軸 の i
直・正 W
ARRAY YB(
3
0
0
)
1
傘 グ リ ッ ド の Y軸 の 1
直・負ホ/
ARRAY NY(300 )
1
* 次 の グ リ ッ ド の Y軸 の 1
直・正キ/
ARRAY NX(300 )
1
*次 の グ リ ッ ド の X輸 の l
直・正 W
ARRAY NYB(
3
0
0
) : 1
傘 次 の グ リ ッ ド の Y 軸の{直・負キ/
ARRAY NXB(
3
0
0
)
1
傘 次 の グ リ ッ ド の X軸 の 1
直・負傘/
字/
ARRAY ACC(100 )
1キ kth ACCEPT
キ/
1
キ kt
h l‑ACC(
K
)
ARRAY ERR(100 )

紅==:;::=====================•
EN口
/キラベルザ
%DO [
=
1 也TO 晶KK
LABEL ERR&[="P(晶[)"
弘E
ND
LABEL KK="最 大 解 析 回 数 "
LABEL ERR&KK="検 出 力 +P (
&
K
K
)"
二
A
LABEL DELTA
LABEL N PAR K="n例 毎 に 解 析 "
RUN

TSTART=&TT

/キ初期値傘/
KK
= &KK
ZALPHA =
晶 Cl
[NC
ニ 1
0
1
N=INC+l

1
字解析回数(繰り返し検定の回数)
1
傘 機 能 1の 結 果 か ら 取 得 率 /

/傘両官干の分散,もとの差傘/
S[GMA=&S1
GMA :THETA=&THETA
/
キ 2群の場合 1群 あ た り の 例 数 字 /
N̲PAR̲k=2傘 (SIGMA
キD
ELTAlTHETA)卒事 2
:
N グリッドの幅傘/
H=ZALPHA/INC
角 川N
) <一一グリッドの X輸 の i
直傘/
DO 1
=
1 TO [
N
C
+
l
榊 (
1
‑
1
) :川正の部分 V
X(I)=
XB(
1
)
=
榊([寸) : 1
傘負の部分掌/
END
X(
[NC+1
)= ZALPHA
XB(
1NC+1
)=‑ZALPHA

LABEL AST='平 均 解 析 回 数 1

ASN=AST
*N PAR K
LABEL A
S
N
=
'平均症例数'
MAXN=N PAR 榊 KK
:LABEL MAXN= 最大症例数・
T[ME
ニT[MEO‑TSTART : L
ABEL T[ME='実行時間'
RUN

1
0
1

キ/

片 微 小 区 間 の 数 ( 奇 数 に す る こ と ! !) *
1
1
*配 列 の 大 き さ ザ

DELTA=ωELTA :1
* 対立仮設の!直:,
:
{ (ドリフト分〕

/傘期待解析回数と期待症例数字/
DATA DAT2A :SET DAT2
ARRAY ERR(
10
0
)
AST=1
DO [
=
1 TO KK‑l
AST=AST+(I‑ERR(
[
)
)
END :

POWER‑.{:' *
*
1

キ/

105.
[beta]
NYB(
J
)=NYB(
J
)+Hキ (
2叫 B(N‑2柑 )

/
キ Y(
N
) <ーーグリッドの Y軸の{直(定数除く)キ/

キEXP(
‑(
X
B(N‑2キ
日 )‑NXB(
J
)+DELTA
)キ 2
/
2
)
+4牟YB(N‑2キ日+1)
キE
XP(
‑(
X
B(N‑2時 +
1
)‑NXB(
J
)+OELTA)*
*2/2))12:

00 1
=
1 TO I
N
C
+
1
Y(I)=Exp(
ー( X(1
)ーOELTA)キ 2
/
2
)
YB(I)=Exp(ー (
X
B(
1
)‑OELTA
)宇陀 1
2
)

END
NYB(
J
)=NYB(
J
)+2牟H牟 Y(I)

ENO

キE
XPー
((
X(
1
)‑NXB(
J
)+OELT
A
)*
*
2
/
2
)1
2

/
牟 ERR(K)の 初 期 化 キ /
DO L=1 TO KK

ACC(L)=O

NYB(
J
)=NYB(
J
)+2キHキYB(
1
)

END

牟

EXPー
( (XB(
1
)‑NXB(
J
)+DELT
A
)*
*
2
/
2
)12

1
* 1回 目 の 積 分 Newton‑Cotes second order *
1

NYB(
J
)=NYB(
J
)*
2/3/S0RT(2*3,1415926535897932385)

ACC(1)= H キ (
Y(
N
)+YB(
N
)
)

END

/
2
‑
1
00 B =1 TO N
ACC(1
)=ACC(I)+Hキ(
2牟 Y(N‑2時)+4キ Y(N‑2柑+1))

/
キ Pkの 値 キ /
ACC(K)= NH 牟 (
N
Y(
N
)+NYB(
N
))

ACC(I)=ACC(1
)+Hキ(
2キYB(N‑2牟B
)+4キYB(N‑2キ
日+
1
))

00 B = 1 TO NI
2‑1
ACC(
K
)=ACC(
K
)+NH牟(
2キ NY(N‑2牟B
)+4キ NY(N‑2キ
日 +1))

ENO
ACC(I)=ACC(I)+2キHキ (
Y
(
I
)+YB(I))

2キNYB(N‑2キB)+4牟NYB(N‑2キ
日 +1))
ACC(
K
)=ACC(
K
)+NHキ(

1
)=ACC(
1
)1
3/Sqrt(2*3.1415926535897932385)
ACC(
)
ERR(I)=1‑ACC(1

ENO
ACC(
K
)=ACC(
K
)+2州 Hキ (NY(I)+NYB(I));

/
キ 2回 目 以 降 の 分 布 の 算 出 牟 /

ACC(
K
)=ACC(
K
) 13/S0RT
(2キ3.1415926535897932385)
ERR(
K
)=1‑ACC(
K
)

宇一一一一一一ー一一一一一一一一一一一
角 NEXT グ リ ッ ド ザ
/
牟 k回 目 の 棄 却 限 界 値 (Kの関数)牟/

/キ次の積分のために入れ替えキ/

NZALPHA=ZALPHA
キ(
K**&LAMBDA)

00 L=1 TO N

/ホグリッドの幅キ/
NH=NZALPHA/INC

X(
L
)= NX(
L
)
XB(
L
)=NXB(
L
)
H=NH

/
キ NX(N) <一一グリッドの X軸 の 値 キ /
00 1
=
1 TO INC+l
)
NX(
1
)= NHキ(1
‑1

ENO

00 K=2 TO KK

ENO ← 一

Y(
L
)= NY(
L
)
YB(
L
)=NYB(
L
)

一一ー

ー一一一一一一一一

NXB(
1
)=‑NHキ(1‑1)
ENO

/キラベルホ/

NX(
1NC+1
)= NZALPHA
NXB(
1NC+1
)=‑NZALPHA

百0
01
=
1 %TO &KK

LABEL ERR&I="P (&1)"
¥ENO

/キ各 NX(
1
)における{直.積分 Newton‑Cotes *
1
DO J=1 TO N
/キ正部分 NX ,NY *
1
NY(
J
)ニHキ Y(
N
)キEXP(
ー
( X(
N
)‑NX(
J
)+DELT
A
)キ
ホ 2/2
)12
NY(
J
)二 NY(
J
)+HキYB(
N
)
キEXPー
( (XB(
N
)‑NX(
J
)+OELT
A
)牟
キ2
/
2
)1
2

LABEL KK="最 大 解 析 回 数 "
LABEL ERR&KK="検 出 力 +P (
&
K
K
)"
LABEL OELTA=",
c
LABEL N̲PAR̲K="nf
刑事に解析"
RUN

00 B = 1 TO N/2‑1
NY(
J
)=NY(
J
)+ Hキ(
2キ Y(N‑2キB )

/キ期待解析回数と期待症例数牟/
OATA RESULT2 : SET DAT2
ARRAY ERR(
1
0
0
)

キEXP(
ー
( X(N‑2牟B )‑NX(
J
)+OELTA
)キ 2
/
2
)
叫 キ Y(
N‑2柑 +1)
キEXP(‑( X(N‑2キ
日 +1)‑NX(
J
)+OELTA)*
*
2
/
2
)
)1
2

AST=I

NY(
J
)=NY(
J
)+ Hキ(
2牟 YB(N‑2キB )

00 1
=
1 TO KK‑l

キEXPー
( (XB(N‑2牟B )‑NX(
J
)+OELTA
)キ 2
/
2
)
+4キYB(N‑2牟B+1
)
( (XB(N‑2キB+1
)‑NX(
J
)+DELTA
)キ 2
/
2
))12
牟EXPー

AST=AST+(I‑ERR(1
)
)

END
NY(
J
)=NY(
J
)+2牟HキY(
1
)
ホE
XPー
((
X(
1
)‑NX(
J
)+OELTA
)キキ 2
/2)12

ENO

LABEL AST='平均解析回数・.

ASN=AST州 PAR̲K
MAXN=N PAR K叫 K

LABEL ASN
ゴ平均症例数'
LABEL MAXN=
・最大症例数'

TIME=TIME()‑TSTART

LABEL TIME='実行時間'

RUN

NY(
J
)=NY(
J
)+2ホH*YB(
1
)
キE
XPー
((
X
B(
1
)‑NX(
J
)+DELT
A
)牟
ホ2
12)12

/牟出力キ/
TITLE "",と検出力等 (λ=&LAMBOA, C (
1
)=&Cl, 標 準 偏 差
=&SIGMA) "

NY(
J
)=NY(
J
)*2/3/S0RT(
2キ3, 1415926535897932385):

/キ負部分 NXB,NYB *1
NYB(
J
)=H叫 (
N
)キEXP(ー( X(
N
)‑NXB(
J
)+OELTA
)牟
キ2
/
2
)1
2
:
NYB(
J
)=NYB(
J
)+ HキYB(N)
キE
XPー
( (XB(
N
)‑NXB(
J
)+OELT
A
)字率 2
/
2
)1
2
00 B = 1 TO N
/2‑1
NYB(
J
)=NYB(
J
)+Hキ (
2叫 (N‑2柑 )

キEXP(
ー
( X(N‑2キ
日
+4キY(N‑2キ日+1)

PROC PR1
NT S
=
'・
+ OATA=RESULT2 NOOBS
VAR KK OELTA ERR1‑ERR&KK MAXN N PAR K AST ASN TIME
FORMAT TIME TIMEI0.2
RUN

)‑NXB(
J
)+OELTA
)キ*2/2
)

%ENO :
1** '
?
)

キEXP(
‑(X(N‑2ホ日+1
)‑NXB(
J
)+OELT
A
)キ 2
1
2
)
)1
2
: 百OUT: %MEND

‑102

・
"
'

POWER *
*1

106.

日本 S A Sユーザー会 (SUG I‑J) 臨床試験における探索的な統計解析 高橋行雄 日本ロシュ(株)医薬開発本部 ExploratoryS t a t i s t i c a lAnalysisonC l i n i c a lT r i a l s YukioTakahashi 、 NipponRoche PharmaDevelopment 要旨 ICHガイドラインの影響により探索的な統計解析がポピュラーになってきた。これまで の背景因子に差があった場合の問題も包含する概念と捕えることが望ましい。探索的解 析は、解析を実施する以前に解析のアルゴリズム定めておく必要性を論じた。そのアル ゴリズムとして、主効果モデルおよび交互作用モデルの併用による変数の選択、総合的 な解析、有意でない交互作用項の除去、最終的な統計モデルの確定、を提案し、典型的 な事例を示した。 キーワード: 探索的解析、共変量、背景因子、交互作用、 GLMプロシジャ 1 . はじめに 二重盲験比較臨床試験は、新規化合物の有効性を証明する手段として広く行われてい る。その結果の統計解析は、通常はランダム化をベースにした仮説検定の枠組みで対処 できる c ところが、様々な患者の人口統計学的データや検査データの基準値など、いわ ゆる背景因子が、比較したい処置群の問でアンバランスが生じた場合には、それらの背 景因子が主要評価変数に与える影響を調べる必要が出てくる。一般的には、処理群聞を 独立変数、背景因子を従属変数とみなし、統計的有意差検定の手法を用いて P 値を算 出し、ある一定の P値以下となった場合に「背景因子」に偏りがあると判定し、 「背景 因子の調整」の対象としている。これは、 1992 年に制定された「臨床試験の統計解析 J にも反映されている。この JPN統計ガ に関するガイドライン (JPN統計ガイドライン ) イドラインでは、 「ある背景因子が処置群問で異なった場合には、その事実がその後の 1 0 3

107.

データ解析および結果の解釈におよぽす影響を記載する。重要な背景因子について統計 上の調整を行うならば、それらの因子を選択した理由を説明する」と示されており、こ れがややもすると、処置群問で背景因子に統計的な偏りがあった場合にのみ、その背景 因子について統計上の調整を行えばよいとの誤解が生まれている。このような解析は、 いずれにしても事後的に行う探索的な解析である。探索的な解析の常識では、ある背景 因子が処置群聞でバランスが取れていたとしても、それが共変量(予後因子)であった ならば、その共変量を統計モデ、/レに含めるべきであり、さもないと薬効、あるいは安全 性を見逃してしまう可能性が高まる。 2 . ICHガイドラインの影響 日 米 欧 医 薬 品 規 制 ハ ー モ ナ イ ゼ ー シ ョ ン 国 際 会 議 ( I nt e m a t i o n a lC o n f e r e n c e on H a r m o n i s a t i o n、以下 ICHと略す)の結果として厚生省より「治験の総括報告書と内容の ガイドライン (FSRガイドライン ) Jが 1 9 9 6年に関係団体に通知された (佐々木ら ( 19 9 7 ) を参照) 0 FSRガイドラインの 1 1. 4. 2 . 1共変量による調整の節では、 「人口統 計学的測定値若しくは基準値、併用療法、又はその他の共変量若しくは予後因子の選択 及びそれらによる調整を報告書中に説明し、調整の方法、解析結果及びそれらを裏付け る情報(例えば、共分散分析又は Cox回帰の出力結果)を統計手法に関する詳細な文書 中に含めること。これらの解析に用いられた共変量又は方法が治験実施計画書で計画さ れたものと違っていた場合には、それらの違いについて説明し、可能であり適切な場合 には、計画された解析の結果も提示すること。」のような要求がされている。 さらに、 1 9 9 8年 2月 5日に、 ICHのプロセスでステップ 4となった「臨床試験のた めの統計的原則(ICH統計的原則 ) J では、背景因子に偏りがある場合の調整というテー マは、 5 . 7部分集団、交互作用および共変量の節で述べられている。そこでは、共変量 を含む統計モデルを用いた探素的な解析は、統計モデノレに交互作用を加えることからは じめることを薦めているが、もはや、処置群間で背景因子の分布に偏りがある場合につ いては述べられていない。 この 2つの ICHのガイドラインが出る以前は、私自身も、過去の臨床試験の統計解 析で、統計モデ、ルを用いた探索的な解析を行ったとしても、報告書などには原則として含 めないようにしてきた。これらの ICHガイドラインは、規制当局が統計モデ、/レを用い た解析結果を、「これだけでは承認しがたい」との条件付きではあるが、統計的有意差 検定のみならず、探素的な解析を受け入れるようになったことを喜ばしいこととして受 け止めている。 ‑104一

108.

3 .探索的解析の定石 さて、 I CH統計的原則で求められている試験統計家の責務を果たすためには、探索 的解析にどのように対処したら良いのであろうか。探索的な解析は、手当たりしだいに 行うことによる恋意性が入り込みやすい。そのために、事前に定められたアルゴ、リズム に従った解析計画を事前に立てておくことが肝要と考えている。これまでに経験した探 索的解析を通じて得られた経験的原則とその解析事例を示す。 「探索的」にといっても、多変量解析のエキスパート以外は、どこから手を付けてい いのか路頭に迷ってしまうのが現状であろう。闇雲に行われた探索的解析は、解析担当 者にとっても、その結果を承認しなければならないマネージャにとっても、規制当局の 統計の関係者などにとっても、有り難迷惑な存在になるであろう。 探索的というのは、手当たり次第と言う意味ではない。そこには、探索のアノレゴ、リズ ム(定石)が存在し、その手順を踏まえたものだけが、信頼できる探索的な解析結果と なる。アルゴリズムは、一つではない。しかし、最終的には、同じような結論に到達で きるのが、良いアノレゴリズムといえよう。 臨床試験での探索的な統計解析は、統計モデルとしては回帰分析タイプが主体となる。 この場合に、コンビュータを用いたいろいろな変数増減法のアルゴリズム、あるいは総 ASでも REG、L O G I S T I C、PHREGプロシジャ 当たり法などが研究されてきていて、 S などでは、オプション指定により実施可能である。そのような機能を用いて「自動的に」 と言って悲意性があたカも入っていないことを強調したい誘惑に駆られるのであるが、 残念ながら、実用性には著しく欠ける。これらの変数増減法のアノレゴ、リズムに共通して いるのは、 I C H統計的原則で求められている交互作用を変数選択の対象とすることを考 慮、されていないためである。さらに、これらの統計モデノレに共通するのは、欠測データ を l個でも含むオブ、ザベーション(症例)を自動的に解析から除いてしまうので、統計 モデ、ルに含めようとした変数のセットに、解析症例数が依存するとしづ厄介な問題を引 き起こす。そのために、探索的な解析の手段としては薦められない。 4 .共変量の絞り込み手順 さて、共変量を含む統計モテ、ルを用いた解析を行うためには、ランダム化以前の多く の変数(背景因子)の中から共変量となる変数を絞り込むことから始める必要がある。 そのためには、あらかじめ定めた手順で行うことが望ましい。 手順 1 ) 共変量の候補として取り上げる理由を次のように分類し、 一1 05‑

109.

理由 1:基本的な変数としての性、年齢、疾患の重症度、併用薬の有無など : 処置群聞での分布に偏りがある変数 理由 2 理由 3:共変量(予後因子)として知られている変数 : これまでの試験結果より、共変量となりそうな変数 理由 4 それぞれの理由を明らかにして抽出する。 } 慎序変数の場合、 2から 3区分に再分類する。取り上げた 手順 2) 変数が、分類変数、 I 変数で 2つの変数聞に欠測セルがないことを確認する。なお、「不明」がある 同 川 知 場合は、「不明」をカテゴリとして解析の対象とする。 unu ヴ占ハ i E‑12 AI A2 ( A B ) I Iのように 0となっている場合には、 2つの変数を組合せ、 (AB)12、(ABhl、 ( ABh2のように 3区分とし、相対的に 0に近い場合にも組合せを考慮すること。 手順 3 ) 相関係数行列による検討を行い、変数聞の相関係数が、 0 . 8 5以上で、あった場 合は、医学的な関連がよく知られていれば、どちらかを落とす。 ) 変数が連続量の場合、処置群ごとに散布図を書き、ほぽ直線が当てはまるこ 手順 4 とを確認する。また、変数変換などで、飛び外れ値がないようにする。直線 に当てはまらないと判断される場合は、原則として 3区分の順序変数にする。 ) 処置群と個々の変数の組合わせごとに、別々に主効果モデル、および交互作 手順 5 用モデルによる回帰分析を行い、次の条件による変数のピックアップを行う 0 .主効果モデルで、処置群のみの l元配置モデルの P値に比べて主効果モデ ノレの処置群の P値の変化が大きい変数 ‑主効果モデルで、有意となる変数、共変量として認められた ・交互作用モデルで、処置群との交互作用項が有意となる変数 手順 6 ) ピックアップされた変数、交互作用項をすべて含む回帰分析を行う。有意で ない交互作用項を除いて、再度、回帰分析を行う。これは、できるだけ簡潔な モデ、ルにするためであるが、有意でない主効果は残しておく。これは手順 5で で共変量であったものが総合的な統計モデ、ノレで、は他の共変量の影響で、有意で、 なくなっていることを明示的に示しおく。 ‑106

110.

5. 主効果モデルと交互作用モデル 表 lに示すように、ある薬物の薬効を調べるために臨床薬理試験を行ない、生体内の 活性物質の変化を測定した。この用量は固定用量とした。結果として、体重に関連して 反応が違う、言い換えれば体重が共変量となってしまった、実験前には個人間のばらつ きの影に隠れてしまい共変量として認識できるとは考えられなかったのである。一般的 に女性の方が男性に比べて体重が少ないことが知られているので、性による薬効の差が 本質的にはない場合で、あっても、体重が薬効に及ぼす影響を間接的に受けて、 l変量ご とに共変量の拾い出しを行うと、性が共変量として拾い出されてしまう。もちろん体重 も共変量として拾い出されるのであるが、この時点では、体重か性のどちらが薬効に強 い影響を与えているか同定できない。このような事は、通常の臨床試験でもしばしば起 こることである。この例について共変量の影響を総合的に調べてみよう。 表 l 生体内活性物質の変化 I D 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4 1 5 投与量 ' 性 D o s e ( m g ) S e x 50 50 50 50 50 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 200 200 200 200 200 M M F F F M M F F F F M F M F 投与量 。 。 。 。 。 解析用変数 性 S DZ 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 Dj 。 。 。 。 。 。 。 。 。 Y W (kg) (ng/ml) 6 5 70 62 50 4 5 6 8 59 6 5 6 1 44 6 3 5 5 52 6 9 54 59 54 5 5 7 1 6 8 54 6 0 64 70 80 70 76 79 7 1 7 5 図 Iに示すように、反応 Yは、性による違いははっきりしないが、体重が重い被験 者ほど反応 Yが低くなり、かっ投与量が高いほど反応 Y が高いようである。これは、 単位体重当りの体内の薬物濃度が一定となる関係などの影響により体重が共変量と なっていると思われるのである。 1 0 7

111.

U 2 7 0 7 0 dpA ︑・ ︑. ・ ︑ ︑. ワ臼¥ ︑・. ︑ .‑ ︑ 9 1 ︑・. ︑ ︑l . ︑ . ︑ ・ . ︑・. 2 nMい 8 0 8 0 つ白︑・. ︑.. ︑ ハ ︑・. ︑ . ︑・. ︑. ・ ︑ i l l・ ︑ ︑ .. . ︑・. ︑. Y Y 6 0 6 0 。 o1 5 0 5 0 + F +ーーーーーーー+ー一一一一一一+一一一一ー一一 t‑ ー ー ー ー ー ー ー 一 一 一 一 一 + 一 一 一 一 一 一 一 M 4 0 S巴X 図 l a 性別の効果 5 0 6 0 7 0 W e i g h t 図 1b 体重と薬効のプロット 0 :50mg 、1 :100mg、2 :200mg 表 2に示すように、投与量 3群聞には、 l元配置分散分析の結果 p = 0 . 0 5 5 4と有意で はない。次に、投与量群と性の 2変数についてを交互作用を含まない 2元配置モデル(主 効果モデ、ルという)および交互作用を含む 2元配置モデル(交互作用モデノレという)の 結果を示す。投与量群と性の交互作用は有意ではない。主効果モデ、ルの性は p = 0 . 0 4 1 5 と有意であり、共変量であることが示され、投与量群も p = 0 . 0 2 7 7と投与量群のみのモ デル p = 0 . 0 5 5 4に比べ小さくなっている。投与量群と体重の 2変数についても同様に、 交互作用はなく、主効果モデルで、体重が p = 0 . 0 0 0 2とはっきりした共変量であることが = 0 . 0 0 1 3と P値が大きく変化している。 示され、投与量群も p . 共変量の同定 表2 (表中の値は P値) 交互作用モプ、ル 主効果モプ、/レ 投与量群+変数 i 投与量群 0 . 0 5 5 4 投与量群のみ 0 . 0 2 7 7 * 投与量群+性 0 . 0 0 1 3 * * 投与量群+体重 変数 i 見かけの主効果 投与量群 変数 i 0 . 0 4 1 5 * 0 . 0 0 0 2 * * * 0 . 0 2 3 2 * 0. 48 39 表 2の交互作用モデノレの欄の主効果に H 0 . 0 4 1 9 * 0 . 0 0 0 7 * * * 正しい効果 交互作用項 i 0 . 3 1 7 8 0. 43 1 1 見かけの刊を付けてあるのは、体重を含むモデ ルの投与量群の p = 0 . 4 8 3 9に惑わされないようにとの注意である。 表 lで定義した解析 用変数の場合に、 この P値は投与量群ごとに回帰直線を当てはめた場合に体重の okg ‑ 1 0 8

112.

に直線を外挿したときの投与量群聞の差の検定結果になっており、医学学的には全く意 味のな結果になっている。逆に P 値が極端に小さくなっている場合もある分けいで、 それらに惑わされてはならない。 表 2で共変量と認められた変数は性、および体重 W で、交 E作用項は有意で、はない ので、 2つの共変量を含む回帰モデ、ルを立てる。 Y i‑ D t i + D2i+Si + Wi+ e i ここで、 =1 , 2, . . . ,1 5 Dt = 1 :投与量が 100mgの場合、 D2 = 1 :投与量が 200mgの場合、 S = 1 :男、 o:それ以外 o:それ以外 o:女 とする。この回帰モデルによる回帰係数の推定値を表 3に示す。この結果、性 Sの回帰 . 8 7 8 8となるが p=0. 4 9 1 3と有意ではない。体重の 1kg当りの変化はー0 . 6 5 1 7 係数はー 1 となり p = 0 . 0 0 2 1と有意である。体重 1 0 k gの差に換算すれば ‑ 6 . 5 1 7となり、性による 薬効による差は、ー 1 . 8 7 9より大きいことがわかる。 . 共変量を含む回帰モデ、ル 表 3 解析変数 切片 Dj D2 S W 回帰係数 推定値 推定値の SE T値 1 0 0 . 2 1 0 7 4.8517 1 2 . 9 3 0 3 一 1 .8 7 8 8 一0.6517 8.9074 2 . 6 2 8 1 2 . 6 2 3 5 2.6294 O .1 5 8 4 1 .8 5 4.93 一O .7 1 ‑ 4 .1 1 P{ 直 0.0947 0 . 0 0 0 6 * * * 0.4913 0 . 0 0 2 1 * * この回帰係数より、投与量群と共変量との聞で、交E作用項が統計モデルに含まれていな いので、解析変数 Dtの回帰係数は 50mg投与群 D。との共変量による調整済の平均値の 差となっており、その P 値は、その差の検定結果となっている。 D2についても D。との 差の検定結果となっており、 p = 0 . 0 0 0 6とボンフエロニの多重性の調整 α=0 . 0 5 / 2=0 . 0 2 5 よりも小さく、多重性を考慮しでも有意な差である。 投与量群ごとの回帰式は、 D。群.. Y O=1 0 0 . 2 1 0 7 Dt群:: Y t=1 0 0 . 2 1 0 7+ 4 . 8 5 1 7‑1 .8 7 8 8‑0 . 6 5 1 7 W D2群: : y2=1 0 0 . 2 1 0 7+1 2 . 9 3 0 3‑1 . 8 7 8 8‑0 . 6 5 1 7 W ‑1 .8 7 8 8‑0 . 6 5 1 7 W ‑109

113.

性が女の場合であれば、 Sが 0なので、 D。群:: Y O= 1 0 0 . 2 1 0 7‑0 . 6 5 1 7 W D ]群:: Y l= 1 0 5 . 0 6 2 4 ‑ 0 . 6 5 1 7 W D2群 : : Y2=1 1 3. l4 1 O‑ 0.6517W となる。これらの回帰直線は、体重が 6 5 k gの男性場合、それぞれ、 5 8 . 0、 6 2ふ 7 0 . 9 となる。女性の場合は、これらの回帰直線より‑1.8 8低くなる。その影響は、体重、お よび投与量群に比べて相対的に小さいことが分るであろう。 Y 、 、 、 、 、 、 4 1 i 、、 、 、 1 、 2 、 I2 ~"O" z 7 0十 。~'" 6 0 。 5 0 +L LH π6π6 叩 ba‑‑ ‑ou 一 司 ︐ ︐ +nU W ‑nhu +nu ‑Fhd +nu A斗 企 ム I n u v 図2 . 男性の場合の用量反応 変数選択法的な解析の考え方からすると、性を除いた回帰モデルを最終的に選択するの であるが、前にも述べたように単独では見かけ上の共変量となっていることを無視して いないことを示す意味で残すのである。 なお、投与量群聞で、背景因子の分布に差があった場合の変数に対して、ここでは特別 な扱いは全くしていないが、これまでに示してきた探索的なアルゴ、リズムの中で自動的 に背景因子の偏りの調整の可否も含めて対応がなされている。 今回は、従属変数が連続量の場合について取り上げたのであるが、 2 値変数の場合 は、ロジスティック回帰分析による対応が望まれるのであるが、同様のアルゴ、リズムが 適用できるが、ここでは触れない。 文献) 吉村ら ( 1 9 9 7 )、臨床試験のための統計的原則、薬理と治療、 Vol .2 5,S u p pI .4 . 公定書協会編(1994) 、新薬臨床評価ガイドライン、 3 5 ‑ 7 1、薬事日報社. 佐々木ら ( 1 9 9 7 )、総括報告書ガイドラインについて、サエンテイスト社. ‑110一

114.

日本 S A Sユーザー会 (SUG I‑J) 多項目×多種検定における多重性の調整 坪田邦広 日本シエーリング株式会社 臨床開発部統計解析室 CDM AdjustmentofTestingM u l t i p l i c i t yf o rmanyVariablesandTests K u n i h i r oTsubota B i o r n e t r i c s&DataManagernentGroup,CDM, C l i n i c a lD e v e l o p r n e n tD e p t ., NihonS c h e r i n gK . K . 要旨これまで私たち製薬企業の実務統計担当者は、承認申請に向けて常に多重性の問題に注 意を払い、またヒアリングの度に多重性の問題に悩まされてきた。この SUGI‑]では 1 992年に iMULTTESTプロシジャの紹介 J ならびに iPROBMC 関数による多重比 SAS関数 PROBMCの一応用:多種検定の実質限界値の評 較法」、また 1 993年には i 価」など多重性に関する優れた内容の発表があり、私たち実務統計担当者はそれまでより 踏み込んだ議論ならびに処理が可能になった。 そこで今回これらの発表に感謝の意を込め、 MULTTESTプロシジャによるシミュレー ションを用いた多重性の調整方法を説明し、多項目検定と多種検定が混在した場合の調整 方法への応用についても説明する。 キーワード: 、OR問題、 AND問題 多重性、 MULTTEST 唱E 目晶 司E 目晶 司E 目晶

115.

‑ ・ ・ ・ 圃 ・ ・ ・ ・ ・ ・ ・ 多項目 X多種検定における 多重性の調整 日本シエーリング株式会社 臨床開発部統計解析室 CDM 坪田邦広 •• i 帰無仮説下での p値の累積確率分布 田 周 到 . ; ー ハ " .波宮ふ必 ム 噌E 4t η 4ノ

116.

‑ E B o n f e r r o n iの補正 ハ灯・有意水準 α' 圃 . . . . . . . . .. • k個の項目の検定をすると、 k個とも有意になら ない確率は (1‑a')k ・従っていず、れかの項目で有意になる確率は 1‑(1ー α, )k • 1‑(1一αつ k=α 圃 1一α=(1‑α , )k ・ α'キ α/k 1‑α キ 1‑kα'→ ・・ ‑ ‑ ・ 圃 ・ ・ ・ ・ ・ ・E E ‑ ‑ MUL TTESTP r o c e d u r eの記述 • p r o cm u l t t e s tnsample=10000p e r m u t a t i o n ; c l a s sGROUP; ‑E • testfisher(ITEM1,ITEM2,.・,ITEMk); • 出力結果 E RAW P PERM P ITEMI ITE恥1 2 0 . 0 3 5 6 0 . 5 6 3 5 0 . 0 8 4 6 0 . 8 1 2 9 ITE恥1 k 0 . 0 0 1 2 0 . 0 2 1 5 Ph 噌 1よ nJ

117.

MULTTESTP r o c e d u r eの多重性の調整方法 ・ ・ ・ ・ . 1.原データでk個の項目を検定→元の p値 ‑ ・ ・ ・ ・ 圃 ・ ・ 2 . c l a s s変数の属性を変えないで、無作為割付 3 . k 個の項目について検定→最小 p f 直 4 .この操作を繰り返す(10000回) 5 .元の p値の最小 p値に対するパーセント点 → 調 整p f 直 圃 x2検定とF i s h e rの直接確率検定 ••••••••••••• • • A B 有効 無効 56 64 46 x2検定 36 pニ O .248 p =0.312 F i s h e r 検定 • p r o cm u l t t e s tn s a m p l e =1 0 0 0 0b o o t s t r a p ( o rp e r m u t a t i o n ) ; c l a s sGROUP; t e s tf i s h e r (RESPONSE); • • • • 一1 1 4 ← Boot ̲ p P e r r n̲ p O . 2473 O . 3112

118.

E E ‑ ‑ 圃 圃 ・ ・ 圃 ・ ・ 圃 ・ ・ ・ ・ BOOTSTRAPとPER 乱1 URATION • • • • • BOOTSTRAP PE~任JTATION 復元抽出法 非復元抽出法 x2検定 圃 F i s h e r 検定 分布に基づく検定 並べ替え検定 n o n ‑ p a r a m e t r i c つ p a r a m e t n c 標本尋母集団 無限母集団 圃 Neyman‑Pearson流 F i s h e r 流 ‑ ・ ・ ・ ・ ・ ・ ・ ・ 園 田 ・ ・ ・ ・ ・ OR問題の調整方法の考え方 .OR問題 いずれかの項目での有意な結果を主張 圃いずれかの項目で有意となる確率 (α) ・最小 p値の分布から、元の p値を補正 ・多項目 X多種検定への応用 つ EA 句 EA 句 p h u

119.

‑ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ 圃 ・ ・ 多項目 X多種検定への応用 高 空j J 町行苧71T Wilcoxon F i s h e r t 検定 1.元の p 1 直 2 .無作為割付(Resampling) → MUL TTESTP r o c e d u r e OUTSAMPO p t i o n を利用 変 数 SAMPLE ̲ ,̲ CLASS̲自動作成 3 . R e s a m p l eデータで3種の検定 →最小 p 1 直の分布から p値を調整 ‑E E ・・ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ AND問題の調整方法の考え方 .AND問題 いずれの項目でも有意な場合にのみ OK ・有意水準 α' • αk個とも有意になる確率は →,̲ =α 圃 圃 ,k , α'k ~l /k 一+ α=0.05,kニ 2の場合 α'=0.2237 目・相聞があるので言い過ぎの危険増大 ・最大 pf直の分布から、元の p値を補正 1 0 よ 唱E よ 唱E p u

120.

日本 S A Sユーザー会 (SUG I‑J) 4係数ロジスティックモデルの 1)/、ラメトリゼイションとその応用 肥田英明司田崎武信 塩野義製薬株式会社 解析センター Reparameterizationo f4‑ParameterL o g i s t i cModelandI t sA p p l i c a t i o n H i d e a k iHidaandTakenobuTasaki h i o n o g i&Co.,L td . BiometricA n a l y s i sD e p t .,S 要旨 関心のある反応率に対応する用量をパラメータに持つように変形したモデルを用 いた,その用量とその用量推定値の分散の容易な推定法を提案する.提案法の良好 な性能を確認し,他の用量反応モデルへの拡張を示唆する. キーワード: 用量反応モデル,パラメータ推定, NLINプロシジャ 1.はじめに 医薬品の開発では,開発候補物質の用量と生体反応との関係がいろいろな相で検討され る.その検討では,反応率を用量の関数として表現した用量反応モデルを想定し,そのモ デルを介して用量と反応率の関係を評価するのが多くの場合で適切である.本稿では,ロ ジスティック用量反応モデルにおいて,反応、率が 50%になる用量とその信頼区聞を推定す る問題を考える.従来は,反応率の上限を 100%,下限を 0%に固定して, 50%反応率を与 える用量(位置)とロジスティック曲線の曲がり具合(傾き)をパラメータとする 2係数ロジ スティックモデルをあてはめ,あてはめたモデル上で反応率が 50%になる用量を推定して いた.ところが,実際のデータでは反応率の上限が必ずしも 100%に,また下限が必ずし も 0%にならないことから,反応率の上限と下限もパラメータに含む 4 係数ロジスティッ クモデルが考案された.この 4 係数ロジスティックモデルでは,反応率の土限と下限の中 間(中間反応率)に対応する用量が位置を表す自然なパラメータであると考えられる.した ヴ t ム 守E ム 守E

121.

がって,反応率の上限と下限,中間反応率に対応する用量,および傾きをパラメータとす る 4係数ロジスティックモデルをあてはめ,推定されたパラメータを用いて反応率が 50% になる用量を間接的に推定していた. しかしながら,この方法では推定された用量についてその信頼区聞が直接的には構成で きないといった不便がある.そこで,中間反応率のみならず任意の反応率に対応する用量 とその用量推定値の分散を, 4係数ロジスティックモデルのリパラメトリゼイションによ って直接的かつ容易に推定する方法を提案する.そして,提案した方法で得られたそれら の推定値の性能が良好であることを,他法との対比により示す.さらに,このリパラメト リゼイションで用いた考え方を,他の用量反応モデルに拡張した結果についても報告する. 2.4係数口ジスティックモデルのリパラメ卜リゼイション 反応率 yの下限が 0 (0%),上限が 1( 1 0 0 % )に固定され , Yが用量 xに関する 2係数ロジス ティックモデルに従うとする.ここに,用量 xは実用量と対数用量のいずれでもよいが, 以下では対数用量であるとする.このとき , Yとxの関係は反応率が 0 . 5 ( 5 0 % )になる用量 α0.5と傾き pを用いて l o g /~ / =s(x‑a 5 ) O. ¥1‑Y¥ ] ) 1 ︑ ︐ ノJ‑‑l5 q m 一 α 一 一x 却一回 一 向 μ 一 一‑ 1 IA H一 UP 司‑ VJ e一+ すなわち 1+e x p [‑s(X‑α 0 . 5) ] と表される.上記のモデルを拡張して,反応率の下限 Ymin と上限 Y m a xをパラメータに含む 4係数ロジスティックモデルは , s (>0 )とするとき l o g /Y‑ム/ =s(X‑αm i d ) ¥Ym 田 ‑ Y¥ すなわち Ym Ymin Y= Ym 十 川 mm . l +exp[‑s(X‑αm i d) ] 副 ‑ ̲ Ymin+Y m a xe x p [ 戸(x‑αm i d) ] 1+exp[s(x αm i d) ] と表される.ここに, αm i dは中間反応率 ( Ymin+Ymax)/2 に対応する用量である. ここで,任意の反応率 r ( Y m i n<r<Y m a x )に対応する用量を α rとする.この α rを直接推定 するためのリパラメトリゼイションを考える.具体的に, ‑118‑

122.
[beta]
日卜 l
O
g
[
剖
=
ん
ー

l
O
g
[

αr)

とおしこれは

Ym
a
x‑Ym
i
n

Y=Y
m
i
n+ i
¥
mじ
1+
1Y
!
̲!exp[‑s(x‑αr)
]
.
¥r‑ Y
m
i
n)

九日一子市xp[s(x αr)
]

=ymm+(

J
m
a
x 一二 +exp[s(x α
r)
]
r‑ Y
m
i
n

Y
m
i
n
!Z
旦 じ 三 + 叫[
s
(
x‑αr
)
]
!
+
(
Y
m
Ir‑Y
m
i
n
I
担

Y
m
i
n)exp[s(xー αr)
]

…

主旦二三+exp[s(x‑αr)]
r‑Ym
i
n

(
ピ

a
xexp[s
)
Y
m
i
n+Ym

r‑Y
m
i
n

Z盟 主 二E+expIF(x‑αr)
]
r‑Y
m
i
n

と展開される.ここに , s>Oと仮定すると
ym

→Ymmim
1
n
r+

y

ロ叩叩
I
汀

/f

目 一

Y
m
i
n

→Ymiη
n
m
1
i

と
て

而
而
吋

H

川…叫

川
l+
1Y

x→ ∞ の と き

m込 二
旦

!̲Ix∞

.
¥r‑Y
m
i
n)

x=αrのとき
Y= Y
m
i
n十

Ym
a
x‑Y
m
i
n
i

¥

1+
1Ym旦二三 1
x1

.
¥r‑Ym
i
n)

=Y
m
i
n+ ‑ Ym
a
x‑Y
m
i
n

m
i
n+y
max‑r
m
i
n 'r‑Y

r‑Y
m
i
n
=Y
m
i
n+r‑Ym
i
n
ニ r

x→∞のとき
y
m
a
x‑Y
m
i
n
;1
1
1
1
¥ 一
→Y
m
i
n+Y
m
1
+
1主主ニ!̲ xO
.
¥r‑Y
m
i
n)

Y‑
→Y
m
i
n+

<
1
'
"

‑
'

I

日

になる.また , r=(Ym
i
n+Ym
a
x)/2のときは αrαm
i
d
' かっ

1
1
9一

‑

Y
m
i
n= Y
m
a
x

123.

Y m a x 2=2 Ym ( Ym + Y m i n2=1 h主土主且ー引 Y m a x+Y 2 Y m i n r巾 m担 阻 2 阻 ./mm であることから, Y= Ymin 十 mm Ym 皿 一 一 Ymin 一 一 1+exp[‑s(x‑αm i d) ] i d) ] ̲ Ymir +Ym a xexp[s(x‑αm 】 1+exp[s(x‑αm i d) ] となり,通常の 4係数ロジスティックモデルに一致する. 3.用量推定値と用量推定値の分散の推定値に関する性能評価 ここでは,用量と反応率の関係がロジスティックモデルで表される場合において,関心 のある反応率に対応する用量,および用量推定値の分散をリパラメトリゼイションによっ て実際に推定する.以降では, r 関心のある反応率に対応する用量」を単に「推定したい用 量」と表記する.そして,シミュレーション研究によって,リパラメトリゼイションによ る推定したい用量の推定値と,その用量推定値の分散について,それらの挙動を他の方法 で得られた推定値と対比的に検討する.つまり,推定の性能を ・真値からの偏り,および分散 ・関心のある反応率の値が,中央付近であるか上下限付近であるかによる,性能の相対 的な優劣への影響 ・反応率に関する誤差の大きさがもたらす性能の相対的な優劣への影響 に着目して評価する. 推定したい用量を求める方法として,モデルのリパラメトリゼイションによる方法を含 めて以下の 3 法をとりあげる.それらを,それぞれ仮に直接推定法,間接推定法,逆推定 法と呼ぶことにする.具体的には, ・直接推定法 ここで提案している,リパラメトリゼイションによる方法.すなわち,推定したい用 量をパラメータにもち,反応率を応答,用量を説明変数とするモデルをあてはめて, 推定したい用量と,その用量推定値の分散を直接的に求める. ・間接推定法 反応率を応答,用量を説明変数とするが,推定したい用量をパラメータにもたないモ デルをあてはめる.そして,推定したい用量はあてはめたモデルで得られたパラメー タの推定値の関数として求める.また,用量推定値の分散の推定値は後述のデルタ法 によって近似的に算出する. 1 2 0 ‑

124.

‑逆推定法 上記の 2 方法とは逆に,用量を応答,反応率を説明変数とするモデルをあてはめる. そして,推定したい用量を応答の予測値として求める.また,用量推定値の分散の推 定値は,間接推定法と同じくデルタ法によって近似的に算出する. e 以下に,デルタ法の概略を説明する.反応率と用量の関係が n個のパラメータ θ l '… ,n を e する.このとき, δの推定値 δ の分散は, δ を θl ' …, eの推定値 θ … ,eで偏微分したベ 用いたモデルで,そして推定したい用量 δが θ 1 ' . .・ ,nの関数として,それぞれ表されると l ' n n クト jレ¥ 7= ( ぷ/ a e …, a 8 /a e n ) Tとん…,札の分散共分散行列 Z を用いて , ¥ 7T 7で近 L¥ 1, 似的に推定される.詳細については,例えば竹内他編 ( 1 9 8 9 )を参照されたい. シミュレーションでは,反応率 y と用量 x の関係が m mm +kσ Y= Y m i n+ ‑ ‑ /Y 、今一 Y 1+I 主じ~I 叫 [-ß(x ‑α J] ¥r‑Y m i n) , で表されるモデルにおいて , r=0 . 5 0,αr二 5,s=0 . 9 8 6 5, Ymin= 0 . 1 5, YmaX ニ 0 . 9 5と 設定した.ここに,誤差 k σ は標準正規分布に従う乱数 σ の定数 k(= 0 . 0 2 5,0 . 0 5,0 . 0 7 5 ) 倍であるとした.そして , yは 1標本につき x=1 ,2, ・ ・ 9の各点でそれぞれ 1個ずつ . 5 0, X ニ 8のときの y の 得られるとした.このモデ jレでは , x= 5のときの y の真値が 0 真値が 0 . 9 0になる.そこで , yニ 0 . 5 0および y=0 . 9 0となる用量とその用量推定値の分 散を直接推定法,間接推定法,逆推定法によって , k= 0 . 0 2 5,0 . 0 5,0 . 0 7 5のそれぞれの場 合について 1000 回の試行から推定した.この試行には, SAS/STAT ソフトウェアのパー ジョン 6,リリース 6 . 1 2上で稼動する NL lNプロシジャを利用した. その結果 , y=0 . 5 0 に対応する用量の推定において , k=0 . 0 2 5 の場合で直接推定法と 間接推定法による推定値の平均が逆推定法による推定値の平均よりも真値に近く,かつ直 接推定法と間接推定法による推定値が一致した.そして,用量推定値の分散は直接推定法 と間接推定法で推定したときに,逆推定法によって推定したときよりも小さかった.用量 推定値の分散の推定値については,用量推定値と同じく直接推定法と間接推定法による推 定値が一致し,かっそれらの分散は逆推定法で推定したときよりも小さかった . kの値が 大きくなるにつれて,パラメータの分散の推定値が 0 になったために直接推定法と間接推 定法による推定値の一致しない事例が出現した他は,推定性能の相対的な優劣について誤 差の大きさによらず上記の傾向が共通してみられた.用量の推定値,および用量推定値の 分散の平方根である標準偏差の推定値について , k=0 . 0 2 5,0 . 0 5,0 . 0 7 5のそれぞれでの直 接推定法による推定値に対する逆推定法による推定値のプロットを図 1 に示す.他方, y=0.90に対応する用量の推定では,反応率が上限に近いこともあり,パラメータの分散 . 5 0に対応する用 の推定値が 0になった事例,すなわち不安定な推定になった事例が yニ 0 1 2 1 ‑

125.

k=0 . 0 2 5 1 . 0 5 . 0 0 . 8 5 . 5 護 lZ̲ T 佳 5 . 0 定 4 . 5 o. 2 5 . 0 • 2 5 . 5 1 5 . 0 1 10 0 0 14 4 4 . 5 0 . 4 0 . 5 0 . 8 1 .0 0 . 8 1 .0 0 . 8 1 . 0 直接推定 直接推定 k=0 . 0 5 1 . 0 5 . 0 0 . 8 5 . 5 . .・ . . . : ユ ‑ ‑ ・ ・ . ~.:, ‑ = ー = 二 ' ー . ̲ , 一‑ i i " ‑ : : " ' ‑ ": ・ 0 . 5 逆 逆 ー 定 T 佳 T 雀 5 . 0 ム £ 二 0 . 4 • 5 . 5 l 5 . 0 oo o‑ 4 0 14 4 . 5 2 0 4 . 5 5 . 0 0 . 4 0 . 5 直接推定 直接准定 k= 0 . 0 7 5 5 . 0 5 . 5 護 逆 T 佳 5 . 0 定 主 ‑ 2 0 4 . 5 推 接 0 . 2 4直 5 . 0 O 5 . 5 ‑定 ‑ 4 . 5 DU 4 1 14 • 図 1 . Y= 0 . 5 0に対応する用量の推定での,直接推定法による推定値に対する逆推定法に よる推定値のプロット(左:用量の推定値,右:用量推定値の標準偏差の推定値) ‑ 1 2 2一

126.

k=0 . 0 2 5 1 4 1 2 逆推定 逆 T 佳 1 0 定 . ‑ ̲ ; ̲ : ‑ ̲ ‑ 三 ‑ 6 e̲‑‑ ; . . ー ー ・ 5 1 0 1 2 1 1 4 直接推定 =・・ ・2 2 3 直接推定 k= 0 . 0 5 1 4 1 2 逆推定 i 芝 ナ 佳 1 0 定 ‑ ・ . 安 をz 二司に二1‑ v : J 1‑ ・ 5 6 1 0 1 2 1 4 直接推定 直接推定 k=0.075 1 4 1 2 逆推定 i 芝 T 佳 1 0 定 直接推定 直接推定 図 2 . Y= 0 . 9 0に対応する用量の推定での,直接推定法による推定値に対する逆推定法に よる推定値のプロット(左:用量の推定値,右:用量推定値の標準偏差の推定値) ‑123一

127.

量の推定よりも増加した.そこで,推定の精度を推定値の平均ではなく中央値で,また推 定値の散らばりを分散に代えて推定値の分布の 75%点と 25%点の幅で評価した.すると, k= 0.025 の場合で用量の推定値の分布について,その中央値は直接推定法と逆推定法に よるときに真値との近さがほぼ等しく,間接推定法による中央値よりも真値に近かった. また,分布の 75%点と 25%点の幅は逆推定法によるときに最も小さく,直接推定法による ときに最も大きかった.用量推定値の分散の推定値の分布は,その分布の 75%点と 25%点 の幅が逆推定法によるときに他の 2 法よりも小さかった.誤差が大きくなるとともに,用 量の推定値の分布について,その中央値は直接推定法によるときに最も真値に近くなるも のの分布の 75%点と 25%点の幅も最も大きくなり,逆推定法による用量の推定値の分布の 75%点と 25%点の幅が最も小さくなる傾向にあった.そして,用量推定値の分散について も,逆推定法による推定値の分布の 75%点と 25%点の幅が最も小さくなる傾向にあった. 用量の推定値,および用量推定値の標準偏差の推定値について , k= 0.025,0.05,0.075の それぞ、れでの直接推定法による推定値に対する逆推定法による推定値のプロットを図 2 に 示す. 以上より,反応率と用量の関係にロジスティックモデルをあてはめて,関心のある反応 率に対応する用量を推定するときに,中央付近の反応率が対象であればリパラメトリゼイ ションは極めて有用であると判断された.一方,上下限付近の反応率を対象とするときに はリパラメトリゼイションによる用量の推定値の取り扱いに注意すべきことが示唆された. また,同じく上下限付近の反応率に対応する用量を推定するときには,用量を応答,反応、 率を説明変数とするモデルをあてはめて,推定したい用量を応答の予測値として求めると 相対的に安定した推定値の得られることがうかがわれた. 4.リパラメトリゼイションの他の用量反応モデルへの拡張 これまでは,反応率と用量の関係がロジスティックモデルで表される場合を検討した. ここでは,ロジスティックモデル以外の用量反応モデルで,推定したい用量をリパラメト リゼイションによって求める方法を議論する. ロジスティックモデ jレを含めて,一般に反応率 y の変換値を f(y) , 反応率の下限 Ymin および上限 Ymax の間にある任意の反応率 rの変換値を f(r) とおく.このとき, 用量 X ,反応率が rになる用量 αr' および定数 Fを用いると,これらの関係は ) f(y)‑f ( r )=s(x‑αr と表すことができる.そこで,補対数一対数変換モデルを例としてリパラメトリゼイショ ンによって推定したい用量を実際に求めてみる. 反応率の上下限をもパラメータにもつ補対数一対数変換モデルには, ‑124一

128.

︑ ﹄︐︐ α x /目︑ Qur ¥l'iftl'ノ ﹂ ﹁IIll1115 ‑ ‑ α Qur x /目︑ ‑PJ ) 寸1111till‑‑ /目︑ 42 ρレ αr ノ ¥1li‑‑e ﹁lili‑﹂ ‑ ︑1Ill‑﹀111tJ ‑ ‑ x Qρ 一‑ m ︑ ・ ︐ ︐p x 一一 ‑n ︑TIlt't alll‑J ¥i︐ l l‑‑/ ︑ 一一国 一 m n d mv 一 y‑‑ 一 m 一 y ︑ σb o r /Ffill‑‑t r‑‑‑JI‑‑L p x Fill﹄I111111﹂ n ρレ ) ym x a /目︑ n 一 m n d 一 mv v d ‑uJ 一一目 /dili‑‑¥ r一 m 一e m r一 m 阻一一 ︑ ・ oob r{ll︿Ill ob o fl'L﹀f﹄llJ ﹁Illi‑‑‑‑L ︐ ︑¥︑PIlli‑‑e/ 一山 一 m n m ‑ v d y‑‑ y 一 日J qb ym + /21111t¥ G ym o ︑ qb rill‑d B I t s tに 二y m一民 一 UJ VJ 一 町 /fII111l qb o ︑ ︑ ob o ﹁IIll111ll ﹂ ¥1till/ 一回 ﹁Illi‑‑Ef‑‑J 引y d 一 m 二y 国一一 一y 九 一 ‑ ‑y すなわち m一 国 V J 一m qb と o f 1 1 1 1¥ ﹁Illl‑‑‑L ob o すなわち の 2 通りがある. いずれも単調であるが,変曲点はロジスティックモデルと異なり最初の モデルでは反応率の上下限の中間よりも上側に 2 番目のモデルでは中間よりーも下側にそ れぞれもつために,非対称な形状を示す. ここでは,最初のモデルをとりあげて, ロジス ティックモデルでの検討と同様にシミュレーション研究によって,推定したい用量の推定 値と, その用量推定値の分散について, それらの挙動を他の方法で得られた推定値と対比 的に検討する. シミュレーションでは, 反応率 y と用量 xの関係が 目 い ‑ymm)exp[‑(log(zr で表されるモデルにおいて, rニ 0 . 5 0, ̲αr 5,s= 0.5242,Y m i n= 0 . 1 5, Ym . 9 5と a X= 0 二 設定した. ここに,誤差 k σ は標準正規分布に従う乱数 σ の定数 k( =0 . 0 2 5,0 . 0 5,0 . 0 7 5 ) 6 .0 1 .0 5 . 5 0 . 8 r 0 . 6 i 芝 T 芭 5 . 0 ー一‑‑‑ ユ 之 二 . ‑ ζタ 人 : , ‑ . . ̲ ‑: T 佳 定 定 1・ o. ~ ~追試.t:L 4 0 5 o. 2 0 4 04 . 4 0 5 5 . 0 5 . 5 。 . 8 6 . 0 直接推定 1 . 0 図 3 . Yニ 0 . 5 0に対応する用量の推定での,直接推定法による推定値に対する逆推定法に よる推定値のプロット(左:用量の推定値,右:用量推定値の標準偏差の推定値) ム 唱E Fhu ηム

129.

倍であるとした.そして , y は 1標本につき x=1 ,2, ・ ・ ・ , 9の各点でそれぞれ 1個ずつ 得られるとした.このモデルでは , x=5のときの yの真値が 0 . 5 0, X =8のときの yの . 9 0になる.そこで , y= 0 . 5 0および y= 0 . 9 0となる用量とその用量推定値の標 真値が 0 . 0 2 5,0 . 0 5,0 . 0 7 5のそれぞれ 準偏差を直接推定法,間接推定法,逆推定法によって , k= 0 の場合について 1000回の試行から推定した.一例として , k=0 . 0 5の場合での y=0 . 5 0 となる用量の推定値,および用量推定値の標準偏差の推定値について,直接推定法による 推定値に対する逆推定法による推定値のプロットを図 3に示す.その結果,用量の推定値, および用量推定値の分散の推定値の挙動について,ロジスティックモデルの場合と同様の 結果が得られた. 5.おわりに 本稿では,用量反応モデルのパラメータが実験者にとって解釈が容易で馴染みのある指 標になるようにモデルを再表現して,それらの指標を直接的に推定することの実用性を検 討した. その結果,関心のある反応率が中央付近であれば,推定したい用量をパラメータに含む モデルのあてはめによる直接的な推定は精度の良いことが確認された.他方,関心のある 反応率が上下限に近いとモデルの誤差が大きいときに,直接的な推定はやや不安定な傾向 をみせた.そして,この場合には応答と説明変数を通常とは逆に,用量を応答,反応率を 説明変数とするモデルをあてはめて,平均応答の推定という形で用量を推定すると相対的 に安定した推定値の得られることが示唆された. 最後に,例えば Ratkowsky(1990)にみられるように,リパラメトリゼイションの仕方に よって,推定値の性質が「貧弱」になる場合があるために,推定値の性質を確認すること が必要で、あると考えられる.また,三輪( 1 9 8 5 )では一般化逆回帰推定量が議論されており, 本稿で検討したような場面への拡張に関心を抱いている.そして, NL lN プロシジャを適用 するときには,初期値をはじめとする各種の実行条件の与え方で推定値が大きく変動する 場合が見受けられる.したがって 使用実績を重ねながらリパラメトリゼイションの適切 性をさらに評価していきたい. 参考文献 Ratkowsky,D.A .( 1 9 9 0 ) .Handbookof NonlinearR e g r e s s i o nM o d e l s .NewYork :Marcel Dekker. 竹 内 啓 他 編( 1 9 8 9 ) . 統計学辞典.東洋経済新報社. 1 9 8 5 ) . 線形校正における点推定量の平均 2 乗誤差にもとづく比較.応用統計学 三輪哲久 ( 1 4,8 3・9 3 . 唱Eゐ nノ ω nb

130.

日本 S A Sユーザー会 (SUG I‑J) 中間解析における α消費関数と検定統計量についての検討 0本 田 圭 一 ・ 浦 狩 保 則 塩野義製薬株式会社 解析センター Onα‑SpendingF u n c t i o n sa n dT e s tS t a t i s t i c si nI n t e r i mA n a l y s i s K e i i c h iHondaa n dY a s u n o r iU r a g a r i B i o m e t r i cA n a l y s i sD e p t .,S h i o n o g i0 0 .,L t d . 要旨 中間解析における棄却限界値を算出するために開発した SASプログ、ラムを用いて,治療 効 果 が 2値で得られる 2アームの群逐次試験の計画時における α消費関数および検定統計 量の選択について検討した事例を紹介する. キーワード: 群逐次試験,繰り返し有意性検定,独立増分構造,棄却限界値 1 . はじめに 中間解析に関する松井他(19 9 7 )の興味深い総合報告を講読したことをきっかけとして, 2編の m i t a g ee ta , . l1 9 6 9 : L a na n dD e M e t s,1 9 8 3 )を参考にして,中間解析における棄却限界値を 文献(Ar 算出するための SASプログラムを開発した.そして,その実行結果がそれらの 2編の文献での数値 結果と一致することを確認した(浦狩・本田, 1 9 9 8 ) .ここに,検定統計量は「独立増分構造」をもっ正 規変量であることを前提とした. 本稿では, まず L a na n dD e M e t s( 1 9 8 3 )で示されている P o c o c k型 , Q ' B r i e n ‑ F l e m i n g型 , L i n e a r型の 3種類の α消費関数について,上記のプログラムを利用して棄却限界値を求め, α消費 関数のそれぞれの特徴を評価した.次に,治療効果が 2値で得られる 2アームの群逐次試験の状況 を設定し,独立増分構造をもち近似的に正規分布に従う検定統計量を用いる繰り返し有意性検定 の第 1種の過誤率と検出力をシミュレーションにより評価した.同時に独立増分構造をもたない卑近 な二つの検定統計量を用いる場合の棄却限界値の選定および第 1種の過誤率と検出力についても 1 2 7

131.

検討した.さらに,浦狩・本田(1998)の SAS プログ、ラムを,検出力の理論計算をも可能にするように 改訂した. 2 . 中間解析における棄却限界値 2群の比較臨床試験で,帰無仮説 Hoと両側対立仮説 H1を設けて,有意水準 αの検定を行う 場面を考える.群逐次試験では,試験の途中で,ある程度まとまった被験者数(例えば,数十例)の 成績が得られると,その都度,検定を行う.そして,その検定結果に基づいて試験を中止するか,あ るいは継続するかを判定する. いま,試験の全期間中に最大 N 例の被験者の治療成績を得て,最大 K 回の検定を行うとする. 具体的に,試験開始から最初の N1例の被験者の成績を用いて 1回目の検定を行う.その検定結果 が有意でなければ,次の N2 例を加えた N1 +N 例の被験者の成績を用いて2回目の検定を行う. 2 その検定結果が有意でなければ,次の N3 例を加えた N1 例の被験者の成績を用いて 3 +N2+N3 回目の検定を行う.検定結果が有意でないという条件のもとで,この手順を最大 K 固まで繰り返す. ここに ,Nニ N }+N2+・ + N / (である.また,検定回数に対応させて試験の全期間を K 個の期間 (期間 1,期間 2,…,期間 K)に分割することにする. 1節で述べた「独立増分構造」をもっ E規変量を検定統計量とするためには次のようにすればよ I, Z 2 "・, ZKがあり,それぞれは2群の差をはかる量 い.いま,期間ごとに独立に得られる統計量 Z であり,帰無仮説 Hoのもとで標準 E規分布に従うとする.具体的に,期間 1の N1例の被験者の成 績だけから統計量 Z Iを求め,期間 2の N2例の被験者の成績だけから統計量 Z2を求め,期間 3の 例の被験者の成績だ、けから統計量 Z N3 3を求める,という手順を踏めば,一般に Z I, Z 2 '… , ZKは 互いに独立であるといえる.期間 kの最後における,すなわち k回目の検定での検定統計量として S k=ZI+Z2+ ・+ Z k ( 1 ) あるいは,それを期間数の kで調整した S k=( Z I+Z2+ …+ Z k ) IJ k ( 2 ) を用いることにする (k=1 ,2, …, K).このとき,検定統計量 S kあるいは S kは独立増分構造をもち, しカも正規分布に従う. 中間解析における棄却限界値を次のように表記する. ( 1 )式の S I,S 2 '… ,SKに対応する棄却限界値を C 1, C 2, " ' ,C Kで表す. ( 2 )式の S i,S i, . . . ,S < Iに対応する棄却限界値を c i, c i, …, c < Iで表す. ここでは, ( 1 )式を用しも場合について記述する.なお, ( 2 )式を用いる場合も考え方は同じである. 1, c 2 '… , C Kを用いて,試験の中止・継続の判定ノレーノレを次のように定める.すなわち, 棄却限界値 C 臨床試験の途中 (kニ 1 ,2, 一 ., K ‑1)では, ISkl~Ck ならば Ho を棄却し , k回目の検定をもって臨床試験を中止, 1 2 8

132.

I S k l<C kならば,k回目の検定以後も臨床試験を継続, とし,臨床試験の最後の解析 (k= K)では, I S K I~ CKならば Hoを棄却, I S K Iく CKならば Hoを採択 とする. 群逐次試験では,最大 K回の検定において第 l 種の過誤率が有意水準の αになるようにしなけ ればならない.この試験全体の第 1種の過誤率は,帰無仮説が真のとき J 、ずれかの検定で、誤って 帰無仮説を棄却してしまう確率であり, 月=吋SI r~ C jo rI S 点 C2 0 ト・ I H 0] o rI SK1~ CK で定義される.したがって, R α 二 を満たすように C j, C 2, " ' , CKを定めることが必要である. ところで,最大 K 回の検定において第 l種の過誤を犯す全体事象は,互いに排反な K 個の部 分事象に分割することができる.それらは Hoのもとでの ISII~ c1 ( 1回目の検定で H。を棄却) I S ( 2回目の検定で H。を棄却) く I rCj and IS21三 C2 く I rCj and IS21くC2 and... and ISK‑I rく C K ̲ j and I S K I三 CK I S (K回目の検定で H。を棄却) である.し、ま,k回目の検定で H。を誤って棄却する確率を 九=Pr[ I S I r <C j and ' " andI S k ‑ I r <C ト j and ISkl~CkIHO] と表す ( k= 1 , …, K).このとき ,P o=αにすることは ,P j+P …+P k 2+ K =αにすることである .P α 消費量)と呼ぶ. をk回目の検定における第 l種の過誤率の消費量 ( 浦狩・本田 ( 1 9 9 8 )では,任意の最大検定回数 K (K三1 )とその最大 K 回の各検定での第 l種の 過誤率の消費量の設定値 π j, π2' … , πKを予め与えておき, 円=πj'P ・' , P 2 ニ π2' K =πK を満たす棄却限界値の系列を算出する,すなわち, S ] ' S 2 "・ ・, SKに対する C j, C 2 "・ , ' CK S ,iSi, " ' , SKに対する C i, C i, ' ・ ・, CK をそれぞれ算出する SASプログラムを提示している.L a na n d DeMets(1983)の方法を用いる場合に は,最大 K回の各検定での第 l種の過誤率の消費量の設定値 πj'π2' … , πKは α消費関数を通 して算出される. ‑129

133.
[beta]
3.α 消費関数と検定統計量の選択
主評価指標が2(有効,無効)の場合で, 2アームの群逐次試験を計画しているとする.試験群
と対照群の母有効率をそれぞれ PTとPC' 帰無仮説と片側対立仮説をそれぞれ HO:PT‑PCニ O
とH1:ヰ ‑PC>0で表す.最大検定回数を Kとし,試験全体の有意水準を αに制御したし、とする.
一般に,このような試験では表 lに示す情報が得られる.この表で,記号 nとrはそれぞれ期間

k(=1,2
,… ,K)
までに集積される被験者数と有効者数を表す.右肩に*を付したものは期間 k
の中で集積される情報であることを意味する.

ア ム

T

表l. 2アームの群逐次試験で得られる情報
期間 K
期間 2
期間 l
.
.
*
*を
(n~(T), r;( T)) を観測
(
n
;
(
T
),
rLT))を観測
(nl(T)'r
1
(T)) 観 測

.

*

n
l
(T)ニ n
l
(T)
r
1
(T)

=η*
(T)

(n;C),
r
ふ)を観測

C

nl(C)

=nl*
(C)
*

(C)
r
l
(
C
)‑ η

ト一一一一一一一

r
2
(T)

一一一ー』一一一一一一一トー一一一一一一一一一一一一一一・

=n1(T)+n2*
(T)

nK(T)

*
=η(
T)+r2(T)

K
(T) ニ r
K
‑
1
(T) +r
K(T)

n2(T)((C),r;(C))を観測
本

n2(C)
r2(C)

=nl(C)+n2(C)

=nK‑1(T) +nK(T)
本

.
.
.

*C
=rl(C)+:
I(
)

(n~(C)' r;(C))を観測
K(C)

=nK‑1(C)+nK(C)

rK(C) ニ r
I(C) +r
;(C)
Kー

以下では,表 Iのような群逐次試験において, Lana
n
dD巴M
e
t
s
(
1
9
8
3
)の方法を用いて中間解
析を行う場合の α消費関数と検定統計量の選択について検討する.
3
. 1.α 消費関数

LanandD巴M巴t
s(
19
8
3
)で
、
は
, 3種類の α消費関数が例示されている.

① Pocock型

α(
t)=α・l
o
g
{
l+(e‑
l
)
t
}
② O'Brien‑Fleming型
α(
t
)= 22c
I
>(/.
J
t
) , α(0)=
=0
③Lin
e
a
r型

α(
t
)= α
t
これらの記述において, αは有意水準 ,tは情報分数 (
0三I壬 1),z
α/2は標準正規分布の

上保IJα/2点
, φは標準正規の累積分布関数である.最大 K回の各検定で消費する第 l種の

=1ム… ,
K)
過誤率の消費量の設定値は, α消費関数の差分値として与えられる.すなわち k(
回目の検定における第 l種の過誤率は,

πk =α(
t
d α(
tk‑l)
で設定されることになるただし,んは k(=12,
・
.
.,
K
)回目の検定における情報分数であり,
‑130

134.

{ o= 0である.①は,試験の早期段階において関数値の上昇度が大きく,消費される過誤率が 大きい.②は,試験の早期段階において関数値の上昇度がご、く小さく,消費される過誤率が小さ い.試験を通じて各期間で情報量が等しいとき,すなわち各期間の情報分数の差分値が等しい とき,①に基づいて算出される棄却限界値は Pocock法で、の棄却限界値にほぼ近くなる.②に基 '8了i e n ‑ F l e m i n g 法で、の棄却限界値にほぼ近くなる.③では,試 づし、て算出される棄却限界値は 0 験の早期と後期で過誤率は一様に消費される. 3.2.検定統計量 . : 法 ①独立増分正規統計量:Si k( =1,2,… ,K)回目の検定統計量として, S i . : ニ Sk/ . J k k を用いる.ここに ,Sk= I Z iであり ,Zkは , 山 * * +rk (C) * * 百* ‑ r ' k (T) 1 k‑ nk(T)+nk(C) * 本 rk(C) nk(T) nk(C) k つ一 とおいて, けから 、 f *̲ rk(T) *一, . . : : : ̲ f n * ¥̲ 1 1 1 一* 1 ‑ var(Dk)=1τ一+一「一│九(1一九) ¥nk(T) nk(C)) z ;ニD ;/ [ V 互不で、与えるすなわち,期間ごとに,その期間で得られた情報だ z ;を求める Hoのもとで¥ZJ,z L ,z ;は互いに独立に近似的に標準正規分布に 従うから,その累和であるらは独立増分正規変量になる. Si.:は期間数 kで Skを調整したもの . : を2節で述べた棄却限界値と比較して有意性を判定する.こ である.したがって,検定統計量 Si の検定法を本稿では Si.:法と呼ぶ. ②非独立増分正規統計量:Z k法 k( =1,2,… ,K)回目の検定統計量として, Z k=Dk/ . . . j 可否石7 ̲ を用いる.ここに ,P k= r 1 : ( 1 " )+rk(C) nk(T)+nk(C) rk(T) rk(C) nk(T) nk(C) Dk二一一一一一一一 ..~_/ n ¥ I 1 1 I 一 一 v a r ( Dk)=1 一一一+一一一│九(1 凡) ¥nk(T) nk(C)) である.すなわち ,k回目の検定までのすべての期間で得られた情報を用いて検定統計量を求 oのもとで近似的に標準正規分布に従う.ただし ,Z kは独立増分 める方法である.このみは ,H 構造を満たしていないため,棄却限界値を正確に算出することは難しい.ここでは, α消費関数 の差分値として算出される第 1種の過誤率の消費量の設定値引に対応する標準正規偏差 Zπk '1' 唱 u nぺ 句 '

135.

を棄却限界値として近似的に用いる.この検定法を本稿ではみ法と呼ぶ. ③非独立増分カイ二乗統計量(連続補正 ) : x l法 k(=l,l K)回目の検定統計量として, ヲ 仇(T)mk(C)一mk(T)乃( C ) I ‑nk( ・ )/2} nk( . X ;= 町 , nk(T)nk(C)ら { ・ )mk(・ ) を用いる.ここに, mk(T) ニ nk(T)‑ rk(T) , mk(C) = nk(C)‑ rk(C) , r k (・ ) =rk(T)+rk(C) ,mk(・)=mk(T)+mk(C) ,nk(・)=nk(T)+nk(C) である.すなわち ,k回目の検定までのすべての期間で得られた情報を用いて,自由度 1のカイ 二乗検定統計量を求める方法である.②と同様に, α消費関数の差分値として算出される第 1種 の過誤率の消費量の設定値引に対応するカイ二乗分布の上側パ一セント点 X 2, l (2 πdを棄却 限界値として近似的に用いる.ここでは片側検定を想定しているため,有意性の判定の際, PT ‑Pcの推定値が正値か否かということも考慮する.この検定法を本稿で、は x l法と呼ぶ.なお, 連続補正を施さない場合のカイ二乗検定の結果は,②の Z k法での検定結果に一致する. 4 . 検討事例 4 .1 .シミュレーションの概要 最大検定回数を3回 (K=3)とし,試験群と対照群のおのおののについて,母有効率と各検定 に対応する3つの期間のそれぞれでの被験者数を与え, 2項乱数により有効患者数の標本を求め た.そして,それらの標本を用いて, 3通りの検定法 (S k法 ,Zk法 , x l法)で,試験全体の有意水 準を 0 . 0 5に制御して ,Ho:ヰ ー Pc=0の H ] :ヰ ‑PC>0に対する群逐次検定を実施した. シミュレーションは,次の設定で、行った. ・被験者数:集積される被験者数が両アームおよひ3つの期間ですべて等しい,すなわち n](T)二 f l ] .(T) =n3(T)ニ n](C)=fl].(C)二円(C)= n とした. ・情報分数:各検定時の情報分数は,それまでに集積される被験者数から定めた.具体的には,上記 ) 即こ 1 / 3,2/3,1とした. の被験者数の設定から, 1回目, 2回目, 3回目の検定での情報分数を1 PC)= .、ンミュレーション・パラメータと標本数:試験群と対照群の母有効率のベアとして, (ヰ , ( 0, 4 . 0. 4 ) , ( 0 . 6, 0 . 6 ),( 0, 4 .0 . 2 ),( 0 . 6, 0 . 2 ),( 0 . 6, 0. 4 ) の 5通りを設定した.1つの期間の lつのアームで 集積される被験者数として ,n= 1 5,3 0の2通りを設定した.母有効率のベアと被験者数とによる 1 0 通りの組み合わせのそれぞれで, 10000個の標本を生成した. ‑ 第 1種の過誤率および検出力の算出:各回の検定までに有意差の認められた標本数を全標本数 ( 1 0 0 0 0 )で割ることにより,第 1種の過誤率(( ヰ , Pc)=( 0, 4 . 0心 , ( 0 . 6, 0 . 6 )の2通りのベアの場合), ( l トPC)=(0ム0.2),(0.6, 0 . 2 ),( 0 . 6, 0. 4 ) の 3通りのベアの場合)を算出した. および検出力 ( 4.2.棄却限界値 η J ω ﹃u Tよ

136.

P o c o c k 型 , Q ' 8 r i e n ‑ F l e m i n g 型 , L i l 1e a r 型の 3種類の α消費関数について, 3 通りの検定法のそ れぞれで用いた棄却限界値を表 2に示す. 表2 . 日消費関数別の各検定法における棄却限界値 l回目 2回目 日消費関数 検定法 P o c o c k型 S k法 ( α 消費量は,期間 10 . 0 2 2 6 . Z k法 期間 20 . 0 1 5 5,期間 3 0 . 0 1 1 8 ) x f法 O ' B r i e n ‑ F l e m i n g 型 ( α 消費量は,期間 10 . 0 0 2 2 . 期間 20 . 0 1 9 8,期間 3 0 . 0 2 8 0 ) S k法 Z k法 : χ 法 L i n e a r型 S k法 ( α 消費量は,期間 10 . 0 1 6 7, Zk法 期間 20 . 0 1 6 7,期間 3 0 . 0 1 6 7 ) x f法 3回目 1 . 9 8 0 2 . 2 6 3 5 . 1 1 9 2 . 0 0 2 2 . 0 0 2 4 . 0 0 8 1 . 9 9 4 2 .1 5 6 4 . 6 5 0 2 . 8 4 9 2 . 8 4 9 8 . 1 1 5 2 . 0 3 2 2 . 0 5 8 4 . 2 3 6 3 . 6 5 1 2 .1 2 8 2 .1 2 8 4 . 5 2 9 1 . 9 9 8 2 . 1 2 8 4 . 5 2 9 1 .8 8 1 2 .1 2 8 4 . 5 2 9 1 .7 3 2 1 .9 1 1 S k法と Zk法とは,検定統計量の定義式は異なるものの,それらの帰無分布がともに標準正規 分布である点で共通している.両者の棄却限界値の系列を比較すると, 2回目以降で S k法での棄 却限界値が Zk~去で、の棄却限界値よりも小さくなる .3 種類の α 消費関数を比較すると,用しも検定 法に関わらず,最初の棄却限界値は P o c o c k 型で、最も小さく,最後の棄却限界値は Q ' 8 r i e n ‑ F l e m i n g 型で、最も小さくなる.なお,よく知られたことであるが, P o c o c k 型の α消費関数のもとでの S k法の棄 却限界値は 3回の検定を通して約 2でほぼ一定している. 4.3.第 1種の過誤率と検出力の評価 3種類の α消費関数と 3種類の検定法の組み合わせに対して , (P c)=( 0. 4 , 0.4)の場合の p P n=1 5のときの第 1種の過誤率を表 3 (こ,(PT, Pc )=(0. 4 ,0 . 2 )の場合の n=1 5とn=30のときの検出 力をそれぞれ表4と表 5に示す. 表 3に示したように,試験全体の第 1種の過誤率(期間 k=3 の行を参照)は ,S k法において名 目有意水準の 0 . 0 5をやや上回る値で ,Z k法において名目有意水準をやや下回る値で算出された. x f法で、の第 1種の過誤率は相当に小さい値で、算出された.すなわち, x l法はかなり保守的な検 定法であることがうかがわれた .α 消費関数が試験全体の第 1種の過誤率に及ぼす影響は比較的 に小さかった.これらの傾向は ,n=30のときも, (P Pc)=( 0 . 6, 0 . 6 )の場合にも同様にみられた.な T, お , x ;法で、の結果は連続補正を行った場合を示しているので、あって,連続補正を行わないカイ二 k法での結果に一致することに注意したい.また ,S k法での第 1種の過誤率が名 乗検定の結果は Z 目有意水準をわずかに上回った理由として,統計量 Z Uこ対する正規近似の精度の低さやサンプリ ング誤差が考えられる.実際に, ( ヰ ,Pc)= ( 0. 4 , 0.4)の場合に,被験者数とシミュレーションの標本 ‑133

137.

表3 .シミュレーションに基づく第 1種の過誤率:( 斗 , Pc)=( 0. 4 , 0. 4 ) , nニ 1 5 α消費関数 Pocock型 o'Brien‑Fleming型 期間 k SI c 法 l 0 . 0 2 1 6 0 . 0 3 7 5 0 . 0 5 0 6 0 . 0 0 3 3 0 . 0 2 4 8 0 . 0 5 4 9 0 . 0 2 1 6 0 . 0 3 7 5 I 0.0581 ー 2 3 l 2 3 L i n e a r 型 Z k~去 x f r 宏 0 . 0 2 1 6 0 . 0 3 0 0 0 . 0 3 5 4 0 . 0 0 3 3 0 . 0 2 4 4 0 . 0 4 4 7 0 . 0 2 1 6 0 . 0 3 1 5 I 0.0405 0 . 0 0 9 6 0 . 0 1 4 4 0 . 0 1 7 7 0 . 0 0 0 8 0 . 0 1 2 1 0 . 0 2 3 6 0 . 0 0 9 2 0 . 0 1 4 2 0 . 0 1 9 0 表4 .シミュレーションに基づく検出力:( ヰ , PC)= ( 0. 4 ,0 . 2 ) ,n=1 5 α消費関数 期間 k Pocock 型 2 3 O'Brien‑Fleming 型 2 3 L inear型 2 3 S I c 法 Z k法 xf~去 0 . 1 8 6 6 41 2 5 0. 0 . 5 9 5 2 0 . 0 3 7 5 0 . 3 6 8 3 0 . 6 6 0 8 0 . 1 8 6 6 0. 41 2 5 0 . 6 2 0 7 0 . 1 8 6 6 0 . 3 6 5 1 0 . 5 0 0 8 0 . 0 3 7 5 0 . 3 5 8 9 0 . 5 8 4 3 0 . 1 8 6 6 0 . 3 7 3 1 0 . 5 3 3 2 0 . 0 9 9 2 0 . 2 5 1 5 0 . 3 8 7 2 0 . 0 1 6 2 0 . 2 4 9 7 0. 4925 0 . 0 7 9 8 0 . 2 5 3 1 0. 4277 表5 .シミュレーシ司ンに基づく検出力:(ヰ , Pc) =( 0. 4 ,0 . 2 ) ,n=30 α消費関数 「 期間 k Pocock型 2 3 O'Brien‑Fleming 型 2 3 L inear型 2 S I c 法 Zk法 : χ 0 . 3 8 8 0 0 . 6 8 7 0 0 . 8 6 1 0 0 . 1 0 9 3 0 . 6 4 3 7 0 . 8 9 8 2 0 . 3 3 3 6 0 . 6 7 7 1 I 0.8769 0 . 3 8 8 0 0 . 6 4 1 4 0 . 7 9 8 5 0 . 1 0 9 3 0 . 6 3 6 2 0 . 8 6 4 0 0 . 3 3 3 6 0 . 6 3 8 2 0 . 8 2 0 3 0 . 2 6 2 6 0 . 5 5 0 4 0 . 7 3 9 0 0 . 0 6 8 1 0 . 5 5 2 7 0 . 8 1 9 7 0 . 2 3 3 0 0 . 5 5 5 8 0 . 7 6 9 1 法 表6 .シミュレーションに基ペく試験全体の第 l種の過誤率:( 斗, Pc)=(Oム0. 4 ) α消費関数 n Pocock 型 3 0 1 0 0 200 O'Brien‑Fleming 型 3 0 1 0 0 200 3 0 1 0 0 200 L i n e a r 型 1 0 0 0 0標本 0 . 0 5 3 7 0 . 0 5 3 7 0 . 0 5 3 1 0 . 0 5 5 2 0 . 0 5 5 9 0 . 0 5 4 1 0 . 0 5 3 0 0 . 0 5 5 2 0 . 0 5 4 4 1 3 4 50000標 本 0 . 0 5 4 3 0 . 0 5 3 0 0 . 0 5 2 0 0 . 0 5 3 2 0 . 0 5 3 0 0 . 0 5 0 8 0 . 0 5 2 7 0 . 0 5 2 8 0 . 0 5 2 7 100000標 本 0 . 0 5 3 4 0 . 0 5 1 9 0 . 0 5 0 9 0 . 0 5 1 5 0 . 0 5 1 8 0 . 0 4 9 5 0 . 0 5 1 8 0 . 0 5 1 7 0 . 0 5 1 5

138.

数の設定値を増やすことで第 l 種の過誤率が名目有意水準の 0 . 0 5 に近づくことを確かめた.その 1こ示す.被験者数の増加は正規近似の精度を理論的に上昇させる.標本数の増加はサ 結果を表 5 ンプリング誤差の影響を小さくするものと考えられる. 表4と表 5 1こ示したように,(fト P c )=( 0. 4 ,0 . 2 )の場合の試験全体の検出力は, O ' 8 r i en‑F l e m i n g 型の α消費関数を用いたときに最も高く, P o c o c k 型の α消費関数を用いたときに最も低かった.検 k法での検出力が最も高く ,Zk法がそれに続き, 定法についてみると ,S x f法で、の検出力が最も 低かった. 4.4.検出力の算出 ( 1 )式の検定統計量 Skを用しも場合の検出力の算出手順が M c P h e r s o na n dA r m i t a g e( 1 9 7 1 )で与 えられている両側対立仮説のもとで ,S k( k = 2, ・,K )の確率密度関数は, 五(SK)=lhA‑l(. h L =叫 { ‑ t (Sk‑U δ) 2 } d u . J2 π l.," ,J ( 3 ) J‑C'̲I ‑‑ で与えられる.ここに ,f ト ,1(・)は直前の (k‑1)回目の検定での検定統計量 Skー Iの確率密度関数, Cト Iは ( k‑ 1 )回目の検定での棄却恨界値, δは2群の差を標準化した値である.このん (Sk)が求 まれば 1回目から k回目までの検定で帰無仮説が棄却されない確率が に ニ υ λ μ ω 州 川 u u ) d Qk でで、算出される. したがって,対立仮説のもとでの l回目から k回固までの検定での検出 力は Pk=1‑Qk で算出される. 上記の特殊ケースとして,治療効果が 2値で得られ,しカも両アームおよびすべての期間で等し くn例が集積されるとしづ状況を想定すると,対立仮説のもとでの試験群と対照群の母有効率をそれ ぞれ P r ' Pcとするとき, (3)式において δ一 ‑ F L‑ ‑13 ~~{ヰ (1 ー Pr ) + 以 l‑PC)} とおくことで,近似的な検出力が得られる. n= 3 0と n=1 0 0 のときの, 3種類の α消費関数に対する(ヰ, P c )=( 0. 4 ,0 . 2 )の場合の,シミ 1こ示す.なお,ここでの検出力 ュレーションに基づく検出力と上記の理論計算に基づく検出力を表 7 は両側検定に基づくものであるー 表 7に示したように,理論計算値が、ンミュレーション値をわずかに上回った.この原因としては,正 規近似の精度が低いことが考えられる.実際に,被験者数が nニ 3 0の場合よりも n= 1 0 0の場合の ほうが理論計算値とシミュレーション値は近い値を示した. 1ム qJ Ru

139.

表7 .シミュレーションと理論計算に基づく検出力:( ヰ, Pc)=(Oム0 . 2 ) ,nニ 100 α消費関数 Pocock型 l 2 3 O'Brien‑Fleming 型 l 2 3 型 L i n e a r n=30 期間 k l 2 3 n=100 シミュレーションf 直 理論計算値 シミュレーション1 i 宣 理論計算値 0 . 2 6 5 0 0 . 5 7 3 5 0 . 7 7 4 3 0 . 0 3 5 1 0. 4972 0 . 8 3 1 6 0 . 2 3 3 0 0 . 5 6 7 0 0 . 7 9 3 8 0 . 2 9 2 0 0 . 5 9 1 9 0 . 7 9 1 5 0 . 0 4 8 2 0 . 5 1 8 2 0 . 8 4 3 3 0 . 2 5 4 0 0 . 5 8 4 5 0 . 8 1 0 5 0 . 8 0 2 2 0 . 9 8 5 1 0 . 9 9 9 4 0 . 3 7 3 2 0 . 9 7 8 4 0 . 9 9 9 7 0 . 7 6 5 2 0 . 9 8 4 7 0 . 9 9 9 5 0 . 8 1 1 3 0 . 9 8 6 9 0 . 9 9 9 4 0. 4081 0 . 9 8 0 6 0 . 9 9 9 7 0 . 7 7 8 8 0 . 9 8 6 5 0 . 9 9 9 6 5 .最後に 4.4節の検出力の計算では,両アームの被験者数がすべての期間で等しいことを想定した.この ことに関連して, KimandDeMets(1992)で、は,消費関数接近法を利用した中間解析において,解析 時期を変更したことの検出力に及ぼす影響は小さいことが記されている.したがって,このように等 間隔の情報量で中間解析の時期をあらかじめ規定することはとくに問題ないと思われる. 本稿では中間解析における検定統計量として独立増分構造をもっ正規変量で、あることを前提と した.しかしながら, KimandDeMets(1992)で、は,独立増分構造をもたない検定統計量による繰り返 し有意性検定が議論されている.今後,これら 2つの検定統計量の性質を比較したい.また,本稿で 検討した状況,すなわち正規分布に従うデータに基づく 2アームの群逐次試験において,棄却限界 t a g e randYun(1997)で、提案されている.その SAS プログラムと 値を算出するための SASフ。ログ、ラムは S の比較を通して,我々の開発プログラムの性能を評価し,改良につなげたい. 参考文献 Anni t a g e, P ., McPherson, CλandRowe, B . C . ( 1 9 6 9 ) .R e p e a t e ds i g n i f i c a n c et e s t so na c c u m u l a t i n gd a t a . .S o c .,AI32, 2 3 5 ‑ 2 4 4 . j . R o y . S t a t i st Kim, K .a n dDeMets, L .D . ( 1 9 9 2 ) .S a m p l es i z ed e t e r m i n a t i o nf o rg r o u ps e q u e n t i a lc l i n i c a lt r i a l sw i t h i m m e d i a t er e s p o n s e .S t a t i s t i c si nM e d i c i n e,1 1,1 3 9 1 ‑ 1 3 9 9 . Lan, 1 く. K . G .a n dDeMets, D .L .( 1 9 8 3 ) .D i s c r e t es e q u e n t i a lb o u n d a r i e sf o rc l i n i c a lt r i a l s . 7 0, 6 5 9 ‑ 6 6 3 . B i o m e t r i k a, C . K .a n dAnni t a g e, P . ( 1 9 71 ). R e p e a t e ds i g n i f i c a n c et e s t so na c c u m u l a t i n gd a t awhent h e McPherson, .RoyS t a t i st .S o c .,AI34, 1 5 ‑ 2 5 . n u I Ih y p o t h e s i si sn o tt r u e .j W . j .a n dYun, j .j .( 1 9 9 7 ) .O b t a i n i n gg r o u ps e q u e n t i a lt e s tb o u n d a r i e sw i t hS A S .The S t a g e r, s e r sGroupP re s e n t s,P r o c e e d i n g so fPharmaSUG97. P h a r m a c e u t i c a lI n d u s t r γ S A S@ U 浦狩保則・本田圭一(19 9 8 ) .中間解析における棄却限界値の算出用 SASプログラムの開発.第 4 7 回関西 SASユーザー会 ( 1 9 9 8ん 3 )配布資料. 松井茂之・宇野一・小山暢之(19 9 7 ) .中間解析における統計的アプローチ:最近の理論的展開.日 本計量生物学会・第 5回計量生物セミナー ( 1 9 9 7 . 1 0 . 3 ‑ 4 ) 1中間解析」講演予稿集. F I声 唱 b ハ ο η

140.

日本 S A Sユーザー会 (SUG I‑J) スペクトルデータの解析における PLS回帰とノンパラメトリック回帰 0三輪哲久市,高橋渉常事,二宮正士**, VuNguyen‑Cong料, 口祐男***,南山 日l 恵*常事 本農業環境技術研究所,判農業研究センタ一,***富山農業技術センター PLSRegressionandNonparametricRegressionf o rSpectrumData へ e i s h iNinomiya判, TetsuhisaMiwa WataruTakahashi**,S VuNguyen‑Cong**,SachioKawaguchi判事, MegumiMinamiyama判 * 本Na tI n s tAgro ・E nvironS c i,料 Natl . Agr. Res. Cent., 本 **ToyamaA g r i . Res. Cent. 要旨 スベクトルデータを用いた校正 ( c a l i b r a t i o n )の問題に対して, PLS 回帰による解析結果と,ノンパラメトリック回帰による解析結果とを 示す。 PLS回帰の実行には, PLSプロシージャ(評価版)を用いた。 また,ノンパラメトリック回帰の実行プログラムは SAS/IMLソフト ウェアを用いて作成した。さらに,データマイニング手法としてのノ ンパラメトリック回帰の利用について報告する。 キーワード: PLSプロシージャ, SAS/IML, リモートセンシング,データマイニング 1 はじめに 近接リモートセンシングの分野では,近年,波長を小刻みに変化させて測定したスベクトルデー タ(すなわち,ハイパースベクトルデータ)の利用が可能である。このとき,測定された各波長が l つの説明変数の役割を果たすので,扱うモデルは,説明変数の数が非常に多い重回帰モデ、ルとなる。 各波長の測定値は独立ではなく,これら多数の説明変数のあいだには強し、多重共線性が存在する。こ の多重共線性を扱う手段として, リッジ回帰,主成分回帰, PLS( P a r t i a lL e a s tS q u a r e s )回帰など が提案されている(たとえば, Brown( 1 9 9 3 )など)。計量化学 ( c h e m o m e t r i c s )の分野では, PLS回 帰がよく使われている。 現在 SASR 6.12では,評価版として PLSプロシージャが提供されている(小野, 1 9 9 7 )。このプ ロシージャを用いることによって,容易に PLS手法を実行することができる。本稿では, PLSプロ シージャを用いてハイパースベクトルデータを解析した結果を報告する。 上記にあげたリッジ回帰,主成分回帰, PLS回帰では,説明変数聞の相関関係は考慮するものの, 説明変数の順序関係は考慮、していない。しかしスベクトルデータでは,説明変数聞には順序関係が 存在する。この順序関係、を考慮した上で多重共線性の問題を解決する方法として,ノンパラメトリッ ク回帰による解析法を検討する。ノンパラメトリック回帰では,多くの行列計算を必要とする。本稿 では, SAS/IMLを用いたノンパラメトリック回帰の計算プログラムを示す。 ‑137‑

141.

さらに,データマイニング手法としてノンパラメトリック回帰を用いた例を報告する。意志決定支 援のために蓄積されたデータベースにおいて,その説明変数聞には,スベクトルデータのように順 序関係が存在する場合が多い。この順序関係を考慮、してモデルを構築することにより,データベース から意思決定に役立つ情報を引き出すことができる。 2 PLS回帰によるスペクトルデータの解析 2 . 1 データセット 1 9 9 3年から 1 9 9 6年に富山県農業技術センターで施 ‑ 40 W 肥水準を変えて栽培した水稲品種コシヒカリ,ハナエ ~ 30 R ‑ 3 6について,最高分げつ期から減 チゼ、ン, 日本晴, I 口 数分裂期(ハナエチゼンについては出穂期)に,分光 ぢ20 g / m 2 ),乾物重 ( g / m 2 )を測 反射係数(%),窒素吸収量 ( : ; j10 定した。分光反射係数は, 1 1 ‑ 1 8 0 0 (ライカ)を用いて 0 : 唱 ω ω 00‑1100nmを 5nm間隔で測定し,白板の値 波長範囲 4 で除して算出した。したがって,測定した波長の数は 600 800 1000 Wave length(nm) p=( 1 1 0 0‑4 0 0 ) / 5+1=1 4 1である。図 lに , 2つの観 図1.ふたつの異なる観測値に対する 測値に対するスベクトルデータを示す。本稿では,窒素 ハイパースベクトルの例 吸収量を目的変数,分光反射係数(スベクトルデータ) を説明変数とした解析を行なう。観測値の数は η =1 5 6 であった。重回帰モデルとして, y= x β+e ( 2 . 1 ) と書けば ,yと εは 1 5 6x1ベクトル, β は 1 4 1x1ベクトル ,xは 1 5 6x1 4 1行列である。以下 では,説明変数,目的変数とも,平均がゼロとなるように調整されているものとする。 2 . 2 PLS回帰 p T f PLS回帰,とくに SASと関連する部分に ついては,小野 ( 1 9 9 7 ),T o b i a s ( 1 9 9 5 )に説 明されている。ここでは,目的変数の数が l 一 一 一 一 一 、 Zll"'1Z rl X T r 一 一 一 一 一 一 一 一 一 ー 、 Cll"'1Cr n つの場合について簡単に述べる。ベクトル Zl は ,y との共分散が最大となるように決 める(そうなるように Cl を選ぶ)。次に Z2 Z は , Zl と直交するベクトルの中で νとの共 分散が最大となるように決める。以下,同様 C にして T 個のベクトルを選ぶ。これらを潜在因子 ( la t e n tf a c t o r )としづ。選ばれた T 個の zに対し て重回帰分析を行なう c AβAγ 一 一 一 一 xc A γ A β C X ︽ γ Z 一 一 A U 一 一 ( 2 . 2 ) ( 2 . 3 ) SASの PLSプロシージャでは,潜在因子の数 r (SASでは変数名 L Vが使われる)を決定するため のいくつかのオプションが用意されている(小野, 1 9 9 7 )。 一1 38‑

142.

2 . 3 全データへの PLS回帰の当てはめ 出力1.窒素吸収量(変数 na)を目的変数とする PLS回帰プログラム(全データ) %global xvars xvarsIML yvars num̲x num̲y; %let yvars=na; %let xvars=x1‑x141; %let xvarsIML='x1':'x141'; %let num̲y=l; %let num̲x=141; Proc PLS Data=nadata LV=10 CV=One Outmodel=namdl OutCV=nacv; Model &yvars = &xvars; Output Out=naout Predicted=yhat; Run; %get̲bplsCn四 dl,dsout=nabpls); 出力 lは ,n =156個の観測値すべてを用いて PLS回帰を実行するための SASプログラムであ る。潜在因子数 LVの決定には,観測値を 1つずつ除いて計算するクロスバリデーションを用いて いる (CV=Oneオプション)。結果を出力 2に示す。クロスバリデーションの結果,予測残差平方和 (PRESS)は , LV=5で、最小となった。 出力 2 . 全データを用いた PLS回帰の結果 The PLS Procedure Cross Validation for the Number of Latent Variables Number of Latent Variables 。 Root Mean PRESS 一一ー一一一一一一一一一一ーーーーーーーーー 1 2 3 4 5 6 7 8 9 10 1.0065 0.5767 0.5244 0.4129 0.3903 0.3800 0.3808 0.3854 0.3940 0.4002 0.4029 Minimum Root Mean PRESS = 0.380028 for 5 latent variables The PLS Procedure Percent Variation Accounted For a 寸 ム L U +し s e 寸ム ao iT r a + L M 67.8333 5.8614 10.3805 2.1325 1 .1810 v v er nr 75.0769 96.5256 98.6819 99.1138 99.3487 nt en de 4qu4 F b ーム円 75.0769 21.4487 2.1563 0. 4319 0.2349 epu n u Model Effects Current Total pu Number of Latent Variables 67.8333 73.6947 84.0751 86.2076 87.3886 図 2に.元の変数,すなわち各波長の分光反射率に対する回帰係数を示す。この回帰係数の計算 n s t i t u t eI n c .の wwwサイトで提供されている には, SASI 1 3 9一 ExamplesUsingthePLSP r o c e c l u r e "

143.

のマクロプログラム %get̲bplsを修正して用いた。図 3は,観測値と上記の回帰係数を用いて計算 した推定値との散布図である。 コ 」 . . ‑・. 10 0.1 . ・・.‑ ・ o・ i J みf f │ . 4 3 F ‑ キj c ω o B l ー 叶 ‑叶 4 ‑ 1 4 ‑ 1 ‑0.05 ω 8 ‑0.1 400 600 800 1000 . ・ ‑ 0 2 4 Wave 1ength(nm) 0 o 図 2.PLS回帰の回帰係数(全データ) 6 8 ユo 12 Observed(g/m^2) 図 3 観測値と推定値との散布図(全データ) 2. 4 確認データセットに対する予測 回帰係数の計算に用いたデータセットに対する当てはまりがよくても,それは,回帰モデルの良さ を示すことにはならない。実際,潜在因子の数を増やせば,いくらでも当てはまりは良くなる。 本節では,全データの 1/3を確認データセット (η=156/3=5 2 )として取り除き,残りの 2/3を 校正データセット (η=1 0 4 )とする。校正データセットのみを用いて回帰係数を計算し,次に,確認 データセットに対して予測を行なう。ここで, PLS回帰の計算において,説明変数の数 p=141 の 方が,観測値の数 η =1 0 4より大きくなっていることに注意しておく。 実際にスベクトルデータを用いて計測を行なう場面では,校正用データは広い範囲をカバーする ように測定されるのが普通である。そこで本節の解析では,窒素吸収量の大きさの順に全データを 並べ, 3番めごとの観測値を確認データセットとした(出力 7 )。 出力 3 . 2/3の校正データを用いた PLS回帰プログラム Proc Sort Data=nadata Out=nackdata; By na; Data nackdata; Set nackdata; If ModC̲N̲,3)=0 Then y = . ; Else y = na; %let yvars=y; Proc PLS Data=nackdata LV=10 CV=One Outmodel=nackmdl OutCV=nackcv; Model &yvars = &xvars; Output Out=nackout Predicted=yhat; Run; クロスバリデーションの結果, LV=7で予測残差平方和 (PRESS)が最小となった(出力 4 )。しか )。この回帰係数を用いて確認データセットの し,このときの回帰係数は大きく変動している(図 4 窒素吸収量を予測した結果,予測値と観測値との相関係数は r= 0 . 9 2 6であった(図 5 )。 ‑140一

144.

出力 4 . 2/3の校正データを用いた PLS回帰プログラム The PLS Procedure Cross Validation for the Number of Latent Variables Number of Latent Variables Root Mean PRESS 内 円 4ム 4ム 円unununununununununu ・ 71878525843 91639515765 円 UQd J 4QdQdnuQdnvnutム OFb543343444 ・ 円 u tム 門4 q u 4 Runb7 RUG‑v 円U Minirnum Root Mean PRESS = 0.395454 for 7 latent variables The PLS Procedure Percent Variation Accounted For む ‑‑巾ム 円 s e1ム ー ムa bt ao HV 司 + L M nu Model Effects Current Total nt en de nr er p&u e U Number of Latent Variables ー一一一一一一ー一一一一一一ー一一一一一一ーーー一一一一一ー一一一一一一一ーーー一一一ー一一一一一一一一一一一一一ー 73.6661 22.8856 2.1692 0.4140 0.2152 0.1628 0.1362 1 2 3 4 5 6 7 73.6661 96.5517 98.7209 99.1349 99.3501 99.5129 99.6491 66.8434 6.1867 10.7467 2.4805 1.2051 1.0709 0.7591 66.8434 73.0302 83.7769 86.2573 87.4624 88.5333 89.2925 ユ2 , . Q 0.2 . ‑ 10 P寸 ふJ 〈 己 ω ミ B ー 叶 o' U . r l 斗4 斗4 ~ ふJ 6 U ~ ‑0.1 召 4 u 0 H 400 600 800 1000 瓜4 Wave length(nm) 2 "" 且・. ・ . . ‑ ‑ . . . . . . . . ‑ •・ ・ . . ・ 工 . , a ・"" "̲ " " " ~. ̲ ̲ =0.926 0 o 図4 .PLS回帰の回帰係数 ( L V = 7 ) 2 4 6 8 10 12 g / r n ^ 2 ) Obse工ved( 図5 .観測値と予測値との散布図 ( L V = 7 ) ‑141‑

145.

図 4 を見ると,潜在因子を多く取り込みすぎているようである。逆に, PLSプロシージャの CVTest(Stat=PRESS)オプションを指定して実行すると LV=3が選択された。この場合は潜在因 子の数が少な過ぎる。 潜在因子の数を LV=5として計算した回帰係数,および散布図を図 6と図 7に示す。こちらの方が, 回帰係数の変動が少なく,また予測値と観測値との相関係数も LV=7の場合よりも高くなっている。 これらの結果より, PLS回帰を実施するときは,クロスバリデーションの方法をいくつか実行し てみて, PRESSや回帰係数の安定性から総合的に判断して潜在因子の数を決定することが有効であ ると思われる。 SASの PLSプロシージャには,今回用いたもの以外に,し、くつかのクロスバリデー ションのためのオプションが用意されている。 ユ2 1ム U 円 . . . . N 〈 芝 8 ↓J 600 800 H 1000 白 2 Wave length(nm) ‑ U 一 ω ・ U 苦 4 •• • 同‑ RJ44Aせ ・円 ∞ ﹂・ U 円 ‑ g6 ̲ .. ・ . . ̲ 9 . ・ . ・ . . . . ・ h e ‑ ‑ ︐ ︐ u、 円 U ωυ h h H ω o u 叶 叶H 心以己 ̲1 0 r=0.934 0 o 2 4 6 8 10 12 図6 .PLS回帰の回帰係数 (LV=5) Observed{g/m^2) 図7 .観測値と予測値との散布図 (LV=5) 3 ノンパラメトリック回帰によるスペクトルデータの解析 3 . 1 ノンパラメトリック回帰 スベクトノレデータを用いた計測において,各波長の分光特性値,すなわち説明変数は Xlぅ X2γ ・ ぺ Xp の順に並んでいる。 PLS回帰(および, リッジ回帰,主成分回帰)は,説明変数聞の相関関係、(多重共線性)は考慮 するけれども,この順序関係は考慮、していない。したがって,説明変数の順序を並べ替えても同じ結 果が得られる。このことが,推定された回帰係数が波長の軸に対して必ずし滑らかにならない理由 のひとつである。実際,性質の異なる変数を説明変数とすることも可能である。 ノンパラメトリック回帰手法は,時系列や空間系列データの平滑化に使用され,時間軸や空間軸に 対して滑らかな変動を表現する(たとえば Greenら ( 1 9 9 4 )参照)。この手法をスベクトルデータの 凡門 + ︑八 A d ド ZM + 凡門 z pZH u d l 一η n Z M 解析に応用する。ここで,変数 Xj の 効 果 内 と Xj+l の効果 sj+l に大きな変動が無いと仮定して ( 3 . 1) を最小にするような回帰係数 β を求める。 ( 3 . 1 )式の第 2項は,回帰係数内を連続的に変化させる ための制約条件である。平滑化パラメータ入は連続性の程度を制御している。 ‑142一

146.

入を固定すれば, ( 3 . 1 )式を最小にする 9は , ( 3 . 2 ) n u 'ム‑ n u ' 一 ム Ti ¥11III1111111/ 1ム ム 一ヮ 一 /1111111111lt¥︑ ' t 1一 ︒ 一 一 D ︒ 一 't 2 1 3= (XTX+η 入D)‑lXTY ( 3 . 3 ) によって与えられる。 平滑化パラメータ入は,クロスバリデーションにより求める。すなわち, CV=jZMOO))2 ( 3. 4 ) を最小 i こする入を用いる。ここで。 ( i ) は,第 i番めのデータを除いて回帰係数を計算し,その回帰 係数を用いて第 t 番め観測値を予測したものである。 ノンパラメトリック回帰は,多くの行列計算を必要とする。しかし, SAS/IMLソフトウェアを利 用することによって,これらの計算は容易に実行できる。出力 5に,上記のノンパラメトリック回帰 を実行するための SASマクロプログラムを示す。 . ノンパラメトリック回帰計算のための SASマクロプログラム 出力 5 %Macro npreg(indata=indata,outdata=outdata,lambdadt=lambdadt,bnpr=bnpr); %* indata: Input data set; %* outdata: Output data set (containing yhat); %* lambdadt: Data set wユth variable 'lambda'; %* bnpr: Coefficients; Data calibdt; Set &indata; if &yvars ‑= .Then Output; Run; Proc IML; I 叫** Start IML 村 * * 1 Use calibdt; Read All Var (&xvarsIML) Into Xclb; Read All Var {&yvars} Into yclb; Use &lambdadt; Read All Var {'lambda'} Into lambda; n = Nrow(Xclb); np = Ncol(Xclb); nlmbd = Nrow(l日 bda); ] ; Xmean = Xclb[ :, yme回 =yclb[:]; ) * Xmean; X = Xclb ‑ J(n,1,1 y = yclb ‑ J(n,1,1 ) * ymean; Cwk = J(np‑1,np,0); Do 工=1 To np‑1; ] = ‑1; Cwk[ i,i ; Cwk[i,i+1] = 1 End; C = Cwk' * Cwk; Start cvcalc(lambda) Global(n,X,y,C); ‑143

147.
[beta]
A = X 寧 Inv(X'寧 X + (n‑1) 寧 1a
r
n
bda 寧 C
)寧 X
';
;
y̲tilde = Inv(Diag(I(n)‑A)) 寧(I(n)‑A) * y
cv = Sum(y̲tilde # y̲tilde) In
;
Return(cv);
Finish cvcalc;
cv = J(nlmbd,1);
Do i=1 To nlmbd;
] = cvcalc(larnbda[i]);
cv[工
End;
index = cv[>:<];
optlmbd = 1a
r
n
bda[index];
Print optlmbd l
a
r
n
b
d
a cv;
寧

+
L
M

a

.
︐
寧

e

pve
︐
.
b

1ム

的寧叩

・
dvd

*‑

MArh
o

*

nDm
︑
f
he

寧=

VAT4

+mm

VAnu

s=

aa
e
e
D D

ヲ白︑

=+LM+lu

Use &
工 ndata;
Read All Var (&xvarsIML) Into Xall;
n = Nrow(Xall);
yhat = Xall * beta + J(n,11
) * betaO;
Create yhatdt From yhat[colnarne={'yhat'日;
Append From yhat;
Create cvdt From cv[colnarne={'cv'}];
Append From cv;
Create &bnpr Frombeta[colnarne={'b1'}];
Append From beta;
Quit; 1
**** Quit IML 字 率 字 率 /
Data &outdata;
Merge &indata yhatdt;
Data &larnbdadt;
Merge &larnbdadt cvdt;
Run;
%Mend npreg;

3
.
2 全データへのノンパラメトリック回帰の当てはめ
第2
.
3節と同じ窒素吸収量の全データに,ノンパラメトリック回帰手法を適用する。連続量入に

関して,今のところ,与えた入の値の中で CVの最ノト値を見つけることになっている(出力 6
)。

. 窒素吸収量に対するノンパラメトリック回帰の実行(全データ)
出力 6
Data larnbdadt;
Input power 也也;
larnbda = 10*寧 power;
Cards;
0.001 0.1 0.5 0.8 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.8 2.0 2.5 3

Run;
%let yvars=na; %let xvarsIML='x1':'x141';
%npreg(indata=nadata,outdata=naout,larnbdadt=larnbdadt,bnpr=nabnpr);

1
4
4

148.

︒ ハ U ・‑‑ n u ハU ﹀U JQJQυ J 勺 ro nononono n u ( 3.4)式のクロスバリデーションの変化を図 8に示 01 .5の近くで c vは最小になる。 す。入=1 計算された回帰係数は,図 9に与えられている c 当然ながら 計算の原理から回帰係数は波長軸に対 ハ U しでかなり滑らかに変動する。 観測値と推定値との散布図(図 1 0 )は , PLS回 o 0.5 1 1.5 2 2.5 3 帰の場合と同程度の当てはまりである(相関係数は T=0 .936。 ) 1og(lambda) 図8 . クロスバリデーション 4 4 U 円 ハU 勺ムつ白 . ・ . 日 8 1 〈 E 、¥ ~ U 円 円 U T コ 6 ω ~ 4 . r l U 4円 一円U ・ 4・ r b 4 円 U U 円 U 円 一一一 U 円 υ 叶しHUHUoυ 。 U U 円 円 心以己 U叶 . . . . 畠 . .・ . . 1 0 f I i ‑ < 600 800 1000 2 ・ ' : " . ピ 。 。2 4 6 8 10 12 Wave 1ength(nm) 図9 . ノンパラメトリック回帰の回帰係数 Observed(g/m^2) (全データ) 図1 0 .観測値と推定値との散布図(全データ) 3 . 3 確認データセットに対する予測 予劇モデルとしての良さを評価するため, PLS回帰の場合(第 2.4節)と同じ校正データセットか . 1節で与えた SASマクロプログラム ら回帰係数を計算し,確認、データセットで予測を行なう。第 3 %npregは,欠測値が存在する場合にも使用できる(出力 7 )。 . 2/3の校正データを用いたノンパラメトリック回帰 出力 7 %1et yvars=y; %let xvarsIML='xl':'x141'; %npregCindata=nackdata,outdata=nackout,1arnbdadt=1arnbdadt,bnpr=nackbnpr); 図1 1は 2/3の校正データセットから推定された回帰係数である。図 9の全てのデータを用いた場 合とほとんど同じ形である。この回帰係数を用いて確認データセットへの予測を行なったときの散布 図を図 1 2に示す。観測値と予測値との相関係数は T =0.935であった。 . 9 3 4 ) と,ノンパ 確認データセットに対する予測に関して, LV=5を用いた PLS回帰(図 7,T =0 2,T ラメトリック回帰(図 1 二 0 . 9 3 5 ) とは,ほとんど同じ高い予測精度を示した。 ただし PLS回帰では,平滑化パラメータの役割を果たす潜在因子数 LVが離散的な整数値をとる。 このため,潜在因子を 1つ増やすか減らすかで,回帰係数の形がかなり変化する。 これに対しノンパラメトリック回帰では,平滑化パラメータ入は連続量であり,入の最適値のま わりで回帰係数の形は安定している。 145‑

149.

・‑ . 阿‑ ••• ・ H e ‑ ‑ . 0 U U U 門 門 円 寸 ム QU u 円 nU U 門 U U 門 門 ハU rb U U 地内ノ︼ 円 U 円 ︑. ‑‑ ・ .. . . ・ . ・ . ・.~・・ 1 ・ ‑ 円 rbn 円 U unU 一一一 円 ω﹄り叶刀ωH 向 (N︿巨¥び)刀 ︒ ︒ U 円 64202464 円 ハu n u n U ハU U H U H ω o u 叫にω 叶O 叶 U A 10 ・ . Wave length(nm) r=0.935 0 o 図1 1.ノンパラメトリック回帰の回帰係数 2 ( 2 / 3の校正データを使用) 4 6 8 10 12 Observed(g/m 2) 八 図1 2 .観測値と予測値との散布図 4 データマイニング手法としてのノンパラメトリック回帰 4 . 1 大豆栽培試験データベース データマイニングのための統計手法としては,ニューラルネットワークや決定木などの手法がよ く使われている。しかし,蓄積されたデータベースにおいて説明変数の役割を果たすものの中には, 前節のスベクトルデータのように,変数聞に自然な順序が存在する場合も多い。本節では,そのよう なデータベースに対し,ノンパラメトリック回帰の利用を検討する。 表1.関東東海地域大豆栽培試験データベースの一部 番号 199 198 216 219 117 118 1 1 1 116 1 2 1 114 39 40 44 45 1 17 試験地 長野県南信農試 長野県南信農試 長野県南信農試 長野県南信農試 栃木農試黒磯分場 栃木農試黒磯分場 栃木農試黒磯分場 栃木農試黒磯分場 栃木農試黒磯分場 栃木農試黒磯分場 農環研 農環研 農環研 農環研 農研センター 農研センター 年度 S56 S56 S56 S60 S56 S56 S56 S56 S59 S59 S58 S58 S58 S58 S59 S59 品種 エンレイ エンレイ ナカセンナリ ナカセンナリ エンレイ エンレイ タチスズナリ フクユタカ エンレイ タチスズナリ エンレイ エンレイ エンレイ エンレイ エンレイ キタホ 7 レ 播種月.日 6 . 0 8 6 . 0 9 6 . 0 8 6 . 1 0 6 . 1 9 7 . 0 1 7 . 0 1 7 . 0 6 7 . 0 2 7 . 0 2 5 . 2 6 6 . 0 6 7 . 1 8 7 . 2 7 5 . 1 0 5 . 0 4 収穫月日 9 . 2 7 9 . 2 9 1 0 . 1 9 1 0 . 2 5 1 0 . 1 0 1 0 . 2 4 1 0 . 1 7 11 .1 4 1 0 . 1 4 1 0 . 1 0 9 . 3 0 1 0 . 0 6 1 0 . 1 3 1 0 . 1 6 9 . 2 6 8 . 2 9 kgj10a) 収量 ( 389 362 407 302 269 345 267 428 363 352 385 347 192 103 432 129 表 Iは,関東東海地域の農業試験場で実施された大豆栽培試験に関するデータベースの一部であ る。大豆の生育には気象条件が大きく作用する。したがって,気象条件の影響ノミターンを把握するこ とは大豆の生産管理にとって重要なことである。このデータベースでは,試験年度・播種目・収穫日 が記録されているので,別途 AMeDSAデータベースより,生育期間中の気象要素(最高・最ノト・平 均気温,降雨量, 日照時間)を説明変数として利用することができる。 1 4 6一

150.

本稿では品種エンレイの収量について解析する。品種エンレイのレコード数は η =99で、あった。 最も早い播種日は 5月 1 1 日,最も遅い収穫日は 1 1月 1日で.その期間の幅は p = 175 日である。 4.2 ノ ン パ ラ メ ト リ ッ ク 回 帰 モ デ ル に よ る 日 別 気 温 効 果 の 解 析 第 z番めの収量約に対して, 日別平均気温 t りを説明変数とする重回帰モデル Y iニ 乞 tijsj + ei ( i=1, 2、 η ) ( 4 . 1 ) j=l を考える。 t i jは 5月 1 0日から数えて第 j 日めの気温を表わし,回帰係数 s jは第 J 日めの気温の 効果を表わす。ここで η =99<175= p であり,観測値の数より説明変数の数の方が多い c 第 j 日めの気温の効果 s jと第 j+1 日めの気温の効果烏 +1 とは大きく違わないことが予想され 同 A︐ + 凡門 戸 乞 何 ︑八 + 烏 u d nZ P Z M る。そこで, ( 3 . 1 )式と同様に, ( 4 . 2 ) を最小化することによって,回帰係数 i ろを推定する。平滑化パラメータ入についても同様に,クロ スバリデーション ニ 宅 cv ( 4 . 3 ) ( Y i‑Y ( i ) ) 2 を最小化することによって求める。 第3 . 1節で与えた S ASマクロプログラム %npregが使用可能である。 huhU ム ・ ・ '8 1d ・ r P1 ム tee4 alw dy ・ '07 ・ 自P 15 自 * 4 e7'* 円 Fb r4ム r U nx ・ 'e1 e‑tW4 a31do= ︐ . txa︑ PAFb ae d a ・ dltbtd4 VJlumu ︑b O 手 ム PaPAm4 ︐.︐ s n n 1 na. I I I ‑ 5︑3 n aa du ttr2R aaa 出力 8 . 大豆栽培試験データに対するノンパラメトリック回帰の実行 QU 7' EU F b 企 EU F h U 4 1u 円 L F h u 4t‑ EU EU 企 F h u n ヨ 4 企 企 企 ム . ︐ 円 U4 %let yvars=yield; %let xvarsIML='xl':'x175'; %let num̲y=l; %let num̲x=175; %npregCindata=soydata,outdata=soyout,1日 bdadt=l日 bdadt,bnpr=soybnpr); 図1 3に,回帰係数烏の変化の様子を示す。この図から,気温の効果は生育期間を通じて一定で はなく, 7月上旬から中旬にかけてピークをもつことがわかる。したがって,この時期の気温が重要 であり,この時期に低温に遭遇すると減収することが予想される。 従来は,旬局1平均気温などを用いて,説明変数の数が増えることを防いでいた。ニューラルネット ワークなどでもそうである。しかし,ノンパラメトリック回帰を順序を持つ説明変数聞に適用するこ とによって,図 1 3のように全ての説明変数を生かすことが可能となる。 図1 4に観測値と推定値との散布図を示す。当てはめの精度はあまり高くない。今回の解析では. ノンパラメトリック回帰手法の利用の可能性を検討するために最も簡単な場合を扱った。次のような 点を考慮することによって,モデ、ルの精度はさらに高まると思われる。 ‑147

151.

‑今回は, 日別平均気温のみを説明変数として収量を推定した。その他の栽培条件,たとえば 施肥量や栽植密度などを説明変数として取り込むこともできる。この場合,説明変数の一部 にノンパラメトリック回帰を適用することは容易である。 o ・ここでは摂氏気温をそのまま説明変数として用いた。しかし,温度効果は,ある闇値温度 T 以上から現れる可能性がある。 ・時間軸としては,暦日を用いている。播種目が異なる場合,生育ステージを横軸にとって温 度の効果を調べる方が現実的である。 ﹃ ••• EJ 200 ど ユ00 、 •• • ' .. Day sice 11/May 図1 3 .回帰係数(温度効果) .h 内 乙 ハU ーム ーム コ 11.1 ハ U ハHu ・ U qdnUF 9.8 q d (N︿巨¥び )ガω μμ 叶 ﹄ コ ーム F U 円 n U ーム・ハ ・円 U 7.10 • .t .・. 350 ・J.e ・ av‑‑‑‑ n u ム ノ 門 しH しω ou A 以口 U 叶U 叶H . .. . ︐ . ・ ・ ︐ p ‑ e E . ・ . ・ ・ ・ ・ ・ .‑Ll. e ︑ . a‑‑ . ・ ︐ .︐ 400 200 =0.631 300 400 Observed(g/m^2) 図1 4 .観測値と推定値との散布図 5 おわりに 本報告では,スベクトルデータの解析に, PLS回帰を用いる方法とノンパラメトリック回帰を用 いる方法とを検討した。水稲中の窒素吸収量の予測において,いずれの方法も高い予測精度を示し, ノ、ィパースベクトルの利用が有効であることが示された。 これらの手法は SASを用いて容易に実行できる。 PLS回帰の実行には, PLSプロシージャ(評価 版)を用いればよい。ノンパラメトリック回帰の実行では行列計算が主体となるので, SASjIMLソ フトウェアを利用する。ノンパラメトリック回帰を実行するための SASマクロプログラムを与えた。 また,蓄積されたデータベースに順序関係をもっ説明変数が存在する場合に,ノンパラメトリック 回帰がデータマイニングの一つの手法として利用できることを示した。 参考文献 Brown, P .J .( 1 9 9 3 ) . Measurement, R e g r e s s i o n,andC a l i b r a t i o凡 O x f o r d :ClarendonP r e s s . Green, P .J .andS i l v e r m a n, B .W. ( 1 9 9 4 ) . No叩 αr a m e t i r i cR e g r e s s i o n and G e n e r a l i z e dL i n e a r London:Chapman& H a l l Models, 小野裕亮 ( 1 9 9 7 ) .PLSプロシジャ(評価版)の紹介, SUGI‑J'97論文集, 3 8 5 ‑ 3 9 8 . SASI n s t i t u t eI n c . . Examples U s i n gt h ePLSP r o c e d u r e, h t t p : / / w w w . s a s . c o m / r n d / a p p / s t a t / p a p e r s / p l s e x . p df . T o b i a s,R .( 1 9 9 5 ) . Ani n t r o d u c t i o nt op a r t i a ll e a s ts q u a r e sr e g r e s s i o n,P r o c e e d i n g so ft h e2 0 t h CaryNC:SASI n s t i t u t eI n c ., 1 2 5 0 ‑ 1 2 5 7 . AnnualSUGIC o n f e r e n c e, 一1 4 8

152.

日本 S A Sユーザー会 (SUG I‑J) 統計関連 T i p sandT e c h n i q u e s 小野裕亮・岸本淳司 統計解析研究室 SASイ ン ス テ ィ チ ュ ー ト ジ ャ パ ン T i p sandT e c h n i q u e sonS t a t i s t i c a lI s s u e s andJ u n j iKishimoto YusukeOno, S t a t i s t i c a lR e s e a r c hL a b ., SASI n s t i t u t eJapan 要旨 GASを利用して統計解析を実行する際に役に立っちょっとした知識をいくつか紹介する。 第 1章:数量化 1類の実行方法 第 2章:数量化 3類の実行方法 第 3章:タイ(同順位)判定の問題 キーワード: S t a t i s t i c s,T i p s 1 数量化 1類の実行方法 数量化 l類の計算方法自体は、通常の回帰分析と同様である。したがって、回帰モデルのため のプロシジャを利用することにより数量化 l類を実行させることが可能である。 SASの次のプロ シジャでは数量化 1類が実行できる。 1 .TRANSREGプロシジャ 2 .GLMプロシジャ 1 .1 TRANSREGプ ロ シ ジ ャ に よ る 実 行 ALS法によって求める方法 TRANSREGプロシジ、ヤは、 ALS法 (AlternatingLeastSquares;交互最小 2乗法)によって最 p t i m a ls c αl i n gを伴う回帰分析を実行するためのプロシジャである。次のような指定に 適尺度化 o より、 ALSアノレゴリズムに基づく数量化 l類が実行される。 1 4 9

153.

proc transreg data=data1 tstandard=center additive utility; model identity(y) = opscore(a b c); output out=out1 replace; run; 上記のプログラムにおいて、 "datal"はデータセット名、 "y"は基準変数(応答変数)、 "abc" は アイテム変数(因子の変数)である。 TRANSREGプロシジャの特徴は、 MODELステートメントにおいて、変数をどのように変換 するかを指定することができることである。 identityは変換を行わないための指定、 opscoreは各 カテゴリーに対してスコアを与えるための指定である。 TSTANDARD=CENTERは、データを中心化するためのオプションである。 UTILITYオプションによって、分散分析表および次のようなパラメータ推定値表が出力される。 Utilities Table Based on the Usual Degrees of Freedom Label Intercept B B1 B2 B3 B4 C C1 C2 C3 C4 0.0000000 0.0000 1.0000000 0.9697031 Importance ( ' l , Utility Range) Variable INTERCEPT 13.967 OPSCORE(A) 1.0000000 1 .7155171 ‑2.6966861 0.7477289 ー0 .3123972 29.040 OPSCORE(B) 1.0000000 5.4986042 3.1605677 ー0 .5789318 56.993 OPSCORE(C) A A1 A2 A3 Utility Standard Error ー 1.1523579 0.1534085 1.6615732 SASマニュアノレのなかで、は、このような分析は「コンジョイント分析 c o n j o i n ta n a l y s i s J とし て紹介されている。出力されている用語 ("Utilityつもコンジョイント分析のなかのものが使われ ている。 "Utility"(効用)の欄には、数量化 1類でいうところの「カテゴリースコア」が出力される。上 記プログラムでは、各アイテム内において度数で重み付けた和が 0になるようにパラメータは基 準化されている。また、数量化でいうところの「アイテムレンジ」は、 "Importance"の欄に出力 されている。ただし、アイテムレンジそのものの値ではなく、全体に占める%で表される。 戸 U hU 円 1ム

154.

偏相聞やアイテムレンジそのものの値が欲しい場合には、 OUTPUTステートメントによって出 力されたデータセットを利用すれば良い。 なお、 TRANSREGプロシジャでは、ダブルバイトの文字は使用できなし、(使用すると文字化け する)ので、データの値、フォーマットの値は英数字にしておいた方が良い。 その他のオプション 前述したプログラムでは、欠損値が存在する場合デフォルトではその欠損値も 1カテゴリーと して扱う。 NOMISSオプションを指定すると、欠損値の存在するオブザベーションはすべて除去 して解析を行う。 通常の数量化 1類を実行する上では、反復計算を行う必要はない。 DUMMYオプションを指定 すると、内部的にダミー行列(指標行列)を作成した後にモデ ルをあてはめるので反復しないで結 果が得られる。 1 .2 GL 恥fプ ロ シ ジ ャ に よ る 実 行 データセット中のオブザベーション数が多くなると、 GLMプロ、ンジャに比べて、 TRANSREGプ ロシジャはメモリを多く消費し、処理時聞が時聞がかかってしまう。これは、 GLMプロシジャが正 規方程式を解くのに必要な積和行列しかもたないのに対して、 TRANSREGプロシジャはすべての AS/STATU s俳句 データをも保持するからである(大まかな目安は、 GLMプロ、ンジャについては S G u i d eV e r s i o n 64 t hE d i t i o np p . 9 6 0 ‑ 9 6 1、TRANSREGプロシジャは同マニュアノレ p p . 1 5 5 6 ‑ 1 5 5 7 を参照のこと ) 0 TRANSREGプロ、ンジャは、 ALS法を実行するためのプロシジャなので、通常の 回帰モデルを推定するのには必要のない、データそのものもメモリもしくはユーティリティフア イノレでもってしまう。 下記に実行例を示す。 x p x +LM 0 n ム ︑ . u 円4 0 5 企 M 5 5 ‑ +LMF ム 4 ︐ f a =.︐ aca a d‑b d + h u a ・b= ︑ ﹃﹄a‑ ave ﹃﹄a ‑ C M m a d C1‑0 σDSe 0cm r 企 ロ lsmean a b c / out=QUT; run; 上記プログラムの SOLUTIONオプションによって出力されるカテゴリースコア(回帰パラメー タ推定値)は、次の通りである。 TRANSREGプロ、ンジャと異なり、正規方程式において一般化逆 行列を用いた時の解が出力される。他の制約に基づいたカテゴリースコアは、 GLMプ口、ンジャ自 体では出力することができない。 カテゴリースコアの値が TRANSREGプロ、ンジャと異なるのは、異なった基準化(制市守)のもと で解を求めているからである。アイテムレンジの大きさ自体は、前述の TRANSREGプロシジャの 結果と同じである。例えば、アイテム Aのレンジは TRANSREGプロシジャ1.15一( ‑ 0 . 9 7 )=2 . 1 2、 GLMプロシジャでも1.3 0‑( ‑ 0 . 8 2 )=2 . 1 2と等しい。 1 5 1 ←

155.

Parameter INTERCEPT A B C Estimate T for HO: Parameter=O Pr > I T I Std Error of Estimate 0.29 0.18 2.85605380 4.48331828 0.38 0.7713 0.8564 0.7056 0.48 0.60 0.34 0.6304 0.5520 0.7338 4.18263899 3.97549723 3.09574624 0.70 ‑1.16 ‑0.75 0. 4896 0.2508 0.4570 5.50373984 4.13935016 2.98345364 0.835765959 3 A1 ‑0.816290098 3 A2 1.305767827 3 A3 0.000000000 3 31 2.027915754 3 32 ‑2.384286854 3 .060127872 3 33 1 34 0.000000000 3 C1 3.837031093 3 C2 ‑4.822142408 3 C3 ‑2.240505120 3 C4 0.000000000 3 ー ー 3.43211561 NDTE: The X'X matrix has been found to be singular and a generalized inverse was used to solve the normal equations. Estimates followed by the letter ' 3 ' are biased,and are not unique estimators of the parameters. MODELステートメントの XPXオプションは、正規方程式の積和行列を出力するためのオプ ションである。数量化 1類の場合、この行列は、パート表と基準変数の周辺和を組み合わせたも のになる。 LSMEANの OUT=オプションによって最小 2乗平均をデータセットに出力することができる。 TRANSREGプロシジャと同様の制約に基づくカテゴリースコアを求めたい時には、このデータ セットを利用するとよい。 なお、 GLMプロシジャでは欠損値が 1つでもあるオブザベーションはすべて分析から除外され る。欠損値に対しでも数量を与えたい場合には、事前のコーデイングが必要となる。 2 数量化 3類の実行方法 数量化 3類を行う場合(特に、カテゴリー数が 2の場合)、解析対象のデータを、不完備指標行 チIJ i mcomplei n d i c a t o rm a t r i xにするのか、完備指標行列 c o m p l e t ei n d i c a t o rm a t r i xにするのかに よってプログラミングが異なる。 なお、スコアを求める際にどのような基準化を行うかによって、カテゴリースコアは異なって くる。ここでは、各標本に対するスコア(行座標)も、各カテゴリーに対するスコア(列座標)もと もに、重み付けた平均 O分散 1になるように基準化した時の解を出力する例を示す。 2 . 1 不完備型の指標行列に基づいて分析を行う場合 不完備指標行列を分析対象とする場合には、次のように数値で値をもっていないければいけな い。また、 CORRESPプロ、ンジャの I D変数は文字型でなければならない。 4 唱EA 円 Fhu

156.

RU 円WA 4ム q A +U+b 44 ︐ . a au d p a ‑ ‑n +U a d id=put(̲n̲, z3.); cards; 10 101 00011 10 0 0 1 o1 1 1 0 1 10 0 0 10 1 10 不完備指標行列に対しては、 IDステートメントと VARステートメントを組み合わせて指定する。 +U 4ム u o =b C d; t=d 司 =dt une o mv ur u 4ムーよ o aos +UFMLU ao 品 da 司 p s 品 a=r two aoh drs pu pu e r r o p o r id i d ; var q1‑q5; run; OUTC=オプションは標本および各変数に対するスコア(列座標および行座標)を出力するため のオプションである。グラフを作成する時には、このデータセットを利用する。 ROW=, COLUMN=オプションは、行座標および列座標の標準化方法を決めるためのオプショ ンである。 ROW=DA , COLUMN=DBと指定すると、それぞれ周辺度数で重付けた平均が 0、分 散が lに基準化される。 SHORTオプションを指定すると、出力の一部を省略して特異値およびスコアだけが出力される。 OBSERVEDオプションは、分析対象となっている行列(度数表)を出力する。 CORRESPプロシジャの結果を示す。デフォノレトでは 2次元 (DIM=2)だけ出力される。 Contingency Table Q1 001 002 003 004 。 。 005 006 1 1 4 Sum 1 1 。 。 。 Q3 1 1 1 。 。 。 1 2 3 Q2 。 1 。 。 。 Q4 Q5 Sum 1 1 1 1 3 2 2 1 1 3 。 。 。 3 3 2 3 15 414 ﹃U にU

157.

Inertia and Chi‑Square Decomposition Singular Principal Chi‑ Values Inertias Squares Percents 9 18 27 36 45 一一一一+ーーーー+ーーーー+ーー +‑‑‑‑+ ー 0.66084 0.43671 6.55071 43.67% ************ホホ********** 0.56876 0.32348 4.85227 32.35% *****ホ*ホ*ホ***ホ*ホ*ホ 0. 42268 0.17866 2.67986 17.87% *ホ**ホ*ホ*** 0.24727 0.06114 1.00000 0.91716 6.11% *** 15 (Degrees of Freedom = 20) Dim2 0.37754 1.29255 ‑1.08700 0.78584 ‑1.72147 0.60231 Column Coordinates Dim1 Q1 ‑0.22721 1.90023 0.35876 0.21062 Dim2 ‑1.13568 ‑0.82252 0.59230 1 .57109 円 4qU4 ︑ nuwnuw n u u Row Coordinates Dim1 ー0 .70703 001 ‑1.00072 002 ‑1.33198 003 004 1.24568 1.26582 005 006 0.17259 出力される用語は、対応分析のものである。 SingularValues"は、スコアを与えた時の相聞と 一致し、それを 2乗した値 Principallnertias"は固有値にあたる。 OUTC=オプションのデータセットには、変数 DIMl .D IM2に列座標および行座標が出力され ている。列および行の周辺度数は出力されていないが、変数 MASS"に相対周辺度数が出力され 5をかけることにより、周辺度数をもとめている。 ている。下記のプログラムでは、合計 1 data out2; set out1; 1.0); freq=round(mass*15, run; 次のプログラムは、周辺度数を求めたデータセット OUT2に対して、基準化がどのように行わ れたかをチェックするだけのものである。 MEANSプロシジャを用いて、スコアの平均および分散 を求めている。 proc means data=out2 vardef=n me包 1 var; class ̲type̲; var dim1‑dim2; freq freq; run; プログラムの結果を次に示す。 FhU Tよ 4

158.

TYPE N Dbs Variable Meむ 1 Variance 一一一一一一一一ーーーーーーー一一一一ーーーーー一一一一ーーーー一一一一一ーーーー一一一一ーーーー一一一ーーーー一一一一 15 DIM1 DBS VAR DIM2 1.184238E‑16 ‑9.62193E‑17 1.0000000 1.0000000 15 DIM1 DIM2 ‑1.33227E‑16 ‑6.66134E‑17 1.0000000 1.0000000 2 . 2 完備型の指標行列に基づいて分析を行う場合 完備指標行列を分析対象とする場合には、下記のように値が重ならないようなデータセットを 作成しておいた方がよい。 0, 1のままでも良いが、結果と元データとの対応が取り難くなる。 data data1; array q{5}$; input q1‑q5; id=put(̲n z3.); cards; A1 BO C1 DO E1 AO BO CO D1 E1 A1 BO CO DO E1 AO B1 C1 D1 EO A1 B1 CO DO EO A1 BO C1 D1 EO 一, TABLESステートメン卜を用いることにより、完備指標行列を指定することができる。ここで 分析に用いたデータは 2値データであるが、 3値以上でも同様のプログラミングで実行できる。 proc corresp data=data1 outc=out1 row=da column=db short observed; tables id, q1‑q5; run; このプログラムでは、下記のような表に対して分析が行われる。 Contingency Table 006 。。 。。 。 。 。 。。 。 。 。。 。 。 。 。 。 。。 。 。 。 。 。 。 。 。。 。 S u r n 2 AO 001 002 003 004 005 A1 1 1 BO 1 B1 CO C1 DO 1 1 1 1 E1 1 S u r n 5 5 5 5 5 5 3 30 1 1 1 1 1 EO 1 1 1 D1 1 1 1 1 4 4 2 3 155‑ 3 3 3 3

159.

3 タイ(同順位)判定の問題 対応のある群間で平均の差をノンパラメトリックに検定したいとき、差のスコアを計算して、 PROCUNIVARIATEで l標本 W i l c o x o n符号の順位検定を行うことがある。たとえば次のよう に指定する。 data wiltest; input pre post 母由; d = post ‑pre; cards; 3.4 2.1 3.3 4.5 6.0 5.2 7.5 6.9 2.2 1.6 proc univariate data=wiltest; var d ; run; Moments N Mean Std Dev Skewness USS CV T:Me田 =0 Num内= 0 M(Sign) Sgn Rank 5 Sum Wgts ‑0.42 Sum 0.949737 Variance 1.704055 Kurtosis 4.49 CSS ‑226.128 Std Mean ‑0.98885 Pr>ITI 5 Nu 血 >0 ‑ 1 .5 Pr>=IMI ‑3.5 Pr>=ISI 5 ‑2.1 0.902 3.538355 3.608 0.424735 0.3787 1 0.3750 0.4375 差のスコアをあらかじめ求めておいたときには、次のようになる。 data wiltest; input d @@; cards; ‑1.3 1.2 ‑0.8 ‑0.6 ‑0.6 proc univariate data=wiltest; var d ; run; Moments N Mean Std Dev Skewness USS CV T:Me田 =0 Num 内= 0 M(Sign) Sgn Rank 5 Sum Wgts 皿 ‑0.42 Su 0.949737 Variance 1.704055 Kurtosis 4.49 CSS ‑226.128 Std Mean ‑0.98885 Pr>ITI 5 Num > 0 ‑ 1 .5 Pr>=IMI ‑3.5 Pr>=ISI 5 2.1 0.902 3.538355 3.608 0.424735 0.3787 1 0.3750 0.3750 FhU 1 ょ ρO

160.
[beta]
符号付順位統計量 (SgnRank)は‑3.5で同じなのに、 p値は 0.
43750.3750で、異なっている。
これはなぜであろうか。どちらが正しい値なのだろうか。
この問題では、 4番目と 5番目のオブザベーションが重要である。どちらも差のスコアは ‑0.6で
あり、タイ(同順位)になっている。タイが生じた場合は、スコアは平均順位をつけることにより
順位和に関して一貫性が保たれるが、分散に関しては小さ目に評価しなければならない。たとえ
ば {12345}の分散は 2であるが、 {123.53.55}の分散は1.9である。
ところで、デジタルコンヒ。ュータでは数値を 2進数の浮動小数の形で表現する。この形式では、
10進数を正確に表現できない。このため、 10進数では同じ数になるべき演算が、コンピュータで
は正しく演算できないことがある。この例では、 6.97.5の結果も1.62.2の結果も 0.6になるは
ずであるが、コンピュータ上では若干違った値になる。実際に Dataステップで計算してみると、
data;
d1 = 6.97.5;
d2 = 1
.62
.2;
put 'd1=' d1 20.17 /
'd2=' d2 20.17;
run;
d1=ー0.59999999999999000
d2=‑0.60000000000000000

となって違った値になっていることがわかる。これはデジタルコンビュータを使う以上しかた
がないことである。 4番目と 5番目のオブザベーションが同じ値であると判定されない場合、 2つ
の観測値はタイと判定されないことになり、分散の評価が違ってくる。これが p値に違いが出て
きた原因である。すなわち、初めの方の計算結果は間違っている。
このような問題を避けるためには、 PROCU
NIVARIATEにかける前の数値を適当に丸めてお
く必要がある。 PROCU
NIVARIATEには、そのための ROUND=オプションが用意されている。
たとえば、 107のところで丸めたいなら、次のように指定する。
data wiltest;
input pre post 由也;
d = post ‑ pre;
cards;
3.4 2.1 3.3 4.5 6.0 5.2

7.5 6.9

2.2 1.6

proc univariate data=wiltest round=lE‑7;
var d
;
run;
Moments
N
Mean
Std Dev
Skewness
USS
CV
T:Mean=O
Num ‑= 0
M(Sign)
Sgn Rank

5
0.42
0.949737
1.704055
4.49226.128
ー

Sum Wgts
Su
皿
Variance
Kurtosis
CSS
Std Meむ 1

0.98885 Pr>ITI
5 Num > 0
1
.5 Pr>=1M
I
‑3.5 Pr>=ISI

ー

5
2.1

0.902
3.538355
3.608
0.424735
0.3787
1
0.3750
0.3750

I

咽E4

ヴ

RU

161.

今度は生データから計算しでも正しい p値が得られている。 2進計算による誤差がタイの判定に影響を及ぼすのは W i l c o x o nの符号の順位検定だけではない。 PROCNPARIWAYを使った W i l c o x o n順位和検定などのノンパラメトリック検定でも、 PROC LIFETESTや PROCPHREGによる生存解析でも同様である。 PROCUNIVARIATE以外のプ ロシジャには ROUND=オプションがないので、このような解析をタイがあらわれそうなデータ で行うときには、あらかじめ Dataステップで ROUND関数を使って数値を丸めておくのがよい。 Tム OO RU

162.

医薬

163.

日本 S A Sユーザー会 (SUG I‑J) 医療機関の治験事務局における 受託臨床試験管理システム作成の試み 0安 藤 永 一 * 古 川 雅 純 .. 後藤果宏、 E ホ有限会社電助システムズ キキ ぺ * BRD JAPAN株式会社 AT r i a lMakeso fC l i n i c a lStudyManagementSystem f o rM e d i c a lf a c i l i t i e s E i i c h iAndoh 本 MasazumiFurukawa' 噂 K a s h i aGotoh'キ • DENSUKESYSTEMSC o . . L t d . キ勺 BRDJAPANCORPORATION 要旨 医療機関の治験事務局における受託臨床試験管理業務を支援するためのシステムを SASシステムにより試作した。本システムの概要ならびに本システムの作成過程において得 られたしてつかの知見について述べる 3 キーワード: SAS/AFソフトウエア、 GCP 1 .システム作成の経緯 平 成 9年 4月から新 GCPが施行され、それに合わせて都内の某病院(都合により病院名 台 は伏せる)において新 GCP'こ準拠した治験体制整備の検討が開始されたっこの中では、 1 験を行う組織や体制、各種事務手続きの検討、標準作業手順書の作成等が行われたc こ れらの検討が進む中で、治験事務局において治験手続きや症例の管理等を高品質で効率 よく行うためにはコンピュータ、ンステムの使用も検討すべきだ、としウ意見が出され、本システ ムを試作することになった D システムの仕様については、当初、医師、薬剤師から様々な意見が出されたが、新 GCP に則した業務自体初めてであり、あくまで、もモデルケースとての検討段階で、あるので、最初 から大掛かりなシステムを作り込むよりはできるだ、け簡便で、必要最小限の規模のシステムか ら始めた方がよいとし、うことになり、以下のような構成にすることとしたc ノ¥ードウェア :Windows95パーソナノレコンヒ ュータ(スタンドアロン) c ソフトウェア :Windows版 SASシステム R6.12、MS‑ExceI7.0、MS‑Word7.0 ‑161

164.

なお、今回のシステム試作において SAS、ンステムを選択した理由は、主には次のようなも のである c ①医師側より、将来的にはデータの集計・解析も病院内で実施したいとしウ希望が出され たため、フ。ログ、ラミング等の習得が比較的容易で、あり、かつ、集計・解析においては秀 でた能力と信頼性を誇る SASシステムが候補となったc ②今回はあくまでも「試作」の段階であるため、システムを作成しながら思考錯誤的に仕 様の変更を繰り返すとし、うことが予想された。そのためスクラップ。アンドビ、ルド、的な手法 でも作成できるものとして SASシステムを選択した。 ③医療機関側には専任のデータベース管理者をおくだけの人的余裕はなく、それを必要 とするようなデータベースは使用したくなかった。また、もし今後、データベースを採用 することになっても、 SASシステムであればデータの移行が可能であり、開発されたア フ勺ケーションについてもさほど変更せずにそのまま使用することも可能であるc ④ SASシステムであれば、 SASシステムのバージョンアップがあっても、あるいはプラット フォームを変更しても、データについては継続性が完全に保証されており、その都度 デ、ータのコンバージョンをするような手間と危険性がない c また、 SASシステムで開発 したアプリケーションについても、ほとんどの場合 1から作り直す必要はなく、継続的な 使用が可能である c ⑤今回のシステムの試作に応用できる、 SASシステムにより開発され既に使用されている システムがあったハ 2 . システムの概要 システムの仕様は、最初からコンピュータシステム上だけですべてを処理するとしづ考え方 ではなく、治験の諸手続きに使用される各種様式を入力元(原帳票)とし、これらのデータを 入力・管理することを基本とした2 治験実施に関する様式には様々なものがあるため、例えばある治験の概要や進捗状況を 知りたい場合、別々に保管されている各種各様の多くの書類を調べなければならず、たい へんな手聞がかかってしまう。そこで、このシステムさえ見れば通常知りたし吃思われる必要 最低限の情報が得られることをめざした。また、帳票類のなかで、一度作成しておけばその まま、あるいは少しの修正を加えるだけで使用できるようなもの(例えば、医師の経歴書等) を、所定の様式で印刷できるようにし、それを元にして必要に応じて情報を修正できるような 機能ももたせた(図1) 0 唱Eム n J μ PO

165.

宮←ー ‑7 DPl 后 ヨ 1 童量豊盟 情報のフィ ピ ? 、 Cコ煙量 事 司 ド1¥・ ノ ヴ ̲̲J 図1 1)主な機能 本システムの主な機能としては下記のものが挙げられるつ現段階での必要最低限の機能 であると考えられる。 ‑治験依頼者情報管理:治験依頼者名、住所、代表者名等の登録、管理 ・治験薬情報管理 :治験薬の名称、一般名、薬理、毒性、 ADME 等、治験薬に関 する情報の登録、管理 ‑治験情報管理 :治験課題名、治験方法、治験責任医師、治験分担医師等の情 報ならびに治験依頼・受託手続きに関する情報の登録、管理 また、当該治験に対する治験審査委員会の審議過程および結 果の登録、管理 ‑症例情報管理 :治験別での、症例ごとの治験開始、終了および有害事象発生 等の情報の登録、管理 ‑職員情報管理 :治験関係職員(医師、薬剤師、看護婦・士等)についての、治験 経験等の情報の登録、管理 ‑治験情報参照 :上記の機能により登録されデータベース化された情報を処理す ることにより得られる、治験進捗状況等の要約情報の表示 ‑163

166.

以下に、いくつかの実際の画面を示す C メインメニュー ‑ ム ‑ ̲ ど 、 医置富田 , 一 神、伊持‑."'> 受託臨床試験管理システム ミ掲. :ブザ ー Kosmos , 璽里哩‑‑圃圃園田‑圃園園田・‑ー圃圃・・・圃圃圃圃圃‑喧理哩‑‑̲. 症例登録 銭帽者名/'宣明名 │屯山一 郎S 28965 4111111J 早期第 2,目臨床試験 亘聞の明:!I. Ca: Je lD 壷時日 「ー「丙)‑a‑‑29 I f ・泊メ Z開始 r H" [ (中止 C ~f8月 間車取押 1 f ・2 巨人 '1 て白書 同窓町得日 掴入日 f本人叶守..百者 ι I " J : 琶なし 誼与閉館目 圃 ・ ・掴 ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ 薗 ・ ・ 圃 圃 圃 圃 圃 E 力J レテ醤号 イニヨ暗主写月日 性別 毎剖 lb男 峰庄抽泉有害事量 圃圃ぃ・烹 E 不明 許 71 申止日 ι女 f 不明 担当匡師屯 E 経 中 1 北川日月 i l 科名 三塁本二一」問i1 iエ J.11監Jゴ γ一及アー: ‑ : ‑ 1 印刷 │ 新規登録 症例が治験にエントリされた時点で登録し、以降、当該症例についての情報を随時入力してして。 同意や有害事象に関して問題のある症例は、別画面で問題症例一覧として参照できる。また、投与 開始日の情報と治験実施計画書の情報とから、必要な検査等の実施日のチェックリストも作成でき る 。 1 6 4一

167.
[beta]
治験進捗状況

i
l

̲A空望者・治験車・;台駿課題

てや豆豆, 0 ・責任屋市

中止不明

i5121
ア「τ「
τ「τ ー

197 し宇宙 ~98 田明

「す「τ「
τ「τ「了「了

一
S
期2
8
第
早
9
6
2
5
相日臨床1
鼠
1験

I~…
ss期42第後
12235相未臨開床試土験

三派員犯人司始問

1
9
7
‑
0
1
‑
0
1~97-12-31

│
内
叫

ゴ

γl

I
王
J
!
.
,
t
‑
う守守

前期の症例登録機能により登録された症例情報とデータベースに登録されているその他の必要な情
報がシステムにより処理され、治験別の進捗状況として表示される。

職員情報登録
道輸幽喧副主

ll11111
﹂

斗﹁

主l
L":常到

「非常到

直園田

所闇

I
P
l!
'
l

内 需 丙1

圃
・
・
取得与周日

専門分野.pií.~草学会芸

終了

│

思歴書棚~

1

免許醤号

l
新規登録

i

再胎

1.
=
.
.
1

治験責任医師、治験分担医師を始めとし、治験に関わる職員の履歴等を登録、管理する。医師・歯
科医師の場合は、それまでの治験実施経験等も登録され、履歴書として所定の書式での印刷もで
き
る
。

‑165

168.

治験情報登録 l よ 九F 暗闇者晶/!古眠葺コード/治験実一世名 │竃開薬師凱 民S 28965 塩酸デノスケシノ 主主j摂b I 器量E 事軍事項 lh冥 E 研コ可否 r縫 待 の 可 否 iニj 浩験翌四品 I 内局 B m盟 四 実~計画書番号 瞳E 璽翠!ml'! ・ ・ 語l<lI!菅理者間康 民各 1 [1干鰯市斗 内料 i 原名 i I n 部長 i箪 ヰ 卑J 一重阻まえ」豆島葉真J よ亘主宰ま1..1江.q,il:1 一一語L.J三監填主J I 終了 │ 新姫君診季 I 蹄 ' 11 │ 次べージ 1 : ヨ 治験依頼者より提出された書類等にあるほとんどすべての情報を登録する。治験責任者名、治験薬 管理者名、所属等の職員に関する情報は、職員情報としてあらかじめ登録されたデータからの選択 入力になる G 治験情報登録 2 餓帽看名/!主 E 質量屯/詰民名 型付醤号 」 中 斗j │電向車問土 αSS28965 早期第 2l~~却王試験 ニj 終了 ; ; j i 1 6 6

169.
[beta]
治験情報登録 3

依岨E嗣由

明﹁羽山

渇一云床

欄照臨
パ Em常的 2

柑哲郎副日

純一期加瞬

・
・
園
田

置付香号

」 ヰ 斗J

実瞳予定問団

斗

E盟理1!II~1l置盟mI

,台駅長任匡師閉鴎

・
・
正名

l
円宇爾苛r
r

内科

田名

肝i
妄

I I

FρX番 号

電話書号

‑孟孟一一孟孟一.
│

終了

II
前ベージ

i

1
:
ヨ

次べージ

治験情報登録 4

敏 晴 者 名J治験票右/;主験名

責付番号

」 中 斗J

│軍閥鰍期工
[
<
主S
2SB65

末試験
早期第 2 @ W

{藍岨蓄が注目するも時

斗
資
書る料

文す資料
明告関る資
説報にする
のる償問す
他わ摘に関
の係・用に

j
=
'
"
・1
日

岡田・・
圃・・園

1寸斗

田
・
・
・
・

E

終了

そにい費雲
茸守払験続
書書全一支治の

文萎{女のる況
明概のへれ現

﹁﹁﹁﹁﹁﹁

「そのi
也

ー亘書

説一謀者者さの
一一首長験駿定験
同治被被予治

平i

i

治験依頼者から提出された添付書類を登録する s 必要な書類がすべて揃っているかどうカミのチェッ
クが行える。

‑167一

170.

治験情報登録 5 組﹁一抑 担↑約四 制君臨 パ官主的2 H一槻加欄 醐宮路朝 'I?:付番号 」辺旦J 治険豊臣匡 E 事記入事項 斗 治終分間医師・ 1 収力者 絡了 l ;台駿実施予定簿潤中の{自の治験数...治験の対鼠哩者数圃・・E │ 治験責任医師が記入、提出する内容を登録する c 必要な書類がすべて揃っているかど、うかのチェ ックが千子える。 治験情報登録 6 {蔓蝿噺名/;主担瞳名/?主 H名 |草島根附i\~?土 民S 2伺 6 5 早野跨 2 1目E 卸王宮ぷ u 受円 S号 」辺辺 区分且び用油 時費弘i f 要医王品 ニJ 「医療用旦 「その他 F 製這〈愉入J 承琵押請 「製造〈愉入J承 擦 問 一 部 変 更 承 E 碑請 「その他 写度毎回目置研究賢 圃圃圃圃圃圃圃圃圃圃圃 r.未入7J J 一 ! づ 損壊哩哩F [':33. べ 一 前 一 終了 輔 Æ~Jnt 釦l 更時適用 lf 有 11111111Jd 四~に耳する日曜安 圃圃圃圃圃圃圃圃圃圃圃・ 岡 田 扇 面 画 面 爵 棚 田 園 田 岡 田 園 周 盟 関 理 由i ‑168

171.

2 )システム試作上の工夫点 先に述べたように、システムに持たせたい機能については他にも多くの意見があったが、 試作ということで、システムはで、きる限り簡潔にまとめたかったため、全ての要望をそのままの かたちで、システムに取り入れることはしなかったC しかし、望ましい機能については何らかの 工夫をすることで要所のみ押さえるかたちで極力本システムに取り入れるようにした。 例えば、治験審査委員会の議事録を作成する機能を持たせたいとしづ希望があったが 議事録となると、やはり単なるテキストエディタで、はなくワード、フ。ロセッサと同レベルの編集機 能が要求される。 SASシステムの上である程度実用に耐えうるワード フ。ロセッサ的な機能を 実現することも決して不可能で、はないが、 SASシステムはもともと文章のような長い文字デ ータを扱うのには適していないこともあり、そのようなものをこのシステムの一部として組み込 もうとするとシステムの仕様が複雑になってしまう。一方、議事録の作成自体をシステムの管 理下で固定化してしまうよりは、ある程度いつで、もど、こでも作成で、きる方が効率が良いとし、う 意見もあった。そうし、った事情を考慮した結果、議事録の作成にはMS‑Wordを使用し、 )。 そこで、作成された電子ファイルを本システムで、管理する方法を採用することとした(図 2 この他にも、ある程度以上の規模のシステムであれば他の方法で実現できるような機能を 上記のような工夫により解決している c 治験審査委員会情報登録 ̲2と乙」 以降、議事録参照ボタンを 押下することにより、自動 的に MS‑Wordを起動し て当該議事録を表示 図2 1 6 9

172.

3 .考察 医療機関における受託臨床試験業務を支援するシステムとしては様々な仕様が考えられ、 それにより、おのずとシステムの規模も異なってくるつ今回我々が試作したシステムは、必要 最低限の機能で、規模も最小とし、うことができるであろう c 一方、大規模システムを考えた場合 には、例えば、電子カルテや臨床検査等のオーダリング のシステム、さらには会計システム 等ともリンクし、治験分担医師が診療時に入力した情報がそのまま治験管理情報としても使 用できるといった、ンステムも考えられる(実際にしてつかの大学病院ではこのようなシステム が稼動している)。しかし、このような場合には、院内に数多くのコンピュータ(端末)が必要 であり、さらに、院内全体にネットワークを敷設し、これらのコンピュータを接続する必要があ る。そのためには、専任のシステム管理者が必要になってくるカもしれない。このように、大 規模なシステムでは、その導入にも維持にもそれ相応の人員とコストを要するであろう。しか しながら、臨床試験を受託するすべての病院がこのような条件を完全にクリアできるのであ ろうかc 今回のシステム試作の経験から、医療機関におけるいわゆる治験管理システムで最低限 必要な機能がある程度はみえてきた。そして、それら必要最低限の機能を実現するために は、高度なあるいは最先端のコンヒ ュータ技術は必ずしも必要で、はないことがわかった。 o 最も重要なことは、コンピュータシステム先にありきで、はなく、やはり、まずは「人」が行う治 験体制を整備し、その中で、入手に頼るよりはコンピュータに処理させた方が良い行程を探 り、その医療機関の実状にあったコンピュータシステムを導入することで、はないだろうか。何 もかもを無理やりコンピュータ、ンステムの画一的な定型処理にのせてしまう必要はない c か えって入手の方が適している作業もあるはずである。その見極めは人が頭を使って行うべき ではないだろうか。 本システムは未だあくまでも試作段階であるが、今後、今回の経験を踏まえて、より実際的 なシステムにしていくつもりである c 最後に、本システムの試作にご協力頂いた、株式会社 SASインスティチュートジャパンに 深謝致します。 ‑170‑

173.

日本 S A Sユーザー会 (SUG I‑J) 盲検化での症例数の再計算のための EMアルゴリズムを用いた分散推定プログぉラムについて 0 鍵村達夫,出本敏靖 日本ベーリンガーインゲ、ルハイム 臨床統計部解析課 Estimationo fVariancebyEMAlgorithmapproachf o rsamples i z e Re‑estimationwithoutu n b l i n d i n g TatsuoKagimura,ToshiyasuIzumoto DataAnalysisSectionBiometryDepartment,NipponBoehringerIngelheim 要旨 臨床試験の途中で,症例数設定の根拠となった前提を再検討する事は,成功する臨床試験を行うた めには意義のある事である。今回 Gould らによって報告された EM a l g o r i t h m を応用した群内分散推 定法に基づき,盲検化で分散を推定する SAS/IMLプログラムを作成した。そしてその初期値が推定に 及ぼす影響を検討しさらに実際の臨床試験データに対して適応し,プログラムの特性を検討した。そ の結果,データが正規分布からかなりずれていても 1群 100例程度の臨床試験であればその分散の 推定値は十分に実用性のある推定値が得られると考えられた。 キーワード EMa l g o r i t h m,Samples i z ea d j ・ ustment,C l i n i c a lt r i a l,SAS/IMLソフトウェア T はじめに 適切な試験例数の推定は,試験デザイン,主要な評価変数の選択などとともに臨床試験を成 功させる重要な要素である。臨床試験における症例数の推定は、過去の試験結果や専門領域で 妥当と考えられている知識を必要とする。しかし,この前提となる推定値は、その試験薬に対 して過去に経験のない試験デザインや評価変数を選択した場合や,遥か以前のデータあるいは 海外のデータを参照するような状況では,不確実な状態を受け入れざるを得ないのが実状であ る。また,たとえ最近の試験のデータが利用できたとしても、患者集団、疾患の重症度、診断 基準、医学的手法などの点から生じる可能性のある試験問差を考慮、しなければならない。症例 数の設計の際に直面するこのような不確実性な要因により,結局,試験実施者の意志に反して 過剰な規模の臨床試験や、結論を得ることが出来ないような検出力の低い試験の実施につなが ってしまいがちである。それゆえ試験の中間段階で,症例数を再見積する事は有益である c 臨床試験において例数を再見積もりする方法は、ここ数年来いくつかの論文で検討されその 方法が開発されてきている 1‑11)。それらは,中間的に割付を開示して行う方法と盲検化で行う 方法の 2 つに大別される。今回, Gould らによって報告し 2)された正規分布を仮定したデータに対 する盲検下での分散の推定法に注目し, SAS八MLソフトワェアを用いて盲検下で分散推定プログラムを ‑ 1 7 1

174.
[beta]
作成しその特性を検討したので報告する。

2
. 方法
Gould らはその報告12)で,盲検下でサンプルの群内分散の推定法として,検定の対立仮説で
l
g
o
r
i
t
h
m を用い
仮定された平均の差に基づく分散の単純調整法と,対立仮説に依存しない EMa
l
g
o
r
i
t
h
mを用い
た方法を示している。今回作成した SAS/IMLソフトウェアプログPラムは後者の EMa

た方法であるが以下に両者の概略を述べる。

2
.
1
. 単純調整法 CSimplea
d
j
u
s
t
m
e
n
t
)
中間段階のサンプノレで、群 1で B
nの観察があり、群 2で{l・ B)nの観察があると仮定する (nは
0 Xj
既知で Oは未知 )
iを j番目の群 iの観察とする。プールしたサンプルに基づ、く全体の分散の
推定は盲検下で計算できそれは次のように示される。

工(Xij̲X)2=工(Xjj‑Xj)2+nθ(1‑θ)(X]‑X,)2

(
n一l
)
s
2=
ニ

(
n‑2
)
δ 2+nθ(
1 θ)
(
X
]‑X2
)
2

ここでがは未知の群内分散の推定値で,サンプノレは盲検化されているので,群毎のサンプル

2は判らない。けれども、もし対立仮説 H]:μ1一向 =
1
1が真で
の平均支], X2がわからないので δ
あり、 nが充分にあれば X
]一九はムに接近するので

)
2"
"0(
n
θ(
1 θ)
(
X
]‑X2
1 θ)
(
n‑
1)企2
となり,さらにブロック化無作為割付でブロックサイズが小さければ,

。は既知に等しいと

群 1
,群 2の割付比)に接近する。ここでもし θ
考えることができ,あらかじめ与えられた B (
=
0
.
5 (割付比群 1:群 2=0
.
5:0
.
5
) なら群内分散は次の式により求められる。

ハ7
5
j
(
S
2
t
/
4
)
2
.
2
. EMA
l
g
o
r
i
t
h
m
盲検化されているので、中間的観察値 X j, i=
l,
"
'
,nがいずれの処理群であるかを知ることは
できない、そのため処置の割り当ては

m
i
s
s
i
n
ga
t random" と考える事が出来る。ここで τiを

次のような処置群のメンバーシップインジケーターとする:
τj=
1(
0
)

症例 iが群 lなら 1 (
群 2なら 0
)

τ];..τnは P
r
(,]ニ 1
)=
θ の独立なランダム変数である。

τ1が与えられ、 Xi( i=
1,…ス)が正

規分布の密度を持つなら
)
‑
(

'
j
>

f(X
jI μ
],
J
.
12
'σ)ぽ 1exp{‑‑LIT(
X
t一μ
]
)
2+(
ト'
j)
(
X
)
2]
)
j μ2
σ2σ2
Xjが与えられたときの τiの条件付き確率(ないしは期待値)は

/
o
̲ 1
‑
θ
P
r
(
'
j 1I
Xj
)=1
/{
1+一~exp[(μI
/ θ
二

ん )(μ]+ 約一 2x j )
/
2σ2]}

(
2
)

となり中間的観察値の対数尤度は(
1
)式から

L (
n
/
2
)
I
o
g(T2+{工 [
(
'
j
(
X
;
)
(
X
j μJ2]}/2σ2
j‑μ y+(1‑'
二

(
3
)

j
:
:
:
:
:
l

となる。 e=Bと見積って, (
2
),(
3
) 式が与えられたときに,
172‑

。の推定のための EM a
l
g
o
r
i
t
h
m

175.

( D e m p s t e r , L a i r d, andRubin, 1 9 7 7 ) は次のとおりである。 E Step: ( 2 )式の μl'μ2とoに現在の推定値を代入して, τ:の期待値の暫定値を得る。 M Step:τ1の暫定的期待値を ( 3 ) 式に代入した後 μl'μ2とoの最尤推定値を得る。 この凶 E" と "M" のステップを,。の値が安定するまで繰り返す。 2 . 2 . 1 . EMa l g o r i t h mの 初 期 値 Gouldらは, EMa l g o r i t h mにおける初期のパラメーターを見出すために Fowlkesの方法を適応 することを提案している。 すなわち中間的観察値 X i' i=1, … ,nの順序付けたデータを Z(I)くZ(こ ) く … くZ(n) とする。 i=1, . . . , nに対して P i=( i‑O.5)/nとし q i φI ( P i )を計算する, 二 ← (φiは標準正規分布関数の逆関数)。 次に ( q i, Z( i ) ) , i=1 ・ . ,,.nへ最小二乗法による線形回帰を適応し;直線の傾き b,その切片 a を求 める。 μl'μ2と oの初期値は t 。 子 =b , J 1 1 .0 二 α b /c ム 。 =α +b/c で与えられる。 ここで C は任意の定数であり,定数 C の選択は平均の初期値の推定に影響するが分散には影 響しない。 この定数 C は , c= 2σ/(μ1‑μ ュ)であるが, μ l 'んのいずれも未知である。そのため Gould らは,症例数を推定するために正規近似を使うほとんどの臨床試験において変動係数の逆数 λ=(μ1一向 ) / σ は,通常 0 . 2 0から 0. 50の範囲であるので(l群約 430から 70例の範囲で,そ I0 . 3 5 ) = 5 . 7 1 とする れぞれ検出力= 0 . 9,片側 α=0.05),その範囲の中心の 0 . 3 5を取って, C=2X(1 ことを提案している。一方,本邦で通常行われている非劣性試験の場合は,想定される ( μ l一向)が小さいので Cは 1 0 0程度の大きな値を与えるべきと我々は考えている。 3 分散推定プログラムの特性 Gould らは EMa l g o r i t h m による推定方法は, 。の推定は適切であるが, μ l 'ん の 推 定 は 初 期 値に依存するために保証できないとのシミュレーション結果を報告している。今回我々も作成 したプログラムを用いて Gould らと同様のシミュレーションを行った。その結果,真の oの値 によらず分散の推定は良好であり, Gouldらの報告とほぼ一致したシミュレーション結果を得た (表1)0 3 . 1 . 推定に対する初期値の影響 一方,初期値の値と u と( μ l ん)の推定値との関係を見るために,正規乱数を発生させて作 . 4, a :2 0 . 1の各群 1 0 0例(合計 200例)の 2つの D a t a s e tに 成した平均値の差:ー7.4およびー0 対して,初期値の設定に用いる定数 C を変化させたときの推定値への影響を検討した。なお平 4 . a :2 0 . 1,各群 1 0 0例の D a t a s e tは通常の臨床試験で有意差が検出される場合 均値の差:ー7, ‑ 0 . 4, a : 2 0 . 1,各群 1 0 0例の D a t a s e tは非劣性試験の例として想定 の例として,平均値の差 : した。その結果を,図 1および図 2に示す。 分散の推定については,いずれの D a t a s e tでも, C の値が 5以上で D a t a s e tが持つ分散にほぼ ‑173

176.

近い値を推定し,初期値によらず安定していた。一方,平均値の差については C の値とともに 変化し推定値としての信頼性は保たれなかった。 0 0回の繰り返し Simulation) 表1. EM algorithmによる σの推定値の精度(1セルあたり 1 。 。ITrue MeO.an5Differenc1e.l0/Tr σ 2.0 回 obs/gp Trueσ 0 . 5 2 5 5 0 2 4 0 . 5 2 4 .D . Mean Is Mean 1S .D Mean Is .D Mean 1s .D 0 . 4 7 91 0 . 0 4 90 . 4 9 8 j O . 0 4 60 . 5 4 1 1 0 . 0 5 80 . 6 8 7 1 0 . 0 6 2 0 . 9 6 9[ 0 . 0 9 51 .0 0 4i 0 . 1 0 51 .0 8 01 0 . 1 0 1 . 2 0 7 1 0 . 2 1 62 1 .9 8 5 1 0 . 2 0 22 . 7 5 11 0 . 2 3 4 3 . 8 5 81 0 . 3 8 94 . 0 5 6 1 0 . 3 7 54 . 4 1 5 1 0 . 4 5 15 . 4 8 9 1 0 . 5 3 6 0 . 4 8 91 0 . 0 3 90 . 5 0 1: O .0 3 30 . 5 4 8 1 0 . 0 4 3O .6 9 5 1O .0 3 7 1 0 . 9 7 41 0 . 0 7 51 . 1 0 30 .0 2 01 O .0 7 41 . 0 7 41 .3 9 4!O .0 8 2 1 1 .9 6 51 0 .1 1 62 .0 1 11 0 .1 4 42 . 1 5 80 . 1 6 62 .7 6 5 3 . 9 3 21 0 . 2 5 7 . 2 9 95 4 .3 8 40 . 5 4 2 日 「 方法: I T r u eM e a nD i f f e r e n c e l / T r u e σ ,T r u eσに対応するん, μ2'σ を持つ正規乱数を各群 2 5ないし は5 0個発生させ Datasetを作る。その Datasetに対して E MaI g o ri t h mにより σの推定値を求める。 それを 1 0 0回繰り返して σの推定値の平均と分散を求めた。なおここでの EMalgorithmの初期値 を求める定数 Cは C=5.71 と置いた。 3.2.実データでの分散の推定 Gould らによって開発された盲検下での EMa l g o r i t h m による群内分散推定法は,正規分布す るデータを前提にした方法である。しかし実際の臨床試験データは正規分布の前提が十分に確 保されない場合が多い。そのため,実際の臨床試験データを用いて分散の推定を行い,データ が持つ群内分散と比較し,正規性の前提が崩れた場合の推定値への影響を検討した。臨床試験 データは気管支哨息患者を対象に行われた l群約 1 0 0例の二重盲検比較試験のデータ用いた。 また初期値の影響も検討するために C = 5 . 7 1 と C=IOOを用いた 2つの場合で群内分散の推定を行 った。その結果を表 2に示した。 = 5 . 7 1と その結果,検討したほとんどの項目で正規性が認められなかったにもかかわらず, C C=IOO のいずれの場合も推定された σのずれは 4 . 2 % " " ' 7 . 9 %の範囲で良好な σの推定値を示し た。また, rvc 後値 J ,r 発作点数の変イヒ J, r 重症度の変化」のような群聞に有意差のある項 目も良好な σの推定値が選られ, r 重症度の変イヒJのような 2‑6の離散変数での推定も良好であ った。 Gouldは推定した分散より症例数 N'の再計算を行し、それが事前に想定した症例数 N の1.33倍 以上のときは症例の追加を行う事を薦めている。分散と症例数には次の関係があるので N ' σふ e r NOLM 盲検化での中間的な検討で J三7=115倍以上 σが当初の見積もりよりも大きかったときには, 事前に想定した検出力を保持するために症例数の追加など試験規模の拡大の検討をする必要が あるかもしれない。 ‑ 1 7 4一

177.
[beta]
l
i

号
日

!
i

平

標

ー. •. c
;
;

3
佳

,
白

偏 1)
差

ぉー
ゼ

σ

推定された σ

,

a

...三

~...

、,、.

会

. 、, .
、、. ・司 . . 、. 、 、,

~

E 均

‑
・
.
.
.
.
.^."、6''.e、
町
可

値

ー

晶

の

、 , 、.
、..

n
l差

• '

ー1
6
&

1
)

鎖、推定された平均値の差

'
I
Q

‑
I
S

。

ーI
Q

3

2

日

B

10

初期値の推定に用いた Cの値
図1.平均値の差と σの推定値に及(ます初期値の影響
C
D
a
t
a
s
e
tの値 :μl一μ2=‑7.4 σ=20.1
)

D
[
l

平均値の差

I
1

・
,
‑
.

標
準!I
偏
差
σ11

e

山 ‑Q"
"
"".~
‑
.
.

A
.,,~

品 ザ 町
山

-~.

甲府 P

一

W

,酋r
"'

.
1
1

,.~
λb

推定された σ

a

.
.

.
1
1

1
.
2
1

〆推定された平均値の差

‑
1
1

。

すl

日

2

初期値の推定L
こ用いた Cの値
図2
.平均値の差と σの推定値に及(ます初期値の影響
(
D
a
t
a
s
e
tの値 :μlμ2=‑0.4 σ=20.1
)

‑175

B

10

178.
[beta]
2 臨床試験データでの EMAleorithmを用いた群内分散の推定結果

Et¥(司占
4044444AU
叶叶

44JlAUAU44444444404

↓ 24444444441444AU444

官凶}一拍相判一泊叫叫品川同時抗目崎品川刊祖師同時特抗日泊抗特品目川内向日一白山柄拘同師刊肺山四拘師四師同時開問一柿叫品目嶋崎刊叫師同一団臼珂叫特時輔自刊訓偶一

l
ι

阿国審制単一 4 4 A u一吐

一叶

制

mmmmm

40121076444ttt4ta‑‑a

一9 9 9 6 a 1 1 4 3 4 ‑

刷叩一 m m m m

一

由
一

mmmm
刊川肺師泊四持品辺倒内四品目特偶肌嶋田一括師抑制問叫品市羽師︑
し
寸寸﹂ uf 寸寸寸
4ff
4 f 4 一f 寸 寸 4 0 46 4 寸一寸 41JlJLJ 41JhJlaa4一

一2 2 2 2 2 2 2 2 2 29 2 2 2 2 2 2 2 2 2 ‑

mmmmMmm
一M m m
加 m 馴刷
m m 刷叩一 m m m 加 叩 川 畑 細 川 川
刷 mmmm
43 0 4 d o o m 日‑ 1 18 3 2 0 2 2 1 1 A 0 9 2 1 2 20 0 0 0 o a o ‑ ‑ o

叫

一1 2 2 2 1 2 2 3 2 ? 2 2 2 1 2 1 2 2

MMH
品 EmMmm
J
l 寸寸寸寸寸寸寸寸寸寸一寸寸寸寸寸

一2 2 1 2 2 2 2 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 1 1 1 1 2 2 2

b S
唱
Eas‑mm 一 削 仰 m m m m m m
脚 mmM
川 mMmm
川鵬
mm
‑ 5 8 9一G ' 1 6 0 0 4 4 3 0 6
崎 5q41326081

3)

fzLh

MM

師脚前倒抑制

MMUM

ω

印刷

・

リ目印

一2 2 2 2 2 2 2 1 1 2

mm 醐削叩回附叩刊剛山師捌目一抑制捌印刷刊由加回目ト掛川
日目リ
MMMMO 一日リ MMMMUUM
UUMMMM

一2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2

mm 附前帥別別叫捌出目一醐捌回附
ωUM
は U1M
ω 日目的目

日回目印
一一

日即日町四日
ト 45

ra

E値 値

唱

4000000
Mmm
出刊巾刀日前日片目一
‑100142‑ao‑‑Anu‑222‑35sa‑

附抑脚叩一附町制抑制問卿蜘釦山抑制御醐蜘附棚田剛帥問削側側脚叩脚剛一側脚卿蜘脚附脚附附脚脚一

寸寸

一

mm 叫 Mm 師側田昌山
日リ一↑
UMMMUMMM

一2 2 2 2 2 2 2 2 2 2 2

け一口

3

卜

可

1‑

nn5 一

町一‑‑一一一‑一

4一 目 別 日 叩 出 品 目 別

O一 抑 制 抑 制 抑 制 抑 制 引 制 ︒ 一

1‑4S マ 1 1 5 1 2 3 7 4 Q 7 1 4 3 3 6 ‑ ' ' 1 ︐ ︐ ( 1 1 ' ' ‑ ' 1 1 U J ? ? 1

一叶一一‑一‑一

4MMMM44
一回川日目白
︑
‑411

0

町加畑山一

m

加即叫

mm

加川印刷胤附則訓則市叩間一

143

叩叩曲目白田

1144444341

1 4 31 1 4 4 4 4 4 3 3 1

FFFFFFF‑VFFFFFFFtFFFFFFFFF

岡山田同一叩什刷回目前

同日日目印刷回世田一拍刊叩而刀回引引回田町田目白出回目一日田町田町引肝担四円一日岡崎町引叩白河引曲目一

MMMMMMM
仁 l
lz
割引

IE

値直帥咽一

idt

叩直細川崎帥帥刈阻問問細川同芯

ド︐︐

︒
町

一

畑町的一回同日目川帥川目別問川品川川
M 周到百一 11444442?11850J 刷 αJ 副 nJ42S N
os 引 1402 2 1 1 1 2 3 9 1 1 ‑ ‑ 6 1 a
9‑‑‑

∞

L 幅 値 附 問 問 削 帥11早i館 組 組 帥 醐 細 胞

WMmMMmhM

ト民軍軍置置量

一捜期川川川川附象

E

一郎川町畑山間廿

一団日日同町四寸寸

﹃・‑

寸
一

畑一

二
一

mm

44

m m m m ωは出一
一
一

FFFFFFFFFF

ニ

一沼周回目
mm 日泊目白血一
‑jnunβqpaJi4544‑

TVVVVN

一

L 叩剛山口山川町立川市川町市山山山

SEa‑‑

刊州側側側一

︐釦知相知鑑

~"λ噛且"'"家とした臨床思量

E S E 凶一 1 2
一師同目立帥特目白九品目路師同同肺特別un刊協同品九郎肺肌
EEE午
HEE制 畳 一 寸 J
l 叶一ペペ寸寸寸寸寸
J
I 寸寸寸寸
f 寸寸寸寸寸

ー

‑‑4

寸 MMMMuumMM
1104

mmM
組踊山畑
mmmm
加加川川
mMmmmm
川淵加川一
Mm 訓川団川
mM 川 mmmm
一川刷川刷刷
mm 脚川畑一川畑
M 刷訓川
mmmm
刷訓
m m 四一一
‑5896116004430665341326082'304697111842022114092122‑ooooooo‑‑o‑9096a'34348E
一ト z r u
引 2V 1 ド 1nz
‑1
‑4'tT13vq41T1366‑2183291‑

山口

MM

一2 2 1 2 1 2 2 2 2 2 1 2 2 2 2 2 2 2 2 1 2 2 2 2 1 2 2 2 2

ー

戸 g凶一日
a
wE
M一 白 岬 凹 刊 円 回 目 白 日 目 引 回 引 口 町 同 印 刷 一 町 内 判 制 臼 臼 師 団 同 国 一 回 白 川 町 田 崎 日 刊 日 目 的 一
b 宝z
Hn 一印印日刊同町田町田叩刊担制四割印河口凹臼刊刊回目担割岨凹
内
抗 FAO‑255AAβ651142
創創一
一小 5 8 ‑ a A S 3 2 8 5
M
om‑23Da336JD2AJS813DAa‑nρJ84505AAnn‑3
小 β 副川
$21658851150943306641313260810304676‑:1372202211309212200000oo‑‑o‑Q9969134347‑
マ
?37Q4
一守
1fu
引 211111‑
‑141
71366‑q181221‑

asω 芝凶一 2 2 2

m 叫何日制問叩川剖
口 UMMMM
q E呈 fF5︒三一 HM一M M O 一M M M U
一

z
i
b
T 一印刷臼一則
{
民
一
二
︺E

・

守

'37‑2vtq
T16'880'1624'510'Q'824
mw
剛別刷附帥叫脚川町別問問旧制問
mm 脚附脚
mmm

一

‑一一

空 2 2 L 5 2一 旦 白 目 一 喝 M m M M 4 f
‑10‑‑v‑
一‑一一

JL 脚
一m w
10
F臣
盟
国
E2g
同 盟 国 一 引 制 O一 哨 刑 制 引 制 抑 制 制 抑 制 訓 引 制 叩 叫 叩 叫 引 刑 制 刑 制 訓 訓 制 抑 制 訓 一 割 訓 引 叫 訓 刑 制 制 抑 制 訓 引 制 刑 制 抑 制 一 訓 引 相 抑 制 刑 制 抑 制

戸 FRPFAPRPRPFRPFRPKFRPRPFFFFRPRPRPFFFFFFF‑zrrFFFFFFFRPKFFFFFnPRPRPFF
一F F F ‑ F F F F F F F F F F F F F F F F F
l
fMlis‑‑昨1101州 ! 川 叫 7EijudHIE‑叫 引 田 一 叫 崎 刊 ー ー 叫 が ー 引 叩 叶 ー 刊 叫 恥
J
引J
引 u d 内 川mlmmm叫 刈 町 i
副 ﹁2﹁ 州 1 4 l m M 刊 凹 凡
‑J4l 四 川 川 叫 品
叫
一 ー即引1
同 J副 社 ー 叫 ー 州 ーm川m
1t310L‑8一
E E X一 蹴 抑
mmmm
mmm M
制一川附印刷印刷瑚捌
田町制叩印刷即制加町帥
川明一 m M M
山市山叩即加制山師醐制印刷
一叩加担問問
山間一制抑制川
m 哨1
叩叩問問日
‑1ao
一a a 2 a 3 1 3 0 4 2 4 0 4 0 0 0 o a a 3 0 2 0 1 2 1 0 20 3 0 0 0 0 1 0 0 o n o o a a I o l 1 1 2 3 5 2 5 a O 88 8 1 2 2 a 4 1 a 7 L

ー
ピ
つ 5 ww

一一問岬帥帥

Feft

‑
Z
A町一一口間前

一時時住則的削則的叩羽巾山川町別式中川叩山中叩3dMU一一沼鴻明明ポゴ諸説明遡問問胤脱出品加盟恥じt
b側部Z
込山町川町一部一一脱却益⁝⁝⁝⁝⁝⁝一一一一血
一叫一乍町一沼町一間前川町官一一止問町

一一直直直附曜

zl

!ij

ー

UM

zeE主e
a
m
w一 四 日 9 一 制 印 四 刊 目
HM け回日刊日刊町四引拍
4M 白川町引日帥目白羽拍刊日時判百回
1n 刊臼刊拍引回目羽目一目白河田田川市田回目担一
h 刊訂回目引回目曲目的
‑aaa‑aaia12301aO014aaO1a1010aaaa12‑0100a01000aaaaa10a‑oa1aaaaaaa‑2221121aaL2‑
E‑E孟 一 品 抑 制 一 価 問 脚 即 日 間 目 川 町 日 制 附 則 削 岬 旧 制 加 即 日 山 市 川

回

5 e亘 一 回 目 曲 一 曲 目 白 田 町 四 回 目 回 目 白 口 問 目 的 回 目 制
η
0 拍町田川町川崎町田︒叩泊目口
一品目日一回刊日目︒四円却口
1491216471214798789‑‑‑
‑‑丘町&‑ZZ1Ez‑‑

一日品目一一回 u m U M
円同川日日目的
as4115mU13γ1
一
F5‑6126612

i
l
j
j

‑Q14‑3167200703650030366105992986064506442656899155624584657129176663810‑
一84 3 34 3 1 2 2 2 2 5 5 15 0 8 5 5 8 3 2 9 6 0 ‑
一3 3 78 2 3 4 5 4 5 0 2 8 5 6 1 5 7 3 8 2 0 5 6 8 2 3 8 1 7 3 3
45005727979353806885'42970998152‑114444422L1854553676FU‑
一7 9 7 ‑ 9 4 3 6 0 0 7 0 3 a 4 2 0 2 0 4 2 7 7 0 1 7 2 3 0 4 9 8 2
89
6
211111‑‑
ロ 19
悶 19
円刊日拍
一‑‑一
‑ 4 日 s 一拍 1 却 2 2 1
34M221
円刊日一 mm89
朗 6
別問
一一
︒︐司d f
︒︐の
︒︐ー‑‑‑
司
‑aUFO‑
u
i両 目 的 曲 目 刊 日 目 一
一四回目一 HH 口倒括河川口口什回羽田回出叩叩回目田町田間引目前回目白一刀四時制刊百別口町田百四四制制刊白羽一回目回引田円回目前回一ロ的制

鉱乱釦

mmmmMmmm
山刷加一則訓哨附加刷附則
山市叩団四抑制叩畑山間開制即日
mm 則明 mm 川帥 mM 川市制服脚問問
mm 加問削叩山川町叩一
mm 問 mmm
‑aanu‑oaoo‑‑'O00102300oto‑‑200oto‑‑‑00000000000000OGoo‑ooooaa1003‑1122220a1ao

E4ω 一 川 棚 哨 一 刊

一ぺ

ド

η 曲目白血出品
η 刊叩 M 引回四回目呂田町同町四円四四回目師団担叫刊目白田一倒回目白四日目判的引一山
mM 臼目白引日間
HM 一
ト 3
一C E 3 3 5 9 4 3 9 q 1 3 8 0 0 1 3 2 0 2 V 4 2 0 5 5 8 8 16 q T 2 2 1 2 3 V 5 8 3 8 4 0 4 10 7 7 9 1 2 4 8 a 41 ? 1 6 8 2 2 8 4 0 2 a ‑
U221123
tAV一a a t a 1 3 5 t o n s 4 64445024H
﹂
一叶叶 404aj44
ぺ 444Autt
一
屯 a‑4141a111Aut
は
一 5476a522aag

‑FFF‑FFFFFF‑FFFFFFFFFFFFFFrFFFFFFFF‑ZF

‑σ

吉一以叩ゆ誌はは訳出向山以口出山口ははは一訳出はは山山口出出向山一向山山山口問問一川
二
一

ぜ
'
聾

e

一七呈一白日目一回開刊担伺刊日凹臼咽叩羽

a
El g

E
l

EstimateC=5.71

2

剛
ヲ E E 曹 ︑ 用 銀 一 m m 側一 m 刷 服 脚

b

‑

EMalgori山 m

玉三皇室盤笠且

J主i

唱Eム

nb
ηt

179.

六六六犬犬山村犬山胃 E s t i m a t i o no fV a r i a n c ew i t h o u tUnb1inding f o rNormallvD i s t r i b u t e doutcomes byEMA l g o r i t h ma p p r o a c h , . A.L.Gou1d&W . J . S h i h t‑ t h e o r yMeth., 2 1( 10 ), 2833・ 28. 5 . 3 ( 19 9 2 ) Commum.S t a t i s. 1 9 9 8 . 3 . 6T .Kagimura r e ‑ e s t l m a t . s a s 六 D a t a s e tname % l e tds=d0103m02 , p 六 v a r i a b 1 ename % l e tvarname=d15 :n2=θ:1 ・θ , *assignmentr a t e:nl % l e ta s r = O . 5 p r o ci m 1 ; *I n i t i a 1s e t u p , , 六 d a t a s e tname use& d s ; *v a r i a b 1 er e a dfromd a t a s e ti n t oxOm a t r i x reada l lvar{&varname}i n t ox O ; , *n1:n2=8:1・θ st=&asr; s t a r t1 h ( t, xO, min1 , max1, min2, max2, min3, max3, lh1 ) ; n = n r o w ( x O ) ; mm=10; d e 1 t = ( m a x1 ‑ m i n1 ) / ( m m ‑ 1 ) / / ( m a x 2 ‑ m i n 2 ) / ( m m ‑ 1 ) / / ( m a x 3 ‑ m i n 3 ) / ( m m・1 ) ; l = { O00000O } ; ) ; d o1m1=min1t om a ¥ : 1by(max1‑min1)/(mm・1 ) ; d o1m2=min2t omax2by(max2・min2)/(mm・1 d olsd=min3t omax3by(max3‑min3)/(mm・1 ) ; ls d 2)+sum( 併( x O・ 1m1 ) # # 2+( 1 ・t ) # ( x O・ 1 m 2 ) # # 2 ) / ( 2 * l s d 2 ) ; 1 1= ( n / 2 )* l o g( 1 2 = 1 1[[ l m 1 [[ l m 2 [[ l s d [[(max1・ min1)/(mm・1 )[[(max2・ min2)/(mm・1 )[[ (max3‑ ) ; min3)/(mm・1 1 = ν ' / 1 2 ; e n d ; e n d ; e n d ; 対 付 l h1 = 1 [ 2 : n r o w ( 1 ), ] ; f i n i s hl h ; x O = x O [ l o c ( x O ,[ 1 ] ^ = . ), ] ; *I n i t i a 1e s t i m a t e * Estimatedbynorma1d i s t r i b u t i o nP 1 0 t; n = n r o w ( x O ) ; d 1寸( n, 1 , l I( n +1 ) ) ; p=cu s u m ( d 1 ) ; o b i t( p ) ; n o r=pr s x = x O ; s x [ r a n k ( s x ) ]= x O ; ヴ t ヴ t EA 唱

180.
[beta]
n
o
r
寸(
n,
1
,
1
)11
n
o
r
;
b
=
g
i
n
v
(
n
o
r
)
*
s
x
;
s
d
=
b
[
2
]
;
c
o
n
t
=
5
.
7
1
;
m1
=
b
[
1
]
‑
b
[
2J
!
c
o
n
t
;
m
2
=
b
[
1
]
+
b
[
2
]
/
c
o
n
t
;
e
s
tIma
t
=
O11m1
11
m211
s
d
;
*EMa
l
g
o
r
i
t
h
m
max=max(xO);
min=min(xO);
dif=max‑
m
i
n
;
n
=
n
r
o
w
(
x
O
)
;
doj
a
=
1t
o50U
N
T
I
L
(
s
d
̲
d
i
f
f
<
0
.
0
1
)
;
*S
t
e
pE
t
=1
/
(
1+
(
(
1
‑
s
t
)
/
s
t
)
*
e
x
p
(
(
m1
・
m2)*(m1+m2・2
*
x
O
)
/
(
2
*
s
d*
s
d
)
)
)
;
*S
t
e
pM
*N01
min1=min;
max1=max;
runl
h
(
t,
xO,
min,
max,
min1
,
max1,
d
i
f
/1
O
,
出f
,
l
h1
)
;
s
l
=
l
h1
;
s
l
[
r
a
n
k
(
s
l
,[ 1
]
)]
,=
l
h1
;
l
h
m
a
x
=
s
l
[
1,
]
;
*N02
doi
a
=
2t
o7
;
d=lhmax;
l
[
5
]
;
m
i
n
1
=
c
l
[
2
]・c
;
max1
=
d
[
2
]
+
c
l
[
5J
m
i
n
2
=
c
l
[
3
]
‑
d
[
6
]
;
m
a
x
2
=
d
[
3
]
+
c
l
[
6
]
;
min3=d[4]・d
[
7
]
;
max3=d[
4
]
+
c
l
[
7
]
;
i
fmin3<=0t
h
e
nd
o
;
i
fmax3/10000<0.0001t
h
e
n
min3=max3/10000;
e
l
s
emin3=0.0001・
e
n
d
;
runl
h
(
t,
xO,
min1
,
max1
,
min2,
max2,
min3,
max3,
l
h1
)
;
s
l
=
l
h1
;
,[ 1
]
)]
,=
l
h
1
;
s
l
[
r
a
n
k
(
s
l
l
h
m
a
x
=
s
l
[
1,
]
;
e
n
d
;
m1=lhmax[2];
m2=lhmax[3J
;
s
c
l
=
l
h
m
a
x
[
4
]
;
,
、
e
s
=
n
r
o
w
(
e
s
t
i
m
a
t
)1I
l
h
m
a
x
[
2
:
4
]
e
s
t
i
m
a
t
=
e
s
t
i
m
a
t
l
l
e
s
;
s
d
̲
d
i
f
f
=
ab
s
(
(
s
d‑
e
s
t
i
m
a
t
[n
r
o
w
(
e
s
t
i
m
a
t
)
‑
1,
4
]
)
/
s
c
l
)
;
e
n
d
;
p
r
i
n
t"
E
s
t
i
m
a
t
i
o
no
fV
a
r
i
a
n
c
ew
i
t
h
o
u
tUnblindingf
o
rNormallyD
i
s
t
r
i
b
u
t
e
dOutcomes";
p
r
i
n
t"
b
yEMA
lgorithmA
p
p
r
o
a
c
h
"
;
p
r
i
n
t
"
p
r
i
n
t"
D
a
t
a
s
e
tNam巴 &
c
l
s v
a
r
i
a
b
l
e:&varnam巴
p
r
i
n
t"Assignmentr
a
t
e
:n1:n2=e
:
1・ e e=&asr";
p
r
i
n
tne
s
t
i
m
a
t
[
c
o
l
n
a
m
e
=
{
"
S
t
e
p
""Mean1
""Mean2""
S
.
D
.
"
}
]
;
q
u
i
t
;
‑178‑

181.

参考文献 1 . Gould , A . L .a n dS h i h, WJ.( l9 9 2 ), Sample s i z er e 引 t i m a t i o nw i t h o u tu n b l i n d i n gf o rn o r m a l l y d i s t r i b u t e doutcomesw i t hunknownv a r i a n c e, Comm.i nS t a t .‑T h 巳o r yandMethods, 2 1 ( 1 0 ), 2 8 3 3 ‑ 2853 2 . Gould, A . L .( 1 9 9 5 ), P l a n n i n gandr e v i s i nt h es a m p l es i z ef o rat r i a l, S t a t .Med., 1 41 0 3 9 ‑ 1 0 5 1 J .andB r i t t a i n, E .( l9 9 0 ),The r o l eo fi n t e r n a lp i l o ts t u d i e si ni n c r e a s i n gt h ee f f i c i e n c yo f 3 . W i t t e s, t a t .Med.,96 5 ‑ 7 2 c l i n i c a lt r i a l s,S ラ 4 . Gould, A . L . (1 9 9 2 ),I n t e r i ma n a l y s i sf o rm o n i t o r i n gc l i n i c a lt r i a l st h a td on o ta f f e c tt h et y p e1e r r o rr a t e, S t a t .Med.,1 1, 5 5・6 6 W. J . , Samples i z er e e s t i m a t i o ni nc l i n i c a lt r i a l s,i nP e a c e, K( e d ),B i o p h a r m a c e u t i c a lS e q u e n t i a l 5 . S h i h, S t a t i s t i c a lA p p l i c a t i o n s( D e k k e r ),C h a p t e r1 8, 2 8 5 ‑ 3 0 1 6 . S h i h, WJ . (1 9 9 3 ), Samples i z er e c s t i m a t i o nf o rt r i p l eb l i n dc l i n i c a lt r i a l s, DIAJ ., 27)61‑761 . 7 . Herson, J .andW i t t e s, J. ( 1 9 9 3 ),Th eu s eo fi n t e r i ma n a l y s i sf o rs a m p l es i z ea d j u s t m e n t,DIAJ ., 27, 7 5 3 ‑ 7 6 0 M.AandDay , S. J . ( l9 9 4 ),I n t e r n a lp i l o ts t u d i e sf o re s t i m a t i n g sample s i z e, S t a t . Med., 8 . B i r k e t t, 1 3, 2455‑2463 9 . 仙 Sh i 出 h ,S t a t .Med.,1 42239‑2248 1 凶 t 廿 出 ho 山u tu m 江 巾 n 巾 1 b l i n 吋 凶 d i 暗 n 喝 1 g¥ w れ 、 v , h e 巴nk ∞ 巳 eyr 印e s 叩p o n s 臼e凶 1 s悶 r a t 旬eぱ ofchan 酢 ge ¥¥"引司, ヲ 1 0 .S h i h, W JandZhao, P . ( 1 9 9 7 ), D巴s i g nf o rs a m p l er e ‑ e s t i m a t i o nw i t hi n t e r i md a t af o rd o u b l e ‑ b l i n d t a t .Med., 1 6, 1 9 1 3 ‑ 1 9 2 3 c l i n i c a lt r i a l sw i t hb i n a r youtcoms, S 1 1 .G o u l d .A . L .a ndS h i hWJ.(1998), M o d i f y i n gt h ed e s i g no fo n g o i n gt r i a l sw i t h o u tu n b l i n d i n g, S t a t . ラ 恥1 e d ., 1 7, 8 9 ‑ 1 0 0 ︐ 円Mu ︐ ηa l

182.

日本 SASユーザー会 (SUGI‑J) 簡易帳票作成システム SASt oExcel 症例一覧表モデル V1.2" 藤本浩 株 式 会 社 電 通 国 際 情 報 サ ー ビ ス 81コンサルティング部 Easy‑to‑use"r e p o r t i n gsystem,WindowsSASSystemt oMS‑Excelr e p o r t i n gformmodel V e r s i o n l . 2 H i r o s h iF u j i m o t o I n f o r m a t i o nS e r v i c e sI n t e r n a t i o n a l‑Dentsu,I t d . o n s u l t i n gDepartment SystemI n t e g r a t i o n& C 要旨 昨年発表した症例一覧表を労せず作成できるツールに僅かながら手を加えたので報告 させて頂く。論文に関しては始めてこのツールを目にする方を考慮し、内容によっては 昨年の論文と同様の情報を掲載しである。 キーワード Windows版 SASシステム、 MS‑Exce197、DDE通信 1 . はじめに 現在では一般化しつつある SASから E x c e lへのデータ送信であるが、毎回オーダーメイドの フ。ログ、ラミング、で実現するには手聞がかかりすぎるc そこで一咋年は SAS で簡単なパラメータ を指定すれば Excelへ自動で罫線付きのクロス表を作成するツールを開発した c 今回は去年発表した、臨床開発業務で最も苦労されると思われる症例一覧表(や、その他 の帳票類)の作成を簡単に実現で、きるツーノレのバージョンアッフ。を行った c 2 . 設計思想 この症例一覧表モデ、ノレは、一昨年のクロス集計表作成モデ、/レとは逆転の発想をしている C 前回は大量のクロス集計表、しカも場合によってはカテゴ、リ内容が違う等で全ての帳票のレ イアウトが異なる場合を想定していたので、 SAS のプログラム形式を取ったパラメータを指定・ 実行すれば Excel上に自動で、成形された帳票を作成する方式を取った c しかし今回は、一覧表等のレイアウトに関する要求がシビアな物を対象としており、その指定 をパラメータ形式で対応するには限界がある2 そこでこのモデ、ルで、は、 Excel上に完成形のレイアウトを作成しておき、データを埋め込みた いセルに SASの変数名を記述するだけで目的に達するような設計を施しているc ‑181

183.

3 .仕 様 今回の症例一覧表モデ、ルの仕様(要点)は以下の通りであるc .レイアウト作成は 1症例分だけでよい 一歩全症例分作成する手間は必要ない f l字位置,セル内で、の折り返し,ニレザーフォーマ ・セル内の形式(フォント種類・サイズ, F ット他)は E x c e lで指定した通りにデータが出め込まれる →データが埋まった後に修正・成形作業会しなくてよい ・同じ表に対して複数回実行した場合、実行回数分だけシートを自動で作成する 帳票作成の履歴が 1 つの E x c e lファイルに自動で管理できる → 1 ・デ、ータセットにない変数が指定された場合、エラーセノレ部分を赤色にし、実行も即座に 中断する →エラー時の修正対応が即座に出来る ‑症例毎に行数が可変になる帳票(併用薬個数分レコードを起こす等)を簡単に作成する →対応に最も苦労する部分こそツールで、カバーし、業務効率を引き上げる ・フォーマット化指定されている変数は自動で変数変換する →わざわざ新たなデ、ータセットを作成する必要はない •E x c e l9 7で、可能になった「セル結合」されたセルにもデータ送出可能とする →新たなプログラミング、テクニックを利用して実現 4 . /¥‑ジョンアップ 今回行ったバージョンアップは以下の2点で、ある c 1.指定可能な変数の上限増加 →今まで1 シートに 99変数まで、しか扱えなかった所を 999変数まで、使用可能とした 3 2 .内部ロジックのチューニングナ 5 .最後に DDE通信等の技術に関しては、一昨年発表の論文と何ら変わりがないので割愛させて 頂く。今回目指したのも本当に必要とされるツールの開発・改善であり、今まで、 CRO業務で 培ってきた経験やノウハウを如何に具現化させることが出来るカも、テーマのーつであったc お世話になった関係各位にこの場で、感謝の意を申し上げる c 問い合わせ先 E ‑ m a i l:ci a o .f u ji moto@ni f t y .n e .j p FAX:03‑5322‑5849 TEL:0 3 ‑ 5 3 2 2 ‑ 5 8 3 1 ‑182

184.

日本 S A Sユーザー会 (SUG I‑J) SAS/lntrNetを活用した臨床試験解析報告書作成の試み 。矢島 勉、水留 稔、萩野篤司、舟喜光一 医薬開発部 持田製薬株式会社 DevelopmentofStatisticalAnalysis ReportsforClinicalTrialsbySAS/lntrNet Tsutomu Yajima,Minoru Mizutome,Atsushi Hagino,Koichi Funaki Biostatistics & Clinical Data Management Section MOCHIDA PHAMACEUTICAL CO.,LTD 要旨 SAS を多用して臨床試験の解析報告書を作成しているが、多数のプログラム及び膨大 な資料を効率的に整理することは容易ではない。 SAS/lntrNet を利用して報告書を作 成し、ブラウザで参照するシステムの構築を試みたので報告する。 キーワード: SAS/lntrNetソフトウ工ア、臨床試験、解析報告書 1.はじめに SAS/lntrNetは 、 Webパブリッシンク"ツーノレとして HTMLフォーマッタ機能 (HTMLデ ータセットフォーマッタ:%DS2HTMマクロ、 HTMLアウトプットフォーマッタ:%OUT2HTM マクロ、 HTMLテーブルフォーマッタ:%TAB2 HTMマクロ)及び Web用グラフィックの作 成機能を備え、さらにダイナミック Webアプリケーションとして、 Webブ、ラウザから SASアプ リケーションサーバーに対してリクエストを発行し、結果をブラウザに表示するコンピュートサ * ービス機能、及び Webフーラウザから SAS/SHARE NETサーパーに対してデータ照会 のリクエストを発行するデータサービス機能を備えている。 この SAS/lntrNetの Webパブリッシングツーノレを用いて臨床試験の解析報告書に使用 する日 T M Lファイノレを作成し、ブラウザで参照する報告書システムの構築を検討した。本 論文では試作した解析報告書システムの特徴及び問題点について述べる。 ‑183

185.

2 . SAS/lntrNetの Webパフリッシングツール使用例 以下に使用例を示す。なお用いたデータは次のとおりである。 UHVKLUGE FTTVGKEY 62571534 11111111 12345678 投 与 後 GOT 投 与 前GOT 4Eqι 唱EtEn41an4 寸l イ ニ シ ャ Jレ 31462417 NO <使用例 1>: HTMLデータセットフォーマッタ (%DS2HTMマクロ) HTMLデータセットフォーマッタは SASデータセットの内容を表形式で表示する H T M Lファイルを生成する SASマクロである。条件によるデータの抽出や任意の変数の合計を 求めることもできる。 , もd s2htm(htrnlfile=c:¥temp ¥tds.htm openmode=replace, data=tdats, brtitle=test2 dataset formatter add label, labels= y , runmode=b) プログラムに記述されているマクロ引数 HTMLFILE :作成する HTMLファイルのパス OPEN~νIODE :出力モード(置き換え :REPLACE、追加 :APPEND) DATA :HTML化する SASデータセット名 BRTITLE ブラウザウインドウのタイトルパーに表示するテキスト LABELS 変数ラベルの使用の有無(ラベル使用 : Y、変数名使用:N) RUNMODE 実行モード(パッチ形式:B ) N O r‑イニシャル 1 2 3 4 5 6 7 8 F U TH TV VK GL K U E C YE 「吾事前GOT‑‑ 投与後 G O T r 1 3 2 1 1 4 1 6 2 2 1 4 2 1 1 7 1 6 1 2 1 5 1 7 1 1 1 5 1 3 1 4 図 2‑1 SASデータセットをもとに %DS2HTMマクロにより作成した例 ‑184‑

186.
[beta]
<イ吏用O"
I
J
2
>:HTMLアウトプットフォーマッタ (%OUT2HTMマクロ)
日TMLアウトプットフォーマッタは、 SASプロシ、ジャの出力を取り込み、 HTML
ファイル

を生成する。
もo
ut2htrn(capture=on)

proc print data=tdats noobs label;
var no ini pregot aftgot;
runi
もo
ut2htrn(htrnlfile=c:¥t
e
r
n
p¥tout.htrn,

brtitle=test3 output forrnatter,
hsize=‑l,
capture=off)

プログラムに記述されているマクロ引数

CAPTURE
HSIZE

テープ、ルフォーマッタの取り込み開始 (ON)/終 了 (OFF)
:フォントの大きさ

F‑
ーーーー

万三f
凡な3

積層調眠却

・
λ

凶ー

聾勲切

手嘉手言語

金~ξ子毛差是 GOT
4

4
4
4

4
4

4

・・・・・

62571534

31462417
12112121

12345678

金~ξ子官官 GOT

UHVKLUCE
FTTVGKEY

イ 二 二 シ ャ Jレ

ー
ー
ゾャγ 7.~:: :::.2Q~m~内面副 Ö'"

・・
・
・・
・・
・・
・
・・

NO

ー‑ー

図 2 ‑2 PROCP
RINTの出力をもとに %OUT2卜ITMマクロにより作成した例

<イ吏用例 3>: HTMLテープ、/レフォーマッタ (%TAB2HTMマクロ)

HTMLテープ、ルフォーマッタは TABULATEプロシジャの出力を取り込み、 HTMLフア
イノレを生成する。
もlet r
nyfc="02030405060708090AOBOC"X;
もt
ab2htrn(capture=on,runrnode=b)

proc tabulate data=tdats forrnchar=&rnyfc;
table (PREGOT aftgot ) * ・
( N' 't但 AN・ 'STD');
var PREGOT aftgot;
run;
もt
ab2htrn(capture=off,

runrnode=b,
openrnode=replace,
htrnlfile=c:¥t
e
r
n
p¥ttab.htrn,
brtitle=test5 table forrnatter,
center=y)

‑185

187.
[beta]
プログラムに記述されている %letmyfcは表の罫線の種類を指定している。
プログラムに記述されているマクロ引数
出力のセンタリング (Y/N)

CENTER

j
括主 ξ 手盲苛 G O T

i 括を ξ 軍L筆
書t G O T

1N.
.
.
.
.'.!MEAN!STO'1.
.
.
.
.
.
.
.
.
.
.
N
!
M
E
A
i
'
J
!
S
T
O
!8~σOr:f7~ 己主 51己主.6 語 iã~'6oT '
l4~'1"3、;云 .03

図 2‑3 PROCTABULATEの出力をもとに %TAB2HTMマクロにより作成した例

<使用例 4>:Web用グラフィック作成機能

GIF、JPEG、PSなど Webで、使用できるイメージファイルを作成するグ、ラフィックドライバ
が用意されている。
filename ftst '
c
:¥temp
¥tgi
f.htm';
goptions device=gif
cback
=w
hite
ctext=black
gsfmode=replace
htext =1
gsfname=ftsti
proc gplot data=tdats;
plot aftgot *pregot;
runi
goptions reset =a工工;

プログラムに記述されている GOPTIONSの DEVICE でグラフィックドライバを指定
する( device=gif 。
)

25

2D

+
++

+
.
..
.

マ魁 15
ιト

ー
十

e
s 1D

卓

。

。

10

15

2D

25

投与前

図 2‑4 PROC GPLOTの出力をもとに Web用グラフィックにより作成した例

1
8
6

188.

3. システム構築の経緯 総括報告書ガイドライン ( 1CI ‑ ト E3)に従い SAS を利用して臨床試験の解析報告書を作 成している。その結果、多数のプログラム及び膨大な量の資料が発生している。従来より一 定のディレクトリー構造を用いることによりコンビュータファイルを管理している。しかしなが らこの方法では作る側には効率的な整理に時間がかかり、また見る側には効率的な参照は とても大変であった。 そこで、(1)資料の整理が簡単で参照も容易なシステムが必要である、 (2)HTMLのブ ラウザを使いこなせる人が増えてきた、 (3)ブラウザで参照できる解析報告書を作れば必要 な資料を探す時間が短くできるのではなし、かと考えた。その結果、図 3‑ ‑1に 示 す 報 告 書 作 成・参照の方法を考えた。 SAS SAS/lntrNet ワーフ。ロファイ jレ 表計算ファイル データベース 議 " ' ホームページ ビルダ‑ <見る側> Webブラウザ A c r o b a tR e a d e r 〆 図 3‑1 ‑187 <サーバー> i I 文書 表 グラフ プログラム

189.

4. 解 析 業 務 の 流 れ 室 田 、 F 画書 験解 計画 施iV計iv 実析 治 図 4‑1に解析業務の流れを示す。 レ ミ 確認用解析 Lパ トム士‑一一日臥 J > z r r 一室田 国営一告 同析一橋 解解一締 <︑ ←眼 iv転 亨 捌 解析 図 4‑1 解析業務の流れ 解析計画書は主として「治験総括報告書作成の手引(日本製薬工業協会)Jを参考にし た帳票イメージ及びグラフイメージで構成されており、作成には表計算ソフトを用いている。 解析報告書は、治験の概要、解析計画書、解析計画書変更記録、解析プログ、ラム、確認用 解析プログラム、解析結果、確認、用解析結果、打ち合わせ議事録などで構成されている。 なお、解析プログラムから得られた結果と確認用解析フoログラムから得られた結果とを比 較することにより整合性を確認し、解析結果の信頼性を保証している。 ‑188一

190.
[beta]
5
. 解析報告書システム(デモンストレーション)
.
:
P
"
r
O
.
.
.
.
c
;
.
町 内 配 晴1
'W

ヲr
l
a
空
事
i
'
:
l
C量軍主義革切怜

解析報告書
試 験 名 : MOl 同等性試験
ー

lmg錠と O.5mg錠の血中濃度測定試験

ブロトコール奮号 :
M01‑00l

ι

需品『盟主Ul
;J;孟金量孟霊圭呈畳止血

F
‑
‑
‑
‑
‑
,
‑

i
1sV 寝耳目:S>i 翫(!{).y~:i)'{W 診がh崎山 1 "
I
f
.
!
'
!
l
lT

目次
‑この報共婁4
与野るT
子め(;

:閉す工

• 3 益計三~Ílそr1守法論

.
ι盤猛亙函茎

.市鶴聖書持肉容

之軽量"171,

民盟圃E

田園園田』由回目園田園・

,
J
j

7
1
ゅ の 編 集 己 表 手 段)
}
'
/
t 有

8
.解 析 結 果
解析計画書にもとづく解析について
解析報告表部分
解析報告グラフ部分

一一

:M'樟撞2
即時柑柿別回世叩醐制証言'''''

"
20

組出HS

G N 一川

JV

T 刊刈
05';

後日 M
与 M1

投 N∞

︒

n
u

一泊付剖

似

︒
︒
一 河 一6
TMU3
一

一品開旺口

一与均

投 NU

一

ìlイMD'.鉱~U 務政政外.Jj・自国空局開閉‘同i防効,1'<t!~

も+

,
一
+

1
0

投与前

‑189‑

"

20

+

"

191.

6. 解 析 報 告 書 シ ス テ ム の 利 点 解析報告書システムの利点として、作る側にとっては報告書の構成を HTMLファイルで 記述できること及び予め設定した位置に簡単にファイルをリンクできることがあげられ、見る 側にとってはファイルがリンクされているため必要とする資料に容易にたどり着けることがあ げられる。 7. 結 論 解析報告書の一つ形態として、 HTMLファイルで報告書を作成し、ブラウザで必要な資 料を容易に参照できるシステムを試作していた。しかしながら S AS/lntrNet がないときに は SASで解析した結果を納めた HTMLファイルをすぐに作成できず、 ファイルの作成作 業に時間がかかったの 今回、 SAS/lntr N e tの Webパブリッシング、ツールを用いることにより、 SASプログ、ラム に取り込み対象及び取り込み先を書き込め、そのプログラムを実行することにより SASで解 析した結果を納めた HTMLファイルをすぐに作成できるようになり、作業が容易になった。 現在この試みを実際の解析報告書に応用している。 今後、解析報告書の作成をさらに自動化するために、表計算ソフト及びワープロなどで 作成している部分も、 SASプログラムで記述できるようにする予定である。 (参考文献) 1 ) 第 12回プログラマーズワークショップ配布資料( SAS/lntrNet ソフトウェア概要、 SAS/lntrNetソフトウェアハンズオン資料、 SAS/lntrNetソフトワェアインストー ルと設定方法 Windows 版) 1 9 0

192.

日本 SASユーザー会 (SU̲GI‑J) 臨床試験集計解析システム [CL lNCL]の紹介 山本典子 システム企画部 有限会社アーム I n t r o d u c t i o nt ot h eD a t aA n a l y s i sSystem CL lNCL"f o rC l i n i c a lS t u d y N o r i k oYamamoto SystemP l a n n i n gD i v i s i o n .ArmC o r p o r a t i o n 要 旨プログラミングを必要とせず、オペレーションのみで臨床試験の集計解析結果の帳票を作成す lNCL]をSAS/AFを使用し作成した。今回は、システムのひとつのプロダクトとして、 るシステム [CL の集計 臨床試験の集計に不可欠であり、また、ある程度帳票の形式が定型化しやすい「患者背景 J 解析の帳票作成を例にとってシステムの概要とそのシステム構成を紹介する。 i c r o s o f tE x c e l、履歴管理 キーワード:臨床試験、患者背景、 SAS/AF、ノフトウェア、 GUI、M 1 . 開発の背景 臨床試験データの集計解析では、患者背景、有効性、安全性および臨床検査値などの時経列デー で集計解 タの集計解析などが頻繁に行われている。多くの場合、これらの集計処理を行う際には、 SAS 析プログラムを作成し、その結果をEXCELに転記、あるいは DDE機能を利用し EXCEUこ出力して、帳 票を作成していた。これらの作業は手聞がかかる上、転記操作やEXCELでの作業の際に人為的ミスが 発生することが懸念され、それらのチェックにも膨大な時間を要した また、データや集計条件などの変 O 更などで帳票の再出力が必要な場合、集計条件内容の変更やその日時などの履歴の管理にもかなりの 神経を使う必要があった。そこで、蓄積されたブ'pグラムを GUIを利用したシステムに組み込むことによっ て、最小限のオペレーション操作で集計解析や1長票作成処理が行えるシステム、および、集計条件など の変更の内容や日時などの履歴管理を行うことのできるシステムの構築を目標に臨床試験集計解析シス テム [CLINCL]の開発を試みた。 ‑191

193.

2 .システムの概要 当システムは、集計対象となる SASデータセットをもとに、 GUI上で集計項目名、項目毎の検定手法 の選択、値の範囲指定(カテゴリー化)などを行い、実行ボタンをクリックすると、 EXCEL 上に自動的に帳 票を出力することを特徴とする。今回、当システムのプロダクトの一例として「患者背景」の集計解析の帳 票作成を紹介するが、その具体的な処理の流れは以下のようになる。 ①システムを起動し、画面上の指示に従って集計対象となる SASデータセットを指定するとデータセ ットに含まれる項目名の一覧と検定手法のチェックボタンなどが表示されるので、集計を行いたい項目名 の選択、出力する項目の順序指定、値の範囲指定(カテゴリー化)、項目毎の検定手法 (χ2 検定、 F i s h e rの直接検定、 U検定、平均、標準偏差など)の選択をマウス操作で行う c ここで指定された項目名、 りなどの情報は、自動的に<処理ファイル>として保存され、この保存された 値の範囲指定(カテゴリー 1 に出力さ <処理ファイル>の情報をもとに集計および検定が実行され、目的の帳票が自動的に EXCEL れる。 z c 集計条件を変更したい場合は、以前に作成された<処理ファイノレ>を GUI上に再表示させて、項 目名の追加・削除、値の範囲指定(カテゴリ 化)の変更、検定手法の変更などを簡単に行うことができる。 変更された<処理ファイノレ>は上書き保存、または別名での新規保存が可能で、同時に保存(変更)日 時も<処理ファイル>に記録される。 ③データが変更された場合でも、以前に作成しておいた<処理ファイノレ>の情報をそのまま利用でき るので、実行ボタンをクリックするた、けで、以前と全く同じ処理を自動で行うことができる。 上記の 3つの処理は、それぞれ①新規作成モード②修正モード③再生モードとし、オペレーションで 簡単に選択できるようにした。また、保存された<処理ファイル>を利用し、集計対象データ名、集計項 目名、値の範囲指定(カテゴリーイじ)、項目毎に選択された検定手法名、処理ファイルの作成(保存) へドキュメントとして出力する機能を付加し、履歴管理の一助として 日時などの情報を EXCEL f 吏用できるようにした。 その他の機能として、帳票作成の出力様式を、数種類の中から選択できるようにした。「患者背景」の 集計は、ある程度帳票の形式が定型化しやすいが、固定の出力では満足できない場合が多い。したが って、数種類の出力様式を組み込んでおき、必要な様式の種類をオペレーションで、自由に選択できるよ うにし、その選択された出力様式の番号も<処理ファイノレ>に自動保存できるようにした。また、独特の の帳票の形式が必要な場合、追加様式の設定も容易にできるようにした。 ‑ 1 9 2

194.

一要一 一概一 一ム一 一テ一 一ス一 一 ︑ ン 一 ‑193一

195.

3 .システムの構成 当システムは簡単な SASプログラムの組み合わせで構成されている。当システムが内部で自動的に 行う処理は以下のようになる。まず、集計解析処理を行う前にあらかじめ GUI上で指定された<処理ファ イノレ>の情報をもとに項目の選択処理が行われる(右図内 * A)。選択処理後のファイルは、頻度集計用 i s h e rの直接検定用ファイノレ・ U検定用ファイノレ・要約統計量用ファイルな ファイル・ χ2検定用ファイノレ・ F どに分類され、それぞれ検定処理を行う項目だけが含まれる(*B)。それぞ、れのファイルで、それぞ、れの 検定処理が実行され(*C)、最後に全ての検定結果ファイルを連結させ<処理ファイル>で、指定された 項 目l 慎にならべかえて (*D)EXCEL に帳票として自動出力する(*E)。 このような、ンステムの構成のメリットとしては、検定処理を行う前にあらかじめ必要な項目のみのファイ ルを作成することによるパフォーマンスの低下防止、および新しい手法の追加が発生した場合の新手法 用のフ。ログ、ラムのシステムへの組み込みの簡便さなどが挙げられる(*F)。 1 9 4一

196.

セ ノ 々 門 ¥U ︺ ア A 門 ¥U み H ' ←刈 4 象 集 日 システム構成 オベレーションで設定された く処理ファイル>の情報 項目名<群> 出力様式 2 け一図口図図 別項目 F i s h e rU 平均 図口口 口口図 口図口 口図口 *F ~ ‑ ‑ ‑ ‑ i 検定手法などを ー・;追加する場合 χ2検定の結果 F i s h e rの直接検定の結果 平均などの結果 χ2検定の結果 U検定の結果 χ2検定の結果 U検定の結果 己 工コプログラム ファイ jレ ‑195‑

197.

4 .まとめ 当システムの利点としては、 i)SAS システムとMS‑EXCEL のみで構築され、 GUI上でのオベレー ションのみで処理が実行できること、五)したがって、オペレーション操作以外の人為的ミスがなくなること、 日)オPテレーションの設定情報はすべて<処理ファイノレ>に記録されるため集計条件や処理日時の履 v )<処理ファイノレ>の再利用により作業が効率化することなどが挙げられる。 歴が残ること、 i 当システムは、社内において実業務で使用しており、社外の数社でもテスト使用中である。その中でG UIの操作性の向上、検定の追加、値の範囲指定方法の種類の拡張などの要望もあり、改善すべき点が 残されているが、当システムの利用により業務の効率化が実現している。 ‑196一

198.

日本 S A Sユーザー会 (SUGI ‑ J) 臨床試験データ管理における データ出力プログラムの汎用化 言井時秋 IBRD JAPAN 株 式 会 社 臨床開発本部 臨床開発品質管理室 DMグループ Increasing Inter‑Project Usability of Data Output Programs within Clinical Data Management Tokiaki Y0 shii Quality Control, C IinicaI Research IBRD JAPAN Corporation 己目 要 弊 社 で は 、 リ レ ー シ ョ ナ ル 構 造 を 持 つ 複 数 の SAS デ ー タ セ ッ ト か ら 症 例 一 覧表、読合せ用データ出力等を簡単に作成するためのプログラム(マク ロ)を使用し、業務を行なっている。本論文では、作成の経緯と特徴につ いて紹介する。 キーワード: Base S A S ソフトウェア、 マ ク ロ 言 語 、 D D E 通 信 1.はじめに IBRD JAPAN で は 、 臨 床 試 験 デ ー タ を 治 験 実 施 計 画 書 毎 に リ レ ー シ ョ ナ ノ レ 構 造 を 持 っ た 複 数 の SAS デ ー タ セ ッ ト を デ ー タ ベ ー ス と し て デ ー タ 管 理を行なっている(図 1) 。 こ れ ら の デ ー タ セ ッ ト か ら 直 接 正 確 な 一 覧 表 等 を作成するためにマクロ言語を用いてプログラムの汎用化を行なっている。 これは、プログラム作成の効率化のみではなく、出力データのパリデーシ ョンのためにも重要と考えられる。 出力プログラムの構造は、①リレーショナル構造の複数のデータセットか ら l 症 例 l obs の デ ー タ セ ッ ト に デ ー タ を ま と め る た め の Base SAS ソフ ト ウ ェ ア マ ク ロ 、 ② デ ー タ を テ キ ス ト ま た は MS‑Excel に 書 き 出 す プ ロ グ Qd 1ム ウー

199.

SUB‑1 臨床データ SASデータセット MAIN 臨床データ SASデータセット SUB‑2 臨床データ SASデータセット 一一寸 MAIN フォーマット SASデータセット SUB‑3 臨床データ SASデータセット ••• 一」 SUB‑1 フォーマット SASデータセット 1 SUB‑2 フォーマット SASデータセット SUB‑3 フォーマット SASデータセット 図 1 ••• 「 S A Sデ ー タ セ ッ ト に よ る リ レ ー シ ョ ナ ル デ ー タ 構 造 ラ ム お よ び ③ MS‑Excel VBA 7. 0の マ ク ロ に よ る 出 力 書 式 等 の 加 工 プ ログラムとなっている。以下にそれぞれの部分の詳細について説明する。 2.Base SAS マクロ リ レ ー シ ョ ナ ル 構 造 の 複 数 の SAS デ ー タ セ ッ ト を 一 つ の l 症 例 l obs の デ ー タ セ ッ ト に ま と め る の が 本 部 分 の 目 的 で あ り 、 システムのコアとなる。 弊社のデータ管理システムは、データセット名から治験実施計画書毎の データ構造およびおおまかな内容(疾患デー夕、薬剤データなど)が判別 出 来 る よ う に 作 成 さ れ て い る 。 そ の た め 、 こ の 部 分 の プ ロ グ ラ ム ( 図 2)は ①関連データセット名を取得し、該当するフォーマットテーブルからフオ ー マ ッ ト を 作 成 す る マ ク ロ ( 図 3) 、 ② 読 み 出 し に 必 要 な パ ス ワ ー ド お よ び 出力範囲の入力を促すプログラムおよび③各データセットを症例毎にまと め 、 メ イ ン デ ー タ に m erg e す る マ ク ロ ( 図 4 )よ り 構 成 さ れ て い る 。 1 9 8

200.

読 合 せ 用 入 力 デ ー タ 出 力 の 場 合 は 、 デ ー タ を 1つ の デ ー タ セ ッ ト に ま と め た後は、 put ス テ ー ト メ ン ト で デ ー タ を テ キ ス ト フ ァ イ ル に 出 力 す る 簡 単 な プログラムを作成する。しかし、症例一覧表のように表計算ソフトの機能 が必要な場合には、さらに下記のツーノレを使用したプログラムを作成して いる。 一一一一ー一一一一一一一一 l 一一 一一~ 1 ー プロジェクト別データセット完J Iフォーマット データよりフォーマットを作成する パスワード及び出力範囲の入力 リレーショナル構造 S A Sデータセットを 1症例 10 b5 データセットへ変換 「一一一一一一一一一一一一一一‑, 文でファイルへ出力い h u t MS Excel レイアウトシート MS Excel V B Aマクロ S A Sからマクロを I : 実行し、外見を整える│; 症例一覧表作成 プログラム 図 2 臨床試験データ出力プログラムの流れ 1 9 9一 読合せ用出力 プログラム

201.

﹂ ︒ P 山 4 h p l ﹄町 h p H吋MmlmP 世 川 f守W ロh 4h'pl ﹄町h‑R4h'NTMmlnp‑R4bHn メインデータ セット I 区 ︒ ‑ 一 司 一 一 一 l すツ表 る附朝関叫 応セド 対タ一 に一コ トデカ ット入 セツ( タマる 一一す デオ在 各フ存 ω︽冨 図 3 サブデータ セット サブデータ セット J y p ef i n t n 釘n e s t a r t l a b e l t p r o cf o r m a tc n t l i n = . . . ; r u n ; フォーマット作成マクロ A フォーマット 一 一 一 一 一 一 一 一 一 一 一一二一 録制どム h'NTMml ト ω D D F 一色州hF W4PNTMmlhpω ︽ ω 州市崎容﹂﹁'hmふ│ム﹁‑ サブデータセット 三二' r‑ 及び連絡 回 醐 轟 症例番号毎に 転置 ( t r a n s p o s e ) ぽ ︒ 1‑ 1 A 1 A2 A3 2‑1 襲 撃 元へ分割 A 1 1 A12 A13 A 2 1 A22 A23 A 3 1 A32 A33 ω︽冨 2‑1 一 一 一 一 一 一 一 一 一 一 一 ー 一 一 一 一 ー ー メインデータセットと 症例番号で結合 ( m e r g e ) │メイン 1‑1 2‑1 塁 l A 1 1 A12 A13 A 2 1 A22 A23 A 3 1 A32 A33 8 1 1 812 813 8 2 1 822 ̲ 一 ー ー ー ー ー ー 一 一 ‑‑ ‑ 一 ー ー , ー ー ーーー・ー一一ーー・ーーーー一一一ーーーーー‑‑一一一一 』ー 図 4 複 数 デ ー タ セ ッ ト を 1 症 例 1 0 b sの 一 つ の デ ー タ セ ッ ト へ 変 換 す る マ ク ロ 一2 0 0一

202.

3.CATS1 R2.14A バ ッ チ 機 能 を 組 み 込 む DDE通 信 関 連 は 、 CATSR2.14Aの パ ッ チ 機 能 を 利 用 し て い る た め 、 特 別 な プ ロ グ ラ ム を 作 成 す る 必 要 は な い 。 MS‑Excelの ワ ー ク シ ー ト 上 に 出 力 し た い SAS デ ー タ セ ッ ト の 変 数 名 と 出 力 フ ォ ー マ ッ ト を 指 定 し た レ イ ア ウ ト シ ー ト を 予 め 作 成 し 、 プ ロ グ ラ ム 中 に CATS を 利 用 す る た め の パ ラ メ ー タ を 指 定 す れ ば 、 デ ー タ が MS‑Excel へ 出 力 さ れ る 。 4.MS‑Excel 7.0 VSA によるマクロ 出 力 書 式 等 の 加 工 が 必 要 な 場 合 は 、 デ ー タ を 出 力 し た 後 、 SAS 側 か ら DDEで 同 レ イ ア ウ ト シ ー ト 内 の MS‑Excelマ ク ロ を 実 行 さ せ て い る 。 こ の 加工とは、罫線の追加や書体の変更等でデータの変更は行なっていな し 、 。 5 .終 わ り に 基本的な部分のマクロ化により、データ出力プログラムの作成に要する時 間が大幅に短縮された。データ定義書、入力基準書等の作成プログラム のマクロ化も着実に進んでおり、ロジカルチェック仕様書の様な悩むべき タスクにより多くの時間を費やすことが可能となった。 今後の課題はロジカルチェックプログラム等の基本部分のマクロ化による 汎用化であるが、各治験問で変数名を統ーする方向で対応したいと考え ている。 ICATSは ( 有 ) 電 助 シ ス テ ム ズ の 症 例 一 覧 表 作 成 用 ソ フ ト ウ ェ ア の 商 品 名 ‑ 2 0 1一

203.

日本 S A Sユーザー会 (SUG I‑J) SAS Pharma Technology Process ークリ二力 jレ・データウェアハウスと SAS/PH‑CIini caIソフトウェア Pet日 rVillers*、LeeEvans*、0鈴木真弓(訳)林 * SAS Institute I n c . PharmaHealth Technologies ** SASインステイチュートジャパン マーケティング部 SAS Pharma Technology Process ‑ C l i n i c a l DataWarehouse and SAS/PH‑CIi n i c a l Software a y u m iS u z u k i~ranslation)** Peter V iII ers*、LeeEvans*、M * PharmaHealth Technologies SAS Institute I n c . ** Marketing D e p t . SAS I n s t i t u t e Japan L t d . 要旨 クリニカルデータの現在おかれている環境や問題の一つのソリューションとしての Pharma Technology Process について述べると共に、その核となるテクノロジーであるクリニカル・データウ i l l e r s エアハウス及び SAS/PH‑Clinical、ノフトウエアの概念について解説する。尚、本論文は PeterV による " C l i n i c a lDataWarehouse"及び、 LeeEvansによる"l . m p l i c a t i o n so fSASPharmaTechnology Processf o rI n d u s t r y "の論文及び資料の一部を翻訳したものである。 キーワード: クリニカルデー夕、データウェアハウス、 SAS/PH‑Clinicalソフトウエア 1 . はじめに 米国 SASI n s t i t u t e 社には PharmaHealthTe c h n o l o g i e s (以下 PHT) と呼ばれる部署がある。ここで は専門のスタッフにより、新薬開発のプロセスが現在抱えるさまざまな問題に対する SASシステム のソリューションを提供している。本論文では、 PHTが提案しているクリニカルデータをよりスムース に分析、レポート、文書化するための一連の流れである PharmaTechnologyProcess とその核とな るテクノロジーであるクリニカル・データウエアハウス及び SAS/PH‑Clinical ソフトウェアの概念につ いての翻訳である。 ー 203‑

204.

2 . クリニカルデータの流れとそれに付随する問題点 2 . 1 クリニカルデータの流れ l i n i c a l クリニカルデータの流れは、 CRF(ケース・レポート・フォーム)に記入されたデータを、 Oracle C や C l i n T r i a l に代表されるような CDMS(クリニカル・データ・マネジメント・システム)へと入力されると ころからはじまる。データベースとして保存されたデータは次に分析及びレポーテイング環境で使用 される。ここでは、データの参照機能や、統計解析ツー jレ、またはレポーテイング 言語が使用される。 そして最終的に分析及びレポーテイングの結果を文書管理システムへ送り、 NDA(New Drug A p p l i c a t i o n )の準備段階となるのである。 C l i n i c a lD a t aP r o c e s s クリ二力ル・デ-~. マネジメント・システム 分析&レポーテインク 環境 文書管理システム &NDA準備 図 1 クリニカルデータの流れ 2 . 2 クリニカルデータの流れが抱える問題点 前述した流れに沿ってデータを利用する際には、現状ではさまざまな問題点があげられている。図 1 肉で~.~として表現されているのは、ボトルネックとされている個所で、ある。以下はそれぞれ段階 にある代表的な問題点である。 CDMS(クリニカル・データ・マネジメント・システム) 変数を抽出し、付加価値データの作成に限界がある データを直接分析する事が難しし、 分析&レポーティング環境 プログラムを利用して抽出した変数に整合性がとれないケースがある 分析するデータセットを管理するのが難しい。バリデーションなどの目的のために CDMS のデータへ戻るのが難しい ユーザーがデータ及びデータセットの連結に対する豊富な知識を持つ必要がある ユーザー聞で分析やレポートを共有するのが難しい スタディを超えてオフ ジェクトを使用する際に必ず オブ ジェクトを修正する必要がある 一般イヒされたレポートのフォーマットがない ‑ 2 0 4

205.

アウトプットを元となったコード、ログ、デー夕、クエリーなどを関連づけることが難しい。 文書管理システム &NDAの準備 モDMSへのレポートの登録は手作業で行なわなければならない レポートがアップデートされたとき!こ EDMSもアップデートされるというメカニズムがない レポートを作製する際のアウトプットのフォーマットが統一されていないために、プログラム 面での拡張を難しくしている コードとログ、アウトプットの連携をさかのぼることが難しい。加えてスタディやサブ、セット、 実行時間、どのバージョンのデータセットが使用されたか、などの情報も記述しておく必要がある ため余計な時聞がかかる。 3 . SASPharmaTechnologyProcess 前章にて解説したとおり、現在のクリニカルデータ・プロセスではさまざまな種類の問題を抱えてい る 。 SASPharmaTechnologyProcessは、そのほとんどの問題が解消するために考えられたプロセ スである。 SASPharmaTechnologyProcess 分析&レポーティング クリニカル・データ・ マネジメント・システム ク1 )二力ル データウェア1¥ウス SAS/PH・ C l i n i c a l ソフトウェア DLi 21 文書管理システム &NDA準備 環境 文書管理システム &NDA準備 図 2 SASPharmaTechnologyProcess まず、 CDMS に貯えられたデータから、クリニ力ル・データウヱアハウス(次章にて概要を解説)を作 成する。 CDMS とクリニカル・データウヱアハウスの聞には、リンク (OC士 INK)を張り、データをロード する。一方、クリニカル・データウヱアハウスで管理されているデータは SAS/PH‑Clinical 、ノフトウヱ ア(次々章にて概要を解説)において分析及びレポーテイングが行われ、最終的に文書化する際に は、専用のインタフヱース (DLI)を通して文書管理システムへ自動的に情報をロードする。このように、 ‑205

206.

整備された環境でクリニカルデータを利用することにより、今まで、障害となっていた部分を取り除き、 より効果的で正確なデータ活用を行なう事が出来るようにするのである。 4 . クリニカル・データウェアハウス 図 2にあるように、 SASP h a r m aTe c h n o l o g yP r o c e s sの中で重要なテクノロジーの 1つが、ク 1 )ニカ ル・データウェアハウスで、ある。これは、一般企業において既に実践されているデータウェアハウス A S / P H ‑ C l i n i c a lソフトウェア聞の問題を解 をクリニカルデータに応用することにより、 CDMSから S 決する、と~\うコンセプトである。データウェアハウスとは、一般に基幹系システムにあるデータを意 思決定を行なうために整理し、エンドユーザにとって使いやすい形で格納するもので、ある。同種の 目的に対して同様のテクノロジーを応用するのであるが、一般のデータウエアハウスを構築する機 能では、クリニカル・データを扱うには十分ではない。例えば、アプリケーション・レベルでのセキュリ ティの問題や、データウェアハウスを作成する際に使用される S A S / W a r e h o u s eA d m i n i s t r a t o rソフト ウェアはクリニカル・データを扱うために作成されたものではないため、必要とされる機能が不足し A S / P H ‑ C l i n i c a lソフトウエアヘスタテ、ィを自動ロードする際の基本的な自動ロード機能 ていること、 S は作成されているものの、いくつかのメタデータに保存されている情報(例えばキー構造の情報)が 抱け落ちてしまい、完壁な形にならない事などが問題点としてあげられる。このようなクリニカル・デ ータを扱う際に必要な機能は PHTにて作成され、それらの機能と S A S / W a r e h o u s eA d m i n i s t r a t o r ソフトウェアを使用することにより、クリニカル・データウェアハウスが構築されるので、ある。 PHTのクリニカル・データウェアハウスの機能の一部を紹介しよう。 クリニカル・データウェアハウスでは、 O r a c l eC l i n i c a lを含むその他の CDMSに保存されているデー タやメタデータにアクセスする機能を持っている。最初に、 CDMSが作製したメタデータを格納したフ ァイルやデータセットやそのビューにアクセスする。クリニカル・データウェアハウスは、そのファイル を読み、情報を使用して関連する複数の生データやテーブル、ビューを 1つのスタディ!こ対して 1度 のオベレーションで定義を行なう。その後は、一連のエンジンや市販または企業で作成された CDMSにて作成されたメタデータを読み、定義を行なうためのアプリケーション・プログラミング・イン タフェースによって修正される。この機能により、メタデータにシームレスにアクセスを行なうことを可 能になるのである。 クリニカル・データウェアハウスを構築することにより、以下のような利点があげられる。 付加価値データの作成及びメインテナンスをするために、ドキュメント化され、パリデートさ れたメカニズムが作成出来る ‑2 0 6一

207.

変数を計算するトータルな構成が出来る データ・エントリーに最適化されたデータの構造を、分析に最適化された構造へと変更する ツー jレが用意される SAS!W arehouse A d m i n i s t r a t o rソフトウエアと共に使用される力スタマイズされた拡張機能 を利用することにより、クリ二力ルデータ特有の問題を解決出来る SAS/Warehouse A d m i n i s t r a t o rソフトウェアを使用した際に作成されたコードをそのまま取 り込むことが出来る OracleC l i n i c a lからメタベースを完全に取り込む機能を備えている クリニ力ル データウェアハウスを効果的に利用するために、現在開発中の機能もある。しかし、デ E ータウェア 1¥ウスを構築する専用ツー jレである SAS/WarehouseAdministratorソフトウェアとクリニ 力ル・データを使用するためにカスタマイズされた拡張機能を利用することにより、現在クリニ力ル・ データが抱えている特有の問題を解決することができるのである。 5 . SAS/PH‑Clinicalソフトウェア クリニ力ル・データの抱える問題点の 2 つ目の、ノリューションとなるのが、 SAS/PH‑Clinical ソフトウ エアで、ある。 SAS/PH‑Clinical ソフトウエアで、は、分析及びレポーテイングの環境を強力にサポートし ている。その特徴は以下の通りである。 GUI環境を提供している すべての人が閉じデータを使用することが出来る ほとんどのユーザーは、データの構造や、連結などに関する知識が必要ない 分析やレポーテイングのテンプレートを作成することが出来る ワークグループの環境を提供しているので、オフ ジェクトを共有することが出来る アウトプットとコード、ログ、環境の情報と連結している。(アウトプットを保存すると、コード やログなども一緒に保存される。) SAS/PH‑Clinical ソフトウェアで、は、上記にあげられているようなデータの連結やクエリーの作成、 分析およびレポーテイング、など、すべての作業は GUI を使用して行なうことが出来る。 SAS/PH‑ C l i n i c a l ソフトウェアでは、どのようなデータセットやキーとなる変数へもアクセスするように設計され ている。データセットを一般化するキーとなるのは、使用するデータの構造である。データセットはリ クエストに応じて連結されるため、 1つのデータセットに含まれている変数を、複数のデータに変数と ‑207

208.

して指定することも可能であるし、また、複数のキーが存在する複数のデータセットを含めたスタデ ィを指定することも出来る。 e c h n i c a l News Vo . l 5 No.4を参照さ その他、 SAS/PH‑Clinicalの具体的な機能については、 SAST れたい。 6 . おわりに 以上、 SASの PharmaTechnologyProcessと、そのコアとなるテクノロジーである、ク 1 )ニカルデータ・ ウェアハウス及び SAS/PH‑Clinicalソフトウェアについて簡単に解説した。 これらはあくまで PharmaHealthTe c h n o l o g i e sにて提唱しているコンセプト及び機能の概要で、ある。 より詳細な情報及び本論文に記載されている、ノフトウェアについては SAS社までお問い合わせ願 いたい。 参考文献: 1 :LeeEvane,SASI n s t i t u t eI n c .I m p l i c a t i o n so fSASPharmaTechnologyProcessf o rI n d u s t r y " 2 :P e t e rV i l l e r s,SASI n s t i t u t eI n c . TheC l i n i c a lDataWarehouse" l o n i c k i,SASI n s t i t u t eI n c . UpdateonSAS/PH‑Clinicals o f t w a r e " 3 :SandraS c h l o t z h a u e r& GaryK ‑208

209.

金融

210.

日本 S A Sユーザー会 (SUG I‑J) ニューロ TAA 小野 潔 金融研究部 ニッセイ基礎研究所 T a c t i c a lA s s e tAll o c a t i o no fNeuralNetworks KiyoshiOno F i n a n c i a lResearch‑ Department NLI Research I n s t i t u t e 要旨 ニューラルネットワークは、株式や債券の予想収益率を、未知の非線 形関数値として、任意の精度で算出できる。しかも、制約条件やデータ に矛盾があっても、可能な限り柔軟に近似解を算出できる構造をもって ERやイールドスプレッドが異常値 いる。このため、赤字決算の影響で P になった場合でも、任意の精度で収益率を予測できる可能性がある。 本稿は、ニューラルネットワークを用いた、株式と債券の収益率予測 と、その予測値を用いたニュー口 TAA 、相場シグナルについて報告する。 hht ワ キ ニューラルネットワーク、 TAA 、 SAS/CONNECT 1 .はじめに TAAは、常に資本市場の変化に対応して、各アセット・クラスの W J 待収益率の予測を修正し、 より高い収益率が期待できるアセットの組み入れを機械的に増やす戦略である。般に、 TAA は、イールドスプレッドや PER等を入力変数とし、債券と株式の投資割合を計算する。 ところが、 96年に、銀行が不良債権の償却のために、多額の赤字を計上した。その影響で、 東証 1部の PERやイールドスプレッドが通常とは、かけ離れた値になり、予測システムが正常 に動作できなくなる事態が発生した。その解決策のーっとして、ニューラルネットワークがある。 ニューラルネットワークは柔軟性が高く、異常仙を示す変数が含まれるときでも、システムがそ の影響を少なくするように、その結合強度を小さくし、自動的に対処する性質がある。 債券・株式の収益率を予測するには、多種主!1の金融・マクロデータを加工する必要がある。 弊社の金融・マクロ DB は、 ORACLL~ に構築されている。そこで SAS/CONNECTで必要な J ‑ ̲ 2 1 1

211.

データを l 直接 SASシステムに取り込んだ後に、 SAS関数で j J [ ]工し、ニューラルネットワークの 人山力データの DBを作成した。パックテスト結果は、 SAS/STATを利月jし分析した。 2 .ニ ュ ー ラ ル ネ ッ ト ワ ー ク の 特 徴 闘犬を特定しないで、入力データから ニューラルネットワークは、予測対象の非線形関数の 1 iJ I . : 線形関数値」を算出できる。関数の形状をまず特定する必要がある従来の手法とは、対照的 である。また、 f l i l J 約条件に矛盾があっても、システムが自動的にネットワークの結合強度を変更 l j l J 約を満足するような解を探索する。これらの性質をもつことから、ニューラル し、可能な限り f ネットワークは、金融・マクロデータへの応用が考えられる。 ただ、ニューラルネットワークには、次のような短所があり、普及の妨げになっている。例 えば、モデル最適化やパラメータ推定、入力変数の選定なとに決まった方法論がなく、試行錯誤 が必要であること。また、学習時間が非常に長くかかり、効率的にシミュレーションできないこ と。さらに、ニューラルネットワークは、他の人仁知能理論に比べても、構造的記述による知識 表現が弱いため、入力データの関係をネットワーク土に表現できないこと。このような問題点が あるにもかかわらず、ニューラルネットワークは、データの正規分布の仮定を必要とせず、非線 型関数を容易に取り扱うことができる点で、新しいモデルの開発が期待できるのである。 3 .設 定 条 件 と 学 習 結 果 3 . 1 .プロセス ニューロ TAAでは、投資比率の測定と相場シグナルの判断について、次のプロセスを続て 検討している([:x l l)。まず、投資比率の測定にあたって、債券指数の 1ヵ月先の収益率を実証!JJ 値から予測し、同掠に株式指数の収益率を予測する。さらに、求めた債券と株式の予測収益率か ら 、 「シャーフ。の最適投資比率」を用いて、資産配分を決定する。 次に、債券の相場シグナルは i j カ月先の予測収益率」から、株式の相場シク拘ナルは「直近 の最大収益率(後述) J からを算出し、その時点の相場の強気・弱気を判断する。 図1.全体プロセス図 株式 2力月先の 収益率予測 二ュ口予測 ニュロ予測 212‑

212.

3 . 2 .設定条件 モデル:階層型前向き結合ネットワーク 中間層: 1 層 学習方法:パックプロパゲーション法 学習回数:1000‑2000@ 学習用データ:200倒(週次データ) 時系列データの対応:過去 1期前データの時間相聞を考慮する。 3 . 3 . 投資収益率の測定に関する出力変数の計算法 3 . 3 . 1 .債券の出力変数 出力変数は、 1 1カ月先(営業日数 20日)の収益率」とする。 R ( t )ニ ln(BOND(t+20)/BOND(t)) BOND(L):NRIボンド・パフォーマンス総合指数の 5日間平均値 3 . 3 . 2 .株式の出力変数 ① 1ヵ月先の収益率 債券と同様に、出力変数は、 1 1カ月先(営業日数 20日)の収益率」とする。 R ( t )= ln(TOPlX(t+20)/TOPIX(t)) TOPIX(t):TOPIXの 5日間平均値 ② 2カ月先の収益率 2ヵ月先の収益率には、営業日数 20r1 先と 40日先の TOPIXの収益率に重みを掛け た合計値を採用した。より直近データである 2 0日先の収益率の重みを大きく ( = O . G )した。 R ( t )=0 . 6女 lnσOPIX(t+20)/TOPIX(t)) +0. 4*l nσOPIX(t+40)/TOPIX(t+20)) 3 . 3 . 3 .株式相場シグナルの出力変数 ①債券相場シグナル 債券の中期相場シグナルは、 11ヵ月先の収益率」の週次 8週間の平均値を用いる。 ②株式相場シグナル 株式の中期相場シグナルは、 「直近の最大収益率」は、 「直近の最大収益率」の週次 50週間の平均値を用いる。 11 ヵ J~J ・ 2 カ月先の予測収益率」を入力変数として、ニュー ラルネットワークで予~J!iJ する。 1 直近の最大収益率」が、 TOPIX 指数を売買した場合に得 られる、最も大きい収益率である。計算法は、将来 8週間以内の TOPIX (週平均値)の最 d小値から、事後的に他 Lがりと伯下がりの収益率を計算し、絶対値の大きい方を 大値と i 「直近の最大収益率」とする。この値が、大きし 1ほと、「買」が収益を生みやすく(強気)、 逆に小さいほど「売」が収益を生みやすい(弱気)。したがって、この値を出力変数にす ることにより、ニコーーラルネットワークは、相場の強気・弱気を学習できる。 2 1 3

213.

3.4.入力変数の選定結果 下記データ(ボラティリティーと回帰係数は除く)は、 5営業日を平均し、さらに 2 5 0の データ(週次で約 5年分)を正則標準化して、使用した。 ( 1 )債券の入力変数 P I( N R Iボンド・パフォーマンスの総合指数)、② B P Iの 3 0 1 1回帰係数、③ B P I ①B の2 0 0日[ n j帰係数、④ C Bインテーックス指数、⑤イールドスプレッド、⑥日経長期債券指 数、⑦債券先物オプションのインプライド・ボラティリテイ ( 2 ) 株式の入力変数 ①T OPIX、② TOPIXの 8 0日回帰係数、③ TOPIXの 2 0 0日回帰係数、④東証 1部の PER 、 ⑤ TOPIX先物オプションのインプライド・ボラティリティー、⑥イールドスプレッド、 ⑦信用買代金 ( 3 )株式相場シグナルの入力変数 ①T OPIX、②イールドスプレッド、③ヒストリカル・ボラティリティー、④空売比率、⑤ 1ヵ月間の収益率、⑥ 1カ月先の予測収益率、⑦ 2ヵ月先の予測収益率 4 .予測結果 4 . 1 .二ユーロ TAAの結果 4 . 1 . 1 .資産配分の理論式 資産配分には、 「シャープの最適投資比率」を採用し、投資対象が 2種類の場合は、下記式 を使川し、 3種類の場合は 2次計画法で投資比率を求めた。期待収益率は、ニューラルネットワ ークで求めた株式・債券の予測収益率(週次 4週間平均値)を使用した。 Xs~ 1 σ b2 σ sb)+( μ s μ b)・ (ART) σS2+σ b2‑2 σ sb Xs~l-Xs μ 5・・・株式の期待投資収益率 μb .・・債券の期待投資収益率 σ5・・・株式の投資収益率の標準偏差 σb.・ ・ 債 券 の 投 資 収 益 率 の 標 準 偏 差 σsb.・・債券と株式の共分散 Xs... 株式への投資比率 Xb・・・債券への投資比率 ART・・・リスク許容度 4 . 1 . 2債券と株式 債券と株式からなる TAAの 4年間(月末リバランス)の運用結果と債券・株式指数の比較 を図 2に示す。なお、債券・株式の売買コストは考慮していない(以後の累積収益率の計算も同 様)。 ‑ 2 1 4

214.

図 2.債券と株式のニューロ1'AAの累積収益率(%) (期間例年‑ . . . . . 9 8年 3月末、月末リバランス) Dr 2 0 表1.投資交代期間 ( 9 4年‑ . . . . . 9 8年 3月、月末リバランス) 債券投資 株式投資 全体 14月 最太連続月 14月 8月 1月 2月 1月 最小連続月 平均 4 . 5月 6月 8月 父代回数 5回 5回 10回 期間の割合 64~也 36~也 100~也 債券と株式の投資交代は、平均 6ヵ月ごとに先生している。債券と株式の投資期間の割合は、 債券が全体の 6割を越えている。これは、ニューラルネットワークが株式のマイナスの収益率を 予測したため、債券投資期間が長くなったためである。 PERやイールドスプレッドが異常値となる、 9 6年 3月‑ . . . . . 7月の期間は、 3月から株式投資 となり、 7月から債券投資となった。予測収益率と実際の収益率を比較すると、 6週から 8週後 には、異常伯の影響が少なくなった。結果的には、株式指数のド落時 ( 9 6年 7月‑.....)に債券投 資にシフトしたことにより、良いパフォーマンスを得られた。 4 . 1 . 3 .債券とコール 債券とコールからなる TAAの運用結果を凶 3に示す。ニューロ TAAは、ほぼ指数と同じ動 きをしている。 98年 3月末時点では、ニユーロ TAAは BPIをわずかに [ ‑ ̲ [ r l [っている。 一215‑

215.

図3 .債券とコールのニユーロ TAAの累積収益率<%) (期間例年~凶年:~月末、月末リバランス) 30 2 5 2 0 l--_~~-~習 1 5 1 0 5 。 ∞戸円︒∞町田 F F円OFh町田戸 NFFO∞ 町 田 F F 申凶∞oh町田戸 円 削 申o h町田 NFNoh白白 F F hF寸o h白白 F 申N 白O 由 自 由 NON 戸市山田町 F 円NhoD白白 F FN由O D白白戸 白 白F 円 F円OD白白戸 F O円︒戸田町田 F ∞OFOD 寸N ∞O 町 田 町 NN申O 回目白 F OFNO町田町戸 hF寸O 町 田 町 F 田ONF守白白戸 ∞N 白O 寸町田戸 田NhO寸白白戸 F 円N 目 ︒ 寸 白 白 ‑ 寸 戸 円O 寸 町 田 hoFO寸 白 白 F FHU 表2 .投資交代期間 (!)4年 叩年 3月末、月末リバランス) 債券投資 コール投資 全体 最太連続月 最小連続月 平均 父代回数 期間の割合 7月 1月 2 . 3月 14回 61呼 色 3月 1月 1 .4月 15回 39呼 也 7月 1月 1 . 8月 29回 100呼 也 4 . 1.4.株式とコール 株式とコールからなる TAAの え1 tH結果を [ 6 1 4に示す。株式の下げ相場を予測し、 コール運 月l にシフトした事で、 ' [ ' O P I Xより良いパフォーマンスを得られた。 表3 .投資交代期間(!J.1年 . . . . . . ! ) 8年 a 月末、月末リバランス) 株式投資 コール投資 全体 最太連続週 最小連続週 平均 父代回数 期間の割合 6月 1月 2 . 3月 10回 44呼 色 7月 1月 3 . 3月 9回 56呼 也 7月 1月 2 . 8月 19回 100呼 也 図4 .株式とコールのニユーロ TAAの累積収益率<%) . . . . . ! ) 8年 3月末、月末リバランス) (期間例年 . ‑216一

216.

‑ ‑" ' コ C コ C o コ C w c コ . c コ 19940523 19940725 19940928 19950210 h 判ω皿洗 ( 避E2ht 判g 19950417 19950622 19950824 19951030 19960108 19960313 !日目斗l 19960521 19960723 19960926 J 19961202 19970417 19970623 19970826 19971031 19980112 19980318 ̲ J s g E 前 ∞" '~'ー込 」、 ヰ持 。 コ瀞 ' # .回 4 訟 C J 円 E ~ 酒 量 字 体 同 ∞ o l E帯 ' # .固 ∞~ コ ' " '" コ ̲ . C J l ' ー 込 E 国 者 υ ー 占 」 、 ( ! ) ̲ . " '、‑ J 泊川計三二 JWVUN) 19970212 図印・ 加 4 味・葉比‑ uーやSいいl 口↓﹀﹀S細部荷齢制(渓) 19941205 剛 コ Eコ E ' # .回 コ " 帯 E 4 訟 国 者 。。 1 ¥ ) o hコ ' ー 込 ∞~ o 3 コ E ' # .回 ~ E コ ヲ 件 4 知 中 南 踊 ωM4w 酒亜(宏一刊tgh 判ω皿洗 皿洗‑﹂﹂ A W V U N ) 目 細 鋼E ー 旦 『 皿 ~f 十 〉 4 司令 本 脳 82 回 書 存 盟 担 草 D~ 悩出 遺 山gロ 部川ゆ・奔し岳・ Uー や UUνPAHが↓﹀﹀SM一口一]詑一泊州国印打引斗︒ムい¥山下付l v ヨ ( ︑ 3 4 b拝 )〆 凶斗一拝↓cEMqω 主 UUνPAHが 即時沖S知謀長齢制﹂叶品叫んザ︒ 19940314 ﹁ 圃 4 準作芽比什 U │ ﹂ 弁戸ω ・ C W2uU コ " ' 一 ら3 Cコ 19940107 コC コ Cコ Cコ Cコ 包 ' " む3 C 19940107 ~ ー品 ιm 、J コさ c コ Cコ Cコ む3 C 19940314 19940523 19940725 19940928 19941205 19950210 ・ 19950417 19950622 19950824 19951030 ・ 19960108 19960313 19960521 19960723 19960926 19961202 i 19970212 19970417 ・ 19970623 19970826 19971031 19980112 i 19980318 ~_- n l i~ ~'I l ×l h I : 5I 0)

217.

4 . 1 . 6 .パフォーマンス比較 債券・株式・コールの 3種類を組み合わせた TAAのパフォーマンスの比較結果を表 5に示 )、順位は毎年入れ替わっているが、最近の相場展開(債 す。年間の収益率を比較すると(表 6 券堅調、株式不調)を反映した結果になっている。 収益率とリスクは正の関係があるため、パフォーマンスはリスク度を評価した上で比較する ことが重要である。ここでは、リスク調整後のリターンを、シャープの測度 1で比較した(表 7)。 結果は、最近の株式のリスクの増大を反映して、安全資産の多い「債券・コール TAAJ が、他 より良いパフォーマンスとなっている。 94年 9 5年 9 6年 97年 9 8年3月 .累積収益率比較(%) (94年 1月 5日=0.0%) 表5 ニューロ TAA ベンチマーク TOPIX BPI BPI70 債・株 債・コール 株・コール 債・株・コール 0 . 3 3 . 8 3 . 4 5 . 0 11 . 1 5 . 0 ‑ 1 . 7 7 . 1 ‑ 2 . 2 ‑23. 4 一1 6 . 5 1 0 . 1 1 6 . 7 2 2 . 7 2 3 . 7 9 . 2 11 .1 8 . 8 .6 11 7 . 3 2 3 . 8 1 5 . 8 2 6 . 3 1 4 . 3 1 9. 4 2 6 . 1 25. 4 2 5 . 9 2 9 . 6 3 9 . 9 5 2 . 8 1 5 . 2 2 9 . 7 1 7 . 3 3 0 . 6 表6 .年間収益率の比較(%) (98 年 1~3 月の収益率は、年率換算した) ベンチマーク 94年 9 5年 9 6年 9 7年 98 年 1~3 月 94~97 年平均 TOPIX BPI BP170" 債・株 3 . 8 5 . 0 ‑ 1 . 7 0 . 3 1 2 . 0 8 . 8 3. 4 2 . 0 ‑ 8 . 7 1 5. 4 6 . 1 1 . 7 ‑ 2 . 0 ‑ 6 . 5 . 7 5 ‑21 . 1 3 6 . 0 3 . 1 1 0 . 1 3 6 . 0 ‑6. 4 5 . 2 2 . 1 3 . 7 ーユーロ TAA 債・コール 株・コール 債・株・コール 3 . 4 1 0 . 5 4 . 5 5 . 6 ‑ 2 . 2 6 . 0 5 . 0 1 9 . 8 3 . 0 7 . 9 3 7 . 0 8 . 7 1 1 . 1 3 . 7 1 2 . 6 ‑ 9 . 5 4 5 . 2 4 . 1 表7 . リスク調整後のリターン(%) (週次ベースで計算したシャープの測度を年率換算した) ベンチマーク 94‑98年 3月末 l シャープの涙J I 度 s~ (Rp‑Rf) ap s~シャープの測度 R f~無リスク資産の収益率 Rp~ポートフオリオの収益率 午=ポートフォリオの収益率の標準偏差 218‑

218.

hP 誼鋪竹¥山刊斗﹂ヤ M‑ ・ 1 9 9 5 0 2 2 4 u r s ‑ 1 9 9 6 0 8 0 6 19960611 NHU 19960806 1 9 9 6 1 0 0 3 19961003 1 9 9 6 1 2 0 2 19961202 1 9 9 7 0 2 0 4 19970204 1 9 9 7 0 4 0 3 19970403 1 9 9 7 0 6 0 2 19970602 1 9 9 7 0 7 2 9 19970729 J 1 9 9 7 0 9 2 5 J 19970925 1 9 9 7 1 1 2 5 19971125 MU 1 9 9 8 0 1 2 7 19980127 M4D M M口 同印口 旧田口 00 J ‑EESE‑ ω00 ‑ ↓ 00 ‑問︒︒ H 日 JJSMt一 三 00 一 一主 v u u 怜 ︐一 ︒ 由 ‑go(繍鞠剛山一 ∞ ‑ ‑判︒︒ MU山 ﹁卸汁ボ尚一‑黄島刷物﹂ 30()憧 E4N841{古 CE﹂ い 一 件PR ﹁昌一山﹂ TE〆山齢出3悶畑道一呂 山OA恒 一E〆設出 4m τ 一 お い ¥ 九 司 令 斗 i﹂ ヤ 一 件 〆 ﹁同法こ 史跡者﹂ 3 ∞匝E制圧さ MU OE﹂い川町伊良﹁山昨日﹂〆 部川WS主 〆 山 久刈﹂ γ Jポ5 5匝E d恥 ︒知器鈴伊良﹁罰則﹂ 作 叫 が (国白)︒さ部 AW ヴデ 知間遅豆一位ぽ出‑ 件 一 昨 肖dF 恒 一 一 己 ﹂ リ 恥 叫 が o一 一 24一 い こ Z M U ν P炉一却さ範行事 44﹁パ 自(主蔀一件 MU凶NC 19950224 己竺~ い叫が ( 亙ご 1 9 9 6 0 6 1 1 汁一刑判﹃一︼ ) 0 1 1 9 9 4 1 2 2 7 o主一蔀中久刈﹂ 1 9 9 6 0 4 1 1 19960411 MU 19940704 ‑EHP陸 市 川 一 サ P巌叫がえ一軒﹀朝合﹁パ﹁ 出 ︒ 1 9 9 6 0 2 1 4 19960214 ﹄ 1 9 9 4 1 0 2 7 19941227 『 ; 1 円‑ A一軒い¥九 U i﹂ ヤ 一 件 〆 葵 um3 19940509 h 1 9 9 5 1 2 1 3 19951213 斗 ︐ 19941027 川 一 1 9 9 5 1 0 1 6 19951016 山岳恒E〆 F一 F 出 mS際市﹂ 1 9 9 4 0 3 0 7 図 ? 趣 味 首 部 や W1斗i﹂ ヤ ( 呂 防 相tg 防相ω辺川戸 画持) 19950622 o 8 0 1 9 9 5 0 6 2 2 tgh 判ω辺川戸画内庁) 図 ア 芽 比 首 部 VW1uy ﹂ヤ(玄抑 19950424 Cコ 1 9 9 8 0 3 2 5 。 ト 19980325 1 9 9 4 0 8 2 9 19940829 1 9 9 5 0 8 1 7 19950817 OL 芳一罫AHEH﹁託出﹂ 1 9 9 4 0 1 0 7 19940307 匡 一 一td恥叫が︒高尚 jq一件〆宰 19940107

219.

5 .まとめ ニューラルネットワークは、人力変数の選択が重要であるが、特に、指数の回帰係数とボラ テイリティーが、予測精度の向上に寄与していた。スムージング・カーブの各時点、における接線 の傾きである回帰係数については、指数の上昇・下降の予測に使った。入力変数に単独の回帰係 数を用いた場合に比べて、格段に良い結果が得られたことから、ニューラルネットワークがテク ニカル分析を学習したと推測できる。 ボラティリティーは、原資産指数と因果関係があるが、その関係は線形ではない。ニューラ ルネットワークは、構造がわからなくとも、非線形の関係づけができるため、ボラティリティー のもつ情報を有効に利用できる。特に相場の将来を反映するインプライド・ボラティリティーに ついては、ヒストリカル・ボラティリティーよりも良い結果が得られた。 ニューロ TAAは 、 PER・イールドスプレッドが異常値の場合でも、うまく対処しているよ うである。ただし、異常値への対処には、学習期間が必要である。今回のシミュレーションでは、 PERやイールドスプレッドが異常値になってから、 6‑8週後に実測値とかけ離れない値に収 束した。 金融商品の観点、から、ニューロ TAAを論じると、ニューラルネットワークの中身はブラッ クボックスのために、投資家が不安になることあげられる。これは、ペイジアンニューラルネッ トワークが一つの解決策である。また、ニユーロ TAAの回転率を低くするために、最適投資比 率の計算法を改良する余地が残っている。 今回の研究では、ニューラルネットワークが、異常値を自動的に対処し、債券・株式指数の 予測に利用できることを確かめられ、今後の課題も明確になった。 6 .参考文献 ①Robert R .T r i p I 】i E f r a i m Turban' ,N ucral Networks i nF i n a n c e and I n v e s t i n g, IRWIN p u b l i s i n g,1 9 9 6 . ②麻生英樹、 「ニューラルネットワーク情報処理」、産業図書、 1 9 9 8 . ③村瀬治比古、小山修平、石田良平、「カルマン・二ユーロ・コンビューティング」、森北出版、 1 9 9 4 . ④合原一幸、 「ニューロ・ファジィ・カオス」、オーム社、 1 9 9 3 . ⑤馬場則夫、小島史男、小津誠一、 「ニューラルネットワークの基礎と応用」、共立出版、 1 9 9 4 . ⑥合原一幸、徳永隆治、 「カオス応用戦略」、オーム社、 1 9 9 : 3 . ⑦安達雅春、合原一幸、 「ニューラルネットワークと予測」、オペレーシヨンズ・リサーチ、 1 9 9 2 年 7 月号 p336~341 ⑧宮田義郎、 「ニューラルネットワークと時系列処J f f i J、電学論 C,113 巻 6 号 p:373~:177、平成 5 年 ⑨怯菜育雄、 「パックプロパゲーシヨンによる特徴抽出」、数理科学 No3381沿 1~:37、 199 1. 220‑

220.

日本 S A Sユーザー会 (SUG I‑J) 「シカゴ穀物相場の季節性と変動要因(ファンダメンタルズ) から穀物相場の因果論的接近を試みる J 鈴木二郎 関 口 宗 己 o黒 川 厚 吉野清美 普入恵美 フジフューチャーズ株式会社 商品開発室 ChicagoG r a i nFuturesMarketsForecast throughCausalR e l a t i o n s h i p so fSeasonalFundamentalsAnalyses JIROSUZUKI MUNEMISEKIGUCHI ATSUSHIKUROKAWA KIYOMIYOSHINO EMIFUNYU MANAGEDFUTURESDEVELOPMENTDIVISION FUJIFUTURESCO., LTD 要旨 社会科学としての経済学では、実験によって因果関係を検証することが困難 なため、現在及び過去のあらゆるデータを使用し、因果関係を検証していく 方法が予測の概念として定義される。この因果関係を「相関関係」と単なる 「関係」との違いから因果論的接近を試みる。 キーワード: SAS/INSIGHTソフトウェア SAS/ETSソフトウェア SAS/ASSISTソフトウェア SAS/LABソフトウェア PROCステップ 穀物相場変動の季節性 因果関係の検証 時差相関分析 最小 2乗法の前提と最小 2推定量の性質 回帰分析の基本的概念 穀物相場の変動要因(ファンダメンタノレズ分析) ‑221

221.

く因果関係の検証〉 構造方程式を用いて経済分析等を行うとしよう。まず第一に、分析対象の中で「何が原因で、 何が結果か」を明らかにする必要があるであろう。すなわち「因果関係」の意味するところは、 事象 A が原因となって、事象 B が結果として生ずるという文字通り 原因→結果"が結びつい ているとしづ事である。 自然科学においては実験が可能であるため、このような因果関係を統計的に確認する事が 出来る。しかし、社会科学としての経済学では、そうした実験によって因果関係を検証すること が困難なため、現在及び過去のあらゆるデータを使用し、一定基準に基づいて定義された因 果関係を検証してしてとしづ方法がとられている。この基準として、一般に知られているのが予 測の概念から定義される「クレンジャーの意味での因果関係」である。クレンジャー (Cranger, c .W.J )の定義した因果関係を定常確率過程に従う 2変量 x、yについて説明すると以下の ようになる。 ix、y各々の過去から現在に至る値を用いて yを予測した場合の方が、 xの現在及び過 去の値を除いて yを予測した場合よりも yの予測値として優れている場合、 xから yへの因果 関係が存在する」 上記のように定義された因果関係は常に時間的に先に起こった事が原因となり、後で起こ った事が結果と判断される可能性を残しており、次のような論理的なミスを犯す恐れがある。 (例) 気象庁が降雨予報を出した後に雨が降り出したとする。クレンジャーの意味では、「予報」が 「降雨」の原因となってしまう。 この例の場合は、気象庁が仮に晴天予報を出していたとしても雨は降った訳で、この限りで は日常我々が用いている因果関係とクレンジャーの意味で、の「因果関係は一致しなし、」ことが わかる。 しかし、経済分析においては、この種の分析を積み重ねていくことが真の因果関係に接近 する一つの有力な方法でらあると言っても過言で、はない。 〈相場変動の季節性〉 穀物先物相場が、一般的に夏の時期に大きく相場変動をおこす事は特に驚くことではない。 穀物の収穫高は夏の天候に強く影響され又、スポット価格は逆に穀物の在庫率に関係する。 夏の天候に関する情報は主として夏にもたらされる。 ‑222‑

222.
[beta]
∞
む

田園

̲..

h

‑4v凶mw‑OH出

.
︑F
¥
..

司
書
き

コ

E

C

.

.
,
.
・
.

a眠

・
o
‑
.
:
.
‑
,
.
‑
可L
:
・・圃.
"
'
・
・
圃
..
.
.
圃
圃
・
・
‑
.
司
哩
旦
田
.

通
R

:t-;;~r-!

。

日D 目

日CN

4
F目別

・ 日c‑

,
、
.
.
.
‑
.
..
..
.
.
.
.
.

電..

E

E

(5

否

o

守
、
」

・
・

222 R

(5

αコ

ー‑ Z ( / ) c" U J O I‑

•.•
C 日以
∞叩()の E

トト‑∞‑oiHNH

き
守
、
」

ナ

,

‑
・

通R

•

園

o

‑
.
..

︒一﹄︿匡

‑a

通
障
を

o

九

‑
A
:
.

‑a

官且
a

‑

a

圃
・
‑

..
.
Jd王
子二

通R
1O

・
.
‑

:
γ
‑
.
7
:

︒一﹄︿包

・イ二・ー・

ぱ3

E
圃・

E

通使

き

‑

ブ
r

回

︒一﹄︿包

~..-

守
も
.
/

u

I

.
・
ー
‑
‑
.
司I
f
‑
.
.
.・圃.‑ .
圃園

司
書
き
ぱ3

•

.
,
̲
.
.
‑

D 一﹄︿匡

.
︑
.
︑
¥
︑︑︑︑︑

ヘ
¥

.
:

0
"
"
'
"
こ1‑ ‑ 0

E

・
.
・
・ z
..
.
.
.
‑ー
・
. ..... .r
t
I
・
・
・ ••• ,
'
'
• ・
•.
I
竺
‑

通R

1O

日CN

•

..

‑0.0HNH

4FDN

︑
︑
¥

1
.

・

.
.
・

・
. •
一
.
・

もも.

・
50NN

5 0守N

.FD
記

︒︒∞N

DCU

c
c
h

∞

DD

・
・
・
‑

o 凶 o >・
(
/
) =コc,. c,.ー~

‑223一

>
・

E

223.

先物相場の変動性と l 年の各月との関係を調査した( ( K e n y o n,K l i n g,j o r d a n,S e a l e,and McCabe( 1 9 8 7 ) ))は日次先物対数価格変化量の標準偏差を年率換算した推定値を変動性と している。 すなわち、 Lをl 日の先物価格として、 X;= l o g( f ;)‑log( f ; ー1 ) と し 、 v ;を(ある年の)t月の i日の観測値 X;に基づく・ var(X;)の最小 2乗推定量とする。 (・)確率変数 xのリスクの一般的な指標は分散であり v a r ( x )で表される c 例えば、 6月は t= 6である。 1 1年」には 2 5 0 日の取引が行われるので只の年率換算値を R Pで表わすと v ;p = 250V ;となる c 1974年から 1 9 8 3年まで、のとうもろこし先物と小麦先物について最小 2乗標準偏差推定量 ぷ7の結果を示したものが下図である。 先物価格変動性の季節性ー検定結果 ハ 一一一ー小麦 一一一とうもろこし 2 5 イ ︐ ︐ ︐ ︐ ︐ ︐ ︐ テ 2 0 イ ︐ % ︑ ヘ︑ / / ︐ ア ︑ ︑ ︑ ー ポ フ 1 5 1 3 2 3 4 5 6 7 8 9 (月) 出典:Kenyon,Kling,Jordan,Seale,andMcCabe( 1 9 8 7 ) ー 224‑ 1 0 1 1 1 2

224.

政府穀物価格指示政策に基づく貸出金利のようなその他の変動性決定要因を修正してお 1 9 8 5 )は先物価格の変動性は、 り、この図からは季節性がはっきりと読み取れる。 Anderson ( 実際の受渡日まで、の期間よりも季節性によってうまく説明されることを示した。 く「相関関係」と単なる「関係」との違い〉 2つのデータの関係をフ。ロットした図 aと図 bにおいて、ともに xとyの聞には明らかに何らか の「関係」が解読できる。 1 )図 aのような直線的関係の場合 →「相関関係」と呼ぶ。 y / / / / / / / / / / / / x 図a 2 )図 bのような xとyとの聞に非線形な「関係」の場合 →単なる「関係」であるにすぎない y ノ ノ ノ ノ / / ¥ ︑ ︑ / へ ︐ ︐¥J J' ︐ ︐ J' " x 図b 円' u 円' u EU

225.

従って、統計上の「相関」は一般的な「関係」のごく特殊なものにすぎず、以下に述べる「相 関係数」が小さし、からとし、って「関係」がないことにはならない点に留意する必要がある。 また、一見相関関係の低いデータで、あったとしても、適当なデータ変換を行えば相聞が高く なる事がある。 y / / / / / / ‑ . ‑. ‑ r , 〆 / / ;' x ψ l o gy / / / / / / / / / / / / / / / / / l o gx ‑226

226.
[beta]
‑・・.

‑P41

.6

l

λNZS岨九l 門・ hH夜︑ .M
(
ム

︐︒︒州単型問︒︒︒︒昼円

o
o
d
M
M

︒
︒

6A
お

F

︒
︒
︒
︒
.

︒
︐
︒

︒︒︒歯

E

a‑λl門 ‑hH宗人'

︒
︒

・・・

l

..

.
.
4・・・

‑
.
・

h
λl円也事総 米日吋寝圃咽λl円・竹 nぶ

.
e

s

s

富

れい・・
4れ
τふ当 ﹃
‑・・・
'Ju‑‑4.H1・
ff
'・
・司 .
・
'・
・
・・
. ・ ‑J.r・
4
1
司
・

﹁H

・
γ
't
rK
Le
J
VUp
︐'
:;
j
t
j
︑
e
i・
1

4

.J'

岨
骨
圃
咽
入i 円・竹円円︑川口三韓国咽剛村竹円円︑い

sea‑

(ee)
骨 量 制λl門・竹夜︑

‑
c

か

r
q
ら

車

員

‑

s

8
~

s

1

4

vaJ
・・
・

..

{
g
g
u
E一極寂)按摩λl円・竹円円︑川口三韓国咽剛 判
M竹
円
円
︑
川
︒
︒
︒
歯
制 Y

︑.
M
骨 量 制λl門・ hH夜

、.
‑a'

0

s

a‑‑‑

s

前震回削除
凶宵凪E凶WM

‑227‑

s
t
.
‑

・
‑

ぷ担'n‑K剛

e(』
キ λム )

・
.
¥
・ι
4
i誌

…̲.:#

.
.
.
.
‑
.
.
‑

8

司島

s

・

.:‑t.
・
.
、
九T
・
, ...必量争 r
t
p

九 .

.
,
・
‑

B

‑
・・

s
E

8
~
{
キ
』 λム }

,
λ担'r!'r!ー λ

.
.
.:
ゾJ

̲
.
.

E
R

s
帽

,
.
.
.
.

8
ー一一 ‑
‑
H

‑
E
百

~

自
.
.

員

事
~

,
λ担竹‑K岡国匝審

e

o
o
e
‑
‑
n
E

.
・
λl円相総 米日 奪回・λln‑竹円円︑

豪邸除
一極寂)副宵凪 E凶WMR

̲
.
.
.

,
.
;

・
ぷ有'n'r!ー λ

hv.:
. .・・︑. t‑‑:'り
・
一
‑
・
u・‑
‑
‑
‑4 ‑ ‑・
・
.
︑
︐‑
・
.
.︐
f.
・
d
'

(
g・

‑
u

制活F

s

s

~

~.."

自

‑

g

8 8 8
~富里

8
~

8
~

s

・
.
.
.

~

6

五
•• •.•

・.
τ
.
.
..
.
.
‑
・
・

自

事

~

~

~

・

:
:
:
・
.
.
.
;
.
‑

O
O
岬

凶

6

s

E

• .•.•

s
四 一

.
悼
..
.
‑.
‑
̲
.
.

量

227.

SASデータ データ名 データシンボル CSOY シカゴ大旦終値 2 シカゴ大旦出来高 VOLUME シカゴ大旦取組高 0 1 3 一 一トー一一一一一 4 SUPPLY 大豆新穀供給合計 5 DEMAND 大旦新穀需要合計 6 一一一一一・"… STOCK 大旦新穀在庫 ・ー....,..‑一一一 天旦新穀在麗率 RAT10 7 SALES 8 大旦週間輸出成約高 9 1NSPECT 大旦週間輸出検証高 …一一…一川町一一 …"̲..,,…間一卜一一一一……一一一一一一一一一……一一一一一一一…一一一一一 トー…… 同 PRE1SPT 1 0 前年検証高 1 1 1SPTCPR 検証高前年同月比 1 2一一一一一一… 1SP CMPR 咽""・一一一一…一一一…… │一川検食証証 達 高 累 高 成 一 計率前前年年同同月月比比 1 3 1SPACCPR 1 4 CRUSH 大旦週間圧砕高 1 5 SLASTSTR トーー同町一一卜一一一一一一………‑‑",..ー…ー…… │ 一 │ ー シ て カ 豆 一 ゴ 旧 コ 穀 ー 在 ン 庫 終 率 一 値 悶 可 CCO 1 6 1 7 CSUPTTL コーン新穀供給合計 CDEMTTL ・ー…… 1 8 コーン新穀需要合計 …一山.̲‑̲..・ ト一一一一 … 1 9 CSTOCK コーン新穀在庫 20 コーン新穀在庫率 CRAT10 シカゴ、小麦終値 2 1 CWHEAT 一 一 一 { シカゴ、大旦i 由終値 2 2 CSOY01L シカゴ、大旦粕終値 2 3 CSOYMEAL 24 NYYEN NY $ / ¥ 句" ' ̲ M M H . . . . . . . . ̲ ̲ ̲ ̲ ̲ . 日 m H " H H H ' " ‑ 2 2 8

228.
[beta]
.
ゅ~・
。 。 。 2
。 。
o
'

;
:

事

刷
制

?

守

'

冨

昌
司

?

。
写
。

。 ヨ
自
。 。
。 ??

。

。
8 5 。 。 号 目
胃
耳
‑
。 中 守 中 。 。 。 ー守

。

竃

胃

。 。 。

守

車
Z
E
~
i 。 。 書 s g E 。
。 l
。
。
? ? ? ?

~

自
E ~
。 。 。 ?

宮

苫
a
。 ー。

向

?

、
事
書
書
。 。 。 。 。
自

~

守

吉
田

中

宮

g

?

?

?

炉内
側

.g
寓

自

"
百

g
?

日

g

?

守

~

~

8
。 円
~
。 ? 。 。
匂
:;

N

u
制

守

p
匂

守

中

?

?

~

S
宮

?

凶

側

;
<
。
z
。 。 。
=。 。
剥
匂

s
:
。 、司,
。 ;

~

g
m
8 c

宵

守
@

~

E E

冒
側
:
:
<

守

中

?

。
宮
。 2
? ?

?

。

E

問
制

~

2 宮

。 。

~

向
仰

。 。 。

中

?

富

~

司
事

?

h
伺
図
吟

~

?

?

?

?

中

制

量

。 。 。

‑

自

守

百
.

?
呂
制

富
耳
内

。

誼

凶

8
J
‑
H

宮

由
~円

?

?

@

~

司~

宮

目

0

凶
作
‑

,司

。 。 。 。

守

由 。
。
‑ 告 宮 書
富 胃 自
。 。 。 ? 。 ? ?

?

?

?

守

呂
官

h
門

制

。
田
制
戸

匂

;

?

円
2
、 目
日
ー
~
。 中 ?
炉

制

中

坦
首
E
:。 。
i
f:
。
。
。 E
h
‑

呂

。

s
。

E
E

E 主円
F

中

。
中

E
S

?
日
中

E
Z

。

富
?

富

。

ω
、
s。
制

作
同

?

?

百

冨
制

?

?

?

胃
m

。
.

?

?

。
ω
•
a ー
。
。 。 。
。

.2

。~

宮
h

制

制

?

?

h
制

~

E

2

?

中

?

。

?

牢
s
。
。

:
;

ω
目
•

?

z

?

?

F

書

?

。
、 2
。

牢
耳

牢
p

?

?

?

:
;
。

円
司
2 ,s
。
。

?

思

?

?

~

写
守

側
内

?

中

~ 。
。

。

田
匂
町

担
問

中

?

。

話

E
芭

?

?

~

事

8
。
?
州

s
。 。 。
呂
宮

胃
自

?
剥
制

。

F

中

.
円
司 円‑e
。 ?

2

‑。

、。

自

。

円
h
同

2

?

?

車

2

中

?

。
、 :
l

話

?

?

=
。
F

ss
。
?

.

!
E 宮

。 富
。 。
同
側
制
.

?

?

宮

?

?

:

。
ー
。

E 書 由司' ~
h

。 。 。
呂
軍

?

出

。 。
g

?

書

:
事
:

?

?

胃
@

s

噌

牢
。 。 。 5
? ?

~
。
。 。 。

自
、 g ~
。 。
.
。 ? ? ?

。
円 g
;
。
。 。

制

制

p

@
側
v
国

創
:

中

8
?

8

?

?

h

:
。
1
、 E 写
g s l

制
作

中

?

門
内
戸

?

。
富
。

‑

同

白
0
.

?
首

中

。

自

坦
:
:
:

中

?

。
円 g 目
。 ? ?

;
:
ー

円
牢
s
。 。 守

Z
‑
司

;

守

守

制

同

。

。

:
ω
~、
"
? ?
の

量

。
亘

判
凶

側
F

?

*

~
。

。

宮

。

.
司 苫
冨
!
s 、 。
中

~制

胃

書

?

?

。

自

百
宮

B
。

?

?

由
ー 主
:
;
宮
' ~
自
。 。 。 。 ?

g
?

ま

E

?

守

?

,
円 。

a

胃

~

?

。

2
、
E
:
。 ~ 。
円‑ー s
i
。 。 。 ? l
。
中

‑

a E
白

草

‑229

制

守

記
。
。 。 。 。 亘
? 守

h

誼

.
匂

?

書
。
事
? 。

M

制
M

書
?

邑
。

g ~

‘~

同

?

?

宇
'
?

書

書
?

~?

?

?

?

守

s
。 。

z

。 。

ー 書 書 誼
。 。 。 。

芭
。,、 由
? 。

。

?

・
s .

‑
ゆ

守

h

。

。
g

?

寓

守

中

。

?

。 。 。

h
.
制

。

E =
。

,由
、

~

E ー ~ 自 i
。 。 。 。 。
。
中
例
制

日

?

同
利
制
回

?

?

宰,、

@

前
回

h
N
b

??

。
a
自
。

宮
呂

宮
芭

@

s

z 主
s
。 宮
日
。
~ 。
。 ? ?
。 。 =
。

‑
。 g 由,
E s
? 。 。 ? ? 。

炉

h
制

ま g 事

宮

~

,喧司
~
。 牢
自
g 富
言 B 書
。 。 。 。 。 。 。 。 守
h
@
創

日

ω
。
。

。~~c2
目
耳
5 自 ω.
。 。 。 。 。 。 。 ? 。 。 。

剣
:
;
;

?

g
?

首
匂

前

。 。

?

。 。 。 。

ー 。
ー. .
思
:
;
~
。 。 。 中 中 。 。

、富
。 。 。
~
。 。 。
~

牢

h

‑

h
守

?

,g
司
回
~

宮
胃
F

8
?

?

F

。 。

制

F

h

?

F0?

門
同

富
由
富
ー・ E
耳
・
。 2 '
。 。
ー
。 ー 。 ? 。 ? ? ? ? 。
草

?

E
。

?

中

.
創

居
内

‑

。

。 。

Z
B

8
8 。

o

h
@

~
5 。 。

。
富
。

s 。

吻

?

?

。~

苫
牢

中

制

?

中

?

ま

N
制

?

。 ー‑

?

。~

2
円
.
。

?

。

宮
司

円司,
。 。 2
。 。

g

。 。 。 。

:
司
。
~
。 宮
書
。 。 。 。 。

富
。
富

g g E

•

?

宮

:

内
戸

; 宮

?

0

8

?

@

内

~
;
:
; ・
。 。 。 。

~

S
‑

@

同
側

:
;

。

?

。
。~
富 E 呂
。 。 。 。 。

。
o
.
富 円
? 。 ?

。

?

同

.
。
置
量 ~、 富
。 。 。 。 。
E

草

制

~

守

?

?

?

呂
円
司~
呂
宮
5 。
o
8 g c g 書 s
。│
。 5
。 。
。 ? ? 8
。 ? ? 2
? ? ? 守 。
? ? 。 ? 。
。
。
ー
~
、 五 首
円
‑ g ~ 。 由
.
司
,司
s
刷~
1
'
l
自
牢
呂
~8
。
。 。 ?? 。 。 ?? ?
。 。 。 。 。 。 ?
中
中

ω
:
;
:
L

。

E

牢

。

Z
日

?

?

司 m
2 :
ω
~~~8? 。

h

p

ヨ 2?

中

耳
・
;
:
ー 。
z
。 円
。 g 3 書
。 。 。 。 。 。 。 ? 。 。 ? ? ?? 5
。 s
。
~

担
s
。 =
。

。
司
.
日
E
君 ー
。 。 。 。
宮

?2
8 重

E

刷
@
F

E

.
伺
F

。 。 。 。
」

229.

N Q 日(凶 CSOY VOLUME 0 1 SUPPLY DEMAND STOCK RATIO SALES 1 NSPECT PREISPT ISPTCPR ISPCMCPR ISPACCPR CRUSH SLASTSTR CCORN CSUPTTL CDEMTTL CSTOCK CRATIO CWHEAT CSOYOIL CSOYMEAL NYYEN 279 279 279 279 279 279 279 279 279 279 279 279 279 279 279 279 279 279 279 279 279 279 279 279 6 6 6 .2491 1153703.97 778657.341 2507.5269 2236.3513 2 7 1 .1756 0.1220 3 7 .2048 43.4496 4 0 .9255 1 .1941 1.3078 1.2304 6 5 .2228 O .1176 2 7 8 .6380 9766.5114 8564.3930 1 2 0 2 .1184 O .1414 3 8 8 .6676 2 4 .7087 207.5875 108.4740 88.3621 381543.389 133539.193 212.1898 185.8590 101.9664 0.0464 27.3771 23.9095 20.4257 O .6636 3.0304 3.0240 10.6168 0.0472 62.8631 929.1716 704.5130 550.3160 0.0649 67.6155 2.5162 33.8724 10.8804 527.2500 405900.000 137778.000 2106.0000 1946.0000 125.0000 0.0510 ‑7.3482 6.9209 5.0947 0.1856 0.3633 O .3535 47.5700 0.0470 2 0 6 .7500 9 8 .6800 8 0 .6500 18.0300 0.0430 278.5000 18.2400 153.2000 8 2 .6000 889.0000 2258285.00 1078530.00 2874.0000 2617.0000 510.0000 O .2250 140.7041 142.0404 105.9962 4 .4054 .3431 51 51.3431 9 1 .1964 O .2250 516.2500 10963.0000 9430.0000 2247.0000 O .2700 716.5000 30.4800 2 9 4 .3000 132.3000

230.

。 。 。 耳 目 ? 。 。 耳 。 書 制 牢 。 。 。 。 。 。 r く g y E ! F 刷 ~ n ・ 円 ー 。 。 。 聖 3 誕 主 e 。 苫 ? ? 、 司 制 制 = ,c制 。 。 。 。 。 宮 胃 。 宮 . E ? h 曾 E E : ? 門 ' 司 ~ 芭 前 ? 。 u 室 事 脳 " ミ ' 向 刷 ー ? 。~ 苫 3 ? ? 的 p p 内 守 B E ? ? 芭 。 ? 宮 町 l ' ~ 2 l ' ? ? 自 ? ? ? 寓 a 。 制 ? ? : ; ! 自 匂 富 ~ 。 。 。 。 宮 。 ? 牢 呂 h 守 。 5 。 ? Z B ~ 。 。 ~ 冨 」 E t ー 」 邑 ω ー 」 島 制 = 2 B l ' ? 自 冨 富 ? l ' ? h . " 司 自 ? 。 ? 担 ま ? 王 E ? ? E e 剥 ~ 制 ? ? h @ ~ 牢 円 円 ;; 伊F 。 。 由 自 ~ 富 日 待 ? ? ? 門 芭制 守、 宰 ? ? ~ 刷 S B F 刷 富 : ; ; 2 , 。 。 g ‑ o E 。 宮 ー ~ ~ 2 ? h 副 ? p o 宮 。 ? s 門 F ~ 自 国 守 g : 。 炉 、 E ? ? ? 目 円 例 自 的 劇 F ? ? ? 刷 @' 宮 . 円 同 呂 ; ! : ? 円 ? ~ 。 凶 g ‑ ー 。 司 = E 制。 ‑ ー ? 2 匂= ~ 日 凶、 p 、 p 円 。 。 車 富 刷 由 。 制 日 e w ? 円 h 円 宮 刷 o 向 側 内 喧 。 ω 、 。 。 。 。 : g 日 ? 。 m 。 ‑ 同 F 畢 凶 , 芭 。 。 。 富 g 自 ? ? ? E 内 剥 2 ? ? 制 8 制 。 ‘・~ 制 。 。 。 ? 利 g ? , ~ 。 。 制 ? 。 ? 玉 3 [ 富 iIE 。 .利 円 ? ? ? E ? 。 ; : 。 詰 h 円 宮 内 s ? ? 剣 利 忠 e 凶 ~ l ' ? 牢 : ; ; ? 宮 ? ? .内 電 色 量 ー ‑231 ? ー 」 ? ー F円 宮 何 h 、 司 。 。 守 ま ~ 宮 ? ? 。 ? 。 ω 円 刷 伺 l ' d 宮 。 守 抑 E 中 守 E ? 耳 ' 苫 ~ ? 富 。~ 剥 F ? 告 ? 中 宮 ? 昌 ? i i 。 . ? ? s 制自 ‑ 副 側 ー ~ 喝 ? 宰 牢 , 司 = 、 ? ? ? ? E Z g g 寓 a ? 耳 。 凶 。 刷 ? 苫 舗 自 ? 君 写 ? 司 門 ・ 内ー ‑ 。 書 ; ; E 。 。 。 h 利 的 N 中 ? 。 車 誼 2 。 ー 。 m • 自 ? ? ? ; : : l v 宮 p、 。 。 ? 。 。 。 。 中 守 伺 刷 守 2 @ ‑ @ F u ‑n 守 。 。 。 。 宮 。 。 。 z ' 同 M 坦 自 . 富 田 制 ‑ a 。 。 。 ー e 円 F 国 伺 ? 事 。 門 ? ? 苫 制 。 。 ? 言 ? ? 牢 @ 自 刷 富 自 。 。 ' 町 ' 宮 ~ : E z 。 。 。 ? ? : ; : ; 自 ? ? 自 凶 ? 写 ~ 。 ? 円 凶 町 門 内 ~ 富 z。 F 例 慣 ? 富 。 ~ 宮 。 。 。 s。 。 。 。 h N ・ p 岬 M 冨 ,。 司 喜 呂 車 g ~ 。 E 。 。 。 ' 。 ? 守 。 。 。 ? ? , 制 匂 ー 、 草 円 創 」 伺 刷 。 2 円 p ? @ g 自 Z E u E 島 i : ? ? 苫 守 自 F z u 門 戸 ? l ' 円 h 円 同 ? 、 ‑ 、 ? 由 ? 。 ~ ? 呂 町 ; : 自 由 M内 軍 官 ? 制: ‑ ~ 。 ? 。 苫 寓 ~ ~ 。 。 。 5 。 。 。 。 g ~ :剣 制 i E E 。 門 ? ? 富 昌 制 自 也 ・ h ー 。 ~ 。 ? 中 。 宙 ー 。 宮 百 。 ? 。 。 。 ? 。 ~ ? 富 ? 也 N 円 . , ; M 凶内 ? ? ,。 日 z . 制 司 B 自 宮 。 。 。 。 。 。 。 。 。 。 ? 剥 h 円 8 ? 側 内 自 。 、 ' 制 E 。 。 。 h 国 N 6 。 凶 " 制 。 ; ‑ sま 制 。 。 : 2 日 。 。 o 。 ? 凶 ~ ? 自 l ' 由 。 ? 呂 h ‑ 凶 剣 . マ 自 。 。 。 l ' 日 。 。 凶 ~ 国 . 側 h 円 飢 自 ? ‑。 ? 制 S g F 2 富 5 o . 。 。 。 。 。 中 p 利 円 ? ? ? h ‑ ? 白 。 ー 号 E 。 芭 ? 。 。 。 。 。 。 門 胸h 百 。 。 E 。 ? ? 。 。 円 苫 ? ~ 目 a 明 0 ・ ー ? 刷 h ? @ ? 門 円 ~ 。 牢 、 , 。 田 呂 菖 制 。 日 ~ 。 。 。 。 。 。 。 。 。 。 自 凶 F . ‑ ー ? 戸 : ; ? 的 @ l ' 制 s芭 。 制 , 胃 8 自 。 。 。 。 ? 耳 m 倒,、 。 u 句 富 書 h 利 制 , 制 百 i 1 : l 。 。 l ' ? 。 内 園 .凶 ? : 。 ; ? ? F ・ ー 車 事 富 芭 ; 匂 : 、 ま 書 宮 。 ? 。 。 h ・ 同 6 側 内 ー H SEE: : ; 。 刷 向 由 凶 : 側 吻 :; 自 @ 。 芭 。 。 。 。 t ? h 円 . 司 。 ー 。 。 呂 。 。 ? 制 ま 制 : ; a:;! 。 制 耳 。 。 。 E 。 。 ? ? 。 芭 自o 員 自 。 。 。 。 。 。 日 ? F 。 ? ? ? 量 。 ー 匂 。 、 制 E 胃 苫 。 ? 。 。 。 。 ? ? g 制" 旬。 官' , e 。 : E E 。 百 昌 m E e 。 。 。 。 。 。 ? 。 。 。 E 。 ? ? ? ? 苫 ? 日 ? 凶 5 側 働 ? M内 匂 2 制 。 日 富 喜 g 。 。 s ? ? ? 。 E 刷 ‑ ー 自 E 芭 。 苫 。 。 。 。 g 。 g 。 。 。 。 富 制 ? • : l 刷 刷 @ ? 記 。 号 虫 ~ 。 。 。 。 ~ 凶 N ? 。 量 .。 。。 。制 自。 。 。 芭。 。 。。 制。 ? 。 。 。 。 ~ ? 凶 利 凶 語 ー 」 。~ 町 内h ? 。 芭 a i 自 = 車 E 制 。 ? s ? 。 。 。 ? N ? ? 。司 司 。 。 。 . 芭。. d Fh ? 制., 喧 e ω l 1 : 制 ま ,宮 m 司 軍 = 制 。 。 。 。 。 。 ? l ' ? ? s ω = ー 凶 」 島 ? 。‑ E 。 。 。 。 。 ? ~ ~ ? 作 凶 ? ω p , 富 ~制, 昌 8 司 寓 ~ 。 。 。 s 。 。 ? ? ? 制 宮 " 制 ? ~ 宮 ? ー 、 。 ~ 5 E 。 。 。 . 凶 h 円 草 島 。 ‑ 。 a 。' ? 。 冒 側 ? 戸刷 ' 書 門 ? 胃 円 ~ 刷 ? 宮 。 。 ? : ; ,制 司 耳 . 寓 " 自 。 。 。 。 。 。 制宮 司, ? g = , 日 ; ; 2 。 * ? 制 書 事 ~ 。 。 。 " 置 ・M ? ? ? 側 ? 刷 伺 ~ 草 ・. 。 。 。 ? 制 苫 書 E E 制 。 。 。 。 。 。 ; : ? 書 。 自 ? 富 。 E B ~, 円 ;~ 耳 自 。~ 制~ 。 。 。 。 ,軍 司 ~ 。 。 。 。 百 胃 剣 I

231.

一 に 1ununuauηζkuqOKU8斗 ‑uoonJιnunJι マI41nJι 0 円7 1nHunwuoooonJι υ に 丹 ︑ ukuマIqO71nukusT に 且 nunHUF08斗 nununuマInunwunU4lqJOOK‑uponunuponHunU41nunJι 且 qdoos 斗 マIηζaU41nU マ nunU8斗 ηζnuqonusT Iqd マI K U 8斗 nU41nHU IKU4lqdauk‑unununU41ηζaU41nunununuηζ 司 dau ﹄斗 OOKUnHUマ ︐ 2 6 5 2 6 5 2 6 5 2 6 5 2 6 5 2 6 5 2 6 5 2 6 5 2 6 5 2 6 5 2 6 5 2 6 5 2 6 5 2 6 5 2 6 5 2 6 5 2 6 5 2 6 5 2 6 5 265 2 6 5 2 6 5 2 6 5 2 6 5 ζ auqdqd マI71kuηζqdqdqdnununU8斗 η t tE lMωM1 L CSOY LVOLUME L0 1 L SUPPLY L DEMAND L STOCK L RATIO L SALES L INSPEC L PREISP L ISPTCP L ISPCMC L ISPACC L CRUSH L SLASTS L CCORN L CSUPTT L CDEMTT L CST . OCK L CRATIO L CWHEAT L CSOYOI L CSOYME L NYYEN 平一 N 対数変換ベース 0.1296 0.3430 0.1954 0 . 0 8 6 1 0.0834 O .3682 O .3770 0.9836 0.5716 0.5560 0.5197 0.3219 O .2284 0.1617 0.4147 0.2016 O .2920 O .2923 0.5349 0.4675 0.1624 0.1059 O .1 5 9 1 0.1042 6 .2677 12.9139 1 1 .8334 7.6525 7.5735 4 .8283 ‑ 2 .9759 ‑ 1 .3014 1 .9345 1 .6282 ‑1.6841 ‑ 1 .0125 ‑1.0399 3 .8622 ‑3.0576 5.3315 4.5919 4 .3 9 0 1 2 .8920 ‑3.1466 5.6446 2 .9036 5.0317 4.4140 6 .7 9 0 1 1 4 . 6 3 0 1 1 3 . 8 9 1 1 7 .9 6 3 5 7.8698 6 .2344 ‑1.4917 4 .9 4 6 7 4 .9 5 6 1 4 .6634 1.4828 1 .4172 1 .2895 4.5130 ‑ 1 .4917 6 .2 4 6 6 9 .3023 9 .1 5 1 7 7.7174 ‑1.3093 6 .5744 3 . 4 1 7 1 5.6846 4 .8 8 5 1

232.

【相関係数】 r )は以下のように定義されデータの相関の程度を表わす指標である。 相関係数 ( エ, エ, (x 王) ( Y i‑y) r )= 相関係数 ( 叶 ( x一王 (L(Yi̲y)2 Y rの値の範囲 -1~ r壬l r=1の時 正の完全相関 r=‑1の時 負の完全相関 r=0の時 無相関 Y r=1 r=‑1 小 x x y y r=O r=O 小 ‑‑ ー ・ ・ , , , , , , , . . . . . . . . . . . . . . . h 、 、 、 、 ・ ・ 1 ' ー a x x xとyとの聞には xとyとの問には 「全く関係がない」 「何らかの関係がある」 【時差相関係数】 時差相関係数とは、相関係数を利用して時系列データの先行・遅行関係を検証する手法 である。時差相聞は、一方の変数のラグを取り、これと他の変数との相関係、数を計算すること によって求められる。 u 円︿ ︿ nu nd

233.
[beta]
2
料一司

(
Y
i
‑
1‑y)

時差相関係数=

2(Xt一22(YtIY)2

時差相関分析を行う場合に注意しなければならない事は両方の変数に強いトレンドがあ
る場合にはすべての時差相関係数が高くなりデータのラグ関係が明らかにならないことで
あるこのような場合には適当な変数変換により両方の変数からトレンドを取り除くとラグ関係
が鮮明になることがある

シカゴ大豆価格と在庫寧の闘係

時量相闘4
匹敵

・

1"

現

.m
"E

圃図

ー@間十

宮 田 回

,

,
二

一一抽

,‑

,

a..~-x-...~符

時盤相岡信監{トレンド陣量量)

シカゴ大豆価格と在庫寧の姐穆[トレンド陣量睡}

 一 一 一 一
│
,~・

r:;::高直一

ー土~_o

ι

l

I
1~E・
掴
γ

司@舗?

.

屯幅一

‑234一ー

一一一一ー一一一
~

e

・
・
.
.
"

在庫.,,", ‑x‑

234.

1 . ピークとポトムの樟匝 分析対象となる変数をグラフにして変動の対応を調べる手法は、時系列データ分析の基本 とも言える。 特にデータの変動が上昇から下降へあるいは下降から上昇へと転換するポイントがどの様 に対応しているかは、我々に重要な手掛かりを与えてくれることが多いのである。 シカゴ大夏価格と在庫率の推移 ③' ② " ' 0 ・ 鍾蝿 幅四倍岨 a 竃 却は ・戸崎 ・ ' 0 叩 L一一一一一一一一一一一一一一」岨 ; ; i i i ; ii i ; i i i ; i i i ; i ii i i 図中の在庫率の変動は②でピークを打ち①、③でボトムと見ることが出来る。 これに対しシカゴ大豆相場の変動はやや複雑ではあるが、ならして見るとピークが①'③¥ ボトムが②'と見ることができる。この場合、①と①'、②と②¥③と③'が各々対応しているとする 1 " " ' ‑ ' 1 2週連行してい と在庫率の変動とシカゴ、大豆相場の変動は在庫率が価格に対し、平均 1 ると判断する事ができる。 しかし、この結果からは在庫率の変動がシカゴ、大豆相場の変動の原因となっていると判断 することは難しい。また一般的に、周期的変動をしている変数について先行・遅行の関係をグ ラフから解読することはそれほど容易ではない。 そこで、変動パターンの類似性を時間に関して数量化して、検証することが必要となってく る 。 2 .時差相関分析 時差相関分析は、 2 つの時系列データについて一方を時間についてずらした時の相関係 数の大きさを分析する手法である。 ‑235‑

235.

シカゴ大豆価格と米鹿務省大夏予想在庫事の時差相関 ‑ o . a . ‑0. 8 2 ‑0. 8 0 ‑0 . 7 8 7 6 ‑0. y ‑0. 7 4 ‑0. 7 2 ‑0. 7 0 ‑0. 6 8 ‑0. 6 6 ‑0 . 6 4 10 ‑9 ‑8 ‑7 ‑6 8コ4 ‑3 ‑2 ‑1 0 1 2 3 I o IAX 10 在庫車先行← X →恒笹先行 シカゴ大豆価格と米農務省大豆予想在庫率の時差相関(対数 l t l l後) ‑0. 9 0 r ‑0. 8 8 . 8 6 ‑0 ‑0. 8 4 ‑0. 8 2 ‑0. 8 0 y ‑0. 7 8 ‑0. 7 6 ‑0. 7 4 ‑0. 7 2 ‑0. 7 0 逆福扇示量量毛蚕E 正 面l 主、ジヵ‑=;大豆面書記、 J 予) 懇期末在庫率を5週先行させた (X=‑5)時の i 係数(y =一0.875) 6 8 ‑0. ‑0 . 6 6 10 ‑9 ‑ 1 1 ‑7 ‑6 1 ‑ 5 I~ 面忌 ‑3 ‑2 ‑1 0 1 2 3 在庫車先行← X→価格先行 10 分析の結果、逆相関係数の最も高いのは在庫率がシカゴ大豆相場に対して、 5週間先行し ている場合(一0 . 8 2 9 )である。また全体を見ても、総じて在庫率が先行している場合の係数の 方が高いことが示されており、ピークとボトムの対応で推測された在庫率とシカゴ大豆相場の 関係がある程度数量的に確認されたとし、ってよいと考えられる。 (注) この様に時差相関係数は、因果関係の存在についての必要条件を満たしているわけであ るが、以下にあげる理由によって十分条件を満たしていないのである。 2 3 6

236.

1 )時差相聞を計算するラグ期数の選択の仕方である。ラグ、期数の選び方によっては、先行・ 遅行の関係が必ずしも明らかにならない場合がある。さらに相関度合いの強弱判定は単純 な相関係数の大小比較によっては難しいとしづ問題があるからだ。 2 )時差相関係数が変数相互の関係と変数自身の自己回帰的変動を区別できない点にある。 つまり時差相関係数が高い場合でも、それは単に 2変量の自己回帰的変動パターンが類 似しているだけの可能性もあるからだ。 相関係数はデータの相関関係を統計的に明らかにするにすぎないため、相関係数が l に 近いからといって必ずしもデータ聞に経済的な因果関係があることを意味しない。すなわち、 見せかけの相関「擬似相関」に注意する必要がある。 以下の 2 つの手法は、予測力の精度を改善させることが出来るのではなし、かとしづ視点で 選択された手法である。 く因果論的接近〉 商品先物相場などの相場変動は経済活動を反映していると考えた時、どの程度の説明力 があるかを次の 2つの手法のうち①のモデルで、検討していくことにする O ①回帰分析を利用した説明力の検討 ②Johansenの共和分モデルを利用した検討 ~ 1 回帰分析の概要 回帰分析の「回帰」としづ言葉を統計学の用語としてはじめて用いたのは、生物統計学者 ゴールトン (1822‑‑‑‑1911)である。 一般の経済分析に用いられている回帰の考え方について所得 Yと消費 Cとの関係が以下 の図のようになったとする。 C I I I I I I ‑ ・ I I I E Y nベリ ワu ヴ ‑

237.

問題は、このようなデータが与えられた場合、消費と所得の関係をいかに簡潔かつ効率的 に表現するかである。 こうした観点から、 CとYとの関係をたとえば直線で代表させようとするのが回帰分析である が、これが「回帰」分析と呼ばれるのは、例えば Cの動きをどの程度直線で置き換えることがで きるか、換言すれば、どの程度直線に戻すことができるかからきている。 C / 1 1 . /・ I I 目ノ〆 E 司 c=α +bY I ・ I Y 上記の c=α +bYのような式、すなわち原因となる変数(説明変数)と結果となる変数(被説 明変数)との聞の定量的な関係を示す方程式を「回帰方程式」とし、う。 また、被説明変数と説明変数の関係が I次式で表わされる場合を「線形回帰」、 l次式でな い場合を「非線形回帰」と呼ぶが、この非線形回帰方程式とは、被説明変数と説明変数の関 係が線形関係でないとし、うことである。 しかし、非線形回帰方程式の中には対数変換等により線形回帰方程式に変換することが可 能なものもある。例えば、 y=似 β は非線形回帰方程式であるが、両辺に対数をとると、 l o g y=logα+βlogx となり Y=l o g y、A=logα 、X =l o g xとして上式を書き直すと線形回帰方程式となる。 また、 y= β。 +βjx+β~2X2 +β 3 X 3 は xに関して非線形であるが Xj =X、X2=X2、X3=X3とすれば線形回帰方程式となる。以 下、線形回帰について考えることにする。 ~2 最小 2 乗法(略称 OLS) 、 は αとbに相当)を求める最も一 最小 2乗法は、回帰方程式のパラメータ(前例 c=α +bYで 般的な手法である。その考え方を概念的に言えば、次項の図において各点から回帰直線ま U での長さ ( r)の 2乗和を最小にするようにパラメータを設定することにほかならない。 ベ ηu qL ︒ ︒

238.

二~之と 回帰分析 原時系列ベース 決定係数 =0.6687 相 関 係 数 =‑0.8177 t i 直 =‑23.6445 pi 直=0.0001 直=559.0621 P値 =0.0001 Fi 対数変換ベース 決定係数 =0.7411 相 関 係 数 =‑0.8644 t i 直 =‑28.1592 pi 直=0.0001 直二 0 . 0 0 0 1 直=792.9413 pi Fi 回帰分析(モデ、/レ)による因果論的接近では大豆の全体変動の約 67~74% 説明出来ると考 えられる。 C C Y xとyについてのデータが与えられた時、 y軸方向への回帰と x軸方向への回帰の両方を 考えることが出来る。 y y y軸方向への回帰 x軸方向への回帰 x x ‑ 2 3 9

239.

例えば、 y軸を価格、 x軸を在庫率とすると y軸方向への回帰とは、価格を在庫率によって 説明することであり、逆に x軸方向への回帰とは、価格から在庫率を説明することである。両 者は分析しようとしている対象は同じで、もその理論仮説が違っており、因果関係の観点からは まったく逆の立場に立っている。従って回帰を考える場合には、変数聞の因果関係を十分に 考慮する必要があるのは言うまでもない。 【最小 2乗法の前提と最小 2乗推定量の性質】 , , y =α+bxでL表わされるモデ、/レに最小 2乗法を適用する場合、一般的には誤差が含まれ で、表わせば上記モデルは、 る。誤差は確率的に発生するものとして、これを U, , ,, y =α+bx +u と表現できる。誤差項 U, の確率分布に関する前提は、最小 2乗推定量の統計的性質に大き な影響を与えるので重要である。 の確率分布について次のような前提を置く。 最小 2乗法で、は、誤差項 U, 仮定1.誤差項の期待値は常にゼロ E(U , )=0 仮定 2 .誤差項の分散は観測時点 tとは無関係な定数である。 Var(U , )=σ2 仮定 3 .異なる時点の誤差項は互いに無相関(系列相聞なし) E(U , U, ̲ J= O, S* ‑0 仮定 4 .説明変数と誤差項は互いに無相関 E ( 叫( x , ‑E(x , ) ) ) = O 仮定 5 . 日は正規分布に従う。 ※この仮定はときにより外される事もある 0 仮定 l~ 仮定 4 までが満たされている場合 →「標準的な回帰モデ、ル」 0さらに仮定 5も満たされている場合 →「標準的な正規回帰モデル」 と言う。以上の仮定のうち特に 1~4 までが重要である。仮定 l~ 仮定 4 までが満たされた場合、 線形回帰の最小 2乗推定量は「ガウス・マルコフの定理」より 最小分散線形不偏推定量"と呼 ばれるが、一般的には以上の仮定 l~仮定 5 のうちのいくつかは成立しない場合が多い。 240‑

240.

(推定期間 92 年 9 月 ~97 年 12 月) モデル式 8 5 6 .1 0 8 1 1 5 5 5 .6 7R A TI 0 1 g ・ E ・ ‑ ‑ .. ¥ 刊て¥ ¥ } E ‑ ‑ E 1 5 也 1 0 % ι ¥ar ¥ZI ・ ‑‑‑E品目 E ・ ¥E MR橿 6 0 E‑ELF‑‑‑? ・ F E 叶︑吋帥晶4 .B‑E ‑¥‑E 7 0 0 ll nunbnuva z 唱 F Z El・‑‑︑ ‑ ‑‑ ・ E・ 句司・ .‑E ・ 8 0 20 也 R A T I O I • R CSOY 一 iEa; ・ .1 ・ ; l i ! ! ; ー ・.. ・ . 2 且 F , . ̲ 孟・ J ー」→二一」二̲.̲̲̲̲̲̲,J: ̲ d 二τL B ・4 ー 5 5 0 6 0 0 6 5 0 7 0 0 7 5 0 pC S O Y ‑ 2 4 1一

241.

‑l y 5 υ n n u ~二コ ∞ 700 6 800 C50Y 。 ∞4 密 度 日∞副 5回 540 580 620 660 ∞ 740 7 780 820 C50Y 蜘蜘蜘問叩則 和 一一計方 一吉平葺 Lの 若 践 ノ一み軒敵度正準 ‑一置古分尖修繍 パセンタイJ レ 889α沿0: 7 2 4 . 5邸)() I 6 6 7日XlO1 5 8 5 . α)00I 5 2 7 . 2 5 0 0 1 3 6 1 . 7 5 0 0I 1 3 9日XlO1 6 8 2 α ) ( ) ( }j 9 9 . 0 % 9 7 . 5 9 5 .0% 9 0 . 0 包 1 0 . 0 笥 5 .0% 2 . 5 1 . 0 % 8 8 0出)00 8 5 4 .日)00 8 3 5 .2 ヌ)() 7 9 6印)00 5 6 1 以)00 5 ‑ 49 . 7 ヌ ) ( ) 5 41 .7 ヌ ) ( ) 5 3 2 . 7 5 1 : 回 0 0 RATlO 二 コ 貼 T 1111111MMIlili‑‑ 1 0 ¥ 2国 15¥ RATIO 密 度 RATIO 2 7 9 . 0 0 0 0 置みの含針 Q . 1 2 2 0 吉針 。旧.6<分散 0 . 6 8 8 2 主宜 4 . 7 5 日修正菅平方和 3 8町 山 橿 準 設 豊 2 ) 9印)00 3 ‑ 4. 0 5 0 O田 2 2 ‑0. 4 6 4 1 0 . 5 9 9 7 0田 2 8 ∞ パー守ン 9 イ レ 0 . 2 2 5 0I 0 . 1 5 6 0I O .l a 8 0I Q .0 8 J OI 0 . 0 5 1 0I 0 . 1 7 4 0I 0 . 0 7 3 0i 0 . 0 8却 9 9 . 0お 9 7 .5 . 9 5 . 0 9 0 . 0 1 0 . 0 5 . 0 2 . 5 1師 242‑ 0.2250 0 . 2 2団 0 . 2 2 1 0 0 . 1 8 6 0 0 . 0 7 6 0 0.0640 a . 0 58O 00510 860 ∞ 9

242.

(推定期間 9 2年 9月‑97年 1 2月) ¥ 1 モデル式 asE t‑ h r d 可 ・ ‑ 1 . 5 1rzE ﹃ 2 2 . 5 I E ZBEKz ‑‑o ・ ・・‑ 6.4 6 . 3 J t;‑ 2 4 E ‑ ‑ ‑ 6 . 7 6.6 E: ‑ ‑ ‑ 一 E s 6.5 ‑E ・2 EE‑ ‑Et‑‑ 1 ・ ・ ・ ・ ・ B ・ 一 ・ ・ ・ ‑ ‑ ‑ ‑ EHF‑t ﹂ . cO 6.4 6 .3 ii f‑i・ ‑ E L ・ ・ ‑E' E ! : L に:・一 .• 0.2 い 叶 口 一? ? E ••• 1: !・ ・ i ・ ・ : : ・ 2 ・・・・・ ・ :a ︐.圃 ‑・ P E‑Ez・ ・ R .• ・2 EE‑‑14r ・ト 2 UVT ︽ 6 . 5 一ハし pb 6 . 6 0 . 3 0 0 1 LR A T I 0 1 58408 ‑ ‑.2 P L CS 1 243‑

243.

E J l̲CSOY I 凶 L y n u 6.6 6.5 6.4 6.3 6 . 7 lC S O Y 密 度 Lお I J Y モメ豆下 2 7 9 α ) ( ) ( ) 6 .‑ 49 3 1 0 . 1 3 0 7 0 . 2 3 8 9 1 1 7 6 7 . 4 1 9 7 溝平方和 民量 2 . 0 1 2 2 J 279.0000 .5 7 0 1 1 8 11 0 . 0 1 7 1 4 冊目 4 . 7 4 5 0 4 。 曲78 セン レ 6 . 7叩 1 9 9 .0¥ 9 7 . 5 ¥ 6 . 5 8 5 5 6 . 5 0 3 5 9 5 . 0 ¥ 回 目 6 . 3 7 1 6 1 0国 6 . 2 6 7 7 5国 0 . 5 2 2 4 2 . 5 ¥ 0 . 2 1 3 9 6 . 5 2 田 1 .0 6 . 7 8 0 5 6 . 7 国§ 6 . 7 2 7 7 6 . 6 1 9 6 6 . 3 2 9 7 6.3 回5 6 . 2 9 4 8 6 . 2 7 8 1 J ! [ } 陥TIO ‑2.5 ‑2.0 15 l RATIO 密 度 lRATIO mm 剛山閣削 一一吉平量 一‑一み計散直正道事 一 一量合分尖修揖 Jミ‑,竺ン'イ J レ ‑ 1 .4 9 1 7 ) ‑ 1 .8 5 1 9I 9 9 .0% 9 7 . 5 ¥ ‑ 2 . 2 2 5 6! 9 5 . 0 ¥ ‑ 2 . 4 8 8 9 冊目 ‑ 2 . 9 7 5 9I 1 0四 1 .4 8 4 3 1 5凹 Q .6 3 1 01 2 . 5 ¥ ‑ . 2 . 4 8 8 9 1 田 ‑244 ‑ 1 .4 9 1 7 ‑ 1 .4 9 1 7 ー 1 .5 0 9 6 ー1 . 6 8 2 0 一2 . 5 7 7 0 ー2 . 7 4 8 9 ‑ 2 . 8 4 7 3 ‑ 2 . 9 7 5 9

244.

93回帰分析の基本的概念 【決定係数】 回帰方程式において、被説明変数の全変動のうち説明変数の変動によって説明される部 分の割合を「決定係数」と呼ぶが、この決定係数は方程式の説明力の大小を示す指標と言え よ う 。 0決定係数は次の式から導かれる。 yの全分散 ( S/)(=yの全変動) 二 yの全分散のうち回帰式によって説明された分散 (Sr2) + yの全分散のうち回帰式によって説明されない分散 (Se2) 決定問げ=とと定義すれば、 Sy ニ 上式より R2‑SJV2‑SEZ‑SE2 一一一一一一一 1 ‑ ‑ S y 2 ‑ S/ 一般に S/~ Se2であるから 0豆 R"亘lとなる 】 【I値 I値は、最小 2乗法によって計測されたパラメータが有意で、あるかどうかを判定するために 用いられる統計量で、ここでいう 有意"とはパラメータが統計的に見てゼ、ロで、なし、と判断され るとしづ意味である。 I値を用いたパラメータの有意検定 ( t検定)の原理は以下のとおりである。 y, = a+b x , +u , において、 b=0, すなわち I Xはy(こ全く影響を与えなしリとしづ帰無仮説をた てると、ん=土 。 五 (ただし bは bの最小 2乗法推定値、正3 6は bの分散の推定値)で定義される bの I値 I 6は、自 由度 (n‑2)("はデータ数、 2 はパラメータの個数)の I分布に従うことが知られている。従っ て 、 I分布表により、帰無仮説 b=Oを検定することが出来る。 I 分布表 Pは有意水準 t 0 ‑ 2 4 5

245.

*ここで注意すべき事は、 I検定で棄却された仮説は b=Oである点である。すなわち、ここで の検定結果は b=Oではないことを示すにすぎず、["t値の大きさ(絶対値)二ノミラメータの信頼 f 直の大きさは当該パラメータがゼロとは異なる度合いを示すにす 性」と誤解してはならない。 t ぎない。 *t検定において問題となるのは有意水準(帰無仮説が正しい時、それを間違って棄却する 確率)をどのように設定するかである。通常は 5%あるいは 1%が用いられるが、絶対的基準は なく、分析者の判断に委ねられている。 f i圭壬1.4以上)あればパラメータは有意で、あると *一般的には I値が 2以上(学者によっては . n )によって大きく値が変わり、データが少ない時に することが多いが、 I分布表はデータ数 ( は I値の絶対値がかなり大きくなしせ有意水準を満たさないことに注意する必要がある。 【F値 】 I検定が線形回帰モデルの回帰パラメータの有意性を個々に検定するのに対し、複数のパ ラメータの有意性を一括して検定するのが F検定であるが、 F検定は以下で定義される F値 を用いて回帰パラメータがグループρとして有意かどうかを検定する。 回帰方程式 Yr= α+β丙 1 +s 2X2 1+…+ s k X k r+s k + I X k+r l+ … +spX 戸 +U r Ur~N(0, a2) において、以下のような帰無仮説をたてると、 Ho;sI= s 2=… =s k= 0 X I, Xυ…Xp)のうち最初の K 個の説明変数の中には、 yに影響を与えるも これは「説明変数 ( のは存在しなし、」ことを意味している。この時 F‑ =( S S Eo‑S S E 1 ) / K S S E / ( n ‑ p ‑ 1 ) 1 n:データ数 S S E o :仮説 H。のもとでの最小 2乗残差 2乗和 ( 2 :(Yー九 ) 2 ) S S E すべての変数を用いた場合の最小 2乗残差 2乗和 1: ( 2 :(Y‑YI)2) ただし九 ' Y I :それぞれの yの推定値で定義される統計量 F は自由度 (K, n‑p‑1)の F 分布 に従う。 仮 説 H。が真、すなわち K 個の説明変数の中に被説明変数に影響を与えるものが存在しな Fミ0 )はゼロに近い値をとり、 F値がゼロよりかなり大きな値をとることはまれ いならば、 F値 ( にしか起こらない。したがって、計算された F 値がゼロより十分に大きければ仮説 H。は棄却さ れる。すなわち、検定している説明変数のパラメータの中に有意にゼロと異なるものが存在す るわけである。 F値が十分に大きし、かどうかは、有意水準に応じて F分布表から得られる F の値と対比することによって判断される。 ‑246

246.

一般に有意水準としては、 5% もしくは 1%が使われるが K=Pの場合は一括してすべての 変数が yを説明する上で有意かどうかを見ることになる。言い換えれば「説明変数の一部、も しくは全部が被説明変数に影響を与えている」と結論を下しても、この結論が誤っている確率 は 5%(1%)未満とし、うことになる。 シカゴ大豆価格実演] 1値と予測値 α 1羽 田 90000 if' p ノ / リ . . 川' . ¥ M・、‑.ペャ 」 ・ 、 r " .̲ . ・ lJ J ‑ : 1 価~ 帽 1 ' ァ ミ ! ー←ー予測値 1 ‑ー実測値 │ 5∞ 田 y ; ' . 旬 、 ーー・・棟割匝偏差よ限(十 1):) ・・・・標事価差下限 (‑1):) 98/03/29 98104/05 98/04/12 98104/19 予測値 7 0 5 . 2 1 7 0 6 . 7 6 7 0 6 . 7 6 7 0 6 . 7 6 7 0 6 . 7 6 7 0 9 . 8 8 7 0 9 . 8 8 7 0 9 . 8 8 7 0 9 . 8 8 7 0 3 . 6 5 7 0 3 . 6 5 7 0 3 . 6 5 7 0 3 . 6 5 7 17 .65 .6 5 7 17 7 1 7 . 6 5 誤差 39. 46 ‑ 4 2 . 7 6 ‑ 3 6 . 5 1 ‑ 3 4 . 0 1 ‑ 2 0 . 7 6 ‑ 3 0 . 8 8 ‑ 4 3 . 1 3 5 6 . 8 8 ‑ 4 6 . 3 8 ‑ 4 8 . 1 5 5 8 . 1 5 ‑57. 40 ‑ 6 6. 40 ‑ 8 4 . 6 5 7 5 . 4 0 ‑ 7 0 . 1 5 ‑247‑ ‑1: ! 6 1 6 . 8 5 618. 40 618. 40 618. 40 618. 40 6 21 .5 1 6 21 .5 1 6 2 1 .5 1 6 21 .5 1 6 1 5 . 2 9 6 1 5 . 2 9 6 1 5 . 2 9 6 1 5 . 2 9 6 2 9 . 2 9 6 2 9 . 2 9 6 2 9 . 2 9 +1:!: 7 9 3 . 5 7 7 9 5 . 1 3 7 9 5 . 1 3 7 9 5 . 1 3 7 9 5 . 1 3 7 9 8 . 2 4 7 9 8 . 2 4 7 9 8 . 2 4 7 9 8 . 2 4 7 9 2 . 0 1 7 9 2 . 0 1 7 9 2 . 0 1 7 9 2 . 0 1 8 0 6 . 0 2 8 0 6 . 0 2 80602 m 9 8 / 0 2 / 0 8 98/02/15 98/02/22 9 8 / 0 3 / 0 1 98/03/08 98/03/15 98/03/22 MM5055005000055050 川 町7 0 2 7 0 0 7 0 5 5 5 2 2 U 2 5 1E 56 46 07 27 68 9766353 b 65 55 46 47 33 32 47 4 E3auau o ハ auauauauauauauauaunbaunbau 98/01/04 98/01/11 98/01/18 98/01/25 98/02/01 事 O¥司 的︼¥門 ‑N¥NF¥ho ‑‑¥hm 国 何 ︑ @ ︒ ︑ hm ︑ ︒ ‑¥eo¥hm ︒︒︑︑ hO¥ ︒ 円 的問¥mO¥ha ︑︑マ︒ ¥hm mv‑ O¥門O¥hm ん ︒ ‑ ︑ 一 O¥ho ¥NF¥@m ︒ 句 ︑ ¥ o ‑ 作例 ︒ 句 制 凹 推定期間 (92年 8月 ‑97年 12月)のデータによる 予測値と実 ; X !値との誠差 宅

247.

シカゴ大豆価格実測値と予測値(対数変換後) 7 .000 6900 6800 ノ : ( ∞ 67 力対 ゴ敏 . 6 太変 6 豆像 価値 ∞ Jヘノ . . ー ト 、 格~ 6 . 5 ∞ x n v ¥ J 、 K . ゴ1v¥J:¥ ∞ 4 . 6 ‑ー一予測{直 一ー一一一一一つ・ !‑ー実刑直 ! ‑ーーー標準偏差下限( 1E)│ 日300 i J ‑.‑‑標準偏差上限 (+1r) ¥ 実測値 . 5 0 0 9 98/01/04 6 . 49 83 9 8 / 0 1 / 1 1 6 . 5 0 7 7 98/01/18 6 . 5 1 1 4 98/01125 6 . 5 3 0 9 98/02/01 6 . 5 2 0 6 98/02/08 6 . 5 0 2 4 98/02/15 6 . 48 16 98/02/22 6 . 49 75 9 8 / 0 3 / 0 1 6 . 48 54 98/03/08 6 . 47 00 98/03/15 6 . 47 1 2 98/03/22 6 . 4 5 7 2 98/03/29 6 . 45 05 98/04/05 6 . 46 5 0 98/04/12 6 . 47 3 1 98/04/19 6 予;~Ij{直 誤差 6 . 5 4 0 9 6 . 5 4 4 1 6 . 5 4 4 1 6 . 5 4 4 1 6 . 5 4 4 1 6 . 5 5 0 4 6 . 5 5 0 4 6 . 5 5 0 4 6 . 5 5 0 4 6 . 5 3 7 9 6 . 5 3 7 9 6 . 5 3 7 9 6 . 5 3 7 9 6 . 5 6 6 8 6 . 5 6 6 8 6 . 5 6 6 8 ‑ 0 . 0 4 0 0 ‑ 0 . 0 4 5 8 0 . 0 3 6 4 ‑ 0 . 0 3 2 7 ‑ 0 . 0 1 3 2 ‑ 0 . 0 2 9 8 ‑ 0 . 0 4 8 0 ‑ 0 . 0 6 8 8 ‑ 0 . 0 5 2 8 ‑ 0 . 0 5 2 5 ‑ 0 . 0 6 7 8 ‑ 0 . 0 6 6 7 ‑ 0 . 0 8 0 7 ‑ 0 . 1 1 6 3 ‑ 0 . 1 0 1 8 ‑ 0 . 0 9 3 7 248 ‑1l 6 . 41 0 3 6 . 41 3 4 . 41 3 4 6 . 41 3 4 6 6 . 41 3 4 . 41 9 7 6 6. 41 9 7 6 . 41 9 7 6 . 41 9 7 6 . 40 72 6 . 40 72 6 . 40 72 6 . 4072 6 . 43 6 1 6 . 43 6 1 6 . 43 6 1 +1l 6 . 6 7 1 6 6 . 6 7 4 7 6 . 6 7 4 7 6 . 6 7 4 7 6 . 6 7 4 7 6 . 6 8 1 0 6 . 6 8 1 0 6 . 6 8 1 0 6 . 6 8 1 0 6 . 6 6 8 5 6 . 6 6 8 5 6 . 6 6 8 5 6 . 6 6 8 5 6 . 6 9 7 4 6 . 6 9 7 4 6 . 6 9 7 4 国‑¥円口¥回目 予測値と実測値との誤差(対数変換後) ‑O¥自白¥曲目 推定期間 (92 年 8 月 ~97 年 12 月)のデータによる h h田 一副¥白戸¥ h h a 目︒¥一一¥ 回目¥自白¥ha 九二¥田口¥匹目 田口¥hD¥ト︒ 回目¥田口¥hm 由 円‑¥マロ¥九円︒ 。 自白¥円︒¥九戸田 目 ︒‑ ¥‑D¥九戸田 h 、 、 o 、 、 唱︒¥刷一¥由自 ∞ 6 . 2

248.

《総論》 対数変換や時差相関分析といった過程を経て、様々なフアンダ、メンタルズ、から有効な要因 を絞り込んでいった。その結果、シカゴ大豆相場価格と米国産大豆在庫率の聞には、在庫率 の増減が原因となって価格に変動が生じるとしづ、フアンダ、メンタルズ分析の観点からみても 妥当性があると考えられる因果関係が推定できる。 この両者、シカゴ大豆相場価格と米国産大豆在庫率の関係より得た回帰式の検定結果(9 2 最 小 2乗法(略称 OLS)の表参照)からは、ある程度の適合性(決定係数 0 . 6 7 ' " ' ‑ ' 0 . 7 4 )があ ることが判断できる。 モデルの適合性については、様々な見地・指標・検定方法からその有意性を判断すること ができると考えられる。一つの指標として前項、前々項にこの回帰式より求めた、予測値及び 実測値そして予測値と実測値との誤差を掲載する。 9 2年 9月 ' " ' ‑ ' 9 7年 予測値の誤差としち観点からは 98年 1月以降の実測値は、推定期間 ( 1 2月)における価格変動の変動率の l標準偏差以内に収まっている。もちろんこれだ、けをもっ てモデ、ルの適合性を判断するわけで、はないが、ファンダメンタルズ、としづ数量的に判断を下す のが困難な指標への一つのアプローチになり得るのではないか。 通常マーケットの価格動向は、フアンダ、メンタノレズ分析や様々な価格動向パターンをもとに したテクニカル分析や数量的指標をもとにした分析で、予測されている c 前述の通りフアンダ、メ ンタルズ分析は数量的・客観的な判断を下すことが困難なため、特に商品先物相場はテクニ カル分析がマーケット予測の主流と言える。しかし、重要な指標をもとにしたフアンダ、メンタル ズ分析を全く無視することはできない。そこで、統計的手法によりファンダメンタルズを分析する ことの有効性が意味を持ってくる。 実用性とし、う面から考えると、仮に前述のモデルをもとにした価格予測の信頼性を 6害] 1 程度 1 をテクニカル分析による予測により補うとし、ったような方法をとれば、モデル として、残りの 4害] をマーケットの価格動向の予測に使う実用性は大幅に上昇させることができると考えられる。こ れは逆に、従来テクニカル分析だ、けで、マーケットの価格動向を判断してきたテクニカル・アナ リストの立場から言えば、統計的な指標を価格予測の選択肢に加えることで、テクニカル分析の 有効性を高めるとし、うことにもつながる。 統計的な予測が l標準偏差に収まるとは言ってもこの誤差が許容で、きるもので、あるかどうか は、実際にマーケットで、売買する投資家によって判断は大きく異なるで、あろう。この誤差あるい はテクニカル分析による予測の誤差を補完するためにも、バランスのとれた、 テクニカル分 析"と 因果論的接近による統計的な分析をはじめとしたフアンダ、メンタルズ、分析"の調和が重 要であると考える。 今回の研究で、は単回帰によるフアンダ、メンタルズ、分析の検証にとど、まったが、様々な要因を検 証し、それらを適切に組み合わせて多重回帰を行い、さらにモデ、ルの精度を高めることを今 後の課題としたい。そのためには、バラエティーに富んだ、 SAS システムの統計解析機能は欠 かせないものであると考えられる。これまではアナリストのさじ加減による判断で、フアンダ、メン 2 4 9 ‑

249.

タルズが価格に与える影響を取り違えることが少なくなかった。 売買は統計的根拠に基づく べきで、ある"と考えるマーケット参加者のニーズは、一層高まってくると予想できる。今後 SAS システムに代表される統計解析システムを導入し、投資理論を根拠にフアンダ、メンタノレズを分 析する手法及び、モデ、ルを構築するということが、商品先物市場そのものを投機から投資の世 界に、すなわち資産運用の場として位置づけることの一番の近道ではなし、かと考えられる。 250

250.

日本 S A Sユーザー会 (SUG I‑J) スワップ・レートに基づく金利期間構造と その予測性に関する一考察 日米両市場における実証分析を通じて 宮村幸夫 金融研究部長 株式会社 金融エンジニアリング・グループ Researchingthetermstructuresofinterestratesbasedonswaprates YukioMiyamura GeneralManager FinancialEngineeringGroupI n c . 要旨 近年、急拡大を続けているスワップ市場から示唆される金利の期間構造に焦点を当て、スワッフ'. レートから導きだされるフォワード・レートの予測性についての実証分析を日米両市場において行っ た。その結果、両市場ともフォワード・レートは、かなり有用な予測力を示す可能性があることを確認 できた。また、金利の中心回帰性を考慮、に入れることで、さらに予測力が高まることも検証できた。 キーワード: スワップ、金利期間構造、フォワード・レート、 PROC̲REG 1 . はじめに 周知のように、我が国の資本市場や金融環境はピック、、パン時代を迎えて、金融自由化、証券 化、国際化としづ大きなうねりの中で、国内外の金融機関の生き残りをかけた競争が激化してい る。特に国内の金融機関にとっては、魅力ある金融商品の開発や A s s e tA l l o c a t i o nおよび八 L M ( A s s e tL i a b i l i t yi v l a n a g e m e n t )手段に基づく多様化したリスク管理体制の確立が緊急を要する 重要なテーマになってきている。通常、金融機関の抱えるリスクとは、金利リスク、価格変動リスク、 信用リスク、流動性リスク、経営リスク、システムリスクの 6つ*1に区分されるというが、定量化し得 るのはほぼ最初の 3つのリスクであり、その中でも将来の金利動向を予測しながら調達・運用の 戦略を画策することは、金融機関経営の伝統的な最大の関心事である。このような観点から、従 来、将来金利予測の研究が様々な角度から行われてきている。その中でも、フォワード・レートが 有するその予測力は時として否定されながらも、多くの研究者にとってほぼ永遠的な関心事であ るとし、っても過言ではなかろう。一方、金融資本市場ではデリパティフ、に代表される新たな金融 形態の取引や市場が開設され、前述したようなリスク管理の有用な手段となってきている。このよ a 司ょ 4 円 に U

251.

うな状況を象徴するように、リスク管理の有効な手段であるスワップ取引の近年における成長に はめざましいものがある打。スワッフロ市場の中核をなすものは金利スワッフ。で、あり、この取引に用 し、られる固定サイドの金利率は、債券先物市場、金融先物市場および短期金融市場とともに市 場 金 利 情 勢 を 反 映 し 得 る も の で も あ る 。 我 が 国 に お け る こ れ ら 4市 場 は 、 金 利 裁 定 に よ り 密 接 に 関 連 し て は い る が 、 債 券 先 物 市 場 は 5年、 10年、 20年とし、った長期金利動向を、また、金融先 物 市 場 お よ び 短 期 金 融 市 場 が 6ヶ 月 以 内 の 短 期 金 利 動 向 を 代 表 し て お り 、 そ の 聞 の 期 間 を ス ワ ップ市場が担っているとし、えよう。また、スワップ。市場で、は取引期開設定の自由度が非常に高く、 他の市場では存在しないフォワード・スタート形式の取引も行われている。さらに、スワッフ 取 引 D を魅力的にしているのは、債券投資のように評価損益を計上せずに、含み損はそのままで資金 需要に対応できるとし、った決算上の大きなメリットで、もある。このような利便性ゆえに、金融機関 は金利自由化に伴い、融資金利をスワップ・レートベースで設定したり、 AUvlにおける資産・負 債のキャッシュフローやデ ュレーションのマッチング等の目的に、流動性の乏しい債券に代わっ てスワッフ。を積極的に活用し始めている。 そこで、小稿では、フォワード・レートの将来金利に対する予測性としづ課題に一考察を加える ために、従来にはなかった機動性の高いスワップ市場の金利期間構造に着目し、そこから算出 されるフォワード・レートが、将来金利に対する有効な予測性を有するか否かを日米両国市場の 実証分析を通して検証したい。 * 1・金利リスクとは、企業が行う運用と調達で金利変動に対する形態が異なることから発生するリスクであり、特に金 融の仲介を使命とする金融機関が必然的に負わさ、るを得なし、リスクである。 ‑価格変動リスクとは、価格変動により資産価値が下落するリスクで、投資有価証券の保有に伴う売買損や含み 損を抱えるリスクを指す。 I子が確保できなくなるリスクで ・信用リスクとは、貸出先の経営悪化により、資金の元本回収ができなくなるか、手J ある。このリスクは不良債権問題もあり近年急激に注目され初めており計量化の研究がさかんに行われている 0 ・流動性リスクとは、金融機関に対する信用低下や運用と調達の極端な期間協差により、急激な資金の流出に対 応できなくなるリスクであり、金利リスクとともに、金融機関が伝統的に抱えているものである。 ‑経営リスクとは、経営判断の誤りにより発生するリスクである。 ・システムリスクとは、コンヒ ユータによる大規模なオンライン網に基づく決済システムが構築されるにつれ、ひとり E の決済不能が、ドミノ的にシステム全体の機能麻療を引き起こし、金融機関の連鎖倒産につながるリスクである。 7 Jを参照されたい。) (詳細は、 FONGら[ *2ISDA(国際スワップ・デリパティフマ)が調査した世界の金利スワッフ。と通貨スワッフの取引残高の推移では、金利ス 9 0年 l こ2兆 3120 億ドル、 ' 9 1年に 3兆 G 5 0億 ド 、 ル 、' 9 2年に 3兆 8510億ド、ル、 ' 9 3年に 6兆 1 7 7 0億ド ワッブは、 ' 4年に 8兆 8 1 G O億ドル、 ' 9 5年に 1 2兆 8 1 1 0億 ドル 、' 9 G年に 1 9兆 1 7 1 0億 ド、ル、・ 9 7年に 2 2兆 1 1 5 0億ド ル 、 ・9 9 0年に 5780億 ド 、 / レ 、' 9 1年に 8 0 7 0億ドル、・ 9 2年に 8GOO億ドル、 ' 9 3年に 9000 ルであり、一方、通貨スワップ'は、 ' 億ドル、'例年に 9150億ド、ル、'%年に I兆 1 9 7 0億 ド ・ ル 、' 9 6年に I兆 5GOO億ドル、 ' 9 7年に l兆 5 8 5 0i . 意 ド 、 ル で あり、特に金利スワッフ 取引の拡大には目覚しいものがある。 ( 資 キ ヰ ISDAM a r k e tS u r v e y、B1S I n t e r n a t i o n a lB a n k i n ga n dF i n a n c i a lM a r k e tD e v e l o p l l l e n t s " NOV1 ( 9 7 ) ‑252一

252.

2 . これ迄の研究事例と当研究の分析視点 これ迄の金利予測性に関する研究は、主に、金利水準そのものを分析するとしづ視点とスワッ o こ直結する金利変動性を分析 フ。ション、キャップ、フロア品、った金利デ、 パティブ の収益機会玄 1 I P するとし、った視点から取り上げられ、幾多の検証がなされてきたが、ここでは、まず、小稿におけ る研究の重要な動機付となった Fama[2Jおよび Famaら[ 3 Jの研究およびそれを発展させた小林 4 Jの研究を概観し、次に、当研究の分析視点を述べたい。 ら[ 1 ) これ迄の研究事例 Fama[ 2 Jは、米国金融市場において、フォワードレートに将来金利に対する有効な予測性が 存在するか否かとしづ実証研究を T‑BILL(米国財務省証券)を用いた短期予測としづ観点で行 っている c また、同じく Famaら[ 3 Jでは、同様な観点で米国国債を用いた中期予測の研究も行っ ている。以下では、その理論的背景とそれらの検証に用いられた分析モデ、ルを概観する。 時点 tで購入された x年割引債が残存期間 v年で時点 t+x‑yで売却された際の収益率を h( x,y:t + x ‑ y )とすると①式が成立する。ここで、 P ( x:t )は t時点、の x年割引債の価格とする。 h( x,y:t + x ‑ y ) Ln(P(y:l+x‑y)/P(x:t))=LnP(y:t + x ‑ y )一LnP(x:t ) ① 二 時点 tで購入した額面 1$の x年割引債の利回りを r ( x :t )とすると②式が成立する 例えば、 O r( l :t )は t時点で購入された l年割引債の利回り、すなわち 1年のスポット・レートである。 r ( x:t )=‑LnP(x:t ) ② 時点 tにおける t+x‑l年スタートの l年フォワード・レートを f ( x, x‑l: t )とすると③式が成立する。 f ( x,x ‑ 1:t )二 LnP(x‑l:t )‑LnP(x:t )=r ( x:t )‑r ( x ‑ 1 :t ) 一 ③ 満期に 1$で償還される x年割引債の時点 tでの価格:P(x:t )は、債券の将来の期待収益率で 1$を割引し、た、時点 tにおける現在価値となるから④式が成立するが、そのためには、価格は合 理的な均衡期待収益率に基づいて決定されることが前提となっている。 P ( x:t )=exp[‑E, h ( x, x‑1 :t +1 )‑E, h ( x ‑ l, x‑2 :t + 2 ) …‑E, r ( l :t+x‑l ) ] ー一一一一④ フォワード・レート : f ( x,x‑1:t )は 、 1年割引債を時点 t+x一lで購入するとしウ契約を時点 tで結 ぶ際に適用される金利とみる考え方に基けば、これは時点 t+x‑1 における 1年スポット・レート: r ( l :t +x‑l)を予想し得るとする従来の通説的概念、を裏付けることにもなる。④式における残存期 間 x‑1年の期待収益率を合計すれば、割引債の価格は⑤式のように示すことができる。 P ( x:t )=exp[‑E, h ( x,1:t + x ‑ 1 )‑E, r ( l : 什 Xー 1 ) J ‑253‑ 一一一一⑤

253.

⑤式を③式に代入し、両辺から時点 tの 1年スポット・レート:r( 1 :t )を差引くとフォワード・スポッ ト・スフ。レッド、 f( x,x‑1 :t )‑r ( 1 :t )を求める⑥式を導ける。 f ( x, x‑1 :t )‑r ( 1 :t )=[ Et r ( 1 :t + x ‑ 1 )‑r ( 1 :t ) J+[E t h ( x, 1 :t+x一1 ) ‑r ( x ‑ 1:t ) J 一一一⑥ Fama~土、将来のスポット・レートに対する現在のフォワード・レートが有する予測有意性を⑦式 をモデ、ルとする回帰分析により考察している。 r( l :t+x‑1)‑r ( 1 :t )= 31+b1X [ f ( x, x ‑ 1 :t ) ‑r ( 1 :t ) J+1 1 1 ( t + x ‑ 1 ) 一一一一⑦ さらに、⑥式を実現値ベースで展開すれば、⑧式を導ける。 f ( x,x‑1 :t)‑r ( 1 :t )=[r( 1 :t+x‑l )‑r ( 1 :t ) J+[h(x, l :t+x‑l ) ‑r ( x ‑ 1 :t ) J 一一一⑧ ⑧式から⑨式を展開し、⑨式を⑦式に代入することで⑩式を導ける。 r ( 1 :t+x‑l )‑r ( 1 :t )=[ f ( x,x‑1 :t )‑r ( 1 :t ) J一[h ( x, l :t+x‑1)‑r ( x ‑ 1 :t ) J )X [f h ( x, 1 :t+x‑1)‑r ( x ‑ 1 :t )=‑a1+( 1‑b1 ( x, x ‑ 1 :t ) ‑r ( 1 :t ) J‑1 1 1( t + x ‑ 1 ) 一 一 一一一 ⑨ ⑩ ⑦式および⑩式の回帰係数 b1は一定で、この値はフォワード・スポット・スプレッド、 f ( x,x‑1 :t ) r( 1 :t+x‑l)‑r ( l :t )と収益率のプレミアム : h ( x, l :t+x‑1) r ( 1 :t )を構成する要因を、金利変化 : r ( x ‑1 :t )とに分解する比率を示すものとし、える。 Fama は、以上の理論的背景に基づき、前述したように⑦式で示される回帰モデ、ルによりフォ ワード・レートが有する将来のスポット・レートに対する予測性を、また⑩式の回帰モデ、ルにより将 t Sq1 l3 r e sl I le t h o d ) 来における収益率プレミアムに対する予測性をいわゆる OLS(Ordinary Le日s にて検証し、フォワード・レートは将来金利に対する有用な予測性を有するとしている。さらに、こ の検証結果から短期予測より長期予測の方がより説明力が高いとし、う一見矛盾した考察を金利 の中心回帰性を根拠に展開している。 一方、小林ら [ 4, p p . 1 9 " ‑ ' 2 5 Jは、ユーロ円金利先物市場を使い、金利期間構造モデルとして 定評のある Vasicek[ 6 ] ' 2のモデ、ルを基にフォワード・レートを算出し、⑪式に示す回帰分析モデ、 ルによる検目正を行っている。 r( 1 :t+x‑l)‑r ( 1 :t )= 何 十 b2X [ g ( x, x 一1 :t ) ‑r ( l :t ) J+1 1 2 t + X ‑1 ) ⑪ x ‑ 1 :t )は Vasicekモデルによる期待値) (ただし、 g(x, その結果、 rVasicek モデルを利用することによる将来金利の予測力を向上させることはできなか ったJとしている。しかしながら、我が国の金利先物が米国市場のそれ以上に有用な予測力を持 つことを発見している。 ‑254‑

254.

2)当研究の分析視点、 小 稿 で の 研 究 は 、 前 節 で 述 べ た よ う に Famaの 研 究 お よ び そ の 研 究 を 日 本 の 金 利 先 物 市 場 で 発 展 さ せ た 小 林 ら [4]の 研 究 に 大 き く 動 機 付 け さ れ た も の で あ る が 、 異 な っ た 視 点 に よ る 一 考 察 を 加 え る 研 究 を 目 指 す も の で も あ る 。 こ の 視 点 は 、 主 に 以 下 に 述 べ る 3点である。 まず、一つは、フォワード・レートの将来金利に対する予測有意性を検証するために、 Fama が用いた短期金融市場や債券市場ではなく、急成長しているスワップ市場から算出される金 利の期間構造に焦点を当てた研究を行うことである。この市場の金利期間構造に注目したの は 、 ス ワ ッ プ 取 引 が 債 券 市 場 の 代 替 手 段 と し て 、 主 に ALMの 中 で 期 間 収 益 や 発 生 キ ャ ッ シ ユ・フローを調整する上で必須のものになりつつあるので、当市場から導出されるフォワー ド・レートであれば、 Famaが 分 析 を 行 っ た 以 上 の 予 測 性 を 確 認 し 得 る の で は な い か と 考 え たからである。このような発想は、次の二つの理由にもなっている。 三つめは、金利の中心回帰性が金利予測力に重要な影響を示すという事実を確認するため に、この特性を組み込んだモデルを考案しその影響力を検証することである。なお、このモ デルについては次章で述べる。 そして、三つめは、当研究では、日米両市場における検証を通じて、それらのフォワード・レ ートの予測性についての比較考察を行うことを主眼としてはいるが、同時に、成熟市場として広 く認められている米国金融市場と比較することにより、我が国の金融市場が戦後未曾有の超低 金利政策の中で硬直化していなし、か否か、また、そのことが金利期間構造に反映されていない か否かを、なんらかの形で明らかにすることである。 ホl スワッブ、ンョンを一種の先物オプションとみなすことが可能であることから、その価値を示す理論式には通常ブラ ックのモデルが適用され、⑫式および⑬式によりベイヤーズ・スワッフ¥ンョンおよひやレシーパーズ・スワッブションの 価値が決定される。従って、フォワード・スワッブ・レートのボラティリティの予測による収益機会が存在する。 , 1 ¥ = 1/2 X I :D ;X[fN(d, )‑kN(do ) ] ¥ 1 , ニ ⑫ 1/2 X I :D;X[kN(‑d)‑fN(‑d, ) ] 一一一一一一一⑬ I 1( f/k)+(a2/2)Xt]/[a XJt] 、 内 =d,‑aXJt] ) (ただし、 d,=[I , 1 ¥ 想定元本 1円のベイヤーズ・スワッフ。ションの価値 Vr …想定元本 1円のレシーパーズ・スワッフヘンョンの価値 D ; ・ 満期時点 lにおけるテーイスカウント・ファクター ースワップ。の現在時点のフォワード・スワッブ・レート k ースワッフeションの行使レート ロ ー フォワード・スワッブ・レートのボラティリティー スワッフ。ションの満期まて、の残存期間 N(x) ー ・ 標準正規分布の累積密度関数 (詳細は高橋・新井 [ 8 ]を参照されたい。) ホ2 V~sicek モデルでは、リスクの市場価格 λ を一定として、スポット・レート d r 三 白 X(γr)dt+ad ,,(t) I を以下に示す⑬式で表す。 一一一一一一⑭ el 1e l過程) (ただし、白、 γ パラメー夕、 dw(t):標準¥Vi このそデルの詳細は Vasicek[6]を参照されたい。 nd RU RU

255.

3 . 分析モデノレとその検証 1 ) フォワード・レート算出と分析モテ、ル 当研究におけるフォワード・レートの算出方法およびフォワード・レートが有する将来金利予測 力を検証するためのそデ ルを以下に述べる。 0フォワード・レート算出方法 フォワード・レート算出のために必要なスポット・レートの金利期間構造をスワップ・レートから 導くために Bootstrap法を用いる。この手法の基本的な考え方は、利息、や元金としづ形で発生す るキャッシュ・フローを現在価値に割り引くための割引率を計算することである。そして、この割引 率が金利期間構造の基本となるスポット・レートである。たとえば、年 2回のキヤツシユ.フロ一を交 換する金利スワツフ。で、は、半年スポツト.レ一ト r5 幻削: から⑬式で容易に計算されるようにスワツプ.レ一ト r μ s 刈川 w 叫よ I と同じになる。 100=( rs 2 ) / ( 1 +1 二p /200)+1 00/( 1+r w 1/ 5 P/200) 一←←⑬ 次に、この半年のスポット・レートを基に⑮式で l年のスポット・レート r叫を導出できる c 100=( r 叫 / 2)/( 1+1 ' 5P/200)+( r 1+1 ' 5 1 >2 / 2 0 0 ) 2+100/( 1+l'叫 / 2 0 0 ) 2 s w 2/2)/( 一 ⑮ 同様に、順次 0 . 5年刻みで、スポット・レートを求めていける。実際には、半年のスワップ・レートは 6ヶ月LlBORが適用される。また、1.5年 、2 . 5年…とし、った公表外のスワップ・レートは、それぞ れ l年と 2年を、 2年と 3年を線形補聞により求める。 このようにして Bootstrap 法で、求めたスポット・レートによる金利期間構造を基;こ、フォワード・レ ( 0 . 5,1)であれば、 l年スポット・レート ートを求める。たとえば、 l年後の 6ヶ月物フォワード・レート f と1.5年スポット・レートを用いて⑫式により求めることができる。 Famaの記述形式に従って t時点 におけるフォワード・レートを求める一般式を⑩式に示す。 ( 1+r 2 0 0 ) 2X( 1+f ( 0 . 5, l ) )=( 1+r s p/20W 5 P 2/ 一 ⑪ ( 1+ r ( n : t ) / 2 00 ) 2 "X ( 1+f(m‑n, n :t ) / 2 0 0 )2 ( m一 心 = ( 1+r ( m : t ) / 2 0 0 ) 2 m 一⑮ Appendix1に S AS言語で記述した Bootstrap 法によるフォワード・レート算出プログラムを示 す 。 ‑256

256.

0分析モデル 当研究では、 Bootstrop法にて求めたスポット・レートおよびフォワード・レートを基に、まず、⑦ 式の回帰モデ ルを用いて F amaと同様の分析を行弘次に、 Famaが提唱しているように、金利の t )を時点 t 中心回帰性が存在するものとして、このファクターをそデルに取り込む。すなわち、日 ( でのスポット・レート:1 ' ( 1 :t )と時点 t ‑ nから時点 tまで、の n期間のスポット・レートの平均との草離: 日 v e (1 ' ( 1 :t ), 1 ' ( 1: t ‑ n ))とすれば、⑩式は中心回帰性を考慮、に入れた回帰モデ、ノレとなり、これを用 いて検証を行う。 1 ' ( 1 :t +x‑l)‑r ( l :t ) =日} +b }X [f ( x, x 一1 :t ) ‑r ( l :t ) J+c }X 口( t )+u } ( t + x ‑ 1 ) 一一一一⑩ (ただし、口 ( t )=a v e (1 ' ( 1 :t ), 1 ' ( 1 : トn ))‑l '( 1 :t )である。) 0分析期間と使用データ 1989年 9月から 1996年 1 0月までのデータ・ストリームの月初値によるL1BORおよびスワップ・ レートを使用し検証を行った。 0 . 5年 、 1年はL1BORを用い、 2年 、 3年 、 4年 、 5年 、 7年 、 10年は スワップ・レートを用いた。また、グリッド・ポイントは 0 . 5年刻みとし、線形補問により求めた。 2) 分析結果と若干の考察 まず、⑦式に基づく分析結果を T a b l e1(日本市場)および T i l b l e 2(米国市場)に示す。日米両 市場とも 1年以内の予測期間を除いては、係数 a 1および b 1とも有意になっており、 2年以上の 予測期間においては、予測モデルとしては、かなり高い決定係数を示している。この結果からみ れば、フォワード・レートによる将来金利予測は有用である可能性があり、日米比較としづ観点で は、相対的に米国市場におけるフォワード・レートの予測力が高いように見受けられる。また、 3 年程度までは、予測期間が長くなるに従い予測力が高まるとしづ F alIJ日の分析結果とほぼ同様の 傾向を見出せたが、それ以上の期間では、逆に予測力が低下している。この要因として、前述し たように、スワッフ。市場が中期的な金融市場を代表しており、市場参加者のその期間における将 来金利予測を最も如実に反映しているためではなし、かと考えられる。 次に、⑬式における結果を丁目 b l e 3(日本市場)および T a b l e 4(米国市場)に示す。日米両市場 とも係数 i l 1および b 1の有意性は前述の⑦式による結果とほぼ同様であるが、予測モデルとして の決定係数は、日本市場では分析期間全般にわたり⑦式による結果を凌ぐものであり、金利予 測力はその中心回帰性に大きく依存することを確認できる。また、米国市場でも 5年 の 長 期 予 測 で決定係数は高まっており、 F al I Jaら[ 3, p p . 6 8 7 Jが指摘している「長期的な予測力はスポット・レー トの緩やかな中心回帰性に大きく依存する」としづ考えを裏付けている。 若干の懸念点をあげれば、当研究の分析期間のうち、我が国では、 ' 9 0年 後 半 以 降 ほ ぽ 5年 の問、また米国でも ' 9 0年中盤以降' 9 2 年末までの問、実際に長期的金利低下トレンドを示して おり、このことが、予測モデルでありながらかなり高い決定係数を示す強い要因になっていること は十分想定されるが、そうであれば、トレンド期間の長い我が国の市場の方が、米国市場以上に 高い決定係数を示してもよいはずである c この点については、収集できるデータの制約もあるが、 さらなる調査を続けていきたい。 ‑257‑

257.

4 . むすび 小稿では、フォワード・レートの将来金利に対する予測性としづ課題に一考察を加えるために、 決算上のメリットや取引形態の自由度の高さ故に近年急拡大しているスワッフ。市場が、示唆する 金利期間構造に着目し、そこから算出されるフォワード・レートが、将来金利に対する有効な予 測性を有するか否かについて日米両国市場の実証分析による比較を行った その結果、日米 O 両市場ともフォワード・レートは、かなり有用な予測力を示す可能性があり、金利の中心回帰性を 考慮することで、さらに予測力が高まることを確認できた。また、予測期間という点では、そのフォ ワード・レートの予測力が最も強く示されたのは、スワッフ。市場が代表している中期的期間であり、 当研究で初めに想定していたとおりの期間構造を確認できた。さらにまた、日米比較としづ観点 では、米国市場における予測力のほうがより強く検証された。しかしながら、当研究では、 Vasicek、CIR、HJMモデルといったいくつかの定評のある金利予測モデルによる予測力との比 較や信用リスクに起因するスワッフoのリスク・プレミアムが将来の金利予測にどのように反映される かとしづ点には触れていない。これらについては今後の研究課題としたい。 参考文献 [lJEugeneF.Fama E仔i c i e n tCapit日1Markets:I I , Thej o u r n a lo fFinance,Vo. IXLVI,No5,Oecember1991,pp.1575""1617 [2JEugeneF.FaI l l3 TheI n f oJ'l l l a t i o ni nt h eTermS tJ'l l c t u r eぺ J . o u r n a lo fF i n a n c i日1Economics,Oecember1984,pp.529""546 [3JEugeneF . F a l l l aandRobert R . B l i s s Thel n f o r l l l a t i o ni nLong‑MaturityForwardRates , A l l l e r i c a nEconomicsReview,Vol77,No4,September1987,pp.680""692 [ 4 J小林孝雄・越智顕洋「タームストラクチャー・モデルによる金利予測 J , 金 融 先 物 論 文 集 平 成 8年 9月 東 京 金 融 先 物 取 引 所 p p . 1""26 [ 5 J M c C l l l l o c hj .Huston AnEstimateo ft h eL i q u i d i t yPremium , J . o l l r n a lo fP o l i t i c a lEconomy,Vo. 183,No1,Febru日r y1975,pp.95""119 [ 6 J O l d r i c hA.Vasicek AnE q u i l i b r i u mC h a r a c t e r i z a t i o no ft h eT e r r nS t r l l c t u r e , J o u r n a lo fF i n a n c i a lE c o n o l l l i c s,Vo. 15,1977,pp.177""188 [ 7 J G i f f o r dFongandOldrichA.Vasicek A M l l l t i d i m e n s i o n a lFr日Illeworkf o rR i s kAnalysis , F i n a n c i a lAnalystsJ o u r n a l,J u l y/August 1977,pp.51""57 [ 8 J高橋誠・新井富雄「ビジネス・ゼミナールデリパティブ、入門」 ‑258 日本経済新聞社

258.

TABLE1 日本市場における検証結果 r (1 :t + x ‑ 1) ‑r ( 1・t )二 a 1+b 1x[ f ( x, x ‑1 :t ) ‑r ( 1 :t ) J+u1 (t + x ‑1 ) 分析期間 '89 年 9 月~ ' 9 6年 1 0月 a 1 b 1 ParameterS t de r r o r tv a l u e ParameterStde r r o r tv a l u e 本 r ( 1: t + 0 . 5 ) ‑ r ( 1: t ) ‑0. 404 0 . 1 1 6 ‑ 0 . 0 3 7 0 . 3 9 2 本 r ( 1: t + 1 . 0 ) ‑ r ( 1: t ) ‑ 0 . 0 0 0 0 . 2 8 1 0 . 1 8 8 1 .010 本 本 r ( 1: t + 1 . 5 ) ‑ r ( 1: t ) ‑ 0 . 2 0 8 1 . 9 8 4 0 . 1 9 6 0. 449 本 本 r ( 1: t + 2 . 0 ) ‑ r ( 1: t ) ‑ 2 . 9 4 2 0 . 1 7 4 0 . 8 4 7 0 . 1 5 5 本 r ( 1: t + 2 . 5 ) ‑ r ( 1: t ) ‑ 0 . 9 6 8 0 . 1 3 7 3 . 5 6 4 0 . 1 6 1 0 . 1 0 4 t ) r ( 1: t + 3 . 0 ) ‑ r ( 1: 4 . 0 5 9 0 . 1 3 5 0 . 8 0 7 4 43 r ( 1: t + 3 . 5 ) ‑ r ( 1: t ) ‑4. 0 . 7 3 2 0 . 1 1 6 0 . 1 3 2 ( 1: t ) 0 . 7 6 3 0 . 1 2 8 r ( 1: t + 4 . 0 )一r 4 . 9 0 2 0 . 1 2 4 r ( 1: t + 4 . 5 ) ‑ r ( 1: t ) ‑ 5 . 0 6 3 0 . 2 0 1 1 . 0 1 3 0 . 2 5 9 0 . 6 1 7 r ( 1: t + 5 . 0 ) ‑ r ( 1: t ) 0 . 5 0 9 1 . 8 6 7 4 . 6 3 5 * * * * * * * * * * * A d j ̲ R 2 0 . 0 0 0 0 . 0 0 0 0 . 0 6 6 0 . 3 3 3 0. 48 1 0 . 5 5 8 0. 489 0. 483 0 . 3 3 8 0 . 2 4 6 注 ) tvalue欄の*~[1は 5% 有意 TABLE2 米国市場における検証結果 r ( 1 :t+x‑1)‑r ( 1 :t )=a 1 +b 1x[ f ( x, x ‑ 1 :t ) ‑r ( 1 :t ) J+u1 ( t + x ‑1 ) 分析期間: '89 年9 月~ ' 9 6年 1 0月 b 1 a 1 ParameterS t de r r o r tv a l u e ParameterStde r r o r tv a l u e r ( 1: t + 0 . 5 ) ‑ r ( 1: t ) ‑ ‑ 0 . 0 5 1 0 . 3 8 9 0 . 1 7 4 0 . 2 1 5 r ( 1: t + 1 . 0 ) ‑ r ( 1: t ) ‑ 0 . 9 1 4 0. 0 . 3 8 3 454 0. 41 2 r (1 : t +1 . 5) ‑ r (1 ・ t ) ‑ 2 . 6 9 0 406 0. 0 . 6 5 2 1 .3 6 1 0 . 3 3 6 t+ 2 . 0 ) ‑ r ( 1: t ) ‑ r ( 1: 2 . 3 3 6 4 . 9 3 8 0 . 6 6 0 r (1 : t + 2 . 5) ‑ r (1 : t ) ‑ 2 . 7 3 3 0 . 2 5 9 6 . 3 4 4 0 . 5 8 1 r ( 1: t + 3 . 0 ) ‑ r ( 1: t ) 0. 0 . 1 7 8 439 6 . 8 4 4 2 . 6 7 5 r ( 1: t + 3 . 5 ) ‑ r ( 1: t ) ‑ 6 . 2 3 3 2 . 2 2 0 0 . 1 0 6 0 . 2 8 1 r ( 1: t + 4 . 0 ) ‑ r ( 1: t ) ‑ 4 . 9 2 3 0 . 3 0 6 0 . 1 1 8 1 . 6 6 5 1 . 2 3 8 0 . 1 0 7 r ( 1: t + 4 . 5 ) ‑ r ( 1: t ) ‑ 3 . 7 1 4 0 . 2 3 9 r ( 1: t + 5 . 0 ) ‑ r ( 1: t ) 0 . 2 9 7 0 . 7 3 6 0 . 1 7 0 2 . 8 3 8 * * * * * * * * * * * * * * * * * Adj̲R2 0 . 0 0 0 0 . 0 1 6 0 . 1 4 5 0. 446 0 . 6 7 3 0 . 8 2 4 0 . 9 1 0 0 . 8 4 4 0 . 8 1 2 0. 41 5 注 ) tvalue欄の*~[1は 5% 有意 2 5 9

259.

TABLE3 日本市場における検証結果 r (1 : t + x ‑ 1) ‑r ( l :t )=a1+b1x[ f ( x, x ‑ 1: t ) ‑r (1 :t ) J+c1x[ τ ( t ) ‑r ( l・t ) J + u 1( t + x ‑1 ) 分析期間: ' 8 9年9月 ‑' 9 6年 1 0月 b 1 ‑ c 1 Ad b 1 a 1 c 1 j ̲R2 ParameterS t de r r o rtv a l u fP a r a m e t e lS t de r r o rtv a l u EParameterS t de r r o rtv a l u eVIF r ( lか 0 . 5) ‑ r( 1: t ) ‑0. 496 0 . 1 1 7 0 . 3 0 4 0 . 3 5 4 0. 402 0. 21 5 1 .032 0.038 r ( lか 1 . 0 ) ‑ r ( 1: t ) . 409 0 . 1 6 8 0. 41 2 0 . 2 2 9 0 . 0 4 4 0 . 2 9 0 1 . 0 0 0 0 . 0 4 7 1 r ( lか 1 . 5 ) ‑ r ( 1: t ) 2. 46 3 0 . 1 5 1 0 . 8 0 2 0 . 1 4 9 0 . 0 1 2 0 . 2 6 2 1 . 0 0 2 0 . 3 0 3 r ( lか 2 . 0 ) ‑ r ( 1: t ) ‑ 3 . 3 4 6 0. 0 . 1 2 0 1 .093 0 . 1 0 2 207 1 .019 0.672 一0.082 r ( l: t + 2 . 5 ) ‑ r ( 1: t ) 3 . 9 3 8 0 . 1 2 8 1 . 1 0 3 0 . 1 0 8 0 . 3 2 6 0 . 2 4 1 1 . 11 3 0 . 7 1 6 r ( l: t + 3 . 0 ) ‑ r ( 1: t ) ‑ 4 . 3 8 1 0 . 1 0 0 0 . 8 8 7 0 . 0 7 8 0 . 3 3 0 0 . 2 0 3 1 . 1 8 2 0 . 7 9 5 r ( lか 3 . 5 ) ‑ r ( 1: t ) ‑4. 729 0.094 0 . 8 3 8 0 . 0 8 5 0 . 0 8 5 0 . 1 9 5 1 .257 0 . 7 6 9 r (1 : t + 4 . 0) ‑ r (1 : t ) ‑ 5 . 0 4 5 0 . 8 8 9 0 . 1 1 6 0 . 2 2 1 0 . 1 0 8 一0 . 2 5 1 1 . 3 3 40 . 6 7 7 r ( l: t + 4 . 5 ) ‑ r ( 1: t ) 0 . 1 6 6 1 . 3 9 6 0 . 2 1 9 ‑0. 760 0.298 一5 . 1 6 6 1 . 490 0.609 r ( l: t + 5 . 0 ) ‑ r ( 1: t ) 5. 0 . 2 9 1 42 1 0 . 3 0 9 1 . 5 2 4 0 . 3 6 6 一0 . 1 8 5 1 .056 0. 436 * * * * * * * * * * * * * * * * * * * 注) ・ t ̲ v a l u e欄の*印は印有意 ・τ(t)を算出する平均期聞は6ヶ月を使用 TABLE4米国市場における検証結果 r (1 :t + x ‑ 1) ‑r ( l :t )ニ a1+b1x[ f ( x, x ‑ 1: t ) ‑r (1 :t ) J+c1x[ τ ( t ) ‑r ( l :t ) J + u 1( t + x ‑ 1 ) 分析期間: ' 8 9年9月 ‑' 9 6年1 0月 a 1 b 1 c 1 b 1 ‑ c 1 A d j ̲ R 2 ParameterS t de r r o rtv a l u eP a r a m e t e lS t de r r o rtv a l u EParameterS t de r r o rtv a l u eVIF r ( l: t + 0 . 5 ) 一r ( l: t ) ‑ 0 . 6 1 7 0 . 0 1 5 0 . 2 6 6 0 . 3 5 6 0 . 4 5 6 1 . 2 1 0 0 . 0 4 9 0 . 2 5 7 一r ( l: t ) ー0 . 8 1 4 r ( l: t + 1 . 0 ) 0 . 5 4 9 443 0 . 5 5 5 0. 41 9 0 . 3 5 2 0. 1 . 0 4 5 0 . 0 4 3 r ( l: t + 1 . 5 ) ‑ r ( 1: t ) 1 .578 0. 485 3 . 0 2 1 0 . 8 0 6 一0.916 0 . 5 1 9 1 . 0 0 5 0 . 1 5 0 r ( l: t + 2 . 0 ) 一r ( l: t ) ー5 . 6 9 0 0 . 7 9 2 ‑ 1 . 6 7 3 0 . 5 4 0 2 . 7 8 6 0 . 3 9 2 1 . 0 2 7 0. 484 r ( l: t + 2 . 5 ) ーr ( l: t ) 0 . 6 0 8 一7 . 2 6 3 0 . 7 1 7 3. 206 0 . 3 1 1 一1 . 2 0 9 1 . 0 3 40 . 6 7 7 . 0 ) ‑ r ( 1: t ) r ( lか 3 一 7 . 46 3 0 . 5 7 4 2 . 8 9 5 0 . 2 2 8 0 . 0 2 2 0 . 5 4 7 1 . 0 5 3 0. 792 r ( l: t + 3 . 5 ) ‑ r ( 1: t ) ‑6. 402 0.370 0 . 1 3 7 2 . 2 1 1 0 . 5 6 7 0 . 3 7 6 1 . 0 7 00 . 8 8 5 r ( l: t + 4 . 0 ) ‑ r ( 1: t ) ‑ 4 . 2 8 3 0 . 3 2 8 1 . 2 7 8 0 . 1 3 4 1 . 3 2 2 0. 408 1 . 2 8 9 0 . 8 3 9 r ( l炉 4 . 5 ) ‑ r ( 1: t ) 0 . 9 6 8 0 . 1 4 6 ‑ 3 . 2 4 2 0 . 2 9 7 0 . 5 7 4 0 . 3 6 7 . 48 1 0 . 7 6 5 1 r ( l: t + 5 . 0 ) ‑ r ( 1士 ‑3. 71 7 0. 420 0 . 3 3 7 1 .277 0. 21 5 一0.847 1 .884 0.673 * * * * * * * * * * * * * * * * * * * * * 注) ・ tv a l u e欄の*印は 5 1 i有意 ・τ(t)を算出する平均期間は 6ヶ月を使用 ‑260一

260.

APPENDIX 1 /材料料材料本木材料本木材料材料材料本木材料材料本木材料材料材料*木材料 p l i b . J Pは 、 L I B O RとS W A PR A T Eの 時 系 列 デ タ L I B O R I立 、 0 . 5年物および 1 年 物 を 使 用 。 * S W A PR A T Eは 、 2 年 、 3 年 、 4 年 、 5 年、 7 年 、 1 0年物を使用 * * *木材料材料材料材料材料材料材料本木材料材料本木材料本木材料材料料料/ * * * 木 木 阿 阿 * J J ' b ‑S * 1 且 ‑ F h d n Jム FhunHUFhuFhuハHVFhuFhuハHVFhuFhunHUFhuFhυハHVFhuFhuハHVFhu nUFD7'つtb7'?﹄FD7'?﹄FD7'?﹄FD7'?﹄FD7' w一一一一一一一一一一一一一一一一一 F守lFhuFhuハHVハHVハHVFhuFhuFhunHUnHUハHVFhuFhuFhuハHVハHVハHv nunu‑‑TtT﹄ 4141・lnノι ワιワι ワιワιワιquququ nuwwwwwwwwwwwwwwwww nノιF+lF+lp+lp+lp+lp+lp+lp+lp+lp+lF+lp+lF+lp+lF+lp+lp+l .︐SFhuFhuハHVFhuハHVFhuハHVFhuハHVFhunHUFhuハHVFhdハHVFhuハHVFhuハHVFhuハHVFhJUハHVFhu nununUA 外 7'qu勺LA外7'qu勺LA外7'qu勺LA外7'qu勺LA外7'qu勺LA外7'qu FDnUFhunuzunuzunuw一一一一一一一‑一一一一一一一一一一一一一一一 nJムFhu﹃︐︐4ltnノιFhu﹃︐︐4IlF守lFhuFhuFhunHUハHVハHVハHVFhuFhuFhuFhuハHVハHVハHVハHVFhuFhuFhuFhunHUハHVハHVハHV 一 一 一 一 一 一 一 一 n υ n υ n υ 4 I T ‑ ‑ 1 1 1 1 1 1﹄4111つム勺L勺L勺L勺Lつムつムつム司u司uqdqd Fir‑Fir‑nvnvnvnvEυ 凶 " 凶 " 凶 " 凶 " 凶 " 凶 " 凶 " 凶 " 凶 円 凶 円 凶 円 凶 "Mn 凶 " 凶 " 凶 " 凶 " 凶 " 凶 " 凶 " 凶 " 凶 " 凶 " ・11・1・1CUSS5414141干141干141干lp+lp+lp+1414141414141414141干lp+lp+15I E‑‑ offfffffffffffffffffffff pppp nHVFhuハHVFhuハHVFhuハHVFhuFhunHUFhuハHVFhuハHVFhuハHVFhuハHVFhuハHVFhdハHVFhuハHVFhuハHVFhυハHVFhunHUFhunHU つιA外7'quntA外7'qunUA仏マハDQU41A仏マハDQU11A仏マハDqU4lA仏ZbqufiA仏マハDQU41A仏Zbqu 一一一一一一一一w一一一一一一一一一一一一一一一一一一一一一一一 ﹁ ﹁ ﹁ ﹁ n ド nド nド nドFTEυRUEununvnunvEUEUEURunvnvnvnvRURURURununununu ‑‑‑1・15555nununU41114111114141Tl?﹄?﹄?﹄?﹄?﹄?﹄?﹄勺Lququququ //nυwwwwwwwwwwwwwwwwwwwwwww TFhdnHUFhdnHUFhdハHυFhdハHυ・11F+lp+lp+lp+lp+lp+lp+lp+lp+lp+lp+lp+lp+lp+lp+lp+lp+lF+lp+lp+lp+lp+lp+l lau守nDqU4lau守nDqu一 守 FE‑‑一一一一一一RURunυRunuFDnυFDnυFDnυRunυRunυRunυRunυRunυFbnUFD 3 1 ﹁ ﹁ r I r a n ド nド nド nドnv司unhunkU41﹄司unhunku1︐司unhunku‑‑司unhunkU4lqunhURu‑‑qunhunku hJ111155SEw‑‑一一一一一一一一一一一一一一一一一一一一一 bOFTRUEURunvnvnvnvRURURUEunununvnuEUEUEUEunvnvnvnv ︽司 ︽ nU ︽ knuzunuzunuzunuzunununu‑‑414l4te‑‑Tl 守14lntnt?﹄勺LntntntntnU unu 件 4ゐ 1E司unD且U11司unD且U R u w w w w w w w w w w w w w w w w w w w w w w W 一一一一一一 草L﹁﹁﹁﹁ 一 we‑‑1115555505050505050505050505050 ︽F ︽F F﹄lハHvn U hunkuハHvnU hunkuハHVquFhunkuハHVquFhUAXUハHVquFhUAHunHUquFhunku ‑‑50505050w一一一一一一一一一一一一一一一一一一一一一一 ︽F ︽F ートlnHUnU hunkuハHvnU hunkuF守lFhuFhuFhuハHVハHvnHUハHVFhuFhuFhuFhuハHVハHVハHVハHVFhuFhuFhuFhuハHVハHVハHVハHV ‑一一一一一一一一00011111111222222223333 レ Fir‑Fir‑nvnvnvnν︑LJ 凶 " 凶 " 凶 " 凶 " 凶 " 凶 " 凶 " 凶 " 凶 " 凶 円 M n 凶 " 凶"Mn 凶 円 凶 円 凶 " 凶 " 凶 " 凶 " 凶 " 凶 " 凶 " 1 1 4 1 4 1 干14141干141干l干14141干141干l干141干14141干l干141 ・. 1 1 1 1 c u s s s n U 41 ・2 hJ S ' h l ︑︐ 一ハHυ︑hFJnuu 円J つ ι n u ‑ ‑ +aqF﹄︑ー︑ハノιrd'ー︑ 寸ノXF4LW ﹁nvs ︑154l n v p β し︾ ︐ n︑U41﹄Uvduvduvd ‑ n ド2 U 2 u a ト]﹁﹁﹁ ‑﹁﹁﹁ 1 υ v EM2U2U2u ふ 山 ツ nド iFa勺LCM a L T L + 小 ︒] JrfJu 門 ハ ヲ 本a 2 6 1 ← 也年 る め 宇 佐 求 2 u nk・︐.︐.︐.s ﹄ 白し︾ + I +L‑snDndsndnD n・''・ 2・san守・3an守JfJfJ//' O1/'/'1 ︿ J 2 1︿ J O?﹄?﹄?﹄?﹄︑jF?﹄︑jrnunUJ/nunu psJrfJrfJrfJrrnUJrrnununu︑I''nunu jj7)711011 Aununununu一nu‑一一nu‑‑ 1?=dA仏Zb﹁7'﹁﹁﹁1l﹁﹁ ﹁一一一一・1T11・1一11 且 I ?I?rl 占 小 也 今 n h u r l r l r l r l E ? r l 占T F h u ︑ ノ ・ 1 1 1 ・ 1 n u ‑ ‑ 司 u n v n V 1ワι nυーすI?I?ーすFhul?ーす﹃︐︐﹃︐︐E?E?ーす 百円ヲ nunununU 百u n u 一 日 u n u n u ︽ au守﹁FhuFhu﹁﹁7'7'7' ι z 王 Tl勺Lnu F↑ ' 一 一 一 一 ・ 1 一 一 ・ 1 ・ 1 一 一 一 壬﹁﹁﹁﹁*﹁﹁本*﹁﹁﹁ RUハν・1・1・11司u・11Eυ勺L111・1 ‑)( ホヒ M川困対 n H H u ︐ .r l nunv一一一一一一一一一一一一一一一一二一一一一一一一一 ︑J1JRURURURURUFhυnUFhυFhυnvRunURU 口n 口 ququ /fvinUTlp勺LndA仏ZbnDnD7'n 一一一一一一一一一一一一一 也 T 且 e‑‑rlrlrlrlrlrlrlrlrlrlrlrlrl 本こ凶・1111111111111 し ︾ H みし A M円日M n v ‑ 4 期 制 日 ・ 'β Am伝刊 1 1 5 1 J V ' J〆 nv f j *線 a E M ‑ A T ふ 且 2 u ‑ A T 占T Jf'Jf'JU •• 本 F I N A N C I A LE N G I N E E R I N GG R O U P .I N C . B YY .I Y AU R A 1 9 9 8 . 5 . 5 * * * T e r mS t r u c t u r eC a l c u l a t i o nb yB o o t s t r a p阿e t h o d * * 材材料 S p o tR a t e& F o w a r dR a t eC a l c u l a t i o n /材料材木 * 木 /材料材料材料材料材材料本木材料材料*木材料本木材料材料材料材料本木材 材料本木材料本木材料料材料材料料本木材料本木材料材料料材料材料本木材料/

261.
[beta]
内

内

内

守

内

内

守

内

内

守

守

守

内

守

守

守

守

守

守

守

守

内

守

守

守

守

守

内

︑

ハ
H
V
ハ
H
v
︐
.
︐
nι
*
)

︑

*
︑
ij

)nH
(ー

︐
︐
︐
︐
︐

ー

つ
︐ι

︑

;1一
411

'x
1
1(
一一 n

︑
弘
一一一一一
一
4 ︐
nι
︑tFJ
rirlF4L
DaDanド
cdpapa
﹄
︐

e
n
d
;

wwwwwwwwwwww/E

守

内

内

内

e
n
d
;

rbnvFDEunvFhurbnurbrbnvrb・'
﹃
﹃
﹃
J
﹃
つιrhJV f
つιFhu f
つιrhJV f
つιrhJV f
‑一一一一一一一一一一一41
EurbFDnvnvnUEurbFDnvnunU一
4
A
V4
A
V 4AVan‑van守a
n守 a
n守a n ‑ v a n ‑ v F h J v r h J V F h u ‑ ‑ ‑
41SIz‑‑TITITITS‑zIITS‑zT・'*

ハUFhunvFhunurbnvFDnvrbnurbnUEunvFD
a斗 ﹃fqd
つιa斗 ﹃fquつιan守 ﹃fqdつιan守 ﹃f q u n U
つι一
一一一一一一‑一↑一一一一一一nu
rbFDEUEunvnvnvnurbEurbrbnununvnU

︽

4
U4
U4
U4
n
‑
v
a
na
n
‑
v
a
na
na
nF
h
u
r
h
J
V
F
h
u
w
w
wAVaw
wn aw
wn a
w
whurw
w
w w w w W 1 I r'z
︐
+lFlFlFlFlFlFlFlp+lFlr?lr?lr?lFl r ? l p + 1 4 E E

︽

︽

内

トのものまでを求める*/
/*フォワードレート :
F
S
Wは最長 5年先にスタ

d
on
二 1t
o1
9
;

wwwwwwwwwwwwwwww

内

e
n
d
;

wwwwwwwwwwwwwWWW4l

rhunUFhunvEunUFhunurbnUEunvrbnUFhunv1
ψ
A
T
ψ宇
TlAUマハ口qdTIA仏マハ口qU41AUマハ口qd1tA仏マハ口口UF4L
一一一‑一一一一一一一一一一一一nv
)
rbrbFDEunvnvnvnUEurbEurbnvnvnunvS
4
U4
U4
U4
A
V
a
n
‑
v
a
n
‑
v
a
n守a
n守a
n守a n ‑ v a n ‑ v a n ‑ v r h u r h u r h u F h u a T
つι
J'rl
Z
T
l
r
?
l
Fl
?lFl
?lr?lr?lr?lr?l ︐
守 Fl
守 Fl
守 Fl
守r
+lFl
守r
守 Fl
守p
r'z''t
︑‑PJDa
︐
︐r'z︑ ︐
ψ
φ
nHFO
nUFhunvFhunvrhunvFhunurbnvFDnvrbnurb*
iJ
︑
︐
︐
︐
︐
︐
︐
︐
﹄
'
︐
︐
A
V
ハ
h
u
n
M
U
4
1
14
A
v
n
h
u
n
k
U
4
t
l4
A
V
ハ
h
u
n
k
U
4
1
' 4unhunMU4ll 4
也
昼
Tn
ι
VA
nι
一一一一一一一一一一一一一一一一
JJ'
﹁一
‑
rbrbrbrbnunvnvnvrbrbrbrbnunvnvnU
︑
ト J︐
CM I
司 r
.‑
ququququa斗 a 斗 a 斗a斗 a斗 a斗 a斗 a斗 E U E u r b F D c n
4'ny
1F1
・
ハHvnHupo
FTFTFTrTFTrTrTFTFTrTrT41414lrTFTnM3・
nunU/
﹁
onunu・3
rhunurhunuEUハUEunurhuハUrhuハUrhunUFhunuIL‑‑一一n1
︑

︽

nzJRunonvquEunonvqdrbnonuqdFbno'fl
ι/t
一一一一一一一一一‑‑一一一一一n・
' 0 ・ 'つ
一一口+
rbrbrbFDnunvnvnurbEurbrbnununvnuorb つιnU﹁ ﹁ +luS
4
U4
V
a
n
‑
v
a
n
‑
v
a
na
na
n an‑van‑vrhurhurhJVFhu‑‑ーハHV一‑nManMa‑‑
w
wUw4U
w4A
w
w
w
wn
waw
w
wwwww+lu ﹁一 +
0 5 5 5つι 5
414141414141414141414141PT41414la
lu‑‑

nuDaD
FOFAu

︑﹄

l i ‑ ‑ι
H U ‑ ‑ n︐
口
c
I=
a4
lnHFAU
ー
︑I
ar
1

a
u
+
l
u
n
u
n
w
n

z

d
r
o
pnsimk
;

r
u
n
;

+
l
u
ハ
u
ny
n
¥
U

*
*
*
︐︐︐︐︐

n
d
;
巴

/
*
*
* F
o
w
a
r
dR
a
t
eC
a
l
c
u
l
a
t
i
o
na
te
a
c
hg
r
i
dp
o
i
n
t*
*
*
/

d
om
=
1t
o1
0
;
k
=
n
+
m
;
0t
h
e
n
i
fk
<二 2
m
}
=
(
(
(
1
+
s
p
{
n
+
m
}
/
2
0
0
)料 (
n
+
m
)
/
(
1
+
s
p
{
n
}
/
2
0
0
)材 n
)料 (
1
/
m
)
‑1
)*
2
0
0
;
f
s
w
{
n,
e
l
s巴
f
s
w
{
n,
m
}二 9
9
9
; /
* 欠 ;~IJ 値を 9991 こする *
/

ハ
わ

ヮ

っ

262.

日本 S A Sユーザー会 (SUG I‑J) 債券市場のボラティリティ分析(1) 江口敦 東海インターナショナル証券株式会社 資本市場室 TheV o l a t i l i t yoftheJGBFuturesMarket (1) AtsushiEguchi NewIssueDept., TokaiI n t e r n a t i o n a lSecuritiesCO., L t d . 要旨 SAS/ETSソフトウェアを用いて自己回帰モデルの一種である GARCHモデルを債券先物市場に 適用し、実証分析を行った。 また、様々な GARCHモデルの中でどのモデルが当てはまりがよいかについての分析を行った。 本稿でこれらの結果について紹介する。 キーワード: 債券先物市場、 GARCHモデル、 GARCH‑Mモデル、 EGARCHモデル 1 . はじめに ボラティリティは価格変動の激しさを示す数量であるが、同時にオプション価格を決定す るパラメータでもある。従って、オプション・ディーリングにおいてボラティリテイの計測 は売買の巧拙に直結する。ただし、そもそもボラティリティは「価格変動の激しさ」という 定性的な性質のものであって、計量化のためには一定の仮定を置かざるを得ない。ボラティ リティ定量化のモデルとしては、次のような考え方がある。 ①ヒストリカル・ボラティリティ : 過去 N 日間のリターン(騰落率)の標準偏差。 ②インプライド・ボラティリティ : 一定のオプション価格モデル(例、 BSモデル) により、オプシヨンの市場価格から逆算する。 ③確率的ボラティリティ 過去の相場が現在のボラティリティに影響を 及ぼしていると仮定して、ボラティリティの 時系列構造を推計する。 本稿では、自己回帰モデルの一種である G:‑¥RCI‑!モデルを用いて約 2000営業日の債券先物 263

263.

価格のリターンに適用して③の確率的ボラティリティの分析結果を示す。 2 . データ 90年 4月 2日から 9 8年 3月 3 1日までの債券先物中心限月の価格(終値)を 98年 6月限 に換算したデータを用いてリターンを計算した。ここで、時点 t のリターン Rr は債券価格~、 ¥lil‑‑ノ 尺 p r一 r ‑ u R fili‑‑t¥ ~ーI を用いて以下のように定義する。 GARCH モデルは、確率的ボラティリティの推定に用いられる。ボラティリティは、イン パクトのあるニユースに反応して ‑ 8上昇すると、しばらくそのレベルで推移することがし ばしば観測される。 ARCHモデルはこのような自己回帰的な現象を表わすのに適したモデル であり、その一般形としては GARCHモデルがある。 ARCHモデルやこのモデルから派生し た様々な GARCHモデルは、①誤差項は自己相聞を持たない、②誤差項は分散が不均一であ ることを仮定している。従って、まずこの 2点について検証を行った。 3 . 自己相関と分散不均一性の検証 自己相関と分散不均一性を検証するために、 SAS/ETSソフトウェアの AUTOREGプロシー ジャに用意されている ・ ・ .GeneralizedD u r b i n ‑ ¥ ¥ ! a t s o n ( D W )S t a t i s t i c s (以下 D W検定) QS t a t i s i t i c s (以下 Q検定) Lagrangel v Iu l t i p l i e r (L l v l )Test (以下 U v lテスト) を用いた。 D W検定は自己相関の有無を検定するものであり、 Q検定、 U v lテストは分散不均 一性を検定するものである。 まず、 D W検定により自己相聞を検定したところ表 1の結果が得られた。この結果から、 8 のオーダーに 5%有意水準で、自己相闘が得られた。基となるデータは営業日ベースのデータ であるため、祭日、年末年始が入る場合を除けば 1 0 " ' ‑ '1 2日前のデータと自己相闘が 5%有意 水準で存在ことになる。そこで 1 0のオーダーまで順にラグをとり、再び自己相関を検定した。 表 2から、依然として 8のオーダーについて 10%の有意水準で、自己相聞が存在しているもの の、ラグをとる前と比較して若干の改善が見られた。 次に、 Q 検定と LMテストにより分散不均一性について検定を行い、表 3の結果が得られ た。この結果から 1 2のオーダーまでの全てにおいて、強い分散不均一性が示された。 以上の結果から、本データにラグをとらない GARCHモデルを適用する場合は分散不均一 性の条件は満たすものの、自己相関については若干疑わしいところがある。従って、後節で の分析では、 l目前のデータに依存するモデルとラグを用いて 8のオーダーの自己相関を修 正する A R ( 8 )モデルについても同時に分析を行う。 2 6 ¥ t

264.

表 1:DW検定による自己相聞の検定 Order D¥ V PROBく0¥¥ 2 2 . 0 2 9 3 2 . 0 6 7 6 表2 :ラゲをとった場合の自己相聞の検定 Order E l i m i n a t i o n t ‑ R a t i o P r o b 0 . 7 4 2 8 0 . 9 3 6 5 2 0 . 0 1 6 7 0 1 0 . 0 3 3 5 3 8 0 . 7 4 1 4 1 .4 906 45 8 6 0. 0 . 1 3 6 2 0 . 0 0 1 9 7 4 0 . 0 8 7 5 0 . 9 3 0 3 3 1 .9944 0 . 4 6 8 3 3 4 1 . 9 6 8 0 0 . 2 6 0 2 4 0 . 0 1 2 3 9 4 ‑ 0 . 5 5 0 1 0 . 5 8 2 3 3 1 .9 836 0 . 3 9 2 1 3 0 . 0 0 6 1 5 7 0 . 2 7 3 5 0 . 7 8 4 5 6 2 . 0 3 5 2 0 . 8 1 4 6 41 0 6 0. 7 8 2 . 0 0 7 0 1 .9 1 6 1 9 1 .9265 0 . 0 7 2 9 1 0 1 .9639 0 . 2 7 4 4 6 0 . 0 1 8 5 2 1 0 . 8 2 2 9 7 8 0 . 0 0 4 9 9 9 0 . 0 3 7 9 3 3 ‑ 0 . 0 3 2 9 3 1 0 . 2 2 1 7 ‑ 1 .6 857 0 . 0 1 7 0 3 1 0 . 7 5 6 0 I 0. 44 9 7 9 1 0 表 3:Q検定と LMテストによる分散不均一性の検定 Q Order Prob>Q LM Prob>LM 4 7 9 . 0 7 8 6 1 0 9 . 5 3 6 1 2 5 . 3 4 0 1 5 8 . 9 3 1 D 2 0 6 . 9 3 7 6 2 4 0 . 0 0 8 0 . 0 0 0 1 1 4 7 . 1 6 9 0 . 0 0 0 1 7 2 5 4 . 6 4 6 0 . 0 0 0 1 1 4 8 . 0 8 7 0 . 0 0 0 1 8 2 7 9 . 2 4 6 41 5 2 9 3. 2 3 9 1 0 1 1 1 2 0 . 0 0 0 1 0 . 0 0 0 1 0 . 0 0 0 1 7 9 . 0 4 8 9 9 3 . 5 8 5 6 9 8 . 6 1 6 3 0 . 0 0 0 1 0 . 0 0 0 1 0 . 0 0 0 1 0 . 0 0 0 1 0 . 0 0 0 1 1 1 7 . 1 1 5 1 3 9 . 3 2 6 0 . 0 0 0 1 0 . 0 0 0 1 0 . 0 0 0 1 1 5 4 . 6 9 7 0 . 0 0 0 1 3 3 7 . 7 3 7 3 5 6 . 0 3 0 0 . 0 0 0 1 0 . 0 0 0 1 0 . 0 0 0 1 1 5 5 . 3 6 5 .0 09 1 7l .6 7 4 1 71 0 . 0 0 0 1 0 . 0 0 0 1 0 . 0 0 0 1 3 8 5 . 6 0 0 0 . 0 0 0 1 I1 7 8 . 0 9 6 0 . 0 0 0 1 4 .様々な GARCHモデル 非線型な現象を表わすのに適した ARCHモデルから派生したモデルとして、 GARCHモデ ルをはじめ様々なモデルが考え l':llされている。その中で、 GARCHモデル、 GARCH‑M(GARCH l il e a n )モデル、 E G A R C H ( E x p o t l e n t i a lGえRCH)モデルについて比較した。 i n. G . J .RCHモデルを R , を用いて表現すると以下のようになる。 R, X, β+εr 二 =. , J h ; e ε, t 工α;&,+" L .yJh'‑i h , ω+ 二 2 ̲ ; ε, " ‑ I N ( O, l )ω >0,民主 O ' Yj ::>O, i (=1, 2, . . . q ; j二 1 , 2, . . . p ) ヲ また、 m次のラグを考慮、した G . J .RCHモデルの場合、 ー 2 G 5

265.

十 k my 42 円 一 vr‑F 一 E JmnJ =1 E‑‑ p円 円 ψ' ι v f 一 一 q p : L h=ω 十 エ α1611十 r A ‑ i と表わされる。これは過去の予測誤差の 2乗を表わす h t ‑iに加えて、過去のボラテイリテイ Gt̲; を加えていることを意味している。この式は p=Oとすると、 ARCHモデルとなる。 GARCH‑Mモデルは、 Rt=ぎt j h ;十 Vt s+o . . . φmVト m Vt Gt‑ ( / ) 1Vt̲1‑ 二 , Gt 二 e j h ; t : L i = 1 J 1 r = ω十 乞 α1611十 rA ーJ ; = 1 と表わされ、 GARCHモデルの回帰式に条件付き標準偏差を加えている。 EGARCHモデルは、 1 y川 1 l n ; g ( Z t ̲ ;) 土a l n ( h t )=ω十 十 土 £υ け 巾 仇 九 i y[ z Z t Z ) t二 命 十 イ Z t l ‑ E I g ( I z 弓 弓 ι ] 1 リ 1 ド l t f Gt ~t ‑ j h ; と表わされる。ボラティリティの対数をとることでパラメータが負にならないようにする制 約がなくなることや、負のパラメータを変数として利用することができる利点がある。 これらのモデルは次数 p、 qを増減させることで最適なモデルを選び出すことができる。 以後、この p>O、 q>Oの次数をとるモデルを GARCH(p,q)のように表わし、 mのラグを q)と表わすことにする。 とる場合を AR(m)‑GARCH(p, また本稿における分析において、「リターンにはトレンドがなし ¥J、すなわち、 ix ;β=OJ と仮定して分析した。 5 . 分析結果 (1)次数の選択 まず、ラグをとる場合、ラグをとらない場合の 2種類について、 GARCH、 GARCH‑M、 、 q 1, E‑GARCHそれぞれの p 1 2, 3 3の組み合わせ 1 8通りをデータに当てはめた。 2, , 二 二 sB I C ( A k a i k e ' sI a y e s i a nI n f o r r n a t i o nC r i t e r i o n )、 A n f o r r n a t i o n 次数の選択には SBC(Schwaロ' C r e t e r i o n )の 情報量基準を用いた。 SBC、AICの値が最小の数値をとる p、 qの組み合わせを d 最適な次数の組み合わせとして選択するものである。 SBC、AIC で最適な次数の組み合わせ 2 6 6 ‑

266.

が異なる場合、本稿では SBCの組み合わせを選択する。 はじめにラグをとらない場合の 9通りについて分析を行った。表 4から、 GARCH、 GARCH‑1 v I 、 E GARCH全てにおいて p、 qが選択された。また、ラグをとった場合は、表 5 から A R ( 8 ) ‑ G A R C H、A R ( 8 ) ‑ G A R C H ‑1 v 、 A R ( 8 ) ‑ E G A R C H全てにおいて p、 qが選択された。 従って、情報量基準による分析からは次数は p、 qが最適であると言える。 表 4:モデルを当てはめた結果(ラグととらない場合) A I C 1 6, 7 1 6 . 7 ‑16, 6 8 3 . 3 ‑16, 7 11 .3 1 6, 6 7 6 . 3 ー 1 6, 7 0 9 . 8 1 6, 6 8 3 . 3 1 6, 7 1 6 . 8 1 6, 6 7 8 . 3 1 6, 7 11 .9 1 6, 6 71 .2 1 6, 7 1 0 . 3 1 6, 6 8 0 . 8 1 6, 7 1 9 . 9 1 6, ; ) 2 0 . 7 2 ‑ 1 6, 5 4 8 . 7 1 6, 6 7 7 . 9 ‑16, 7 11 .4 1 6, 684. 4 1 6, 7 1 8 . 0 2 2 1 6, 6 7 3 . 7 1 6, 7 0 7 . 3 1 6, 6 6 6 . 8 ‑16, 7 0 5 . 9 1 6, 6 7 4 . 2 1 6, 7 1 3 . 3 3 2 1 6, 6 71 .0 1 6, 7 1 0 . 1 一1 6, 6 6 3 . 9 1 6, 7 0 8 . 6 1 6, 6 7 8 . 0 ‑16, 7 2 2 . 7 3 ‑ 1 6, 6 7 7 . 5 1 6, 7 11 .0 1 6, 6 7 0 . 5 ‑16, 7 0 9 . 6 6 7 7. 4 ‑16, 3 2 3 1 6, 6 7 2. 4 1 6, 6 6 ; ) . 5 3 3 1 6 . 6 7 7 . 2 1 6 . 6 6 9 . 7 ー 1 6, 7 1 6 . 5 表5 :モデルを当てはめた結果 ( 8のオーダーのラグをとった場合) ‑ 1 6, 6 2 8 . 9 1 6, 7 01 .6 1 6, 6 2 2 . 1 1 6, 7 0 0. 4 ‑16, 6 2 8 . 7 ‑16, 7 0 6 . 9 ‑ 1 6, 624. 4 1 6, 7 0 2 . 6 1 6, 6 1 7 . 5 ‑16, 7 01 .3 ‑16, 5 2 2 . 7 ‑16, 6 0 6 . 5 6 3 0 . 7 2 ‑ 1 6, ー 3 一1 6, 7 0 3 . 3 1 6, 6 2 3 . 3 7 01 .6 ‑ ‑16, 16, 6 2 9 . 9 2 2 1 6, 6 2 3 . 2 7 01 .4 1 6, 1 6, 6 1 6 . 5 ‑16, 7 0 0 . 3 ‑16, 6 2 4 . 8 1 6, 7 0 8 . 7 3 2 1 6, 6 1 6 . 9 1 6, 7 0 0 . 7 6 1 0 . 1 ‑ 1 6, ‑16, 6 9 9 . 5 ‑16, 4 8 9 . 9 1 6, 5 7 9 . 3 3 1 6, S 2 7 . 0 1 6, 6 0 S . 2 6 1 S . 9 1 6, 1 6, 6 9 9 . 8 ‑16, 7 0 6 . 6 2 3 1 6, 6 1 8 . 5 1 6, 6 1 2 . 0 3 3 ‑ 1 6, 6 0 9 . 2 1 6, 6 0 2 . 3 1 6, 6 2 2 . 8 1 6, 7 0 8 . 1 ( 2 )ラグの有無による差異とモデルによる差異 そこで、ラグをとる場合、ラグをとらない場合のどちらがよいかについて検証を行った。 GARCH、G : ‑ ¥ R C日 比 EGARCHそれぞれにおいて、選択された次数におけるラグをとる場合、 7 0 ‑ 程度であり、実務上問題 ラグをとらない場合の確率的ボラティリティの差は最大で1.0X 1 となる差は認められなかった。それぞれのパラメータの評価においても、ラグを表わす AR ( l ) ( 8 )までのパラメータは有意な値ではなかった。また、 か ら 主R ‑267‑ G A R C H ‑ l v l( l , 1 ) の D ELTA、

267.

EGARCH( l ,l )の THETAが有意な値ではなかったことから、ここまでの分析では GARCH( l ,l ) が最適なモデルであると考えられる。 このときのグラフを図 l、 図 2に示す。図 lはラグのない場合の GARCH( l ,l )、 GARCH‑M( l ,l ) の確率的ボラティリティの推移とその差を示しており、図 2 は GARCH( l ,l )、EGARCH( l ,l ) についてを示している。 GARCH( l ,l )、GARCH‑M( l ,l )の差はほとんどないが、 GARCH( l ,l )、 EGARCH(l, l )の聞にはかなりの差が存在している。 表 6:GARCH(1,1)の評価 BValue S t dE r r o r tR a t i o ̲Frob Approx I n t e r c e p t 0.000358 0.000073 4 . 8 8 7 0 . 0 0 0 1 ARCHO 0.000000342 6.635E‑8 5 . 1 5 2 0 . 0 0 0 1 ARCH1 0.076879 0.0102 410 7. 0 . 0 0 0 1 GARCH1 0.899950 0.0128 70.340 0 . 0 0 0 1 V a r i a b l e GARCH(l, l ) l ) GARCH‑M(l, EGARCH(l, l ) DF I n t e r c e p t 0.000588 0.0003 1 .961 0.0499 ARCHO 0.000000344 6.606E‑8 5 . 2 1 0 0 . 0 0 0 1 ARCH1 0.076426 0.0103 441 7. 0 . 0 0 0 1 GARCH1 0.899272 0.0128 420 70. 0 . 0 0 0 1 DELTA 0.071421 0.0920 0.776 4376 0. I n t e r c e p t 0.000336 0.000078 4 . 2 9 7 EARCHO 0.381566 0.1088 3 . 5 0 7 0 . 0 0 0 1 0.0005 EARCH1 0.178034 0.0259 6 . 8 7 3 0 . 0 0 0 1 EGARCH1 0.965720 0.00966 99.996 0 . 0 0 0 1 THETA 0.126663 0.0786 ‑ 1 .613 0.1068 図1 :GARCH(l, l )、GARCH‑M(l, l )の確率的ポラティリティの推移 6 . 0 0目 1 40 0 目 目 ー一一 1 2 . 0 0 % GARCH‑M 置臨( G A 問 H )ー ( G A 問 H ‑ M ) 5 . 0 0 % 1 0 . 0 0 % 4 . 0 0 % 8 . 0 0 % ホ . ヲ イ テ ィ1 ) (百 ) 3 . 0 0 日 6 . 0 0 % 2 . 0 0 % 4 . 0 0 % 1 .0 0 % 2 . 0 0 % ト刷明"111"'‑.........下 差(百) 旬 ̲ . . . . . . . . . .‑ ‑ ‑ ̲ . ̲ ‑ ‑ ̲ . . . . . .. . ̲ ‑.....,.̲,久p‑‑"',同 ‑̲....,...ザ帽、曹 、 ~.__.-_. 0 . 0 0 % 4 / 2 / 9 0 4 / 3 / 9 1 4 / 3 / 9 2 4 / 1 / 9 3 4 / 4 / 9 4 4 / 4 / 9 5 4 / 2 / 9 6 4 / 3 / 9 7 日付 ‑268‑ 0 . 0 0 % ‑ 1 . 0 0 %

268.

図 2:GARCH(1.1 ) 、 EGARCH(l.l)の確率的ボラティ 1 )ティの推移 1 4 . 0 0 % 6 . 0 0国 1 2 . 0 0 % 5 . 0 0国 1 0 . 0 0国 4 . 0 0国 8 . 0 0 拍 車.ライティリ(国) 3 . 0 0国 6 . 0 0国 2 . 0 0国 4 . 0 0 略 1 .00国 2 . 0 0国 0 . 0 0国 差(首) 0 . 0 0 % 4/2/90 1 . 0 0 % 4/3/91 4/3/92 4/1/93 4/4/94 日付 4/4/95 4/2/96 4/3/97 (3)残差の 2乗の自己相聞と残差の平均、分散 GARCH、GARCH‑M、EGARCHは引を平均 0、分散 lで自己相聞がない変数としている。 従って、基準イじされた残差もこの仮定を満たさなければならない。 % 有意水準でなかった。そ 表 7より、基準化された残差の 2乗が自己相闘を持つモデルは 5 の一方で表 8から、平均 0、分散 lの仮定については満たすモデルはなかった。 表7 :基準化された残差の 2乗の自己相関 … . 7 . . . ご ‑ タ … ー ̲ H C L J2 . . . . . . . . . ー . . 0 さIKH で. M O . , J L . . . .ー ー ー 己 主RC . . B . G , : ¥ R 乙 日( L .D . ー ー い Order PROB DW PROB D¥ V PROB DW PROB 0 . 7 4 2 8 1 .9437 0 . 1 0 5 6 1 . 9 4 4 8 0 . 1 1 0 0 2 0 . 9 3 6 5 1 .9929 0. 44 6 1 1 .9916 0. 4345 1 .9498 1 . 9 9 0 9 0 . 1 3 2 6 0. 4286 3 0. 4683 2 . 0 4 4 2 0 . 8 4 8 1 2 . 0 4 2 9 0 . 8 4 0 8 2 . 0 5 3 5 0 . 8 9 1 4 4 0 . 2 6 0 2 2 . 0 1 4 1 0 . 6 4 8 6 2 . 0 1 4 4 0 . 6 5 0 6 2 . 0 1 3 6 0 . 6 4 4 2 D 0 . 3 9 2 1 1 .9969 0 . 5 0 8 6 1 .9970 0 . 5 0 9 6 1 .9869 0. 4208 6 0 . 8 1 4 6 1 .9933 0 . 4 8 5 7 1 . 9 9 6 0 0 . 5 0 9 7 1 .9880 0. 4386 7 0 . 6 1 4 3 2 . 0 4 7 3 0 . 8 8 2 0 2 . 0 4 8 2 0 . 8 8 6 2 2 . 0 4 7 3 0 . 8 8 2 3 8 0 . 0 4 3 8 1 .9723 0 . 3 2 3 5 1 .9716 0 . 3 1 7 8 1 .9616 0 . 2 4 3 1 9 0 . 0 7 2 9 2 . 0 6 7 4 0 . 9 5 3 3 2 . 0 6 7 2 0 . 9 5 2 9 2 . 0 7 1 3 0 . 9 6 1 2 1 0 0 . 2 7 4 4 1 .9285 0 . 0 8 3 0 1 .9283 0 . 0 8 2 0 1 .9209 0 . 0 5 9 9 l. l ) GARCH( N o r m a l i t vT e s t Prob>Chi‑S 249.0560 2 5 0 . 2 3 4 8 0 . 0 0 0 1 0 . 0 0 0 1 2 1 6 . 7 7 0 5 0 . 0 0 0 1 ‑269

269.

6 . まとめ 本稿では、債券先物市場に GARCH、GARCH‑M、EGARCHモデルを用いて、実証分析を行 )が選ばれた。自己相聞が残っている可能性があるケ った。全てのモデルにおいて次数は(1, 1 ースではラグをとったものを同時に検証した。しかし、ラグをとる場合ととらない場合の確 率的ボラティリティの誤差は実務上無視できる程度のものであり、また、モデル上ラグを表 わす AR(l)から A R ( 8 )のパラメータも有効なものではなかった。一方、その他のパラメータに 関しては GARCH( ,l l )に関しては有意な結果が得られたものの、 GARCH‑M(l, l )、EGARCH(l, l ) については有意な結果は得られなかった。モデルを当てはめた後の残差の 2乗の自己相聞は 認められなかったものの、残差が標準正規分布に従うという仮定を満足するモデルはなかっ た 。 参考文献 渡辺敏明(19 9 7 ) 小暮厚之(19 9 6 ) SASインスティチュート r日本の株式市場におけるボラティリテイの変動 ARCH型 rファイナンスへの計量分析」朝倉書庖 rSAS/ETSU s e r ' sG u i d e V e r s i o n 6SecondE d i t i o n J ー 2 7 0

270.

日本 S A Sユーザー会 (SUG I‑J) 債券市場のボラティリティ分析(I I) 山田雅章 東海インターナショナル証券 株式会社 チーフマーケットアナリスト TheV o l a t i l i t yo ftheJGBFuturesMarkets ( I I ) MasaakiYamada C h i e fMarketAnalyst, T o k a iI n t e r n a t i o n a lS e c u r i t i e sC O ., L t d . 要旨 金融オプションは対象となる資産(原資産)をあらかじめ決められた値段で一定期間後に売るま たは買う「権利」で、ある。金融オプションは権利であるため、オプションの保有者の損失可能性は購 入値段に限定される一方で、収益可能性は理論上無限である。こうした損益の非対称性のため に、金融オプション価格は原資産価格の変動の激しさ(ボラティリティ)によって形成されるようにな る。本報告では、東証に上場されている債券先物を対象とし、オプション取引に当たっての事前的 )ティとして GARCH(1,1 )を ボラティリティと事後的ボラティリティの比較を行った。事前的ボラティ 1 用い、事後的ボラティリティとして収益率の分散を用いた キーワード: C GARじHモデル、ボラティリティ、予測 1 . 分析の動機 金融オプシヨンは対象となる資産(原資産)をあらかじめ決められた値段で一定期間後 に売るまたは買う「権利」である。金融オプションは権利であるため、オプションの保有者 の国失可能性は購入値段に限定される一方で、収益可能性は理論上無限である。こうした損 益の非対称性のために、金融オプション価格は原資産価格の変動の激しさ(ボラティリティ) によって形成されるようになる。 もちろん、金融オプション価格は原資産価格の上昇ないし下降によって変動する。しか し、理論上、原資産の微小な価格変動によって引き起こされる金融オプション価格変動は、 原資産価格の売買によって相殺することができる。金融オプションに対する原資産の売買は デルタヘツジと呼ばれる。教科書的には、金融オプションディーラーはデルタヘツジを行っ ており、金融オプション取引からの収益の瀬泉はボラティリティ予測力にある。金融オプシ ← 2 7 1

271.

ヨン取引は原資産価格のボラティリティの売買と言うことができる。 このように、ボラティリティは金融オプション取引において重要な概念であるが、具体 的な利用に当たっては注意が必要である。概念を具体化するためにはモデルが必要であり、 そのモデルによってボラティリティの意味するところも違ってくるからである。本報告では、 1,1 ) モデルを仮定し、事後的ボラティリティ 事前的ボラティリティとして GARCH ( として収益率の分散(ヒストリカルボラティリティ、日 V) を仮定した。 GARCH (1, 1) は、原資産価格のボラティリティが自己回帰性を持ちながらかっ 原資産価栴の収益率に影響されながら確率変動すると仮定している。日 Vは、原資産収益率 が正崩分布に従う独立増分確率変数であると仮定するブラックショールズモデル (BSモデ ル)に整令している。 オプション価格評価を BSモデルによって行うディーラーがボラティリティを完全予測 できたと仮定した場合、ディーラーが持つボラティリティ値が HVに他ならない。事後的 H Vが事前的に分かればオプションの割高割安ができる。しかし、もちろん事後的 H Vは予測 でしか知り得ない。 本報告では、事後的 HVの予測として GARCH (1, 1) による事前的ボラティリテ ィを評価してみたっ結論を先に述べると、予測期間を 5営業日とした場合には GARCH(l, 1)は事前的な収益率の分散による予測よりも優れていた。しかし、予測期間を 10営業日 以上では、 GARCH (1, 1) よりもむしろ事前的な収益率の分散による予測の方が優れ ていた。オプション期闘が 10営業日以上のオプション価格評価では、 GARCHモデルを 適用する労〆りが報われないという結果となった。 2 . 分析の条件 分析の条件は去 1が示すとおり。 ( 表 1)分析の条件 原資産 東証債券先物中心限月終値 収益率 1n ( t日終値 7 (t‑1) 日終値) データ期間 1986年 1月 4 日'"1998年 4月 6日 データ数 3117個 オプション期間 5, 10, 20, 40営業日 オプション期間が N営業日であるとき、事前的ボラティリティ H Vは予測日から N営業 日さかのぼった期間の収益率の分散とした。事前的ボラティリティ GARCH ( 1,1 )で は、予測日の収益率の 2乗 xを用いて次のように計算した。 2 7 2

272.

h (1 )=a O+al*x+b l * h ( O ) *x+b1 * h (1 ) h ( 2 )ニ aO+a1 h ( N )=aO+al*x+b1 *h(N‑1 ) h (1 ) , ‑ ,h ( N )の平均値を事前的ボラティリティ GARCH (1, 1) による予 ~!IJ11直とした。 3 . 分析結果 Aプシヨン期間ごとに分析結果を示す。各 W J間ごとに、 target(事後的 HV)、estimate(事 1 ) ) 、 HV (事前的 HV) を比較した。全則聞にわたる傾向として、 estimateの 前的 GARCH(l, 平均値は targetの 、J L均値よりも大きいことが指摘できる。また、オプション期間が長くなる につれて e‑stimateのボラティリティ変動は大きくなる傾向があるのに対して、 targetや HVは 小さくなる和良向がある。 Target 予測の観点では、 5営業日では GARCH(l,1)の精度が良いのに対して、 10営業日 以 1‑̲では HVの精度が良い。 (1)オプション期間 5営業日 π l e a n v a r t a n c e 2192E‑05 1 . 3 8 2 E ‑ 0 9 2224E‑05 7457E‑l0 2.194E‑05 1 . 3 8 2 E ‑ 0 9 通互 R2 0 . 3 7 02 . 9 5 1E‑05 0 . 2 5 2 3̲216E‑05 311213.498E‑06 6.823E‑07 5 . 1 2 7 3 1 1 2 11.090E‑05 6.695E‑07 1 6 . 2 8 8 (2)オプション期間 10営業日 W l e a n vanance 2.187E‑059.815E‑10 2 . 2 2 5 E ‑ 0 5 9̲346E‑10 2 . 1 9 5 E ‑ 0 5 9B24E‑10 ‑273‑

273.

(3)オプション期間 20営業日 円l ean Vartance 2 . 1 8 4 E ‑ 0 58 . 3 2 9 E ‑ l 0 ー0 51296E‑09 2 . 2 2 9 E 2. 206E‑05 8 . 3 3 9 E ‑ l 0 (4)オプション期間 40営業日 4 . 今後の課題 G A R C H ( l,1)モデルは数日間の近い将来のボラティリティ予測に対して有効性が高い。 方で、 10営業日以上の期間では HVが有効である。従って、 2週間物オプションの価格を 評価する際、過去 2週間の収益率の分散を利用することは妥当性がある。この場合に、 G A R C H ( l, l )は意味を持たないのだろうか。 約定{l1Ii格は HVで決めたとしても、デルタへツジの計算では G A R C H ( l, l )を使う方が良い 結果をもたらすものと思われる。それは、デルタへッジが微少変化を限定としているからで ある。また、たとえば 10営業日 HVが 5%、 5営業日 G A R C H ( l, l )が 4%の場合、後半 5営 業日において G A R C H ( l, l )の上昇が予恕されよう。これは先スタートのオプションをどのくら いのボラティリティで取引するかを決める材料となる。 このほかに、 5営業日 GARCHボラティリティを連結して長期間のボラティリティ予測を 行っていった場合に、 HV対比でどのようなパフォーマンスを示すようになるのか、など応用 や検証のテーマは数多く残されている。 ‑ 2 7 1‑

274.

調査・マーケティング

275.

日本 S A Sユーザー会 (SUG I‑J) 無制限複数回答形式のアンケート調査データの 入力と処理方法 有馬昌宏 神戸商科大学・商経学部・管理科学科 An E f f i c i e n t Method t oI n p u t and Process t h eU n l i m i t e dM u l t i p l e Choice Type Q u e s t i o n a i r e Data Masahiro Arima Kobe U n i v e r s i t yo fCommerce 要旨 アンケート調査における無制限複数回答形式のプリコード回答法質問に対する回答データの 入力を、スプレッドシートを利用して効率化し、 SASシステムで処理するためのデータ入力用プ ログラムを紹介する。 キーワード:アンケート調査デー夕、無制限複数回答形式、 Windows版 SASシステム 1.はじめに アンケート調査で得られる調査データに関しては、①回答者による回答の調査票への記入、 ②調査票に記入されたデータのコーディングと入力、③データの集計・分析処理、の 3つ の 段 階 でエラーが発生する可能性がある。これらのエラーを避けるためには、回答者にとっては分かり やすくて記入しやすい調査票を設計すること、ならびにデータ入力者にとっては入力ミスの発生 が抑制されるように調査票上のデータと容易に対応がとれるように配慮され、単純ミスが解消され るような初期入力データファイルの設計が必要となる。 また、 SASによる集計・分析処理を前提とするならば、初期入力データファイルを SASによる 集計・解析に適したデータ構造をもっデータセットへと変換する作業も必要となる。 ところで、アンケート調査においては、購読新聞を問う設問例を示した図 1のように、無制限複 数回答形式の質問が設けられることがよくある。この無制限複数回答形式の質問に対する回答 データの入力に際しては、図 2に示すように、 ①回答選択肢の数だけのデータ入力欄(通常は回答選択肢に対応するだけのカラム)を用意し ておき、データ入力欄の位置と回答選択肢を 1対 1に対応させて入力する方式、 ②回答選択肢の数だけのデータ入力欄を用意し、回答選択肢番号制│慣に入力してし、く方式、 のいずれかが一般的に採用されることが多い。 ‑277~

276.

問1 0 . 購読新聞について、該当する番号をすべて Oで、圏んでお答え下さい。 2 . 毎日新聞 3 . 読売新聞 5 . 日本経済新聞 6 . サンケイ新聞 7 . スポーツ紙 9 . 英字新聞 1 0 . 業界紙 11.政党紙 4 . 地方紙 8 . 夕刊紙 1 2 . その他 1 3 . 購読していない 1.朝日新聞 図 1 無制限複数回答形式の設問例 方式① 回答例 面蓉著 1 回答者2 回答者3 回答者4 回答者5 回答者6 カラム番号 サ ン 7J レ 00001 サ ン7 J レ 00002 サンアル 00003 サ ン 7 ル00004 サ ン 7。 ル00005 サ ン 7。 ル00006 回答 0 0 3 1 , 5 ニニ二手 0 2 3, 5, 10 じ 式 ② 1234567890123 1000000000000 1000000000000 0010000000000 1000100000000 0100000000000 o010100001000 カラム番号 123456789012345678901234 サ ン TJ レ 00001 サ ン7J レ 00002 サ ン 7J レ 00003 3 サ ン 7J レ 00004 5 サ ン 7J v 0 0 0 0 5 2 サ ン 7J レ 00006 3 5 1 10 0 0 0 0 0 図 2 無制限複数回答形式の回答データの入力例 問5 . 下記のもので、現在あなたが使っているものがあれば、それをあなたが一人で 使っている(占有 1)か、それとも家族や他の人と共同で使っている(共有 B)かに 分けて、該当する記号に Oをつけてお答え下さい。所有していないものや使って いないものには、 1にも 2にも Oはっきません。 占有 共有 1.フジオ 2 . テープレコーダー 3 . レコードプレイヤ 4 . CDプレイヤー 5 . レ寸'寸e イスクプレイヤー 6 . 恥ID 7 . ヘッドホンラジカ 8 . テレピ 9 . 衛星放送受信設備 1 0 . t'デオテー7レコーゲー 1 1 . ピデオ用カメラ 1 2 . カメラ 1 3 . ディジタルカメラ 1 4 . テレピゲーム機 0 1 2 l 2 1 2 1 2 1 2 1 2 1 2 1 2 2 1 2 1 2 1 2 1 2 2 l 1 5 . ワープロ専用機 1 6 . ノ号ソコン 1 7 . パソコン通信設備 1 8 . ピアノ 19. 電子オ~~'ン・電子ピ 7 2 0 . シンセサイザー 21.その他の楽器 2 2 . 電話 2 3 . 携帯電話 2 4 . ファクシミリ 2 5 . ポケットベル 2 6 . 自転車 2 7 . オートパイ 2 8 . 自動車 図3 マトリクス形式の無制限複数回答形式の設問例 ‑278一 占有 共有 1 l l 1 1 1 1 1 1 l 2 2 2 2 2 2 2 2 2 2

277.

しかし、例えば回答者に対して耐久消費財の利用の有無を問う図 3に示すような質問に対する 回答データの入力に際しては、図に示す回答記入形式が回答者にとって最も回答しやすい形式 であるかどうかについては検討を加えなければならないが、初期入力データファイルの作成とい う観点からは、大きな問題を含んでいる。すなわち、この質問は、 2つ の 無 制 限 複 数 回 答 形 式 の 質問が組み合わされた形となっており、しかも回答選択肢の数は 28にものぼっている。したがっ て、前述のカラム位置にデータ項目を対応させる一般的な入力方式では、コーディングの手聞が かかるだけでなく、特に②の方式では 1桁の数字の入力には空白を余分に入れる手聞が必要と なって入力作業者に負担がかかる上、①と②の方式のいずれでも、入力後には特にカラムずれ のエラー対策が要求されることになる。 さらに、無制限複数回答記入形式の質問に対しては、該当する回答選択肢が存在しないため に見かけ上は無回答となっているサンフ。ル(非該当サンプル)と回答拒否による無回答とを識別 するために、該当する選択肢が存在しない場合には特にチェックを入れる欄を設けて対処すると か、「該当する選択肢はない Jとしづ回答選択肢を用意しておくように設計を行なうと同時に、その 区別がつくようにデータ入力を設計する必要が生じる。 2 .無制限複数回答形式用データ入力システムの設計 上述の初期入力データファイル作成上の諸問題の解決を図るため、本稿では、スプレッドシー トを利用して、回答用紙に記載された回答をそのまま入力していけばよいデータ入力方式を提案 する。 その方式とは、図 4に示すように、スプレッドシート上で回答選択肢の数だけの列を用意してお き、回答されている回答選択肢番号を順に入れてして方式である。 この方式の特徴と利点は、次の通りである。 ①原則として、各設問ごとに初期入力サブ ファイル(スプレッドシートのワークシート)が作成され る 。 図 4 スプレッドシートを利用した無制限複数回答形式データの入力方法例 279

278.

②各サプファイルの各レコードは 1つのサンプルに対応しており、データ入力に際しては予めサ ンプル番号等のサンプル識別子を入力しておけば、入力作業者は割り当てられた質問の回答 を基本的にはテンキー部分とカーソノレ移動キ一部分だけを使用して、何の判断を要する作業 もなく、調査票に記入されているとおりにデータを入力できる。 ③入力に際しては、フリーフォーマットで入力すればよく、 1桁の数値の前に空白やゼロを補うと かカラム位置や小数点の位置を合わせるために空白を打つなどの操作は不要で、ある。また、タ グ情報入力などの手間も不要である。 ④無回答の場合には何も入力せず、次のサンプルあるいは次の質問の入力に進んでよい。ただ し、無制限複数回答形式の質問で非該当の欄にチェックがある場合には特定の決められた数 値(例えば数値の 0や 9や 99など)を入力する。 ⑤数値データに関しては、画面上に入力データの最大値と最小値が表示されるので、入力作業 者自身によるエラーチェックがある程度まで、可能で、ある。 ⑥入力作業者は同ーの質問の入力を続けていくことになるので、習熟が早く、入力作業のスピー ド、アップにつながる。 ⑦以上のように入力作業者の負担を軽減するように初期入力データファイルを設計しているので、 コンピュータの操作やアンケート調査のデータ入力に習熟していない学生などでも十分に入力 作業を行なうことができる。 ③したがって、学生アルパイタ一等を利用することにより、多少の時間は要してもデータの入力費 用を節約するとともに信頼性の高い初期入力データファイノレの作成が可能となる。 ⑨さらに、スプレッドシートとそれが稼働するパーソナルコンピュータあるいは端末で、あれば入力 用の機種に制限はない。 3 .SASデータセットの作成 3 . 1 CSV形式の初期データファイル 上述の手順を経て、初期のデータファイルはスプレッドシートのワークシートとして作成される。 これらの初期入力サブファイルは基本的には CSV形式のデータファイノレであり、このデータファ イルから単純集計やクロス集計に便利な SASデータセットを作成するためには、図 5 (こ示す SAS プログ、ラムを実行すればよい。 なお、この CSV形式から SASデータセットへと変換する SASプログラムを実行すると、古いパ ージョンの SASシステムでは、無記入のセルのデータは無視されて読み飛ばされてしまうことに なる。この特性を利用することにより、無制限複数回答形式のデータの入力は、図 1を例にとると、 サンプノレ番号が入力されているセルの右で、あればどの位置に入力してもよいとしづ入力位置の 自由性が得られることになる。 しかし、一方でこの特性は、図 6のような一連の単一回答形式のデータを処理する際には問題 を生じさせることになる。すなわち、例えば Flの性別が無記入であると入力作業者は Flに対応 する列にはデータを入力しないで F2の年齢の入力に移ることになる。その結果、このレコードが CSV形式に変換されると , 1 9, 1 というレコードになり、 SASデータセットへの変換プログ、ラムによって性別が 1 9、年齢が 1というよう にカラムずれと同じ結果を生じることになるのである。 この問題を回避するためには、かつては、単一回答形式のデータを含む初期入力統合ファイ ノレに対しては、空白を数値の 0に変換する作業を実行してから CSV形式ファイルへの変換作業 i m i t巴r 、 で DSDを指定することにより、容易に を行なう必要があったが、現在のバージョンで、は、 d巴l 実行することが可能である。 いずれにしても、このような入力を行なうことにより、「無記入は無記入のままで」としづ原則を維 持して入力作業者の負担を軽減できるとし、う利点、が確保できるのである。 2 1 3 U

279.
[beta]
F1LENAME1N'
A
:
¥問 l
O
.
c
s
v
'
;
OPT10NNODATENOCENTERNONUMBERPAGES1ZE=40L1NES1ZE=256;
a
s
d
a
t
a
'
;
LIBNAMETEST'
A
:¥s
DATA1NSAS;
LABELSAMP
̲NO='
サンプル番号'
PAPER1='"朝日新聞 m
PAPER2='"毎日新聞 m
PAPER3='"読売新聞 m
PAPER4=
川地方紙削
PAPER5='"日本経済新聞削
PAPER6='"サンケイ新聞削
PAPER7='"
スポーツ紙削
PAPER8=
問夕刊紙川
PAPER9='"英字新聞'"
PAPER10=開業界紙刑
PAPERllニ附政党紙削
PAPER12=
閉その他削
IDQ6=
附有効サンプルtu.
KEEPSAMP
̲NOPAPER1‑PAPER12IDQ6;
'M1SSOVERD
SD;
1NF1LE1NDEL1M1TER=',
1NPUTSAMP̲NOANS1‑ANS1
2
;
ARRAYANSWER{12}ANS1‑ANS12;
ARRAYPAPER{12} PAPER1‑PAPER12;
IDQ6=O;
1
FANS1ニ. THENRETURN:
IDQ6=1;
DO1
=
1TO1
2
;
PAPER{
I
}
=
O
;
END;
1FANS1=13THENRETURN;
DOJ=1TO1
2
;
J
}
=
.THENGOTOOUT;
1
FANSWER{
1
FANSWER{
J
}>=13THENL
1
S
T
;
J
}>=13THENGOTONEXT;
1
FANSWER{
PAPER{ANSWER{
J
}}
=
1
;
NEXT:END;
OUT:
RUN;
PROCSORTTAGSORT;
BYSA
品目̲
NO;
RUN;
DATATEST.Q10;
SET1NSAS;
RUN;
図 5 SAS
データセット作成のためのプログラム例

問 11.あなた個人のことについてお伺いします。

F1.性別
1.男

2
.女

F2.年 齢
1
.2
0代;
2
.
3
0イ
t

3.40{
t
‑

4.50代;
5
.60
代
6.70歳以上

図 6 単一回答形式の設問例

‑281一

F
3
.婚 姻 状 況
1.未婚
2
.既 婚
3
.荷量別・死別して独身

280.
[beta]
F1LENAME1N'
A
:¥問 5
.
c
s
v
'
;
OPTIONNODATENOCENTERNONUMBERPAGES1ZE=80LINES1ZE=256;
DATA1NSAS;
KEEPSAMP
̲NOOCCU1‑0CCU28lDQ
5
;
LABELSAMP
̲NO='サ ン プ ル 番 号 '
OCCU1='"ラ ジ オ m
OCCU2='" テー 7 レコ -9~ ̲111
0

OCCU3=
附レコード 7 レ
ー
ヤ
OCCU4='"C D7
"レ
̲
"
¥
,
OCCU5='"L Dプレーヤー'"
OCCU6="'MD"
'
OCCU7='"ヘッドホン 7〆カセ削
OCCU8='"テレビ刑
OCCU9='"衛 星 放 送 設 備 m
OCCU10='"V T R
OCCUll='"ビ デ オ カ メ ラ 川
OCCU12='"カ メ ラ m
OCCU13='"テ
ー γpル
カ
メ7
"1
OCCU14
=
'
"テレ t.'ゲーム'"
OCCU15='"ワ ー プ ロ 削
OCCU16='"ノf ソコン川
OCCU17=川、。ソコン通信 m
OCCU18=
叩ピアノ附
OCCU19=
附電子オ付'ンヒ岳 7)111
OCCU20=
附シンセサイサー'"
OCCU21='"その他の楽器'"
OCCU22='"電話削
OCCU23日 携 帯 電 話 m
OCCU24="'77クシミリ刷
OCCU25='"車。ケットヘ"/v
OCCU26='"自 転 車 削
OCCU27='"オートハーイ削
OCCU28='"自 動 車 問
.
'
lDQ5=""有効サンプル""勺
1NFILE1NDLMゴ
=
'
ぺ
'
I
悶NPUTSAMP
一NOANS
凱1
‑ANS28;
ARRAYANSWER{28) ANS1‑ANS28;
ARRAYOCCU(
2
8
) OCCU1‑0CCU28;
IDQ5=0;
IFANS1=99ORANS1=.THENRETURN;
IDQ5=1;
DO1
=
1TO2
8
;
OCCU(
l
)=
0
;
END;
DOJ=lTO2
8
;
IFANSWER(
J
)=
.THENRETURN;
1FANSWER(
J
))=29ORANSWER(
J
)く=0THENL1ST;
1FANSWER(
J
))=29ORANSWER(
J
)く=0THENRETUREN;
OCCU(ANSWER(
J
))=
1
;
END;
RUN;
0

̲tll

̲111

附

t
t
f

PROCSORT;
BYSAMP̲NO;
RUN;

282一

281.

LIBNAMETEST' A :¥s a s d a t a ' ; DATAART.Q5; SETINSAS; RUN; DATAMATCH; MERGETEST.FACETEST.Q5; BYSAMP̲NO; I D = 1 ; RUN: PROCFORMAT; VALUESEXFMT RUN; 1 =川男子 1 2 = 1 1 1女 子 19 = 1 1 1不明川; PROCTABULATEDATA=MATCHFORMAT=14.0NOSEPS; CLASSSEX; TITLE' 耐 久 消 費 財 の 占 有 状 況 と 性 別 と の 関 係 ' . VAR IDOCCUl.OCCU28; TABLE (OCCUlOCCU2OCCU3OCCU4OCCU5OCCU6OCCU7OCCU8 Ul3OCCUl4OCCUl5OCCUl6 OCCU9OCCUlOOCCUllOCCUl2OCC OCCUl7OCCUl8OCCUl9OCCU20OCCU21OCCU22OCCU23OCCU24 OCCU25OCCU26OCCU27OCCU28) 安 SUMID 安N .SEXALL ; ・ IRTS=40MISSTEXT='O FORMATSEXSEXFMT.; KEYLABELSUM="N="ALL='"全体刑; RUN; ただし、上記のプログラムの実行前に、以下のプログラムが実行されており、 フェイス項目の S A Sデ ー タ セ ッ ト 吋EST.FACE"が作成済みのものとする。 FlLENAMEIN' A : ¥f a c e . c s v ' ; OPTIONNODATENOCENTERNONUMBERPAGESIZE=80LINESIZE=256; DATAINSAS; LABELSAMP̲NO=" SEX='"性別". AGE='"年 齢 削 MAR= 仰婚姻状況削 IDFACE= 川有効サンプル附; INFILEINDLM=γMISSOVERDSD; INPUTSAMP ̲NOSEXAGEMAR; IDFACE=1; IFSEX=.ANDAGE=.AND1 ¥ 在AR=.THENIDFACE=O; RUN; LIBNAMETEST' A :¥s a s d a t a ' ; DATATEST.FACE; SETINSAS; RUN; 図 7 無制限複数回答形式データの読み込みとクロス集計のためのプログラム例 283一

282.

3 .2 エラーチェックと SASデータセットの作成 CSV形式に変換された設問ごとの初期データファイルは、 SASデータセットに変換される前 にプログ、ラム上で、エラーチェックにかけることも可能である。 図 こ示したプログラムには、存在しえない回答選択肢番号の入力としづエラーをチェックする とともに、そのようなエラーの発生したサンフ勺レのサンプル番号を出力するプログ、ラムの例を示して し 、 る 。 なお、 CSV形式のファイノレからデータを読み込むプログラムを作成するには、読込みウィザー ドを利用するのもよいであろう。 ' 5 4.TABULATEプロシジャを活用したクロス集計 SASをアンケート調査データの集計に活用する場合の 1つの難点として、無制限複数回答形 式の質問と他の質問との聞のクロス集計の指定手続きが難しいということが挙げられる。 例として、図 3の無制限複数回答形式の質問から得られる 28の機器別に得られた機器利用率 を男女別に求めることを考えてみよう。クロス集計のためには FREQプロシジャが用意されている が 、 FREQプロシジャで、のクロス集計は当然のこととして 2つの変数聞で、しか行なわれない。この ため、無制限複数回答形式の質問項目については、 ①回答を入れる配列変数 M を最大回答数 mlこ相当する数だけ用意する。 ②回答を M{l}から M{m}に入力する。 ③ FREQプロシジャにより M { i }と性別との聞でのクロス集計を行ない、集計結果を出力データセ ッ トD { i }に出力するという操作を i=1から mまで m回繰り返す。 ④出力デ、ータセット D { i } ( i= 1,…, m)の対応する要素の総和を求め、 TABULATEプロシジャ を利用して出力する。 とし、う煩雑な手続きを経た上でなければクロス集計結果は得られない。 しかし、前節で示した手順で無制限複数回答形式の設問のデータを回答選択肢の数だけの 2 値変数に変換しておくと、図 7 'こ示すような TABULATEプロシジャを活用したプログラムを実行 することにより、簡単に無制限複数回答形式の質問と他の質問との聞のクロス集計を行なうことが できる。 5 .おわりに 本稿では、アンケート調査における無制限複数回答形式のプリコード回答法質問に対する回 答データの入力を、スプレッド、シートを利用して効率化し、 SASシステムで処理するためのデー タ入力用プログラムを紹介した。本稿が、アンケート調査データの入力と解析作業の効率化に少 しでも貢献できれば幸いである。 参考文献 1 )有馬昌宏, r パソコン版 SASシステムによる大規模統計調査データの解析 J,日本 SASユーザ 一会論文集, p p . 2 9 7 ‑ 3 1 4,1 9 9 2 . 2 )辻新六・有馬昌宏, ~アンケート調査の方法~,朝倉書庖, 1 9 8 7 . ‑ 2 8 4

283.

日本 S A Sユーザー会 (SUG I‑J) データベース・マーケティングのカスタマイズ技法 コンクエス卜戦略対応の分析事例 緒方維文 株式会社工フ・工ム・アイ 代表取締役 (e‑mail)fmiogata@alpha‑ne. to r . j p Customize Method f o r DatabaseMarketing casestudy f o r conquest strategy KorefumiOgata President Future Marketing Institute,I n c . 要旨 データベース・マーケテインクの宿命的な戦略課題のひとつであるコンクエスト戦略(新 規顧客の獲得)に関して、通信販売のデータを用いた LTV (ライフ・タイム・バリュー) 概念の適用について論じる。 キーワード: コンクエスト、リテンション、顧客セグメント、 LTV 1.はじめに 「不況に苦慮する企業が多いなかであまり大きな声では言えませんが、お蔭様で当社の業 績は急上昇しています J (ある情報システム企業人)。この一言が物語るように、 OLAP ( o nl i n ea n a l y t i c a lp r o c e s s i n g ) 技術の進展でデータウェアハウスが脚光を浴びている。刻々 と蓄積される大量の業務データを、より早く、より的確に把握して意思決定に生かしたいと いう企業ニーズがその背景にある。 そのための分析手法として、従来の技法に加えてデータマイニングが注目されつつある。 しかしながら実践現場ではそれらの技法をどのように適用すれば良いのか苦慮している人が 決して少なくないのではないだろうか。データベース・マーケテイングをサポートする立場 の一人として筆者は常々「分析技法を有効に機能させるためには企業の実状に応じたカスタ マイズが不可欠である」と感じて止まない。 ではどんな手法をどのように適用すれば有効化し得るか、カタログ通信販売の事例をとり あげてみよう。 ‑285

284.

なお、以下に示す事例は機密保持の関係上、実数値や単位などを秘匿させていただくこと を容赦原品、たい。 2.コンクエス卜戦略の重要性 カタログ通信販売に従事すると、リテンション戦略(既存顧客の引留め)とコンクエスト 戦略(新規顧客の獲得)を同時に追求しなければならないというデータベース・マーケテイ ングの構造的な戦略課題に直面する。 顧客とのきずなを強くして長期的な信頼関係を築き上げようとするリレーションシップ・ マーケテイングが注目されるとともに、コンビュータ技術を駆使した顧客情報システムの普 及によって、リテンション戦略に力を注ぎやすくなってきた。 その方針は決して間違ってはいない。顧客との継続的な取り引きを実現するリテンション 戦略が確立されなければコンクエスト戦略も生きてこない。また、リテンションによって得 た利益をコンクエストの資源に充当するという構図が最も効率的である。かかる観点から筆 1 2段階標的化モデル」を提唱した。その詳細 は「データベース・マーケテイングの実践的分析視点 J (SUJI-]'97 論文集 .P263~279) を参 者はリテンション戦略に対応する技法として 照されたい。 一方、獲得した顧客は時間とともに確実に減衰する。フリークエント・ショッパー・プロ グラムなどのように購買金額や購買回数に応じて特典を供与したり、商品政策の改善など様々 な対策はもちろん有効である。しかしそれは顧客の減衰を緩和するが減衰そのものを回避す ることは不可能である。したがって、既存顧客の維持とともに新規顧客の獲得が同時に必要 となることは万人が認めるところであろう。(図 1参照) ( 図 1)既存顧客の減衰状況 (%) 100 90 80 70 60 50 ~O 3 0 20 。 。 1 0 I 年後 2 年後 3年 後 4 年後 (注)本'1' 例では、初 [~!I 購買後 l 年単位で 購買のあった顧客を既存顧存とした ‑286 5 年後

285.

しかし、新規顧客の獲得のためにはかなり高いコストを必要とするという現実がある。ち . 1倍 の コ ス ト を 必 要 と し て お り 、 結 なみに本事例によると新規顧客は既存顧客に対して実に 5 果的に新規顧客に対する売上は損益分岐点を大きく下回っている。(図 2) この構造から一般的に、既存顧客の減衰に不安を持つ反面、コスト面から新規顧客獲得が 鈍るといったジレンマが生じがちである。そのジレンマを解消するためには投資発想が不可 欠であり、まさにアンソフが主張するように i i 知略とは企業の将来の潜在力を高めようとす る構想」として新規顧客の獲得を位置づけるべきである。 そこで、 LTV (ライフ・タイム・バリュー)概念を用いてこの問題に対処してみたい。 ( 図 2)見込客と既存顧客のカタログ効率の比較 ( カ タ ロ グ l部 当 た り 疋 仁 高 カタログ効率 ‑ ・ ・ ・ ・ ・ ・ . . . . . ー ・ ・ ・ . . . . . . . . . . . . ・ . . ・ . . ー . ・ ー . . . . . . . . . . . ・ ・ ・ ・ ・ ・ ・ . . . . . . . . . . ・ ・ ・ ・ ・ ・ ・ ・ . . . . . . . . . . . ・ ・ ・ ・ ・ ・ ・ ・ . . ・ ・ ・ ・ ・ ・ ・ ・ . . 一一一ーーー一一一一一ーーー-".:"':.~.-"":"・4 . . . . . . . . . 一一ー ・ ・ ・ ・ ・ ・ ・ ・ . . . . . . . . . . . ・ ・ ・ ・ ・ ・ ・ ・ . . ・ ・ ・ ・ ・ ・ ・ ・ . . ・ ・ ・ ・ ・ . . . . . . . . . ・ ・ . . ・ . ・ . ・ ・ . ・ . ー ・ ー ・ ー ・ . . ー . . . . . . . . . . . . . . . . . . . . . ・ ・ ・ ・ ・ ・ ・ . . . . . . . . . . . . ・ ・ ・ ・ ・ ・ ・ . . . . . . . . . . . . ・ ・ ・ ・ ・ ・ ・ . . ・ ・ ・ ・ ・ ・ ・ . . ・ ・ ・ ・ ・ ・ ・ . . ・ . . . . . . . . . . . . . . . . ・ . . . . . . ー ー ・ ・ ・ ・ ・ ・ ー . . . . . . . . ・ . ・ ・ ・ ー ・ . . . . ‑ ー ー ・ . ー ・ ・ . ・ ・ ー ー ー . . . . ・ ・ ー ・ . . . ー ・ . . . . . . . ー ー ・ . . . . . . . . . . . . . . ‑ ・ . . . . . . . . . . . . . . . ・ . . . . . . . ‑ ー . . . . . . . E ( 1 I l 益 分 踏 ! . ' . o . l ・ . . . . . 既存顧客 新規顧客 (見込客) 3. L T V の 概 念 上記のように新規顧客に対する投資効率は極めて悪く、この時点では大きな損失である。 しかし、一時的な損失だけで判断せずにもっと長い日でみれば違った判断ができるかも知れ ない。 このような考えに基づく手法が LTV (ライフ・タイム・バリュー:生涯価値)分析であ り 、 「顧客が一定期間にもたらす利益」に注目するものである。 LTVは一般的に次式で表される。 日 LTV=ヱ ( n年目の収入 n年目の支出) (1+割引率) n 1 すなわち、一時的な損失ではなく、将来に向けての一定期間にもたらされる利益を考慮し ようとするものである。 この発想は、顧客とのきずなを強化して自社へのロイヤルティを高めるために、全ての顧 客を対象にするのではなく特定の標的顧客層を組織化したり購入行動を刺激したりして、顧 客の価値を高めようとするリテンション戦略にも適用でき、他方では見込客の発見や誘いか 287一

286.

けなどのコンクエスト戦略にも適用できる。 本稿はコンクエスト戦略にどのように適用するか、といった観点で進めることにする。 4.コンクエス卜戦略への L T V適用 カタログ通信販売企業の A杜では、主に広告によって募集した見込客にカタログを送付す るという方法で新規顧客の獲得を積極的に行ってきた。 そこで、ある時点において獲得した新規顧客に視点をあてて、その後の動向を分析すると 表 lの状況であった。なお、以下の分析結果はいずれも実績値であることから割引率は適用 しないことにした。また、カタログ発行の状況やリスポンス動向を勘案して 6ヶ月間隔で分 析することにした。 同表は、広告で応募してきた見込客全員にカタログを送付し、それ以降は最初のカタログ で購買した顧客だけを対象にしたものである。 見込客のうち最初のカタログによって獲得した新規顧客を 6ヶ月目の顧客数の欄に表し、 l年目以降は、その新規顧客がその後の各期中に購買した状況を示している。したがって顧 客引留め率の欄は、新規顧客を 100とした各期中の購買者の割合を示している。 売上高から商品原価、広告費およびその他の直接経費(見込客のデータベース登録費およ びカタログ作成費と発送費)を控除した金額を粗利益とし、粗利益の累積を LTV累積額と している。 LTV累積額を新規顧客数で除したものが顧客 1人当たり LTVであり、これを LTV指 標として用いることにする。 ( 表 1)新規顧客の LTV 1年目 6ヶ月目 1年 6ヶ月目 2年目 2年 6ヶ月日 見込客数 X 顧客数 X X X x X 30.7% 顧客引留め率(注①) 100.0% 46.0% 31 .5% 32.2% 平均購入額(注②) 1 .00 1 .01 1 . 11 1 .05 1 .02 売上高(注②) 1 .00 0. 46 0 . 3 5 0 . 3 4 0 . 3 1 X X x X 商品原価 X 広告費 x その他の直接経費(注③) x X X x X 粗利益 x X X X X LTV累積額 (注①)顧客引留め率 X X 顧客 l 人当たり LTV ' 4,344 2,266 ー X X X 744 726 071 2, ー 期首に獲得した顧客数(新規顧客)を 1 0 0とした%で表示した (注②)平均購入金額および売上高 当初 6ヵ月日の平均購入額および売上高を!とした比率で表示した (注③)その他の直接経費 見込客のデータベース登録費、カタログ製作および発送費の合計 x は機密保持の都合上秘匿 ‑ 2 8 8

287.

表 Iで明らかなように、当初は広告費やデータベース登録費に加えて見込客全員にカタロ 344円と大きな損失 グを送付するなど初期経費がかさむことから顧客 l人当たり LTVは 4, を示している。 しかしその後は、広告費とデータベース登録費を消却済みのため、また購買しなかった見 込客を除外して、購買した新規顧客だけをカタログ送付の対象とするため経費が大きく軽減 する。 一方、獲得した顧客の引留め率に注目すると、 I年目こそ 46.0%と急に低下するが、その .5%、 2年目で 32.2%、そして 2年 6ヶ月日で 30.7%とほぼ安定して 後は l年 6ヶ月日で 31 くる。 その結果、 l年目以降の粗利益は急速に改善して、 l人当たり L T Vは 2年目でプラスに , 071円にまで回復してくる。 転じて、 2年 6ヶ月間の累積でみると 2 このように、当初は大きな損失が発生するものの、 2年 6ヶ月後には利益を生んでいる事 実が明らかになった。 A社ではこれまでいくつもの広告媒体を利用しており、上記の結果は全広告媒体を総合し た結果である。広告媒体は発行部数や広告費が異なり、獲得する見込客数や新規顧客数も当 然、異なる。それらを考慮した媒体評価はなされていたが、それは当初の結果だけの一時的な 評価に止まり、一定期間にもたらされる利益までは考慮、されていなかった。 そこで、一定期間の利益という視点でみるとどうなるか、という LTVの概念適用によっ て広告媒体を再評価することにした。 4.1 LTV分 析 に よ る 広 告 媒 体 の 評 価 選 定 広告媒体毎に分析すると図 3の状況であった。 同図にみるように、獲得した新規顧客数は約 4倍、顧客 l人当たり LTVは約 3倍の差が みられるなど媒体格差が明確で、ある。 当初は広告費とデータベース登録費などの経費を必要とすることから、 6ヶ月日の LTV はほとんどの広告媒体がマイナスであり、顧客 l人当たりー 1 0,000を越す損失も複数みられる。 しかし表 Iでみたように、平均的に l年目の顧客引留め率が46.0%と落ち込むものの、そ れ以後の顧客引留め率は 30%強と安定してくることから、 2年目の LTVは大半の広告媒体 がプラスに転じてくる。その一方では、獲得した顧客数が比較的多いものの 2年目の LTV でもマイナスのものも確認される。 この分析結果から、 2年目の LTVでもマイナスの広告媒体は A社には適さないとの判断 で除外して、プラスのものだけを選定する方針が望ましいのではないかとの中間結論が出さ れた。 その結論に従った場合、今までの広告媒体全てを使用した場合と比較して、獲得できる顧 客数と LTVがどのように変化するかを確認することとし、その検証を行った。 289

288.

検証結果は表 2に示され、上記の方針に従って広告媒体を評価選定した場合は、評価前に 比べて新規顧客の獲得数が7 0.1%に減少するものの、顧客 l人当たり L T Vでみると 6ヶ月 日で . 4 . 3 4 4円から . 2 . 3 9 2円となって損失が約 1/2に圧縮され、 l年 6ヶ月日で 744円から 1 . 3 1 0円と早くもプラスに転じ、 2年目で約 4倍もの利益を示すなど、大きく改善されるこ とが明らかになった。 以後このようにして A社では、一時的な損失にとらわれず、一定期間に得られる利益に着 目して広告媒体を評価選定するようになった。 ( 図 3)主要広告媒体別 LTV <2年 目 > ) ) ( n u ) { 1 5000 ︑ ・ ・ ‑‑ ・ ﹃匂・日 U U 込.~ . I • 1 5000 • n u ハ υ n u n u I • ﹃ J ハU ハU ハU ・ 1 ' h T S B E E E B a ‑ B ' ' z a ‑ ‑ t T l B E a T EE ハハ MM M 八ハ γHnu Ill ﹂111 ー寸 Ill1﹁Ill14 V ハ ハ V V八 )︺{ 顧 客 l人 当 た り L T V Hi50 <6ヶ月目> ﹄ 15000 15000 顧客数 顧客数 ( 表 2)広告媒体評価選定による顧客数と LTVの変化 4• 2 L T V分 析 に よ る 見 込 客 へ の 反 復 ア プ ロ ー チ 見込客のなかから購買に結びつけられるのは一部に過ぎないのは事実である。 l回のアプ ローチで可能な場合もあれば、 2回も 3回も必要とする場合もある。 一方で、は、広告費とデータベース登録費は既に 1回目でコストを消却済みであり、 2回目 以降は 1回目よりはるかに小さいコストでアプローチ可能で、もある。 A社ではこれまでほぼ 3ヶ月毎に年 4回カタログを発行してきた。 そしてこれまでの分析 によって、最初のカタログで購入しなかった見込客が 2回目で購入する確率は 1回目で購入 する確率よりも低く、 2回目でも購入しなかった見込客が 3回目で購入する確率は 2回目よ りさらに低くなる、 ということが判明していた。 2 9 0

289.

しかし、果たして何回のアプローチが望ましいのか結論は出ていなかった。 そこで、 L T V分析の適用によって見込客へのアプローチ回数をー制面判断することにした。 分析結果は表 3に示され、大まかには 2固までのアプローチで良さそうだと判断された。 主な広告媒体別に分析すると図 4と図 5の状況であり、 2年目までの期間想定して次の判 断がなされた。 前記のように、まず 1回目のカタログで 2年目の L T Vがマイナスの広告媒体は 2回目あ るいは 3回目の結果には無関係に、今後は広告出稿しない。 1回目のカタログで 2年目の LTVがプラスで、 2回目の送付でもプラスになる広告媒体 ( 図 4の第 I象現に位置するもの) では、今後も 2固まではカタログを送付する。 1回目のカタログで 2年目の LTVがプラスで、 3回目の送付でもプラスになる広告媒体 ( 図 5の第 I象現に位置するもの) では、今後も 3固まではカタログを送付する。 以上のように、 LTV分析によって、今後も広告出稿を継続する媒体、そのうち 2固まで アプローチするもの、 3固までアプローチするもの、 といった評価が可能となった。 ( 表 3)見込客へのカタログ送付回数と LTVの変化 カタログ送付回数 l回目 i 芸付 2回目送付 3回目送付 ( 図 4) l回目送付者と 2回目送付者の主要広告媒体別 LTVの変化 <6ヶ 月 目 > <2年 目 > 15000 V一 "L ‑ " ' : ' ‑ T V ・一 5000 ( ] ) .a た ‑ . i存 ー 。 5000 ̲ 5000 5000 o 5000 10000 15000 1回目送付者の LTV (顧客 l人当たり) 2 9 1 ‑ • ‑一 ・ 一 ・ . ・ 一 ・ .一 5000 ‑ nU 当官 、三五 n u n u n u 客用 10000 1 (回 顧 I l l 1 1 1l l I T I l l 1 1 2 15000 5000 1 5 1 1 0 0 5 0 0 1 1 10000 1 l回目送付者の LTV (顧客 l人当たり)

290.
[beta]
(
 5) l回目送付者と 3回目送付者の主要広告媒体別 LTVの変化

<2年  >

<6ヶ月日>

‑mv

一泊

‑1T

一一日咋ト山

一寸ゅの乞

一寸問問時

.
・.

‑‑‑fー
Iミ.
u
̲̲̲一一
I .̲..

・・
.

0

J



h
I



5000 

n
u
n
u

mV

1

  ︑J





mL4

川初凱
村人

   4S
EMh

回ゆ

c
f
ω ]
5
2



nり 1

1
5000

Lこ

T
5000

5000 

‑一因︒

h.







:
"
‑
T
V

+
.
↓

当 匂 5000 ̲
たり
"
'L

n
u
ハU
)
(
)

よ
号

{
l

客三 10000ー

15000

‑

孟
号

IIIll111ITS‑‑TIllol

3 15000

5.お わ り に
以上のように、自社にとってどの広告媒体が適しているか、 また各媒体からエントリーし
た見込客に何固までアプローチするか、 といった視点で LTV分 析 が コ ン ク エ ス ト 戦 略 に 適
用できることを確認した。
しかし LTVの構造が示すように、顧客の引留め率の変動によってその値は変化する。
顧客の引留めに最も大きな影響力を持つのは商品そのものであり、 マ ー チ ャ ン ダ イ ジ ン グ
政策と密接に関連することを強調しておきたい。

(参考文献)
江尻弘 (
1996) 『最新データベース・マーケテイングj 中央経済社
江尻弘 (
1997) 『事例分析データベース・マーケテイングj 中央経済社
荒川圭基 (
1997) 『好循環経営を生み出すデータベース・マーケテイングj メディア総合研究所

ルディー和子(1985) 『実践ダイレクト・マーケテイングj ピジネス社

ー

2
9
2

291.

日本 S A Sユーザー会 (SUG I‑J) 大学生の実演芸術鑑賞構造とその時系列変化 0古 賀 広 志 * 有馬昌宏* 杉江淑子ホホ ホ神戸商科大学・商経学部 ..滋賀大学・教育学部 An L o n g i t u d i n a lA n a l y s i s ont h eA r t i s t i cA c t i v i t i e so fU n i v e r s i t y rts S t u d e n t si n terms o ft h eA p p r e c i a t i o no fP e r f o r m i n gA H i r o s h i Kogど MasahiroA r i m a * Yoshiko S u g i e " 'Kobe U n i v e r s i t yo fCommerce " S h i g aU n i v e r s i t y 要旨 VTR、C D、LDといった視聴覚メディアの発達・普及とともに成長してきた現代の学生の芸術 意識と芸術活動の実態を探るために、 1986年から 1997年にかけて 3回にわたって全国の約 1万 人の学生を対象にアンケート調査を実施してきた。 1 9 9 6年から 1 9 9 7年にかけて実施した第 3回調 査のデータの入力・解析作業は、 Windows版 SASシステムを利用して現在も継続中であるが、 この作業の過程で、我々の最終の研究テーマである 3回の学生調査に基づく実演芸術鑑賞構造 の時系列分析へと向けての成果と問題点が明らかとなってきたので、実演芸術の鑑賞構造の時 系列比較結果等も含めて、その概要を紹介する。 r o ct a b u l a t e、時系列分析 キーワード:大規模統計調査デー夕、 Windows版 SASシステム、 p 1.はじめに 高度経済成長を達成した上で、人口高齢化、高学歴化、高度情報化といった社会構造の変化 を迎えている我が国では、国民の要求は精神的に充実した生活を送る方向へと向かつてきてお り、文化・芸術に対する関心も量的増大と同時に質的多様化を見せはじめてきている。しかし、こ のような動向に比して、我が国の文化・芸術に関する統計情報の整備は、総務庁統計局の「社会 生活基本調査」などを中心に最近になって漸く着手されはじめた段階であり、他の分野・領域に 比べて蓄積は浅く、その調査方法も十分に確立されているとは言い難く、残念ながら全体を体系 的に捉えるまでに至っているとは言えない。 そこで、我々を含む研究者のグループは、文化・芸術情報の体系化と統計調査方法の確立を 目的として、「社会生活基本調査」で自由時間を最も多く有し、音楽や美術鑑賞などの行動者率 が他と比較して高い集団であることが明らかとされている大学などの高等教育機関に在籍する学 生を対象として、実演芸術の鑑賞活動の実態や芸術意識を明らかにすることを主たる目的とする 有意標本による統計調査 現代青年の芸術意識と芸術活動調査」、以下では単に「学生調査」と 略記)を設計し、 1 985年度より、これまでに 3回にわたってこの調査を実施してきた。 本稿では、これらの 3回の学生調査結果に基づき、実演芸術のライブ、による鑑賞構造の変化 に焦点を当てた分析結果を紹介するとともに、時系列分析を行なう上での問題点を示すこととす る 。 r c 一2 93

292.

2 .調査の概要 2 . 1 調査のフレームワークと調査票の構造 学生調査では実演芸術の需要構造の実態把握に焦点が当てられており、 3回の調査を通して 共通する分析のフレームワークは図 1に示す通りである。調査票上の質問は、大別すると、実演 芸術の鑑賞状況自体を問う質問群、および鑑賞行動に影響を与える要因、または鑑賞行動と何 らかの関連を持っと考えられる事項について問う質問群から構成されている。 実演芸術の鑑賞状況については、劇場やコンサートホール等に実際に足を運んで、鑑賞するラ イブ鑑賞と、視聴覚メデ、イアによるメディア鑑賞の 2つの鑑賞形態に分けて、その鑑賞経験を設問 している。また、ライブ、鑑賞とメディア鑑賞で、は、鑑賞に際して必要となる時間や経費、さらには鑑 賞スタイルそのものも大きく異なっているので、それぞれの実態を分けてとらえる一方で、それぞ れの鑑賞形態が相互に需要を誘発しあうのか、それとも需要はどちらか一方の鑑賞形態で代替 されうるのか、という代替・補完関係の分析も可能な構成にしている。 なお、ライブ鑑賞については、 3回の調査を通して、過去 1年間に限定した鑑賞活動の経験(年 間鑑賞経験)を聞いており、第 2回調査と第 3回調査では、過去を通算して鑑賞した経験(通算鑑 賞経験)があるかどうかも設問に含めている。 一方、実演芸術の鑑賞活動に影響を与える、または関連を持っと考えられる質問群は、①生 活時間に関わる項目(所属学部、学年、所属クラブ、アルバイト状況等)、②経済状況に関わる項 目(家族からの仕送り・小遣い、アルバイトおよび奨学金等からの所得、居住形態、芸術・余暇活 動関連機器保有状況等)、③地域に関する項目(出生地域、生育地域、現住地域、大学所在地 域等)、④文化資本または文化的環境に関わる項目(家族構成と家族の学歴・職業、稽古事暦、 主体的芸術活動歴、購読新聞、読書状況、視覚芸術の鑑賞状況等)、の 4つに分類することがで きる。 また、調査票には、上記の質問項目の他に、性別、年齢、未既婚の別を設問している他に、第 2回調査と第 3回調査では、今後の芸術鑑賞活動の動向を見通すための参考として、ライブ、鑑賞 による鑑賞希望の有無、さらには芸術・芸能に対する意識を探る質問項目も設けている。 2.2 調査対象の選定と調査サンプノレの構造 我々が実施してきた学生調査の母集団は、全国の高等教育機関に在籍する学生である。これ までの 3回の調査では、文部省の「学校基本調査」から母集団の属性別の構成比、すなわち高 等教育機関の設立主体、性別、専攻分野別、さらには地域別などの学生数の構成比を求め、調 査サンプルがその構造に近似した構成比となるように留意しながら、研究グ、ループのメンバーや 研究分担者が各々知己の高等教育機関関係者に講義時間中での協力を依頼するとし、う方式で 講義クラス単位の標本抽出を行っている。 調査実施時期は、これまでの 3 回の調査では、学年末を迎える 12 月から翌年の 1~2 月頃とな るように依頼を行っている。ただし、第 2回調査と第 3回調査では、母集団の構造と比較して回収 サンプノレの構造に偏りがみられたため、翌年度の 5月から 7月にかけてその補正を目的とする追 加調査を 2年次生以上を対象に実施している。 第 1回調査から第 3回調査までについて、追加調査も含めた有効回収サンプノレの設立主体別、 性別、専攻分野別、および地域別の構造と母集団構造との比較を示したものが表 1である。 3 .実演芸術鑑賞構造の時系列分析 3 . 1 調査対象の生育環境の変化 学生調査の対象母集団である高等教育機関に在籍する学生は、我が国の国民全体の中では、 1 8歳から 2 5歳頃までの年齢階層に属する就学者の集団として位置づけられる。 最も新しい第 3回調査の対象母集団の出生時期は 1972年度頃から 1977年度までの間であり、 なかでも多数を占めるのは、 1974年度から 1977年度までの出生者である。これに対して、第 1回 調査の対象母集団は 1961年度頃から 1966年度の聞に、第 2回調査の対象母集団は 1967年度頃 294‑

293.

~ m~ 1 ラ ラ ‑4 =~ 代替 II補 完 ラ戸、 イ 豊監 禁主 ‑y 金監 算 当E 卓荷 主 主 主 算 重E 大学所在地核 園 I 分析のフレームワーク 表 1 有効サンプルの構造 第 l回調査(19 8 5年度) 第 2回調査(19 9 1年度) 第 3回調査 ( 1 9 9 6年度) 母集団 有効回収 抽 出 率 母集団 有効回収 抽出率 母集団 有効回収 抽出率 (%) (%) (%) サンプル サンプル サンプル 1 ,7 3 4,080 7,8 7 9 0.4542,0 5 2,3 3 8 8,3 1 2 0.4052,3 6 8,992 8,4 8 1 0.358 3 7 7,1 0 7 1 ,4 4 9 0.384 4 9 7,569 1 ,0 3 2 0.207 4 6 3,9 4 8 7 3 3 0.158 1 9,816 1 8 0 0 . 9 0 8 2 1,6 0 8 80 O .370 5 7 9,2 7 4 1 ,2 4 2 0.214 8 3 4,7 1 3 1 ,1 5 5 O .0 2 3 .1 3 8 7 9 9,5 5 1 1 8 5 O 設 大学 主 ム L 短期大学 汗5高等専門学校 態 専修学校 j J J I大学院 98.650 87 0.088 1 6 4 . 3 5 0 8 3 0 . 0 5 1 性 男子 1 ,6 6 6,9 9 1 5,4 0 4 0.3242,0 1 0,7 1 5 6,3 4 6 0.3162,1 3 6,1 8 0 5,025 0.235 j J J I女子 1 .0 2 3 .470 4 . 9 4 9 0.4841 , 4 9 2,3 7 1 4.375 O .2 9 31 .6 8 2 .2 6 9 4.286 O .2 5 5 5 7 0 . 5 4 11 ,1 5 5,3 1 5 3,3 専 文芸系学部 8 7 9,530 4,7 8 7 0 . 2 9 31 ,0 4 5,3 4 5 2,5 7 3 0.246 7 8 5,3 0 4 3,8 7 5 0.4931 , 0 5 4,6 2 9 4,5 9 7 0.436 1 ,1 5 7,9 2 3 5,0 1 1 O .4 3 3 攻 社会系学部 分 理工系学部 1 .1 0 1 0 . 2 2 1 8 4 9 8,9 6 8 6 3 2,0 9 2 0.2441 ,0 7 6,7 2 4 1 ,2 6 7 O .1 1 8 5 7,8 野 保健系学部 1 7 9,2 2 6 6 6 4 0.370 3 0 9 . 8 3 8 5 4 8 0.177 372.262 6 6 4 0.178 7 9 2 0.294 3 北海道・東北 2 0 6,5 6 4 9 8 9 0.479 2 6 9,8 0 9 1 4,5 5 6 9 8 1 0.312 1 ,4 0 2,8 9 1 5,4 9 6 0.3921 , 4 2 0,8 8 7 3,4 4 5 0.2421 ,5 6 9,3 8 5 3,3 9 7 0.216 地 関東 7 6,9 1 5 3 2 6 0.424 4 5 7,024 1 ,7 4 7 0.382 5 域 甲信越・北陸・東治 3 6 1 ,3 6 2 0.258 2 8,3 4 7 5 2,7 1 矧l近畿 5 5 3,6 8 5 1 ,7 5 1 0.316 6 ,7 2 4 0.264 7 4 7,8 0 3 2,1 9 7 0.294 中国・四国 ,0 2 5 O .5 9 3 2 2 7,0 0 8 1 ,1 9 2 0 . 5 2 5 2 6 6 .1 8 1 1 7 6 1 0.286 1 7 2,7 4 3 九州・沖縄 2 41 .3 98 0 9,666 1 .8 6 7 0.603 370.580 9 8 3 0.407 3 864 0.233 0 3,0 8 6 1 0 . 7 7 0 0.3073,818,449 i 2,6 9 0,4 6 1 1 0 . 5 7 0 0.3933,5 全体 i " 豆6 2 0.250 注1 ) 母集団の構造は,第 l回調査では支諒右「昭和 5 9 ヰ度学校基示調査 J ,第 2回調査では I 平 成 3年 度 版 学校基本調査 J ,第 3回調査では「平成 8年度版学校基本調査」から計算. 2 ) 第 l回調査では,調査対象から高等専門学校および大学院の学生は除かれている. 3 ) 第 l回調査の専攻分野矧l には,専修学校のその他の分類 3 4 7,4 9 3人が除外されている. 4 ) 第 l回調査の地域別では,東海地域は関東地域に含まれている. 5 ) 第 3回調査の地域別では,高等専門学校の人数が除外されている. 6 ) 有効回収サンプルには,不明のサンプルが除外されている. 7 ) 第 3回調査の有効サンプル数は、未回収票の回収により、さらに増加する可能性がある。 ← 295

294.

から 1972年度の聞に出生しており、各調査での調査対象の生育過程における社会・経済的環境 はかなり異なっている。 表 2には、 3回の調査別に、それぞれの調査対象の出生から調査実施時点までの生育過程を 示すとともに、実演芸術の鑑賞活動に関連が深いと思われる視聴覚機器の世帯普及率の推移を 示している。 この視聴覚機器の世帯普及率の推移をみると、第 1回調査の調査対象が幼児期から小学校低 学年を過ごした時代がちょうど白黒テレビからカラーテレビへの移行期であり、第 2回調査の調査 対象が幼児期を迎えた時期には、ほぽカラーテレビへの移行が完了していたことがわかる。そし て、第 3回調査の調査対象が幼児期を過ごしていた時期には、白黒テレビは家庭から殆ど姿を 消していたのである。 また、音声の録音・編集・再生を可能とするテープレコーダーの世帯普及率は、 1960年代から 1990年まで漸次増大し続けており、カセットテープレコーダーやラジオ付きカセットテープレコー ダーの登場により、放送などからの録音・編集がより簡便になっていったことが読み取れる。 一方、音声と映像の録音・録画・再生を行なうビデオテープレコーダー (VTR)は、第 1回 調 査 および第 2回調査の調査対象が生まれた時期には市場にはまだ登場しておらず、第 3回調査の 調査対象が生まれた 1970年代後半に市場に登場し、 1980年代中盤から 1990年代に入るまでの 数年間で急速に普及していったことがわかる。また、 C Dプレーヤーは、第 3回 調 査 の 調 査 対 象 0年ほどの問で 60%近くの普及率に達してい が小学生となる 1980年代後半から普及しはじめ、 1 る 。 なお、最近の視聴覚メディア環境の新しい構成要素としては、多チャンネノレ化をもたらす放送 衛 星 (BS)や 通 信 衛 星 (CS)によるデFジタノレ放送の開始が挙げられ、視聴覚メディアではデ、ジタル 技術の進展を受けてデジタルビデオディスク (DVD)やミニディスク (MD)といった新しい媒体が製 品ライフサイクル上の導入期から成長期へと移行する段階にあるといえる。 3.2 芸術・余暇活動関連機器の保有状況の推移 視聴覚メディアを通した実演芸術の鑑賞形態(メデ、ィア鑑賞)は、新しい視聴覚機器の開発・普 及に伴って変化してして。前述したように、第 3回調査の調査対象が生育過程で経験してきた視 聴覚機器の発展・普及過程は、第 1回および第 2回調査の調査対象が経験してきた過程とは異 なっており、また、彼らが調査時点で保有していた視聴覚機器の種類も、第 2回 調 査 や 第 1回調 査の調査対象が保有していた機器とは異なっており、このことが鑑賞活動に影響を及ぼしている はずである。 そこで、、過去 3回の学生調査では、実演芸術のメディア鑑賞に直接的な影響を及ぼす視聴覚 機器、そして実演芸術の鑑賞活動と競合関係にある余暇活動に影響を及ぼすことを通じてライブ、 鑑賞とメディア鑑賞の両方に間接的に影響を及ぼすことになる余暇活動関連機器の使用状況 (保有していて、なおかつ使用している)を設問している。 第 1回調査から第 3回調査にかけての芸術・余暇活動関連機器の使用状況の推移については 表 3にまとめであるが、第 2回調査時に比べて使用率が上昇した視聴覚機器としては、 C Dプレー ヤー、衛星放送受信設備、 VTR、ビデオカメラが挙げられる。レコードプレーヤーは、第 2回調査 の時点で既に C Dプレーヤーに代替されかけていたが、第 3回調査では、この代替が完了してい ることが示されている。 VTRは第 2回調査時には自宅通学者と自宅外通学者との問で使用率に かなりの聞きがあったが、第 3回調査では自宅外通学者の VTR使用率が大きく上昇し、両者の 使用率の差は縮まってきている。しかし、衛星放送受信設備は、全体として使用率は上昇してい るものの、まだ自宅外通学者の使用率と自宅通学者の使用率の聞にはかなりの差が存在してい る。また、第 3回調査で新しく項目に加えたミニデ、イスク (MD)は、市場に投入されて問もないにも かかわらず、既に学生全体で約 10%の使用率を示すに至っている。 その他の特徴としては、第 3回調査で項目に付け加えたパソコン通信設備、携帯電話、ポケッ トベルなどの情報通信機器が、それぞれ約 10%、20%、30%とかなり高い使用率となっている。こ れらの情報通信機器は、学生の実演芸術の鑑賞や芸術・文化への参加活動の形態に対しても、 ‑296

295.

D↓ 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 ぺ j i ‑ ‑ 帯 LLU‑‑‑一‑‑一一一‑‑‑‑一一一印凶日凶一世 ーーげ十11111111111111111111111Il‑‑Illli11﹂'Lの 受鐙一一一一一一一↑↑一一一一一2617一三市 一 S設 ‑ 一 一 一 一 一 一 一 一 一 一 一 一 一 一 L L L L 一 J部 王︑量na‑‑一一一一一一一一一‑FbFbnU47一書回 B 一 F一 1 2 3 3 一 れ 上 司﹂ 111111111川川川叶パ川川川川什川一討以 l f ー 内 1 J川川川q Jリ川川川川川J川 斗 消 及 さ 帯 司 司 凶 司 司 JE‑‑ HU 司 IUじ 動 以 ラ 覚 tm 凶 4 ‑297‑ 1I‑一↑一一一一一‑qu4Fb7FboooooFbOOB口町︑ ﹁ ‑ 一 一 一 一 一 一 一 ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ 5 A 白7 aQoququFoqu LqupO守沖且‑! 一F‑一一一一一一一一一1A ワ 13566777一昨王 V下 一 l l l l l l l l l l l l l l l l l l l l ﹂ 一 = 5 1 I l l i ‑ ‑ } I I I l l i ‑ ‑ ‑ l i l l l l i ‑ ‑! I l l 1ド ﹀十一一一一一一一一一一一一135889一期口る 加 川 一 一 一 一 一 一 一 一 一 一 一 一 二 一 U U M M M M一 叫 人 あ 干しか一一:一::一一一一凶uum何回一札はで ヰ斗守Ill111111111111111111114﹂降率 Fげ一一二げははけは日げはげはけ川は川川川け歯以及 一止引一一一05m引邸mm別問拘ωmmωωωωωmm一欄年・普 口 ナIll11111111111111111111L向似る帯 烹 4jjjjijjjjιJJ一一一一一一一一一掛川口い世 詰レ一44ZR山 工 仏 & & Z L 4 1 一 一 一 一 一 一 一 一 一 者 ' て の Eテ一489999754321一費率れで 川寸ぺ川 1 オ ‑2071A240831505930122‑i 以一↑いベ川urLJい1MUU一ペMUUUパUUU一﹁普査世 日々一一79凶M引ωU幻自叩幻引mmω 日 ω引印出回目 ω 一び帯調全 IJ十│1111111111111111111JJ││斗よ世で yr一一lnJJJJ22nJjJJJJJJ↑一一一一おのトは ﹁ 7 ト一旦はMAmA叩品川弘肌見町民仇礼九九九一一一 j部 ツ 率 [ル﹁ │ │ lトトトトトトトトトトいいト トl i l ‑ ‑ L 査 の セ 及 オ一096一30749一‑‑一一一一一一一調市カ普 一ジ一&Z4一ιιianい一一一一一一一一一一一一測都・の 一ラ‑88777778一予はオ器 一 1ι 寸劇寸 1 1 1 1 1 1 1 1 1 1 1 1 1 l i l ‑ ‑ 州 出 納 前 ジ 機 E 凶 9 6 . 3 1 9 7 . 6 6 9 6 . 4 9 3 0 . 0 6 4 0 . 5 7 1 7 .1 8 8 0 . 9 6 86.60 7 5 . 8 0 3 6 . 3 7 VTR 1 4 . 5 1 2 0 . 1 7 7 ビデオ用カメラ 3 . 5 0 .0 7 5 5 . 6 2 7l .6 0 3 6 . 2 5 6 2 .1 2 カメラ 4 . 4 4 . 9 6 5.30 2 デジタルカメラ 0 . 9 5 4 6 . 2 3 3 5 .1 1 5 6 . 9 7 6 3 .1 7 5 0 . 0 0 アレピゲーム機 1 3 . 2 7 4 9 . 3 8 2 9 . 2 3 4 5 . 6 3 5 5 . 8 7 3 3 . 7 6 ワープロ 5 . 5 6 3 9 . 7 1 4 3 . 1 5 2 7 . 3 1 1 8 . 6 6 4 0 . 0 4 4 6 . 2 5 3 3 . 0 0 バソコン 1 0 . 7 6 2 1 l .4 5 1 3 . 3 2 9 . 6 9 パソコン通信設備 5 . 0 3 3 6 . 9 3 1 2 . 0 2 2 8 . 5 6 3 8 .8 3 1 5 .7 2 3 2 . 0 9 2 ピアノ 1 l .2 9 8 . 8 2 1 l .7 6 5 . 5 9 1 2 .7 5 1 5 . 9 1 8 . 8 3 電子オルガン 4 . 5 5 3 シンセサイザー 2 . 6 8 4 . 0 7 . 5 5 4 . 3 2 4 . 8 5 3 . 6 4 0 . 2 72 0 . 6 5 2 3 . 1 5 2 6 . 5 2 1 9 . 2 5 その他の楽器 2 3 . 2 5 2 5 . 6 5 3 3 . 4 5 9 3 . 0 1 5 . 1 9 8 8 . 9 7 8l .8 7 9 2 . 4 0 9 7 2 . 7 5 8 電話 2 0 . 6 1 2 4 . 2 0 1 5 . 7 9 携帯電話 . 7 2 1 9 . 2 6 2 4 . 0 1 1 3 . 7 2 5 . 2 8 7 . 5 5 2 ファクシミリ 6 . 3 3 2l .9 5 3 0 . 1 8 3 ポケットベル 0 . 4 2 6 3 . 4 7 7 7 . 1 5 8 2 . 5 5 7l .4 0 7 2 .1 5 8 自転車 8 . 9 83 2 . 3 5 2l .2 4 2l .0 6 2l .5 3 3l .7 1 3 0 . 4 1 2 オートバイ 2 . 7 23 2 . 3 7 4 3 . 2 0 5 6 . 3 4 2 6 . 9 5 8 .1 5 6 自動車 3 9 . 5 6 4 . 5 8 74 . 9 5 8 9 0 . 7 7 0 5 . 5 6 2 5 . 0 5 33 . 8 1 8 有効サンプル数 1 0 . 2 4 0 1 注1 ) ーは該当する機器について調査していないことを示している. 2 ) 第 3回調査では, r ヘッドホンステレオ」は「ヘッドホンラジカセ J, r ワー 電子オルガン」は「電子オルガン・電子ピア プロ」は「ワープロ専用機 J, r ノ」で調査している. 3 ) 保有していても利用していない機器は対象に含まれない. 9 5 . 2 29 3 . 9 3 2 2 . 4 1 1l .4 4 8 5 . 7 06 0 . 9 1 1 2 . 1 7 5 . 4 1 7 8 . 4 1 4 0 . 3 4 9 4 . 2 4 1 7 . 1 6 7 3 . 7 4 9 . 0 8 6 0 . 1 5 . 0 9 9 . 8 2 9 5 9 . 8 1 4 9 . 5 8 ヘッドホンステレオ ステレオ テレピ 衛星放送受信設備 7 0 . 9 0 9l .2 8 9 . 5 7 5 4 . 8 3 DAT MD 6l .5 94 8 . 9 1 8 8 . 5 6 8 5 . 8 8 3 4 . 5 5 1 6 . 4 5 9 6 . 2 4 9 4 . 7 6 1 0 . 3 7 6 . 5 2 5 5 . 4 5 8 6 . 3 5 2 6 . 5 1 9 4 .7 4 8 . 8 1 5 9 . 4 8 2 8 . 8 8 9l .8 28 5 . 9 2 . 4 3 8 . 8 2 5 .6 7 l .7 9 l フジオ テープレコーダー レコードプレイヤー CDプレイヤー LDプレイヤー 9l .2 3 8 8 . 5 2 4 4 . 9 8 8 8 . 6 9 7 . 2 4 l .7 5 第 3回調査 通学形態 全体 自宅 自宅外 8 9 . 0 8 9l .6 7 8 7 . 8 5 調査 第 2回調査 全体 通学形態 自宅 自宅外 .6 0 9 3 . 2 99 0 . 5 6 9l 9 2 . 5 6 9 4 . 2 9 9l .4 5 第 l回 石川魁同同也一時咋時間 22HA 国一中学生一 前例 程一恥同小学円l一昨︑例外 γ 過一言以一可いトドい 一一幽はゆ以 の一一出生l就学前一企ピ'ピ 及﹁ぃ国│││lili‑‑hHUH川川│illili‑‑L済レはレ 普一星大学一経テてテ 一査担 一'黒い黒 河斗 J 器部副一同情 一比自つ自 機一回生一中学生 一率一'に' il‑fト ト ー 一 及 一 率 一 一2象 聴一第和小学生一普ダ及ダ J 視一一出生│割削 一将一普一 同HZ円 一 器 コ の コ 一蓋吋 育 寸 JU 寸│││lili‑‑‑‑←│││寸刊lil111﹂機レ一レ 生一 盟 い 同 十 一 則 プ ダ プ E の一臣︑高校生ー一臆一る一一 生一時三 ー一視テあコテ 担一回出一中学生ー一割'でレ' の一恥盟小学笥l一明オ率プオ 一貫日一1ドいわ 一中ジ及一ジ j 現一一出生│就学前‑一表ラ普テラ 2 . ︐4 ・ ' I f t ' t a s 一 ︑ ノ 一 d‑ー一nu ワ ム A nbQonuq n b Q u n υ ワ 白4 FORυnυ?U4nbaυ一14q乙 qυAA フ ・ 唱 ' aE十 士 ︒ F O CUGUCU f f乙A f f I00060006noQuQdQdQdQuE土 表一生一山口山口川口問問問問問問問問川口川口四回目印白山山口一主 表 3 芸術・余暇活動関連機器の保有状況

296.

情報入手の方法をはじめとして少なからず変化をもたらしているのではなし、かと思われる。 3.3 実演芸術のライブによる年間鑑賞経験の状況と変化 我々の実施してきた学生調査では、実演芸術を、①伝統演劇、②現代演劇、③オペラ・ミュー ジカル、④舞踊・舞踏・バレエ、⑤クラシック音楽、⑥ポピュラー音楽、⑦大衆芸能、③その他、の 8分野に分類している。ただし、各分野を構成するジャンノレ(種目)は、第 l回調査で、は 47ジャンル 7ジャンルのうち 1 4ジャンルについては外来公演と日本人に で、あったが、第 2回調査では、その 4 よる公演を分け、若干の新ジャンルの追加もあって全部で 64ジャンルに細分化されている。さら に、第 3回調査では、ジャンル数は 64で変化はないが、時代による変化が速くて固定した定義で とらえ難いポピュラー音楽分野のジャンルについて、若干の変更を行っている。 以上のようなジャンルの変動があることを念頭において、全分野・全ジャンルを通じての過去 1 年間に期間を限定したときの実演芸術のライブ 鑑賞経験を有する学生の比率、すなわち年間鑑 賞経験率の変化をみると、表 4に示すように、 1 985年度に実施した第 l回調査では 67.8%で、あっ 9 9 1・9 2年度の第 2回調査で 46.7%と2 0ポイントの低下を示しており、 1 9 9 6・9 7 た鑑賞経験率は、 1 年度の第 3回調査では 44.8%と横ばいの状況になっている。 もちろん、有意標本による調査であるために鑑賞経験率の単純な比較は無意味であり、サンプ ルの構造や設問の相違にも留意して集計結果を比較・分析・解釈してし、く必要があるが、小型・ 軽量で、臨場感のある再生を可能にするデジタル技術を 駆使した視聴覚メデ、イアの出現・普及に 980年代後半のパブ、ル経済と 1 9 9 0年代に入つてのパブ、/レ経済の崩壊、そして現在に至 加えて、 1 るまで、の景気の低迷といった経済環境の動きが、このようなライブ、による実演芸術の年間鑑賞経 験率の推移に影響を及ぼしているものと考えられる。 8つの分野別の年間鑑賞経験率に関しては、第 1回 調 査 で は 分 野 別 の 年 間 鑑 賞 経 験 率 が 計 算されていないために、第 2回調査と第 3回調査との聞でしか比較できないが、分野間での年間 鑑賞経験率の高低の傾向は、第 2回調査と第 3回調査では同じであり、ポピュラー音楽、クラシッ ク音楽、現代演劇の順に年間鑑賞経験率が高くなっている。 さらに細かな分析を行うために、分野別の年間鑑賞経験率が計算できる第 2回調査と第 3因調 査について、図 lの分析のフレームワークに示した影響項目のいくつかでブレイクダウンして鑑賞 経験率を集計・計算した結果をまとめたものが表 5である。 性別でブレイクダウンしてみると、女子では、大衆芸能の年間鑑賞経験率が上昇し、伝統演劇 の年間鑑賞経験率が低下している。一方、男子は、オペラ等の分野で若干増加している他は、 いずれの分野も鑑賞経験率が減少しているが、さほど大きな変化は認められない。 所属する高等教育機関の所在地域別では、鑑賞機会の豊富な東京圏を含む関東地域での年 間鑑賞経験率がいずれの分野でも高く、第 2回調査と第 3回調査は同様の傾向を示している。近 畿地域では、ポピュラー音楽と大衆芸能で年間鑑賞経験率の高い傾向が 2回の調査で共通して 認められる。また、九州・沖縄地域では、第 2回調査と比較して第 3回調査では、オペラ等、舞踊・ 舞踏・バレエ、クラシック音楽、ポピュラー音楽の 4分野で、の年間鑑賞経験率が高くなっている。 ただし、九州・沖縄地域で特徴的に見られる鑑賞経験率の変化の要因は、 5年間の需要構造の 時系列的な変化によるものであるのか、サンプル構造の相違によるもので、あるのか、調査時点で の鑑賞機会の増減によるものであるのか等、さらに詳細な分析を必要とする。 所属する学部の専攻分野別では、教育学部や文学部などの文芸系学部と看護学部や医学部 などの保健系学部に所属する学生の年間鑑賞経験率が高く、社会(科学)系学部と理工系学部 の学生の鑑賞経験率が低いという特徴が見られれる。ただし、文芸系および保健系の学部では 女子の構成比が高く、社会系と理工系の学部では男子の構成比が高いために、年間鑑賞経験 率における男女差が専攻分野別で、の差となってあらわれている可能性もある。 また、稽古事の経験分野別に年間鑑賞経験率を集計・計算してみると、日本舞踊やノ〈レエな どの舞踊系の稽古事と華道・茶道の経験者は、その構成を考慮して女子の鑑賞経験率と比較し でも、第 2回調査と第 3回調査のいずれにおいても全分野にわたって高い年間鑑賞経験率を示 しており、個人が選択的に受ける芸術教育が実演芸術の鑑賞構造に影響を及ぼしていることが s 2 9 8一

297.

表 4 実演芸術のライブによる年間鑑賞経験率 し能・狂言 2 . 文楽 3 . 歌舞伎 伎 統演劇 4 . 現代の歌仰舞の伝 5 .そ 伝統演摩 6 . 演劇 7 . ポピュラー演劇 8 . 新派・新国庫j 9 . 現代的小 劇場 1 0 . 外国劇団 1 1.ア 7 チュア演劇 1 2 . 児童劇 a 1 3 . 人形の他 劇の現代演劇 1 4 .そ 現t 演劇 1 5 . オペラ(日本) 1 6 . オペラ(外来) 1 7 . 日本人の創作オベラ 1 8 . ミュージカノレ(日本) 1 9 . ミュージカノレ(外来) ュー 2 0 . レのビ他 21.そ のオペラ等 オベラ等 2 2 . 日本舞踊・伝統芸能 2 3 . 民俗・民族舞踊(日本) 2 4 . 民俗・民族舞踊(外来) 2 5 . バレエ{日本) 2 6 . バレエ(外来) 2 7 . モダンダンス(日本) 2 8 . モダンダンス(外来) 2 9 . 舞踏・パフォー7 ンス(日本) 3 0 . 舞踏の他・パの舞フ踊ォ‑・舞 7踏 ン等 ス{外来) 31.そ 舞踊・舞踏・バレエ 3 2 . オケストラ{日本) 3 3 . オーケストラ{外来) 3 4 ピアノリサイタノレ(日本) 3 5 ピアノリサイタル(外来) 3 6 弦楽器リサイタル(日本) 3 7 弦楽器リサイタル(外来) 3 8 . 室内楽(日本・外来) 3 9 管楽器(日本・外来) 4 0 . 声楽リサイタル(日本) 41.声楽リサイタノレ(外来) 4 2 . 合唱(日本) 4 3 . 合唱(外来) 4 4 . 邦楽 の他の 4 5 .そ クラシ、ク音楽 クラシぃク音楽 4 6 . シャンソン(日本・外来) 4 7 ジャズ(日本) ジャズ(外来) 4 8 . ロック(日本) 4 9 . ロック(外来) 5 0 . ニューミュージック・フォーク(日本) 51.ニューミュージック・フォーク(外来) ニューミュージック(日本) ニューミュージック(外来) フォーク(日本・外来) 5 2 . ポップス{日本) 5 3 . ポップス(外来) 5 4 . 歌謡曲・演歌 5 5 . 民謡 の{也 のポピュラー音楽 5 6 .そ ポピュア 音楽 5 7 . 落語・漫才 5 8 . 浪幽・講談 5 9 . 芸能ショー 6 0 . 大衆演劇 61.サーカス 6 2 . 奇術 の 他の大衆芸 6 3そ 能 大衆芸能 6 4 . その也 全ジャンノレ 右効サンプノレ数 全体 2 . 5 7 0 . 7 4 1 1 .5 0 1回調査 男子 2 . 2 5 0 . 4 8 3 . 3 1 女子 2 . 9 2 1 .0 2 2 0 . 4 7 0 . 2 2 0 . 1 3 0 . 3 3 8 . 6 0 1 .5 0 0 . 4 4 0 . 5 5 0 . 8 5 9 . 9 9 2 . 1 6 3 . 6 9 0 . 4 5 5 . 2 1 1 .2 7 0 . 1 3 0 . 6 7 0 . 5 6 8 .4 9 1 .4 3 1 .8 2 0 . 2 0 1 2 . 3 1 1 .7 5 0 . 7 7 0 . 4 3 l .1 6 1 1 .6 2 2 . 9 6 5 . 7 3 0 . 7 1 4 . 6 5 1 .6 0 7 . 9 9 0 . 8 2 1 1 .8 0 0 . 2 8 4 . 7 5 1 .4 1 1 9 . 5 1 3 1 .3 0 . 9 8 0 . 5 0 0 . 7 1 2 . 2 4 1 .2 8 5 . 4 9 l .0 1 1 0 . 4 0 2 . 0 0 0 . 7 8 3 . 3 4 0 . 8 7 0 . 5 2 1 .2 4 0 . 5 1 0 . 2 2 0 . 8 2 1 6 . 2 7 1 0 . 9 3 2 2 . 1 2 9 . 6 8 3 . 4 3 1 6 . 5 3 5 . 7 2 3 . 3 1 8 . 3 6 5 . 6 1 4 . 8 0 5 . 6 2 3 . 1 7 3 . 0 0 2 . 1 6 8 . 2 8 6 . 7 7 9 . 4 0 11 .9 3 7 . 3 9 1 6 . 9 0 2 . 0 0 1 .7 7 1 .4 3 1 .0 2 2 . 6 3 2 . 5 9 0 . 5 5 5 . 8 2 0 . 5 0 6 . 8 3 0 . 6 1 4 . 7 1 21 .2 0 21 .4 0 2 0 . 9 8 21 .3 5 1 7 .1 3 2 5 . 9 7 3 . 9 6 4 . 1 0 3 . 8 1 9 . 1 8 0 . 3 9 1 .8 7 8 . 4 7 0 . 2 8 1 .5 3 9 . 9 5 0 . 5 1 2 . 2 4 4 . 1 8 0 . 0 8 6 . 5 9 . 7 6 5 . 0 3 0 . 9 1 0 . 2 9 4 . 2 1 0 . 0 7 2 . 4 2 0 . 6 3 4 . 0 8 0 . 8 9 0 . 1 7 4 . 1 4 0 . 0 8 l .1 5 I 0 . 9 0 6 . 0 8 0 . 9 4 0 . 4 3 3 . 1 9 6 7 . 8 2 1 0,2 7 5 し1 9 5 5 . 5 1 5 . 3 7 0 5 . 3 8 81 .3 0 4, 9 0 5 。 事 2ヨ調査 全体 2 . 4 1 0 . 6 0 3 . 0 0 0 . 4 5 0 . 2 0 5 . 3 2 4 . 9 0 1 .0 8 0 . 2 3 1 .8 1 0 . 7 9 4 . 9 7 0 . 7 0 1 .3 7 0 . 2 0 11 .7 4 l .4 6 0 . 9 4 0 . 2 5 5 . 2 9 1 .7 7 0 . 6 1 0 . 1 3 8 . 1 9 1 .1 4 0 . 5 5 0 . 8 0 l .5 4 l .3 6 l .1 6 0 . 3 0 1 .3 0 0 . 5 5 0 . 2 1 6 . 5 8 7 . 0 9 2 . 4 8 3 . 0 0 1 .5 1 2 . 9 3 6 1 .1 2 . 0 2 3 . 6 1 1 .4 6 0 . 3 8 4 . 7 6 0 . 6 0 1 .2 0 0 . 3 3 1 7 . 0 5 0 . 4 0 2 . 3 9 1 .7 2 1 0 . 7 0 4 . 6 7 男子 1 .1 3 0 . 2 9 0 . 9 3 0 . 2 2 0 . 0 8 2 . 1 4 3 . 1 5 0 . 7 2 0 . 0 7 0 . 9 4 0 . 3 2 3 . 5 3 0 . 3 7 0 . 8 1 0 . 0 8 7 . 5 9 0 . 4 2 . 4 7 0 . 1 0 1 .8 8 0 . 6 9 0 . 1 0 0 . 0 5 3 . 0 8 0 . 5 7 0 . 3 7 0 . 2 7 0 . 4 0 0 . 2 2 0 . 3 4 0 . 0 5 0 . 7 2 0 . 2 7 0 . 0 7 2 . 7 9 4 . 5 8 1 .1 6 1 .3 0 0 . 4 7 1 .7 0 0 . 4 0 0 . 9 1 2 . 0 4 0 . 6 1 0 . 2 2 2 . 9 8 0 . 3 5 0 . 7 7 0 . 2 0 1 0 . 3 8 0 . 1 2 2 . 2 2 1 .4 8 9 . 5 9 5 . 2 0 女子 4 . 1 9 1 .0 5 5 . 8 8 0 . 7 7 0 . 3 7 9 . 7 4 7 . 3 8 1 .5 7 0 . 4 7 3 . 0 5 1 .4 5 6 . 9 8 1 .1 5 2 .1J 0 . 3 5 1 7 . 5 5 2 . 9 3 1 .5 9 0 . 4 7 1 0 . 0 7 3 . 2 8 1 .3 4 0 . 2 3 1 5 . 3 7 2 1ヨ 0 . 8 0 1 .5 5 3 . 1 2 2 . 9 5 2 . 3 2 0 . 6 6 2 . 1 1 0 . 9 4 0 . 4 2 I l .8 5 1 0 . 6 3 4 . 3 1 5 . 3 6 2 . 9 7 4 . 6 6 2 . 2 0 3 . 5 8 5 . 8 3 2 . 6 7 0 . 6 1 7 . 2 4 0 . 9 4 1 .8 0 0 . 5 2 2 6 . 3 5 0 . 8 0 2 . 6 5 2 . 0 6 1 2 . 2 7 3 . 9 1 11 .4 1 1 .0 1 0 . 8 8 8 . 2 4 0 . 5 6 0 . 7 7 1 5 . 8 1 1 .5 9 1 .0 3 3 . 2 4 0 . 1 7 0 . 9 0 2 7 . 4 1 2 . 6 2 0 . 1 1 0 . 9 2 0 . 5 2 2 . 7 5 0 . 5 2 0 . 2 0 6 . 6 5 0 . 5 9 4 6 . 6 7 1 0 . 2 5 0 2 . 4 1 0 . 1 5 0 . 6 9 2 2 . 6 6 2 . 0 4 0 . 1 2 0 . 7 6 0 . 4 9 2 . 0 9 0 . 4 9 0 . 2 2 5 . 3 3 0 . 4 5 3 5 . 8 8 5 . 9 4 5 4 . 3 8 0 . 1 9 1 .1 7 3 4 . 0 1 3 . 4 7 0 . 0 9 1 . 15 0 . 5 6 3 . 6 8 0 . 5 4 0 . 1 6 8 . 5 0 0 . 7 7 61 .7 5 4,2 6 9 。 芽 3因調査 全体 男子 2 . 2 6 1 .1 9 0 . 6 1 0 . 3 8 1 .7 7 0 . 7 7 0 . 2 9 0 . 1 4 0 . 2 1 0 . 1 4 3 . 9 9 2 . 0 8 5 . 6 1 3 . 4 5 1 .0 3 0 . 7 7 0 . 1 3 0 . 0 6 1 .2 6 0 . 6 7 0 . 7 3 0 . 2 6 4 . 7 6 3 . 3 1 0 . 9 4 0 . 4 6 1 .1 8 0 . 5 8 0 . 1 5 0 . 1 6 11 .4 7 7 . 0 4 1 .2 6 0 . 5 8 1 .2 4 0 . 4 0 0 . 3 6 0 . 1 4 5 . 7 4 2 . 1 0 1 .9 0 0 . 8 9 0 . 4 2 0 . 0 8 0 . 1 5 0 . 1 2 8 . 9 7 3 . 6 5 0.96 0 . 3 6 0 . 5 6 0 . 3 2 0 . 8 1 0 . 3 0 1 .3 9 0 . 2 8 1 .4 2 0 . 2 8 0 . 7 4 0 . 2 6 0 . 2 3 0 . 0 8 1 .1 5 0 . 7 1 0 . 8 6 0 . 3 4 0 . 1 8 0 . 0 6 6 . 2 1 2 . 4 0 6 . 8 1 3 . 9 9 1 .0 7 3 . 1 9 3 . 0 3 1 .3 7 . 4 6 1 .6 9 2 . 6 7 1 .5 3 1 .3 9 0 . 5 0 2 . 1 3 0 . 7 1 3 . 1 0 1 .3 1 1 .5 7 0 . 5 8 0 . 4 1 0 . 1 2 3 . 7 1 2 . 4 6 0 . 6 5 0 . 2 2 1 .0 5 0 . 6 5 0 . 5 1 0 . 3 2 1 6 . 1 2 8 . 8 7 0 . 7 1 0 . 2 0 2 . 9 3 2 . 3 4 1 .9 2 1 .2 9 6 . 5 2 1 .5 2 l .8 9 0 . 1 4 1 6 . 7 1 1 .9 9 2 . 2 0 0 . 6 3 1 0 . 0 3 3 . 1 6 0 . 8 2 0 . 1 9 1 5 . 2 4 1 .6 8 0 . 8 4 1 .4 3 2 . 7 1 2 . 8 1 l .3 3 0 . 4 2 1 .7 1 1 .4 7 0 . 3 3 1 0 . 8 2 1 0 . 2 6 5 . 7 3 5 . 0 0 3 . 1 8 3 . 9 0 2 . 3 6 3 . 7 6 5 . 2 8 2 . 7 3 0 . 7 5 5 . 2 6 1 .1 5 1 .5 4 0 . 7 0 2 4 . 8 2 1 .3 1 3 . 6 2 8 . 7 2 3 . 8 7 2 . 2 8 0 . 5 0 8 . 4 3 5 . 0 8 1 .7 7 0 . 3 2 9 . 1 6 2 . 5 2 2 . 9 0 0 . 6 5 11 .1 1 1 .6 6 0 . 6 7 0 . 1 3 0.55 24.46 3 . 2 1 0 . 1 9 1 .8 1 0 . 3 4 2 . 6 3 0 . 4 8 0.20 7 . 6 0 0 . 5 7 4 4 . 7 7 5 3 9,4 6 . 8 8 1 .0 5 0 . 4 4 0 . 1 2 0 . 5 0 1 9 . 5 8 2 . 3 4 0 . 1 4 0 . 7 9 0 . 2 2 2 . 0 0 0 . 4 2 0 . 1 4 5 . 0 4 0 . 6 1 3 2 . 2 1 4,9 5 8 1 6 . 2 2 2 . 4 3 0 . 9 1 0 . 1 4 0 . 6 3 3 0 . 3 2 3 . 9 3 0 . 2 6 2 . 9 0 0 . 4 2 3 . 3 7 0 . 5 4 0 . 2 3 1 0 . 3 1 0 . 5 1 5 9 . 5 8 4,2 7 8 。 玄壬 0 . 8 4 2 . 9 7 0 . 4 2 0 . 2 8 6 . 1 7 8 . 1 3 1 .3 1 注 1) 第 l 回調蚕で扇子奇扉47 ジャンノレ,第 2 回調査と第 3 回調査では 8 分野64ヲ子 ~/v を調査しで云万7て二は該当子るヲャンノレか なし、か集計値が計算されていないことを,空欄は日本と外来を区 j j I Jしていないことを示す ‑299一

298.

表 5 属性別にみた実演芸術のライブによる年間鑑賞経験率 第 2回 調 査 伝統演劇l 現代演劇l オペラ等 舞踊・舞踏・バレエ クラシック音楽 ポピュラー音楽 大衆芸能 その他 全ジャンル 有効サンプル数 全体 性別 男子 女子 5 . 3 2 11 .7 4 8 . 1 9 6 .5 8 1 7 . 0 5 2 7 . 4 1 6 . 6 5 0 . 5 9 4 6 . 6 7 1 0 . 2 5 0 2 . 1 4 7 . 5 9 3 . 0 8 2 .7 9 1 0 . 3 8 2 2 . 6 6 5 . 3 3 0 . 4 5 3 5 . 8 8 5, 9 4 5 第 3回 調 査 学部 文芸系社会系理工系保健系 学部 学部 学部 学部 9 . 7 4 1 7 . 5 5 1 5 . 3 7 11 .8 5 2 6 . 3 5 3 4 . 0 1 8 . 5 0 O .7 7 61 .7 5 4, 2 6 9 1 0 . 8 7 2 . 2 9 2 . 8 1 1 8 . 8 0 8 . 0 5 8 . 0 9 1 5 . 0 0 4 . 9 2 3 . 6 7 1 2 . 2 6 3 . 5 5 4 . 5 2 2 7 . 0 5 11 .6 0 1 2 . 4 1 3 3 . 6 4 2 5 . 2 7 2 2 . 0 5 9 . 2 2 5 . 3 2 5 . 1 7 1 .0 8 0 . 4 2 O .1 5 6 2 . 1 7 3 9 . 3 9 3 7 . 3 7 1 , 9 9 1 3,~Jl~5 4.90 11 .1 8 8 . 8 2 3 . 5 3 1 6 . 4 7 2 9 . 4 1 7 . 8 4 0 . 3 9 4 5 . 4 9 5 1 0 第 2回 調 交 大学所在地域 全体 3 . 9 9 2 . 0 8 11 .4 7 7 . 0 4 8 . 9 7 3 . 6 5 6 . 2 1 2 . 4 0 1 6 .1 2 8 . 8 7 2 4 . 4 6 1 9 . 5 8 7 . 6 0 5 . 0 4 0 . 5 7 0 . 6 1 4 4 .7 7 3 2 . 2 1 9, 4 5 3~ ー 臼 00 伝統演劇l 現代演劇l オペラ等 舞踊・舞踏・バレエ クラシック音楽 ポピュラー音楽 大衆芸能 その他 全ジャンル 有効サぞプル数 北海道 関東 近畿 甲中信部 越 四中国 九沖縄 州 東北 .0 2 4 . 5 5 6 . 6 9 5 .3 2 1 1 .9 0 1 .7 1 .6 6 9 1 1 .7 4 9 . 3 2 1 8 . 7 2 7 . 9 1 1 0 . 5 0 9 . 6 1 6 . 8 4 8 .1 9 6 . 9 0 6 . 5 8 5 . 3 6 1 7 . 0 5 1 7 . 5 0 2 7 . 4 1 2 6 . 9 5 6 . 6 5 4 . 4 7 0 . 5 9 0 . 5 1 4 6 . 6 7 4 5 . 5 9 7 8 3 LUl~O 1 2 . 6 6 1 0 . 5 2 2 2 . 2 8 3 3 .2 5 7 . 4 1 0 . 4 2 5 6 .7 2 3,1 1 9 7 . 6 7 9 . 0 8 . 2 1 3 . 5 4 4 1 2 . 5 7 1 8 . 3 4 21 .9 0 2 7 . 8 3 . 7 7 6 .7 3 7 . 4 7 1 .0 0 0 3 9 . 2 0 4 7 . 7 7 ,6 9 4̲ L ̲ i l l l5 1 舞踊系音楽系 伝統演劇 現代演劇 オペラ等 舞踊・舞踏・バレエ クラシック音楽 ポピュラー音楽 大そ衆の 芸 他能 全ジャンル 有効サンプル数 5 . 3 2 11 .7 4 8 .1 9 6 . 5 8 1 7 . 0 5 2 7 . 4 1 6 . 6 5 0 . 5 9 4 6 . 6 7 1 0 . 2 5 0 3 . 5 5 6 . 6 7 1 3 . 9 4 2 3 . 4 6 6 . 4 1 0 . 2 6 41 .4 7 1 ,1 5 5 3 . 6 4 5 . 3 0 1 2 . 8 0 2 4 . 8 9 5 .3 5 0 . 8 3 3 9 .1 3 1 , 8 1 2 第 美2 術 稽 回 系 古 調 事 査 慈 経 茶 験道 全体 1 2 . 9 7 2 3 . 2 9 21 .4 8 2 4 . 9 7 2 8 . 5 9 3 4 . 8 7 9 . 0 7 O .7 0 6 6 . 6 7 7 1 7 7 . 7 7 1 5 . 6 1 1 2 . 9 2 9 . 9 7 2 5 . 0 8 .5 9 31 7 . 7 3 0 . 6 9 5 7 . 0 6 5 . 0 5 6 3 . 9 9 2 .5 7 1 1 .4 7 8 . 5 4 8 . 9 7 3 . 9 1 6 . 2 1 4 .4 2 1 6 .1 2 1 6 . 0 5 2 4 . 4 6 21 .7 1 7 . 6 0 4 .7 3 0 . 5 7 0 . 8 2 4 4 .7 7 3 9 . 8 1 9, 4 5 3 9 7 2 全体 1 4 . 5 9 1 8 . 2 4 1 7 . 7 4 1 6 . 3 5 2 8 . 3 0 3 3 . 5 8 9 . 8 1 0 . 8 8 61 .2 6 7 9 5 5 .7 0 1 2 . 2 1 8 . 7 2 7 .1 2 1 7 . 4 3 2 7 . 3 9 7 . 3 0 0 . 6 0 4 6 . 9 8 5 . 6 4 5 6 .3 3 1 2 . 9 6 9.92 7 .3 6 1 8 . 3 2 2 7 . 9 6 6 . 3 5 O .5 8 4 7 . 2 9 4.646 3 .9 9 1 1 .4 7 8 . 9 7 6 . 2 1 1 6 .1 2 2 4 . 4 6 7 . 6 0 0 . 5 7 4 4 .7 7 9 . 4 5 3 5 . 5 3 1 5 . 6 3 1 5 . 0 0 1 0 . 2 9 2 5 .3 3 3 0 . 6 7 9 . 4 3 0 . 5 8 5 7 . 3 7 2, 5 6 6 3 .7 0 2 . 6 2 1 0 . 3 8 7 . 7 0 7 .1 4 4 . 0 5 4 .7 9 4 . 2 9 1 2 .1 2 1 2 . 3 0 2 3 .2 4 1 8 . 8 9 . 1 6 6 .5 3 5 0 . 5 7 0 . 4 0 3 9 . 8 9 3 5 . 0 0 4 , 944̲ ̲ ̲ ̲ l , ̲ 1 6 0 2 . 8 7 1 0 . 8 9 8 . 9 3 4 . 6 9 1 7 . 7 0 2 0 . 2 7 1 3 .1 6 0 . 9 1 51 .1 3 6 6 1 第 3回 調 査 大学所在地域 北海道 東北 教養系運動系 6 . 2 1 1 2 . 5 1 8 . 9 7 7 . 2 6 1 8 .1 5 2 8 . 0 3 6 . 8 9 0 . 6 4 4 7 . 9 9 6 . 2 4 3 6 . 1 7 1 6 .7 1 1 5 . 2 4 1 0 . 8 2 2 4 . 8 2 3 0 . 3 2 1 0 . 3 1 0 . 5 1 5 9 . 5 8 4, 2 7 8 全体 全体 学部 文芸系社会系理工系保健系 学部 学部 学部 学部 性別 男子 女子 舞踊系 9 .5 5 2 0 . 5 0 21 .9 1 2 2 . 0 7 3 0 . 5 2 3 2 . 3 9 1 2 . 2 1 0 . 6 3 6 6 . 6 7 6 3 9 関東 甲中信部 越 近畿 6 . 9 4 1 6 . 5 8 1 3 . 5 0 9 .7 6 1 8 . 8 4 2 8 .7 2 9 .1 1 0 . 4 4 5 2 . 0 9 3, 3 7 1 1 .2 8 6 .3 2 6 . 4 7 3 . 9 9 1 3 . 6 9 2 0 . 6 2 3 .6 9 1 .0 5 3 6 . 9 5 1 , 3 2 9 3 .1 8 2 . 1 3 . 2 4 9 . 8 6 8 6 . 8 6 3 . 3 2 3 .5 9 2 . 9 3 1 2 . 9 4 1 2 . 2 3 2 3 . 8 1 1 6 . 3 6 11 .2 9 3 . 8 6 0 . 3 2 0 . 6 6 4 3 . 9 9 31 .3 8 2,1 7 1 7 5 2 音楽系第美3 術 稽 回 系 古 調 事 査 筆経茶験道 5 . 7 6 1 5 .3 8 1 3 . 6 5 9 . 6 3 2 3 . 9 9 2 9 . 6 5 9 . 2 1 0 . 5 3 5 6 . 6 1 4 .7 0 2 4 .1 5 1 2 . 9 7 1 0 . 4 2 7 . 0 1 1 7 . 8 2 2 6 . 1 9 8 .7 2 0 . 5 8 4 9 . 0 4 5.010 9 .1 2 21 .3 3 1 8 . 3 9 1 2 . 3 6 2 6 . 8 9 31 .6 8 1 0 . 5 1 0 . 6 2 6 2 .7 5 647 中国 四国 教養系 4 . 1 8 1 2 . 4 7 1 0 . 8 1 7 . 4 0 1 8 . 2 5 2 6 . 8 3 8 . 5 0 0 . 6 3 4 8 . 5 8 4 . 6 3 6 沖九 州 縄 1 .8 6 9 . 5 6 .0 7 11 7 . 2 3 2 0 .7 5 2 5 . 5 2 4 . 9 0 0 . 5 8 4 7 . 4 4 8 5 8 運動系 4 .5 3 1 2 .7 5 1 0 . 8 0 7 . 6 6 1 7 . 7 4 2 5 . 9 8 7 . 7 5 0 . 4 8 4 7 . 8 3 4 . 8 1 5

299.

示されている。 4 .今後の課題と可能性 本稿では、我々の最終的な研究テーマで、ある 3回の学生調査に基づく実演芸術鑑賞構造の 時系列分析を行なう上で生じる問題の事前把握を目的に、実演芸術のライブ、鑑賞による年間鑑 賞経験率の変化についての分析を試みた。その結果、調査項目や回答選択肢が完全に整合し ているわけではないために生じるカテゴリーの不整合などの問題に加えて、時系列分析に際して は、調査方法に起因する根本的な問題が生じることが再確認されることとなった。それは、限られ た調査費用内で大規模な標本を確保すべく、我々の調査では有意標本による標本調査としたが ゆえに、調査精度の計算もサンプルの偏りに起因する母集団推定値の補正もできないとし、う限界 を抱えているということである。 しかし、このような欠陥はあるものの、我々の実施してきた学生調査はサンプル構造に配慮し た数少ない貴重な大規模調査であり、 ①単に比率や平均を計算して 3回の調査での推移を比較するだけでなく、超大規模データベー ス(データウェアハウス)に蓄積された大量のデータから意味あるパターンを抽出するデータマ イニング、技術を活用して実演芸術の需要構造を規定している要因を明らかにし、その要因の 変化を考察する。 ②「社会生活基本調査」や「全国消費実態調査 Jなどの政府統計での対応する集計結果と比較 参照を重ねながら、学生調査結果の信頼性を確認しつつ分析を進める といった研究を行なうことにより、整備が遅れている芸術需要統計データベースの拡充・整備へと 向けて、その基礎を築いていけるものと考えている。 O 謝辞 本研究は、文部省科学研究費補助金重点領域研究「統計情報活用のフロンティアの拡大ーミ クロデータによる社会構造解析 J(領域代表者:松田芳郎)の公募研究、「実演芸術の需要の実 態と構造に関する統計情報の収集と時系列分析 J(課題番号:09206107)の成果の一部である。ま た、第 l固と第 2回の学生調査は、それぞれ、昭和 6 0・ 6 1・ 62年 度 文 部 省 科 学 研 究 費 補 助 金 特 定 研究(I)I わが国の芸術活動の動向予測に関する基礎研究 J(課題番号62124012、研究代表者: 3年 度 文 部 省 科 学 研 究 費 補 助 金 総 合 研 究 ( A )I わが国文化・芸術情報の体系 三善晃)と平成 2・ 化と統計調査方法の研究 J(課題番号02305009、研究代表者:永山貞則)の研究の一環として行 なわれたものである。 なお、第 1固から第 3固までの調査を行なうにあたっては、調査票の配布、学生への説明、回 収に至るまで、多くの高等教育機関の関係者の方々から多大な協力を頂いている。また、芸術・ 文化統計研究グ、ループ(第 l回研究代表者:三善晃、第 2回研究代表者:永山貞則)のメンバー の方々、ならびに重点領域研究<ミクロ統計データ>の他の研究班の方々からは、本研究への 有益な示唆と助言を頂いてきた。加えて、第 1回から第 3固まで、の調査で、調査対象となった学生 の皆様には多岐にわたる詳細な調査の回答に協力頂いた。ここに記して感謝し、たします。 参考文献 [ l J有馬昌宏 I パソコン版 SASシステムによる大規模統計調査データの解析一「現代青年の芸 r o c e e d i n g so fSAS U s e r s Group I n t e r n a t i o n a l ‑]apan 1 1 t h 術意識と芸術活動」調査の分析 J,P Annual Conference,pp.297‑314,日本 SASユーザー会, 1 9 9 2 . [ 2 J有馬昌宏・法岡(杉江)淑子・折橋徹彦 I 大学生の芸術需要活動の実態 J,世界劇場会議発 表論文集, pp.59‑70,1 9 9 3 . [ 3 J有馬昌宏 I 大学生の演奏・舞台芸術鑑賞の実態とその構造 ‑PC‑SASによる分析‑J, P r o c e e d i n g so fSAS Users Group I n t e r n a t i o n a l ‑] a p a n 12th Annual Conference,pp.55‑64, 日本 SASユーザー会, 1 9 9 3 . ‑ 3 0 1一

300.

[ 4 J有馬昌宏, IPC版 SASとUNIX版 SASによる大規模調査データの解析一実演芸術の鑑賞 r o c e e d i n g so fSAS U s e r s Group I n t e r n a t i o n a l ‑ j a p a n1 3 t h Annual Conference, 構造と特徴 J,P pp.493‑502,日本 SASユーザー会, 1 9 9 4 . 現代学生の芸術需要の実態と構造 J,文 [ 5 J有馬昌宏・法岡(杉江)淑子・折橋徹彦・松田芳郎, I p.27‑34, 1 9 9 5 . 化経済学会く日本〉論文集 1,p [ 6 J有馬昌宏, I 現代学生の演奏・舞台芸術の鑑賞構造 J,商大論集(神戸商科大学), pp.53‑79, 1 9 9 5 . 視覚芸術需要の実態と構造 J,文化経済 [ 7 J有馬昌宏・法岡(杉江)淑子・折橋徹彦・松田芳郎, I 学会く日本〉論文集 2, pp.81‑86, 1 9 9 6 . [ 8 J有馬昌宏・古賀広志・海村正信・杉江淑子・大久保恒治・折橋徹彦・松田芳郎, I 学生調査に p.179 よる芸術需要統計データベースの構築と時系列分析の可能性 J,商大論集(商大論集), p 1 9 7,1 9 9 8 . J芸能白書 1997l社団法人日本芸能実演家団体協議会, 1997. [ 9 J芸能文化情報センター(編 ) [ 1 0 J松田芳郎, I 実演芸術データで見ると J,季刊文化経済学会, Vo1 .2,No.2,pp.11‑12,1 9 9 3 . [ l l J松田芳郎(編), w 統計情報活用のフロンティアの拡大の総括的研究 ミクロデータによる社会 構 造 解 析 1平 成 8年度科学研究費補助金(重点領域研究(I)研究課題番号:08209105)研 究 成果報告書, 1 9 9 7 . 統計情報活用のフロンティアの拡大の総括的研究ーミクロデータによる社会 [ 1 2 J松田芳郎(編), w 構 造 解 析 l 平 成 9年度科学研究費補助金(重点領域研究(I)研究課題番号:08209105)研 究 成果報告書, 1 9 9 8 . [ 1 3 J三善晃(編), wわが国の芸術活動の動向予測に関する基礎研究 1 昭和 62年 度 科 学 研 究 費 1 )研 究 課 題 番 号 : 6 2 1 2 4 0 1 4 )研究成果報告書(総論編・資料編), 1 9 8 8 . 補助金(特定研究 ( [ 1 4 J文部省(編), w わが国の文教政策(平成 5年度版 ) 1大蔵省印刷局, 1993. [ 1 5 J永山貞則(編入『わが国文化・芸術情報の体系化と統計調査方法の研究 1平 成 3年 度 科 学 研究費補助金(総合研究 (A)研究課題番号:0 2305009)研究成果報告書, 1 9 9 2 . 現代学生の主体的芸術活動歴と芸術の [ 1 6 J法岡(杉江)淑子・有馬昌宏・折橋徹彦・松田芳郎, I 需 要 形 成 J,文化経済学会く日本〉論文集, p p . 1 2卜 1 2 9 . 1現代青年の芸術意識と芸術行動調査」による若者の芸術への参 [ 1 7 J大久保恒治・松田芳郎, 1 5回日本統計学会全国大会論文集, p p . 1 1 ‑ 1 2,1 9 8 7 . 加 形 態 J,第 5 [ 1 8 J折橋徹彦・法岡(杉江)淑子, I 若者と芸術活動 J,統計,第 3 9巻第 1 1号 , p p.26‑34,1 9 8 8 . 口9J折橋徹彦・法岡(杉江)淑子 I現代青年の芸術意識と芸術活動 (1)J,関東学院大学文学部 紀要,第 5 6号 , p p . 3 ‑ 2 6,1 9 9 0 . [ 2 0 J折橋徹彦・法岡(杉江)淑子 I 現代青年の芸術意識と芸術活動 ( 2 ) J,関東学院大学文学部 紀要,第 5 8号 , p p.233‑275,1 9 9 0 . 文化 J,月刊世論調査,平成 9年 4月号, p p . 2 ‑ 7 2,1 9 9 7 . [ 2 1 J総理府広報室, I [ 2 2 J杉江淑子, w実演芸術の需要の実態と構造に関する統計情報の収集と時系列分析 1平成 9 年度科学研究費補助金(重点領域研究)統計情報活用のフロンティアの拡大ーミクロデータによ 9 2 0 6 1 0 7 )研究成果報告書, 1 9 9 8 . る社会構造分析 公募研究(研究課題番号:0 ‑ 3 0 2一

301.

日本 S A Sユーザー会 (SUG I‑J) 名古屋都市圏郊外における土地利用の変化 後藤順久 情報科学センター 日本福祉大学 ChangesoftheLandUsei ntheSuburbsofNagoyaMetropolitanArea Y o r i h i s aGoto ,NihonFukushiU niversity InformationScienceCenter 要旨 大容量データのハンド 1 )ングに優れた SASシステムを GIS的に活用することによって、時系列の 土地利用データの解析を行ったもので、ある。 10mメッシュの細密数値情報を分析することによって、 土地利用のダイナミックな変化をビジュアルに表現することが可能で、ある。分析対象地域として名 古屋大都市圏の知多半島を選択し、その地域で貴重な「緑」が減少していることが理解で、きる。現 在残っている「緑」も山林が主役で、はなく、田畑が中心となっている。 キーワード:細密数値情報、 10mメッシュ、土地利用、名古屋大都市圏、 GIS 1 .はじめに 我が国の地図情報の整備は、多様な空間スケールで、進んで、しも。国土全域で土地分類情報を集 約した国土数値情報、植生・動物・気候や国勢調査などのメッシュデー夕、 3大都市圏の都市整備区 域で細密数値情報などのデータが関係省庁により、整備されてきた。東京都などのように地方公共 団体でも独自にデータを収集し、データベース化しているところが現れている。これらのデータを利 用して、地理情報システムが整備されても、それを計画手段として有効に利用してしも事例はそれほ ど多くない。地方公共団体で導入したものの、利用されずに宝の持ち腐れになっていることもある。 どのようにデータベースを作成して分析を行い、地域計画・環境計画分野に利用してしてかが明確 にされていないことも起因している。地理情報システムに関する従来の研究がデータベースとそれを 運用するハードウェアの整備に重点が置かれていたからであろう。 本調査研究では、対象地域を知多半島に絞り、 SASシステムを GIS的に活用することで、詳細な 土地利用のデータを紙のかわりに、コンピュータの上に表現することによって、地図をハイテク化、イ ンテリジェントイ七、ビジュアル化し、ダイナミックに変化する地域の様子をより早く、よりリアルに表現す ることを目的としたものである。その結果、地域における、より具体的な問題点が明確になるであろう。 ‑303

302.

知多地域は名古屋大都市圏にあって、その土地利用は交通基盤整備、社会経済状況の変化に 伴って、大きく変貌してきたとし、える。近年においても知多半島道路や名古屋鉄道知多新線の開通 によって、内陸部での工業団地、名古屋の住宅需要を受け止める住宅地、南部で、のレクリエーション 施設が開発されてきた。今後、中部新国際空港や第二東名高速道路など、の大規模プロジェクトの計 画や事業が進められると、さらに土地利用変化に加速度がつくと考えられる ここでは、過去および O 現況における知多地域北中部の土地利用データベースを構築し、土地利用の動態を分析すること によって、その変化の要因を明らかにする。 2 .土地利用データベースと解析手法 細密数値情報は宅地関係情報の体系的整備の一環として、建設省国土地理院によって実施され た宅地利用動向調査(首都圏、近畿圏、中部圏)の結果をデータ化したものである。本調査研究で は、図 1 1こ示した中部圏(中部圏開発整備法に基づく都市整備区域を中心として面積約 2, 780 キロ 平方メートルの地域)の中でも知多地域に焦点を当て、 10mメッ、ンュとしづ詳細な単位でデータ化さ れた土地利用ファイノレと行政区域ファイルを利用して分析を行ったもので、ある。土地利用の分類区 分としては表 Iに示すように、 1 6種類に及ぶ。中部圏では、 1 9 7 7 (一部は 1974から 1 9 7 6年 ) 、 1983、 1988、1993 年の 4 年次に渡る土地利用ファイルが整備されているため市町村から地方圏レベル に渡る土地利用の時系列変化を研究する上では、非常に利用価値が高いといえる。本ファイノレをデ ータベース化し、その活用を図ることにより、今後の宅地関連施策の展開に必要な基礎資料の入手 だけに限らず、都市・環境政策などにも広く利用され得ると考えられる。例えば、山林が開発される過 程や、造成中の土地が他用途に転換される過程を如実に示すことが可能となる。 図 1 中部圏細密数値情報の調査地域 (出典:建設省国土地理院監修, ~細密数値情報説明書,], 1989) 一3 0 4

303.

表 1 中部圏細密数値情報 (10mメッシュ)の土地利用分類 コ ー ド 農地・山 林等 2 分類区分 山林・荒地等 農地 「了 4 畑・その他用地 造成地 「τ ‑ 6 宅地 I7一 造成中地 空地 工業用地 住宅地 ~ 円γ 一般低層住宅 地 密集低層住宅 戸 F 1 1 回 公共公 益施設 用地 つγ 中・両層住宅地 商業・業務用地 道路用地 公園・緑地等 その他の公共公益施設用地 1 4 河川・湖沼等 1 5 その他 1 6 海 { 疋 義 樹林地、竹林、篠地、笹地、里子草地(耕作放棄地を含む)、 裸地、ゴルフ場等 水稲、蓮、くわい等を栽倍している水田(短期的な休耕回を 含む)をいい、季節により畑作物を栽培するものを含む 普通畑、果樹園、桑圏、茶園、苗木畑、牧場、牧草地、採草 牧草地、畜舎、温室などの畑およびその他の農地をし、う 宅地造成、埋立地等の目的で人工的に土地の改革が進行 中の土地をし、う 人工的に土地の整理が行われ、現在まだ利用されていな い土地および簡単な施設からなる屋外駐車場、ゴ ルフ練習 場、テニスコート、資材置き場等を含む 製造工場、加工工場、修理工場、採掘場、採石場、発電 所、ガス製造工場などの用地をいい、工場に付属する倉 庫、原料置き場、生産物置き場、厚生施設などを含む 3階以下の住宅用建物からなり、 l区画あたり lOOn i'以上の 敷地で、建物が密集していない住宅地をいい、農家の場合 は、屋敷林を含め 1区画とする 3階以下の住宅用建物からなり、 l区画あたり lOOn i'未満の 敷地で、建物の密集してしも住宅地をし、う 4階以上の中高層住宅敷地からなる住宅地をし、う 小売り庖舗、スーパー、デパート、卸売、飲食底、映画館、 劇場、旅館・ホテル等の商 J 苫、娯楽、宿泊などのサービス業 を含む用地および企業の事務所、銀行、新聞社、放送局、 流通施設、その他これに類する用地 有効幅員 4m以上の道路、駅前広場などで、工事中、用地 買収済みの道路用地も含む 公閥、緑地、動・横物園、墓地、寺社の境内地、遊園地等の 公共的性格を有する施設および総合運動場、競技場、野 球場等運動競技を行うための施設用地をしヴ 公共業務施設、教育文化施設、供給処理施設、社会福祉 施設、鉄道用地、パス発着センタ一、車庫、港湾施設用 地、空港等の用地をし、う 河川(河川 l 堤、堤防を含む)、湖沼・溜池、養魚場、海浜地 をいう 防衛施設、米軍基地、基地跡地、演習場、皇室に関係する 施設および居住地等をいう (出典:建設省国土地理院監修,~細密数値情報説明書l1989) 3 .土地利用の時系列的推移 作成した土地利用データベースから、 1 9 7 7年と 1 9 9 3年の土地利用を分類区分毎に色分けして図 1 種類に集約した。ただ 化したものが、それぞれ図 2と図 3である。ここでは分類区分を表 2のように 1 0種類の分類区分となる。 し、「その他」の土地利用は実質的に無いため、 1 Fhu n u q o

304.

表 2 土地利用図を作成するための分類区分 本調査研究での分類区分 オリジナノレの細密数値情報の分類 区分 1.山林 2 .田畑 1.山林・荒地等 2 .回 3 .畑・その他の用地 4 .造成中地 3 .造成地 4 .工業用地 5 .住宅地 6 .商業・業務用地 7 .道路用地 8 .公園・緑地等 9 .その他の公共公益施設用地 1 0 .水系 11.その他 5 .空地 6 .工業用地 7 .一般低層住宅地 8 .密集低層住宅地 9 .中 ・I 害1 層住宅地 1 0 .商業・業務用地 11.道路用地 1 2 .公園・緑地等 1 3 .その他の公共公益施設用地 1 4 .河川・湖沼等 1 6 .海 1 5 .その他 9 7 7年から 1 9 9 3年の 1 6年間に「山林 J が半島全域にわたり減少し 図2と図 3を比較してみると、 1 ていることが一目瞭然で読み取れる。実は知多地域の「緑」の主役は山林でなく、その過半数は「緑」 を補完する田畑であるということである。特に、知多半島北部で、はまとまった山林が非常に少なり、 「緑」を保持するため田畑の重要性が増している現状が読める。この山林の減少は、名古屋大都市 圏の人口増を吸収するために住宅地開発を受入れてきたことによる。さらに交通至便な名古屋鉄道 沿線も同様の状況にあり、新日鉄前駅、南加木屋駅、巽ヶ正駅、朝倉駅周辺などに大型の住宅地 9 7 7 年には北部に限定されていた内陸型の工場は、 1 9 9 3年までに中部 開発が進んできた。また、 1 で、も立地が見られるようになった これは知多半島道路等に代表される自動車交通網の整備や重厚 O 長大産業から組立て型産業の構造転換などにより、内陸型の工場の立地が促進されたと考えられる。 しかしながら、半田市の臨海部はさらなる埋め立てにより臨海型の工業用地を拡大し、海岸線の変 化が見られる。半田市では東西南北の方向、特に西の方向に連坦しながら市街地が拡大してきてい るということも理解できる。 ‑306‑

305.

図2 1 9 7 7年における土地利用図 307‑

306.

図 3 1993年における土地利用図 308

307.

4 J開発系」土地利用の抽出 9 7 7 年から 1 9 9 3 年までの土地利 図2と図 3をコンピュータ上で、オーバーレイ(重ねあわせ)させ、 1 用変化の中でも「自然・水系」から「開発系」の土地利用に変化している 1 0メートノレメッシュを抽出し たものが図 4である。ここでは「開発系」土地利用を、「造成地」、「工業用地」、「住宅地」、「商業・業 務地」、「道路」、「公園・緑地等」、「その他の公共公益施設用地」と定義し、「山林」、「田畑」及び「水 系」を含めた広義の「緑」である「自然・水系」から「開発系」への総量変化を図化しようとするものであ る。土地利用の変化は、土地利用が固定的な既存臨海工業地域を除いて地域全体に万遍なく広が っており、まとまった面積を持つ開発も同様の現象である。 1 9 9 3 年時点では「造成地」と表示されて いる箇所が多いが、富貴工業団地、常滑大谷地区工業団地などのように現在は工業用地としてオ ープンしてしも箇所もある。公園・緑地や公共公益施設として市民に親しまれる、あるいは利用され る施設に整備された箇所数も多いことが分かる。 5 .土地利用の遷移 SASシステムを用いた分析によると、 1 9 7 7年から 1 9 9 3年までの土地利用変化の中で「開発系」土 地利用とされたメッシュは知多地域北中部の総面積 2 9, 4 9 8. 46 h aのうち、約 1 1%にあたる 3, 304. 47 h a で、あった。その変化のうち、主要な「開発系」変化を抜き出し、固化したものが図 5である。 1 9 7 7年の「自然・水系 J の中で、最も大きな面積を失った区分は、「山林」で全体 3, 304. 47 h aのうち 51 .4%、次いで「田畑」の 39.3%である。そして、水系の「河川│・湖沼」、「海 Jの割合は 4.0%と 5.3% で、それほど大きくない。少なくとも 1 9 9 3 年の段階では、他の大都市臨海部に比べて、知多地域で は陸域により開発指向があると見て良い。 1 9 9 3 年の「開発系」への土地利用変化後の区分は、「造 成地」が全体 3, 3 0 4. 47 h aのうち 38.8%、次いで「田畑」の 2 6.4%、「道路用地」の 9.8%、「住宅地」の 9.6%となっている。また、「道路用地」が 6.0%と公共施設の中でも大きな割合を占めている。 「自然・水系」から「開発系」への土地利用変化の内容で、最も大きい割合は、「山林」から「田畑」で 全体 3, 3 0 4. 47 h aのうち 24.9%、次いで「田畑」から「造成地」の 21 .4%、「山林」から「造成地」の 13.9%となっている。 1 9 9 3 年に「造成地」として区分された土地利用は、現在将来とも確定された土地利用ではないケ ースが多しせ考えられる c その中身は「造成中地」と「空地J であり、現在の詳細な用途を精査する必 要があるとともに、今後確定される土地利用を追跡調査してして必要があると考える。 ‑309

308.

図4 i 開発系」土地利用への変化 ( 1 9 7 7年 ‑1993年) 3 1 0

309.

土地利用の変化 1 9 7 7年 山林 (全体の 3 %以上だけを表示) 51 .4 対 1 9 9 3年 田畑 2 6 . 4 % 造成地 3 8 . 8 % 工業用地 4 . 1 % 田畑 3 9 . 3 % 住宅地 9 . 6 % 商業・業務用地 3 . 8 % 道路用地 9 . 8 % 河川卜湖沼 4 . 0 % 公園・緑地等 3 . 6 % その他の公共公益 海 5 . 3 % 合計 (そのイ也2 8 . 2児 ) 1 0 0 . 0 施 施設 4 . 0 % 合計 1 0 0 . 0 % 図 5 土地利用の遷移図 ( 1 9 7 7年 ‑1993年) 6 .知多地域の開発史との関連 戦後の知多地域における地域開発は社会経済の変化に応じて、大きく変貌し現在に至っている。 9 5 9 年の伊勢湾台風による大被害に対する復興事業が行われた。 1 9 6 1 年には愛知用水が まず、 1 9 6 0 年代に港湾整備が行われ、名古屋港、衣浦港に隣接する東海市、知多 通水している。また、 1 9 7 7 年の土地利用図を 市、半田市、武豊町の臨海部で重化学工業を中心とした工場が立地した。 1 見ても臨海部の輪郭は現在とそれほど大きく異なっておらず、ほとんどがこの時期までに形成された ものである。愛知用水の完成が臨海部における工場誘致を可能にした。工業地帯が完成し、合わせ て従業員のための住宅地開発も活発化したごさらに、愛知用水は農業用水を供給し、稲作、果樹、 畑作、畜産などの新たな開発が大規模で進められ、国・県は農地開発事業に着手することになった。 こうした政策は現在まで続いており、「田畑」が住宅地などに農地転用されていく一方で、丘陵部の 雑木林である「山林」を次々と開墾し、「田畑」を補充している実態が本調査研究でも裏付けられる。 今後とも、知多地域は特色ある都市近郊農業の担い手として位置づけられるわけであるが、近い将 来、大規模フ。ロジェクトとの調整が必要となる地区も多くなると想定される。 1 9 7 0年代は知多半島を南北に縦貫する知多半島道路が開通し、臨海部だけでなく、内陸部での 工業開発が行われるようになった 鉄道が少ない知多地域では観光・産業道路としづ位置づけでな O 9 8 3 年の名古屋高速道路との結合は時間短縮の く、生活道路としての利用価値も見い出された。 1 効果に拍車をかけた。名古屋からの住宅需要を受け止める地域として確実性を増すこととなった。 1980 年代は名古屋鉄道が富貴駅から分岐し、美浜町を経て、南知多町に至る知多新線の開通 などにより、自然環境、観光資源に恵まれる知多地域南部がレクリェーション基地として整備が進ん だ。北中部における「スポーツ医・科学研究所」の立地、「あいち健康の森」の構想発表など魅力ある 新たな地域づくりの可能性が芽生えた時期である乙 3 1 1

310.

1990 年代の今日に至るまでに大きなインフラ整備はないが、景気低迷の長期化、重厚長大型産 業の再編など社会経済の変化は大きく、知多地域の開発に及ぼす影響は大きいと考えられる。例え 1 世紀を見据えた ば、臨海部の工業用地に遊休地が発生することもありえない話ではない。今後、 2 第二東名道路の開通、中部新国際空港の開港を控え、地域内外の交通ネットワークはかなり充実し、 それらを加味した大規模な地域開発が展開され、土地利用転換が進むと考えられる。 7 .おわりに SASシステムによる簡便な地理情報システム構築の利点は、大量の情報を扱えることとそれらデ ータ聞の関連性を統計的に分析できることである。今後の課題として、以下の点を挙げ、長期的な展 望を持つ調査研究によってカバーしてして予定である。 名古屋市近郊では、都市的な土地利用と農業的な土地利用が混在している状況(スプロール現 象)が広範囲に見られる。このスプロール現象は地域計画の観点からみると多様な問題をはらんで、い る。公共セクターから見た場合、道路・上下水道・学校などのインフラ整備が非効率となる。また、農 業面から見た場合、農業用水が汚されるとし、った問題など生産環境悪化の現象がおきる。農地が都 市の中で貴重な自然環境であり、景観上、防災上、重要なオープンスペースとなっていることを考え るなら、最小限度、市場原理を取り込みながら、都市と農地の望ましい共存のあり方、土地利用の誘 導、規制のあり方を明らかにする必要がある。このような前提で、土地利用の問題の中でも土地利用 混在の現状を把握し、スプロール化が進行している地域、これから進行すると考えられる地域を把握 することが上記の議論に対しての材料を提供できるのではないだろうか。 適正なモデルを作成で、きるなら、環境の変動や大規模プロジェクトなと、、の影響をシミュレーションに より予測が可能なことである。本調査研究のような現況の土地利用の分析だけでなく、社会経済的な 変動に伴う土地利用への影響の状況を把握するためのシミュレーション機能を取り込み、計画場面 にフィードバックで、きる仕組みを作りたい。 さらに、ここでは土地利用に絞り、簡便な地理情報システムを作成したが、都市計画、交通計画、 農村計画、環境計画など他分野の情報と一体化させることにより、システムの有用性は一層高まると 思われる。このように地域に関わる地域環境資源データベースとして一元的に管理することは一般 的に望まれることである。また、ネットワークを介して、関係者が必要なデータを相互利用(アクセシピ リティの確保)できる情報環境の整備も今後急速に発展する情報技術で可能となるため、是非実現さ せたいハ 参考文献 1)建設省国土地理院監修 J 細密数値情報説明書j], 1989年 2 )後藤1慎久 ; W知多半島の目指すべき地域像Jl,知多半島の歴史と現在,校倉書房, 1993年 11月 3 )武内和彦, t . e :J I I篤史 ; W環境資源と情報システムj],古今書庖, 1994年 6月 4 )杉崎章 J図説知多半島の歴史〈下巻)j],太洋社, 1 9 9 5年 l月 5 )知多地域北中部 5市 3町各種行政資料 ‑312‑

311.

日本 S A Sユーザー会 (SUG I‑J) 財務パフォーマンス分析の新しい視点 S A S / I N S I G H T及び N N Aの効果的活用法として 陶山博太 企業行動デザイン研究所/帝京短期大学 代表取締役杜長・主席研究員/講師 E ‑ M a i l :C Y M 0 1 0 1 6 @ ni f t y s e r v e . o r . j p A New Viewpoint of Financial Analysis H i r o t aS u y a m aP h . D . h eR e s e a r c hI n s t i t u t eo fC o r p o r a t eB e h a v i o rD e s i g n, . P r e s i d e n t,T L e c t u r e r,T e i k y oJ u n i o rC o l l e g e, . 要旨 ニューラルネットワークや、対話型統計解析システムは 我々の情報に対する見方・ほりさげ方を大きく変革して くれる。本報告では、経営分析の分野でそれがどのよう に行われるか、実演を交えて提示する。 キーワード: 州A 、 叫S / I N S I G H Tソフトウェア、経営分析、データマイニンク、 デュホンシステム、付加価値分析 ‑ 3 1 3

312.

u ︑ ︒ 2‑ ‑1 n H 4H1 ムロワる務でに テ プ ︑ 得 財 の o阿川本 スアばをいもる指拡 シのれ面いるな務利 析へす画とすと財常 解題用き析とくの経 計課使如分うと位産︑ 統該をの関よごの資は 担当ト面相みの述総の 話 ︑ フ 画 は を3前 と つ 対るゾのれ弱表でるも ︑よの 2 こ 強 図 法 べ を はにこ表︒のは方制川 先T o図 る 係 方 の を 作 ら印るでき悶えこ聞い か引なチでの考︑相強 こ川とツが問︑ててに 日一ンこ指あつは 内屯 Uny 臼 a刈 守 口 斗υ 0 . n札 n目︑ノ n o n o n 6 2Aa 0 2仏 ふや土 口 4rι114 H f H‑ ﹀HHBl 関X 関 ) 関 ) VAX R11 )円 性 24 ︑ 2産 4R X生 ( ( (備率 率設比 減値点 増価岐 高加分 上付益 ν こ チタと標りさい引 売 粗 損 す一止と分し俄析方︑イ フ特象品川とら準分るちタ パ︑対終象かて常めわト 務めをの対年し経高なロ チ財た業計査!とにをすプ 8タ o般 率 oて 一 る る 企 統 制' ロよい要術をの一た一被るい プにて主業社)デし︑利すっ ア タ し の tmml元成ら山市察に び一と業向山表を作か経考型 よデ的産通約図)をタ産ら川 おロ回全は業(移ト一資か仰 象 ク を ︑ に 造 標 推 ツ デ 総 点h 対マ析く的製指のセ元る視な 析︑分な休(務でタのれの的 分はスは具タ財ま一らさ数統 ・稿ンでの一の年デれ祝復伝 一業す析た・9 し 上 法 ま 2木 マ 拘 る デ 位 5 て こ 主 を ず ‑314一 J:外分配率 *t ﹄ HU ω 関係性の視点(相関分析) を政会には陀前れ各すをシ把メの思し続き討取はみの方財疑ノ/向やは視に 報財(o般法賢いそに出法.︒をア社字に実で会にでら位一常なクク川を点と築) 率視こ構析 情 の 者 い 一 万 総 払 ︑ ら 州 五 ン る 点 ︑M 金 標 た は ﹁ ス の か 債 が 経 的 テ 一 営 業 切 多 は 析 ば 利 き さ を の ボ す 算 てG の 指 し 事 ︑ セ も 容 る ) [ 久 な ソ ム 益 た の の 分 経企決が々分え産置︑組こユに採せ︑上薬ロ功るはロる則するう恒たトテ利っそスス の ︑ る と 技 の と お れ に ち 問 ︒ デ と ︑ 併 て 析 改 成 わ て プ れ り い あ 抜 ︑ ︒ 新 ツ ス 資 な oセ ン ︒ 社合すこ︑そた総筏かやたはこはとし分なれ変してらまたでをはたのネシ投異るロマる 他場一爪るを︑(︑中分担つにうチ析と営々さに対えゼつに報報にきめル析︑はみプ一な ︑ る 間 れ 法 が 保 不 ず に 諜 あ 般 い 一 分 手 経 様 用 型 に 応 発 ( 業 情 情 jて た ラ 解 で と 試 成 オ と どすをか手る指間ま率てで一とロ岐めるた使川烈にら判企い計論けの一計と米を遥フ示 なとどおるいす利を効し川()プ分決れしで仰川待か批合な会析続析ユ統こ従示やパ提 先 う な に す で 去 業 ) 産 化 原 型 る ア 誌 の ら 現 業h m矧 h う 競 し ︑ 分 れ 分 二 型 る ︑ 提 定 務 の 引 よ 納 妓 断 ん を 企 ど 資 分 が 川 れ 型 爪 山 話 山 企 設h の 人 い や ク め 営 ら ︑ ︒ 話 い の の 設 財 案 収し成小判呼中小︑なと制法問ば川る脱ににの所し震ると造ンた続けはる対川めス標ち試 ︑析山内がをと能率率ンに方川呼mす 慌 共 後 際 ︑ か 願 い け 創 リ る ー か で あ ︑ を た セ 目 わ 革 が 分 終 ) 書 析 利 砧 益 フ と う は と h 理 恐 と o実 く し ︑ で j の は す や げ 告 で や わ る 口 ︑ な 変 業 ︑ や 報 世 界 分 吹 利 利 一 ご い で ム の 管 大 例 る ︑ し の は ん o傾 に 在 l投 報 一 ) 山 せ プ に す る 企得態情決常投格別マ目と楠テこ・カ功あも乏い報組い価得存論が木ジ川町さ析時(す 状計終︑経当を料る本ス保リ成でてにな情りなた枇慨に務間口刊川上分間点対 m た 川相の は存率れち化率いで回収いしーだ l ろ い テ し べ 利(造 一でに革ず即進益しの(しとるうをだ忽ス討 の を性創 高一産上辺利い︒‑利かる率正点すよプいしシ検 頭 上 一 資 の 右 常 の る 善 常 お す 拡 が 起 割 た 一 な 在 Sを A係習 附関学 要冒 売 一 総 問 ︑ 経 率 な 改 経 で 現 利 ) を 分 つ ル え 存 Aチ や( 概は 一理は高転にる産の表則の)にあグかは S 一 チてと × り に 上 回 話 ︒ け 資 う を 当 もE り で の つ チ ( ロ T法 点 一 ま め 売 産 う る お 総 連 り 前 た O回 正 連 し 一 析 プ 山開視 o 一 い る 展のる ロ)っす 裕 一 高 っ た る 資 い あ に ﹁ が 回 い え 只 利 修 一 さ ロ 解 ア 川 の 像 す プ 点 に 現 利 一 上 oる あ 総 と で チ ら 質 利 払 川 ( 産 の た で プ 計 た U ら想示 ア視方表 常 一 売 る せ で す い プ 一 ば 性 の 利 を ネ 資 で し ん ア 統 し 日か理提 型のえで 経 一 な さ ン 一 不 良 イ ロ つ の 方 陀 川 雄 と 面 う 呼 の ︑ 川 =に上ヅをばタプも母両資問利り目こと他は利 ︑占一︑て 川 定 考 式 後視点い ︑でを 問勘の公 一形向一率れトア︑分本総融木田科て j た い 視 つ h (型 を 益 一 産 う を マ 効 す ロ の は と 資 ︑ 金 資 利 定 つ 点 て 降 ) ︒ tU1b 利 一 資 い 偵 ︑ 産 普 プ こ 性 子 と ら に 主 債 助 が 視 し 以 る う べしのに 02 ・ mそ 常 一 と の る 資 改 が 来 向 分 債 か 疏 株 負 ︑ た の た ︑ よ こ 一 述新)) をた性点 経一総辺す︑をれ従方は負る損﹁︑どし定︒はかにゆ 2 プし問視 一左在とかこので︑あ終 勘うのムて ・ 刀 j てな o はじめに

313.
[beta]
行h
R .lf}1
元
!1
;
&1':;~. i

︑IJ

門

IJ

︑
︑
%%
((
))率率
))%%比))却
%%)))(())務月)%償
((%%%中小率月月債(%())価
本率(((担担((入率(率)%%減
賃貸来度率負負率率買比)率当%((産
動定子存担費用比比対性月当配(率中小資
変間利依負却費権務権動(配木向配保定
高官同金金貸償融債償債流本金資性分留固
上上人人件側金上人上一川向仰木己当外内形
売売併借入滅純売買売子在資自配社社有
門

γ

IJ

︑

人
/
j
Hl︑ノ

向
吋
小

で

ゆ I
!

扱
つ
・

M川

:¥

A

Jみ

N

ヤ
ノ 14
7VA

一2

広刊︑

一
一

業00
産2 る

通ちと

mx す

川

a [!llü>~nf!!守事夕、~!Ikl;i 贋e-':

円 qd
円q
dAUZFHυRU I RりQυnU1A L
日U I Rり日υnu‑‑ L

L
円
リ
つO Q
L
円
L
円
り
Lqdqdqdqdっけつoqdq
リAUZAUZAUZAua

﹁

ぃ︑

VAVAVAVAVAVAVAVAVAVAVAVAVAVAVAVAVAVA

︑

う要
度の必
作標を
9UH
化
成記畑中

γt僚

司
リ
︐

700.000

2
竺ー脚 o

~T:-'.._一一一旦一一型二型1一一色川 5

22
4
224

︑︑
︑
ノ

m

巧

))))千%
〆
︑
︑
/
︑
︑
H
4
ζudu
︐ドI十
J JO
IJ
IJOJ IJ
に川
5)%%・%(%)))()性人性)
9%・・率(本()川問凶率%)産/産)%
・水率減率益水十四(((転(%生川生)%(
年来減減哨疏利益(本水準阿)))率(働千俄%(率
l減 楠 ( 利 常 利 ) 不 仮 転 転 席 % % % 合 系 労 ( 設 ( 率 比
8 m ( (益 常 経 常 % ↑ 松 山 川 間 資 ( ( ( 適 比 価 率 偵 不 備 点
((従茶利続本経(問権務産定水不本山川本側備制配価岐
列高利利純産資古同日産債償資同比比比長資加装加分加分
系 上 業 常 期 資 己 上 O資 上 人 卸 形 動 座 定 定 己 付 木 付 働 付 疏
時売 m
v
日経当総白売 R 総 売 買 棚 有 流 当 問 問 自 粗 資 相 労 相 国
巧

り
円 OOAUZFURU I Q O口
円
OAuzrb
11 ワL 円 ︒d
A にυQU looqυnu‑‑ L
υnu‑‑ L

VAVAVAVAVAVAVAVAVAVAVAVAVAVAVAVA

VAVAXXVAXVAXXi111111111222222

o i
i
o
o¥

1
.6367
1
.6337
1
.5973
66.401<

Z
Z
4

!

(., ζï~~~ぶ Nð 'l 二
l 三一一一一一一ー
I
II
1
1
5
5
1
1
5
E
511m
5
1
1
T
V I
I!
GPR
H町
一
一
上倒偶
9.4365 0.]234 0.26'9.2517 9.11拍 I
1:
0.4365 1
.0
剖同
9.5757 0.4 ・ 6~ '0.4535 0.2211'
ii
0.3234 0.5757 し 9000 0.5734 0.2405 0.2017
II
0.26掴
9
.+
4臼
0.57S4 1.伺 00 0.IOU3 0.2437
II
9.2517 0.4535 0.2柑 5 O
.J083 1
.剖 00 0.463' I
II
札口同
ι2211 0.2617 0.2437 O
.叫 3
' 1.帥0 0 I I

I
I
‑
iGP向
iHSH
!
1
1
5
5
3時 E
15RTM
15自TV

Nlnl.
,
U
N
I

H.ul̲ J J 1
2.1200ι00ω'1 11
2
.倒 的
10.09 1 I 1
3.0000
1
0蜘
II
3.0000
1
0
.酬 の I I
300.0000
印 O帥
II

0
.
"
7
1引

4
.日 52
6.321<
6.0033
~ .0336
535.2657
224
224

t
J

r

1
盈
fdc
:E
dlt f
t
n
4
1切" T bI
c:~ Gr ・ ph~ P(1
l Hc
:l
p

・

S1
:d O
C
:
I
o
I
H ̲̲̲̲t
1
c
:.
U
I
'

V~~ ,~~l.! ̲
CPR
H剖
H55
~~~..
肝
15
N

i
寸
一
一
一‑‑lJF
ぷ 五 日I
L
E
F
t
l正L 一一一一一一一, 1
1
H55 H5E5RTN 5RTV 1

巴PR H剖

村 Il
,
[
J
ク7
ト 子σ
〉云長云J
ミl
i
l
i
If
i
'
T
I

I
玄l
云長 2

戸 U
h

4EA

ο
η

314.

of つ現向よチッ 報収が卜︑ラる定の 4 習 ) ツ 益 卸 視 ク 組 社 修 学 て 0を い ー を で ︑ 点 仙 あ 両 あ 逮 o 定二でのがイネる情しなツ︒厨タい設れは学 7 ネ 利 棚 の 一 ︑ ︑ 習 ︑ し l 線 高 点 棟 ︒ l点 悦 評 で ︑ で 勘の点標群テルす力返しネる問ンてをぞ肘大ぴた常︑段ツホネ学で対︑山を視折る点視のしのとい点 くの視指標スラ別人り習ルあ中イし率れ力︒最ょせ経市中係ト減比︑要にはた率のたえ視の者かもうし視 きものる指ン一使︑繰学ラで︑つ場益そ人た︑おさ高転問ツ榊点は必のでつ益定れいの定部しるろまの イ ユ を は ら を o一 の 層 か 盈 利 で ︑ し 回 6 映 上 回 I ネ 高 岐 で が た j整 利 勘 ら と 像 助 外 oす あ 望 定 大る伺なた o ︑ よ 別 と れ い S ニ ) と が ン る ユ も 力 ︑ が 常 と め と 0表 反 売 権 に た 上 分 j習 つ 点 ︑ ) 常 ﹁ 得 だ 想 ︑ た る 対 で が 勘 5図 を ︑ 債 次 付 ﹂ 売 品 点 学 あ 視 し 9経 ︑ で き 迎 は し れ に の と を 点はにれ標かな八(ンクな一あニな入にム経こた側 視 点 法 ぞ 目 導 で S 八 ヨ 一 し タ で る う ︑ 的 テ 産 る る 3 2 ( jに 上 ︒ さ に 損 視 復 で の 了 表 産 は jぺ ﹁ 果 と ら 門 も こ 果 の 視 手 れ ︑ で 確 ︑ N シ ワ 散 パ ム よ よ ち 覚 ス 資 え oす は 数 o点 層 売 た 映 層 ︑ ︒ の 反 定 性 修 図 資 に 点 ぐ ︑ 結 め え 部 る る 結 造 た 計 そ で 点 明 に N 一卜分のテにのわ視シ総換るに層凹た視力︑し反力性た定の安係が(総る視注てのじ考やすせ成 創し統はの視かめのケツにそス一次な︑るにれす定問行しの入率読を人渡し勘回不問習︒︑せのをし動はと部対さ達 背 場 ︑ ︒ ら た の の た ン リ ネ ン ︑ シ タ は す を え 層 入 較 一 小 試 に 定 ︑ 転 配 法 ︑ 生 街 ﹁ Oも ﹁ 学 た ら さ 性 力 と 活 を い 業 に 合 た 学 畳 と る れ き ら る の パ プ ル ロ で る 一 而 計 行 力 を 比 を ︑ 備 凶 勘 は 聞 を 子 て 備 配 ︑4 束 ︑ 復 し か 達 係 に め 営 主 よ 市 中 人 統 わ で産率計し設を架約収)反東山木到間と止経株がが佃をな ・ で の き こ て ち う 絞 十 ア ラ 一 と き ユ 両 ) 設 に o山 居 を 件 し 予 一まる別て除︑科の卜一ユニむ憶ンク表層イあず入効の限しをず一総回を例価配ので差表内て行ル︑すてしわるそと視︒ 4ま も で ︑ い ど し 比 ジ ク 一 ユ こ で ピ の 5 の プ る ︑ 力 不 条 定 て 5 ︑ ク 資 転 統 と 偵 率 結 に の 8 で 収 結 に ﹁ こ 柄 ︑ ち の れ ︑ 点 す にに象上りユトをりらワ(出クのし学例回卜率白川点の付外了官(回捕レよ仰そ捕すではろ方ろ 2いよ大さをに影こ一ワ二︑込記コ一図力テでま︑押他にそ数まワ︑産 j 一加分そま誤図以い試べりばし完な観︑うのう o m mu 全のる成レのこ表る︑ず なの突ンいし︑てい標よ部︑のい とどりイもだくし向指みたに凶見は 安もれ営理めしによとら ︑のら経休日たか的にとま 組︑ょのとびな覧ものでれ外ばがの でルみがたのし景党こど ち は 節 T o本 呼 で 一 般 他 見 さ 以 れ ) た る基でけをが︑をぶ傑す件し しべく標しそ︒計視ると 勝と前 見レ多指場︑るが︑でに で業︑う引すのチだム引がかつ府言条山山 ) ) ) ) ) ) ) か企かよ川川学ヴるラば)るりの換川悦検 の d 一一岐にいながれ斯ずがる 00ηο7ynqnU7y な い のL U活 計 タ す グ ネ 度 い 冷 一 つ ( 前 に VA‑‑11ワ ム QUQUA 叫 ︒ 管 2深でとら判ぜ架す /kVAVAVAVAVAVA る ・ 一 が 節 こ け ︑ 存 効 討 の 高 る に M り 統 ン 示 ト 椛 程 て で 4岡山るた おわ/︑/︑/︑/︑/︑/︑ 業のいと︑よらツ表ス)利剖し色の指す新 あ 務 2係 木 い づ は 依 り 検 で業︑問︑古川論とによを 造 来 て こ は を か を だ ヒ 4常 2 院 い 節 つ に で 住 率 率 本 群︑︒らにがが結こけて果 製益つるお吋飽タムたの主将の位担前持ル作 利 転 率 比 産 却 M体 に の と を べ 操 山 布 団 値 性 資 償 標 の る か 時 る シ て な だ れ 結 本 利 持 み 孜 機 一 ラ て 際 問‑ 日 常 を て に ブ デ グ し 品 川 ( 資 全 ス 4 る 性 レ の 終 産 中 小 価 動 定 例 晶川もめと戦あサし要刊さる は 経 徴 み め イ 一 川 ト そ る の 総 ( ラ 表 す 係 イ こ 古川資比加流率悶減 たる占こ場でノと市中山川附ょ っすをの市閃モ件りる併に で 産 特 で た テ ︑ ス oあ る で プ ク 閑 う 関 ハ o 上卸定付一苅陣形 い開く上的要の条よれが体 れ資なんのクまヒるもすこ一の(そにをる 売棚問粗予在有 とに多以外のル提でさ報媒 そ 総 う 込 そ ラ い る み 十 絞 こ ル ど ο)ら るょっタえて数比グでう分さ水だ 性が対功べ前こ現情紙 ‑316 し︑ニ違 論はイの 議境マと て環タス しる一セ にけデ口 前ゆ︑プ のでと業 けんス作︒ をこセのる 耐りロらい 附くプかて ︑つ業れし がを作こ一京 人如何祈るに の的解よ機 数らのに明 仰が来グを ︑な従ンい ︒ 大従すっ︑を山社いて上ちあ し o示 作 れ 怖 さ で と せ た わ で だ限をがさ州法の J さしなの た術開質保加︑る︒ム口定する (る相 l 僻 村 も い る 紡 仇 向 ︒ れ のすい︑がいでていををたら たと強とン古川分って悦質れえ っしのるジて光岡つの係特さ加 あ良釘ぜ一しは上なる聞のだが では︑わマ川与をくがた業き点 隙 態 合 Anい 前 官 れ 低 上 れ 合 揃 悦 肘状場を高に貝そはぴら本がい の程い標︑効役にてか得日獲し つい深府り有や遁し浮で︑き新 4 さが 4 ょ を 当 が と が 析 で べ っ た小係のに源配益来像分とる一 ーが間こ上 m H o利 配 業 問 こ あ で い似て光作るた分全相るのこ︒ とはっ)た現得し外うみるこる 2‑ 3 :. ~~\想像の視点

315.
[beta]
I~r 三~ ~3

-H:J 円u て7~ト十斤 C)~ そ考ーズー:/7'

O
.!
f
)

総資産終?常;古f
何
不
利
リ
』
飾
佑
在
伝
;
本
+
名
;

売L
J
尚
F
向
俳
5
持
車
終
モ
肘
i
常
'
}

~一一→

不~才
7

O.fl~ιO. 3~
総f
t戸(
;
I
D
I松本

※(数l
f
i
'
l
は
f
I
II
I
H
I関係数 f
f
l
i、
線の太さ t
J
i
1
11
iHIf悶強度)
※'F伊IJt;J:)ill産統計製造業nO~9n データ

I
ヌI
三隻 4

t
三コヨ三

トクーラノ、 CD 一_r~乞三長刀ミ l Q.jJ 1
百I

‑
h

ロ
てZ圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃dでT
青I
言1

:f一一…一…

樫恒明監田副批評円 叫
l

」JL」 よ 」
一J
:
̲
j
:
̲
j

型E
」圃・

!

4』

・
・
1
1
:J

: l M f

J

全 国l三百

吋 開頃

ヘ
ル
ヨ IHI :
a

ーー『?間回目『鳴戸『守#弓
lJi
』 工J
I

I

I

司i l l j
綴 醐 l鱒 1
,
11J

fi!
以

•I

豊
重量
到盟三出土

。
0
'

へj ~ ..,WJ""'"出j 必JàlふJ~主同協j 剣旦u主Lu土l

1
1
1
!J

1111
土J

也

I

一
一
一
一
一
一
一
一
一
一
一
一
一
一
一
一
一

II,I

i
凶

t
J
S I1

1
1~

止J

出

二J

I
4
i
i
!

I
山

~ IJ 臨 I
!」土

三 笠j 霊Z

庁

U111

剛

~AH~A';:

誼 並 立l
h
l
エ
企
こ
こ

.
,
・a
乙J
.
!、

317‑

316.
[beta]
I
究1
ミ
霊
長 5

二二二:1.←ーラノレオミットワーーク OJ

メ イ ンm
Hiljj

UE
芯一一一一一一一一一一一一一一一一一一一闘訓 I
h1n
.
ff'

;-巴ヂ I'} , Jラ'!;'\:',i'{>~l

I

,
¥
,
'I

1

'
tf" ,
.
,
実

g
φ

,''
1
1 l'え行 ρ

"

・.
.
"

..,・ .fη ,~/)

ヘ'FJ'qu

ヒI一 通 一 …

雄ヲl 三」 ιj~J~ ̲(̲J
J
.
:
i
J
J-,UιJdニゴ蛙l竺l 投j~j!:

喜

国庫~幽~回凶畠面白瓦諸凪.à:よ圃圃圃圃園田園圃園田園田園圃
I I

1
首1
/
'
1
:
.
.
.
.

1
:
̲.1:脚

炉、

,
:
‑
1
1
1

ι
‑
‑

じ
二

.
a

x
‑

荒波;園

'
;
"
;
1
.
:
1

J,
'

I
玄[c
亙
主
長 G

ご二二一二コ:1.一一ニラノレ才亡ツ

t
三
:
生
党
ε刃主

,

ト

( 1) ‑
/
.
̲
品
主}
Jス
EじD 干
符
E
邑J5
主
烹モ
、
3

コ
仁
I
i
IJJJffl 1

〔豆!J
売上高経常利益率: X

8

総資産回転率

:X 10

売上債権回転率

:X 11

棚在jI資産回転率

:X 13

3伺

総資産経常利策率

318一

:X6

317.
[beta]
i
立l
芸美 7

二二‑ ̲
‑
̲
,
̲ "‑‑ーニフノレ才亡ッ ト '
:
J一一ク G O
三党三E ぐ 2 ) ‑‑IUJ伺も・I
ィ
ー1
三じり特色,モミミー

一層一榊

一力一榊
一人一高

﹁lL売

:X 2

担l
付加価値
設備作産性※

:X22

l
J
l
r
l
在分岐点比率

:X 25

r

:X12

社内宮!保,

口El
総f
i産経常利 l
n
t率

i
玄 i芝長 B

:Xo

[
t
I
)
J定 の 視 点 ! に よ る 宇 神 1
1
1
1線

l!
i
l数 ( 横 Wlh) )
(;I;:~-j誤業(縦イ;ll! ) と 反 復 宇 F

「一一一一「一一寸一一一一下一一一つ一一一

l
玄 lヨ
乏

。

[
I
V
.
If呆竹の視点 i

による~~f: '
1
'
11
1
1
1線
〔平均誤発(縦軸)と反復学腎[[jl
数(横軸) )

一一一下一一一一[一一一一 l
一一一一一│一
10

20

30

319‑

~O

一一

r

50

318.

想りたた 思よれみ はにかで い八導ん る N 県呼 あ N鮎と をた点 点︒押し悦 似る川子討の のあ彼検造 性で反を創 係の︑水宙 開るは効学 をみ解の スで見そで ・ゼ占一の︑の ロ視上しは プの以行の︒ 成像山犬もい オ祝 フい o n パなたる 務はつ失 財になで 盟こ 志向 1 1 J に nカ 指 う川︑りを よ川明と たのがこ き米本位 て従存う み︑のよ ではスの まにセ次 郎スロね 前ンプ概 マ・ (頁一た報て をl タ し 情 め る卜︑一化の極 げ一げユ錬上に おポ上ピ精 oスス にレみンりる一ン 境︑府コよれぺマ 環性もに︑らさス一 位要一示前らが換一 4 プ必提のかな転パフ︒ イのの円法しにイパる テン果)方議法サ務く クイ結のる討方︑財て ラザのトす︑すと︑つ タデ析ン明に指るもな ン如何分ア説前日なンく イ情常イにををうイ深 @経ラと而論そザが クご阿結デ縁 ‑ 3 2 0一 (参考文献) I )ノ〈ゼル h ゲ イ ル r T h eP I M SP r i n c i p l e s~ T h cF r e eP r c s s。 2) 烏 漫 普 司 『 企 業 の 投 資 行 動 理 論 』 3 ) 日 経 ビ ヅ ネ ス .9 7年 6 月 2 7号。 中央経済社。 )︒︒ る 2 る 価 が を 務A 椛 ど る 動 ︒ 形 で 質 とれるに動い的こ使業果ら ゼ率2あ 加 ) 度 財 川 利 な い の る 有 国 木 標すが而治て制るば企結か 指普繋前常れ抑ならののつ さ 比X で 付 の 要 席 が 後 U てこある百貨の 上点(標のも重上氏きるし︑であるそ 値改にを経さるにな上動持 向岐性指来た︑のリ引す致は岡山ですと 怖に上標な摘か床ぜ以活を を 分 売 の 従 い れ 社 べ 税 言 一 性 指 舟 担A 加的向指的指か潟な社常力 ) 益 生 系 ぱ 除 さP 卜 前 提 も 産 い 分 負 川 付 点 の 率 権 り ︑ の oO経 得 6旧聞備値'川を明日ルいをと生深のをや o ︑前一率効集よは折る 0 い 説 ︑設側川費提︑ア払性向備が様ト巴る 習 て を 益 産 央 来 果 山 れ 0しと ( は 依 加d 本 て わ ・ 利 市 民 動 設 り 桁 ス 川 あ 学 ? り 利 資 小 従 結 犬 ら l 々 性 率 の 何 付 仇 資 つ や 一 : 重 の 傾 わ 技 コ 刊 で 凹 よ ち 常 0・ は の 迂 え ︑ 生 惣 益 つ 加 ばM と よ と ニ 航 の 野 価 か 当 木d ら 迂 に ど 経 た 的 と 習 考 が る 信 Hに こ 卜 価 ) 分 加 か ︑ 資 ‑ mか と 用 の 産 つ 制 こ 学 が と タ た の 利 立 付 わ ︑m 常 日 ゃ い は 件 yる の 加 卜 務 付 て ば ︑ 吋 る 離 使 標 資 な 統 な の チ た 一 わ 応 経 て ) ︑ と 人h い ト 付 ス 財 け め ら は ︑ す 距 の 指 総 に ︑ ち 回 一 し デ に 相 産し 5た こ ︑ と て ス 的 コ の わ わ な 産 め く 短 八 本 く 確 と が 今 ロ 唆 元 年 ︑ ︒ 資 と 2 つ の ら 日 め リ 済 木 近 り き ぜ 資 た じ 辰 N効早明るり︑プ一示た 5 り る 総 困 X いこか制古川ナ経資最ととな定る同 @ N 産 ︑ が て な が ア を し lああ 要(と値 D ア(一の向間あを 資ばかす一にたなと旧のでで x J I l 価{ 1 ( 1 m向 へ の 転 換 ①付I ヒストグラムをJlJいた l l g想 像 の 視 点 で は 付I J II { 而備に関する指標(商品/事業開発・ 流通経路改革・原価企画・役務提供方法の 転換(リースからセルへc l c ))の仙に、 内部管抑ーに関する指際、(在庫本など)の重 要性も j l ! ll ̲ Hされた。 いいかえると、投資利益率が高い企業は 而での取りこぼしもないことを意味ーす 管理 i る 。 いま、情報に対する感度が高い企業は、 どんどん付加価値系の指棟(たとえば時間 あたり付 I J l l価 値 な ど ) を 導 入 し て い る 、 し かし、導入したすべての企業が成功する訳 ではない。 成功する企業は、 D U D o n l型 の 勘 定 の 視 点 を忘れない会社である。新しいものと古い ものを上手に編集する者が成功するのだと 思う。 我々は、中!止の官険的商業の時代におけ るビヅネスの木質を折にふれて思い起こす 必要があろう。現代の冒険は付加価値tl1 Ji l i に他ならないものの、売上債悔や棚卸資産 の放漫な管理は、船への浸水を意味し、放 放置すれば沈没につながることを忘れるべ きでない。 2‑ 5 ま と め 攻めと守り ④

319.

日本 S A Sユ ー ザ ー 会 (S U G I‑ ̲ ̲ J ̲ ) ニューラルネットワークによる乳幼児のアトピー性皮膚炎発症予知の検討 0高 橋 幸 一 1 ) 、 早 漂 宏 紀 ヘ 冨 田 守 2) 森永乳業株式会社栄養科学研究所 1 ) 森永乳業株式会社食品総合研究所 2 ) Ap r o b a b i l i s t i cmodelf o ra f f e c to fa t o p i cd e r m a t i t i si ni n f a n c ybyn e u r a lnetworks i r o t o s h iHayasawal ) , M amoruTomita2 ) K o u i c h iT a k a h a s h i l ),H l ) N u t r i t i o n a lScienceL a b o r a t o r y ,MorinagaM i l kI n d u s t r yCO.,LTD 2 ) F o o dResearchandDevelopmentL a b o r a t o r y ,MorinagaM i l kI n d u s t r yCO.,LTD 要旨 乳幼児のアトピー性疾患と家族のアトピー性疾患既往歴の有無との関係を中心に、全国の 1、2歳児の母親 1万人を対象として実施した疫学調査結果に基づいて、 SASニューラルネット ワークアプリケーションによるアトピー性皮膚炎発症予知の検討を行った。 立、疫学調査結果の有効回答数である 4610人とし、児の年齢、性別、出生順 解析対象 l 位、生後 3ヶ月までの栄養法、母子の食事制限の有無、児の食物アレルギーの有無、 2親等 以内の家族の既往歴の有無、離乳食開始時期、卵摂取開始時期、牛乳摸取開始時期、母親 の年齢、母親の職業の有無、居住地域の 18項目を用いて検討を行った結果、感度 88.6%、 ま3.6%で、あった。 特異度 99.5%、全体の過誤率 l キーワード SASニューラルネットワークアプリケーション (NNA)、アトピー性皮膚炎 (AD)、 ‑321‑

320.

1 . はじめに アレルギー疾患の予後判定とその基準の確立は、医師の治療方針決定のみならず、患者お よび患児の親への対応にとっても重要な問題で、あると考えられる。特に乳幼児期におけるアトピ ー性皮膚炎発症の予知は、気管支 1荷息発症へつながるアレルギーマーチの進展予防におい ても重要と思われる。我々は、すでに、乳幼児のアトピー性疾患と家族のアトピー性疾患既往 歴の有無との関係を中心に、全国の 1、2歳児の母親を対象として実施した疫学調査データに 基づいて、多重ロジスティック回帰分析を用いて、第 14回日本 SASユーザー会研究発表会に おいて、 rSASシステムによるアトピー性疾患発症予測についてJとして報告したが、今回 SAS ニューラルネットワークアプリケーションの使用の機会を得て、ニューラノレネットワークによる乳幼 児のアトピー性皮膚炎発症予知の検討を行ったので報告する。 2 . 方法 リスクファクターとして、二親等以内の家族歴(父親、母親、同胞、父方祖父母、母方祖父母 の既往歴)の有無、児の年齢、性別、出生順位、生後 3ヶ月までの栄養法、離乳食開始時期、 卵摂取開始時期、牛乳摂取開始時期、児の食事制限の有無、児の食物アレルギーの有無、母 親の年齢、母親の職業の有無、母親の食事制限の有無、居住地域の 18項目を使用した。居住 地域については全国の都道府県を、北海道東北、関東、中部、近畿、中園、四国、九州、│沖縄 の7地域に分別して検討した。アトピー性皮膚炎は、医師による診断・治療歴にある児を 発症 あり として、家族の既往歴は、医師による診断・治療歴のある人を 家族歴あり、とし、医師以外 の医療従事者から指摘されたり自分で擢患と判断している人を 疑いあり、、これ以外を なじと 6 して分別し数量化したc 表. 1 アトピ‑性疾患既往歴の分別と数量化 .児のアトピー性皮膚炎 φ 医師による診断・治療歴あり・・・・・・ φ 医師による診断・治療歴あり・・・・・・ .家族のアトピー性疾患 φ 医師による診断・治療歴あり・・・・・・ φ 医師による診断歴あり φ 医師以外の医療従事者から指摘されたり 自分て程患と判断・・・・・・・・・・・・・・ φ 医師による診断・治療歴は不明だが ・・ ・・ ・・ ・ 擢患歴ありと思う・・ ・ ・ ・ ・ ・ φ 不明 φ なし 3 2 2 1 . 発症あり o .なし 2 家族歴あり 1 . 疑いあり o なし

321.

N = 4610 AD=705 (l 5.3~ 3.84 % A R 図 1.疫学調査結果 解析対象には、疫学調査結果の有効回答数である 4 6 1 0 1 y l ]を用い、医師の診断治療歴のあ る児のみをアトピー性皮膚炎発症ありとして、この有症率 3.84%を予測するそデ、ノレを検討した O アトピー性皮膚炎発症の有無を目的変数として、リスクファクター 18項目をそれぞれ説明変 数とする単変量ロジスティック解析を行い、危険率 1%以下で、有意で、あった 10項目に母方祖父 母の既往歴を加え、合計 11変数を入力層に使用した。 表 2. 単変量口ジステック解析 Variable F a t h e r M o t h e r B r o t h e r Grand F a t h e r G ra n dM o t h e r N u t r i t i o円 Dist.of i n f a n t F o o d Allergy A g e G e n d e r S o li dF o o d Egg C o w ' sM iI k Dist.ofMother O r d e ro fB i r t h Worko fM o t h e r A g eo fM o t h e r Area Coding 0,1 ,2 ,2 0,1 0 . 1,2 0,1,2 0,1,2 1 ,2 ,3 0 . 1 0,1 1,2 ,2 1 1~24 1~24 1~24 0,1 0,1 1 .2 18~45 1~7 Coefficient 0 . 5 2 8 2 0 . 5 1 9 3 0 . 3 0 9 7 0 . 3 2 7 1 0 . 2 1 2 7 0 . 0 9 4 9 2 . 0 8 9 0 2 . 6 7 5 3 0 . 4 7 9 3 0 . 1 1 9 6 0.1064 0 . 1 4 8 9 0 . 0 8 3 3 0 . 9 1 0 7 0 . 0 3 2 9 0 . 0 3 6 0 ‑ 0 . 0 8 4 6 0 . 0 2 3 5 3 2 3 S .E . 0 . 0 1 8 9 0 . 0 8 1 9 0 . 0 8 3 0 0 . 1 0 6 2 0 . 0 9 4 2 0 . 1 1 6 8 O .1 7 5 9 O .1 7 8 4 0 . 1 5 3 6 0 . 1 0 7 7 0 . 0 6 4 7 0 . 0 2 4 6 0 . 0 2 9 7 0 . 1 6 3 0 0 . 0 2 0 5 0 . 1 9 6 7 0 . 1 5 3 8 0 . 0 4 1 5 P value 0 . 0 0 0 1 0 . 0 0 0 1 0.0002 O . 2 1 0 . 0 2 3 9 0.4164 0 . 0 0 0 1 0 . 0 0 0 1 0.0018 O .2 6 6 7 0 . 1 0 0 3 0 . 0 0 0 1 O .0050 0 . 0 0 0 1 0 . 1 0 9 0 0.8546 0.5825 0 . 5 7 1 1 ∞ Odds ratio 1 . 6 9 6 1 . 6 8 1 1 . 3 6 8 1 . 3 8 7 1 .2 3 7 1 . 1 0 0 8 . 0 7 7 1 4 . 5 1 6 1 . 6 1 5 1 . 1 2 7 1 . 1 1 2 1 .1 6 1 1 .0 8 7 2 . 4 8 6 1 . 0 3 3 O .9 6 5 0.919 1 . 0 2 4

322.

ニューラルネットワークモデ、ルは、多層ノ《ーセプトロンモデルで、層の数を 5とし、ユニット数 は、第2層を 11、第3層を4、第4層を2として入力層に 11項目を用い、学習方法に SASニュー ラルネットワークアプリケーションのデ、フォルト学習方法で、ある Levenberg‑Marquardt法を使用 し、収束基準を 0 . 0 0 1、学習回数を250回とした。学習と評価の為に、それぞれ、解析対象から 40%( 1812例)を無作為抽出し、アトピー性皮膚炎有症率(事前確率:3 . 8 4 % )を判別区分点と して評価した。学習用データおよび評価用データのアトピー性皮膚炎の有症率は、疫学調査 結果の 3.84%に対して各々 3.86%であり、解析検討可能と判断した。また、入力層の変数は、 0 " ‑ ' 1の聞の数値となるように最大値で、除するなどの変換を行った。 。 Outp u t I n p u t Ta r g e t H i d d e nL a y e r 図2 .多層パーセプトロンモデル 3 . 結果 各症例のアトピー性皮膚炎発症予測確率を求め、疫学調査結果におけるアトピー性皮膚炎 3 2 4一

323.

有症率を判別区分点として、 発症あり"の症例を 発症あり"と予測できた感度は、 88.6%、 発症なし"の症例を"発症なし"と予測で、きた特異度は 99.5%で、あった。さらに、全体の過誤率 は 、 3.6%で、あった。 表.3 ニューラルネットワークモデルの評価 Predicted/observed Numbero fcases A t o p i cd e r m a t i t i s A t o p i cd e r m a t i t i s Nona t o p i cd e r m a t i t i s 6 2 9 Nona t o i p i cd e r m a t i t i s 8 1733 二8 8 . 6( % ) S e n s i t i v i t y二6 2x100 / (62+8) 9 . 5( % ) S p e c i f i c i t y=1733x100 / (9+ 1733)二 9 P r e d i c t i v ea c c u r a c y二(6 2+ 1 7 3 3)x1 0 0 / (62+8+9+1 7 3 3) 二9 6. 4( 百 ) 4 . 考察 乳幼児のアトピー性疾患と家族のアトピー性疾患既往歴の有無との関係を中心に、全国の 1 .2 歳児の母親 1 万人を対象として実施した疫学調査結果に基づいて、 S A Sニューラルネット ワークアプリケーションによるアトピー性皮膚炎発症予知の検討を行った結果、感度 88.6%、 特異度 99.5%、全体の過誤率は 3.6%で、あった。 ロジスティックモデルによる単変量解析を行った結果から、危険率 1%で、有意で、あった 10変 去による変数選択を行い、三親等以内の家族の既往歴すべ 数を用いて、さらにステップワイズ7 ての変数を含めた多重ロジステック回帰モデルを設定し、このモデルからアトヒ。ー性皮膚炎発 症予測確率を求め、ニューラルネットワークと同様に疫学調査結果のアトピー性皮膚炎有症率 を判別区分点として評価すると、感度 75.1%、特異度 82.6%、全体の過誤率は 17.7%であ った。 表.4 多重口ジスティックモデルの評価 P r e d i c t e d / o b s e r v e d Numbero fc a s e s A t o p i cd e r m a t i t i s Nona t o p i cd e r m a t i t i s A t o p i cd e r m a t i t i s 1 3 3 44 Nona t o p i cd e r m a t i t i s 7 7 2 3 6 6 1 5 . 1( % ) S e n s i t i v i t y=133x100 / (133+44)二 7 S p e c i f i c i t y二 3 6 6 1x100 / ( 7 7 2+3 6 6 1 )=8 2 . 6( % ) P r e d i c t i v eaccuracy=(133+3 6 6 1 )x100 / ( 1 3 3+44+772+3 6 6 1) 二 8 2 . 3 ( % ) ‑325‑

324.

今後、 SASニューラルネットワークアプリケーションは、 EnterpriseMinerとしてデ、シジョンツリ ー及びロジスティック回帰とともにデータマイニング、ソフトウェアとして提供され、それぞれの手法 によるモデノレの比較及び同一手法内で、の複数モデルの比較など、効率よく検討可能となる予 定である。従って、より信頼性の高い予測精度の高い結果が得られることが期待できる e これらのツールを活用して検討し予測結果の信頼性を実際の現場で検証することが望まれ る 。 参考文献 .SAS Institute I n c . TheSASN e u r a l NetworkA p p licationU s e r ' sGuide,SAS Institute I n c ., Cary,NC,p p .1 2 8,1 9 9 7 . 'Warren,S . S . N e u r a l networks and statistical m o d e l s . I n Proceedings of the Nineteenth Annual SAS Users Group International Conference", SAS Institute I n c ., Cary, NC, p p .1538 ‑1550,1 9 9 4 . ‑豊田秀樹:非線形多変量解析ーニューラノレネットによるアフ。ローチ ,株式会社朝倉書店、 pp.174、 9 9 6 . 東京、 1 ・丹後俊郎、山岡和枝、高木晴良:ロジスティック回帰分析 SASを利用した統計解析の実際 , 9 9 6 . 株式会社朝倉書店, pp.245、東京、 1 ・馬場則夫、小島史男、小津誠一:ニューラノレネットの基礎と応用, 共立出版株式会社, pp.204, 東京、 1994. ‑有田昌彦、三河春樹、白鷹増男、清水正人、高橋幸 、早津宏紀:乳児期におけるアトピー性疾 患の発症と家族のアトピー性疾患既往歴との関係に関する疫学調査結果について, 日児誌 98, 754, 1 9 9 4 . ・有田昌彦、三河春樹、白鷹増男、高橋幸一、早津宏紀、冨田守:疫学調査による乳幼児期のアト ピー性疾患発症と栄養法との関係, アレルギ‑ 46, 354‑369, 1997. ‑326‑

325.
[beta]
日本 S A Sユーザー会 (SUG 1‑J)

大病院における外来患者増加要因の解析

0田久浩志、定本清美、鈴木荘太郎
東邦大学医学部病院管理学研究室

A
f
f
e
c
tf
a
c
t
o
rt
ot
h
eo
u
tp
a
t
i
e
n
t
sincrement
i
nl
a
r
g
eh
o
s
p
i
t
a
l
TakyuH
i
r
o
s
h
i,SadamotoKiyomi,
SuzukiSotaro

to
fHospitalAdministration,Schoolo
fMed.,
TOHOU
n
i
v
e
r
s
i
t
y
Dep.
E‑mail:takyu@sirius.med.toho‑u.ac.jp

要旨
j
t
l
、者属性として、新制に忠、:{i.な鈷年度をう主義し 4
Y
J
h
;
己の何年析を行った。その結果、長JlJ
J

I
l
¥
J
にわたって継続して受療する忠者が次第に県和し、その結果外米忠者が増加 l
すること

:
司令が向
が判明した。また、老年人口の場介、他の年齢に比較して長期受療する忠(i.のi
いことが判明した。今後の i
豆披政策の民 I
JiJを考える J
卦合、忠者登録作!主にもとづく忠若
動向の解析がJTi:要なことを指摘した。

キーワード:

患者動向、長期受療患者、患者登録年度

1̲はじめに
1
I本の保健医療制度のもとでは、忠者は自 I
lJに医療施:没を選択でき、そのため大病院
に忠者が集中する傾向がある。そこで、大病院への忠者集 q
lを是正するため、外米忠おー
は原則として紹介とし、入院医掠に重点を置くべきであるとの提案がなされている 1)。
しかし、大病院に患者が集中する理論的解析はほとんどされていない。

1
三持に行われる ‑
1
1
例えば基本的な医療統計資料で、ある厚生省の忠者動向調査は、 51
の断面調査である九従って、大病院への外来忠者の集中の原因が、 l~ij~Rn 者の受診 1111

数の l
{
I
}
J
Ilか、兼診の増加か、新規j
E
、者数の哨加かなどの解析は当然行われていなかった。
戎々は、新しい患者属性として「患者証録年度」を定義して、 l
寸ー辺、者の初 1
0
.1の受診
からの年数経過による受療動 J
i
i
J変化の解析を行った。その結果、新脱に登録した患者は
年数経過とともに、次第に受療しなくなって減少し、一部の忠者のみが継続して受療す
る忠者となった。そして、継続して受療する忠者が出積されて外来J
♂、者数が増加 i
し、そ

J
J
l
lが '
J
7
.じることが判明した。今!i1]、大病院における外来忠者の
の結果、病院の患者数以r

nL

qu

7
・

326.

哨加要因として、継続受療忠者の特性について報告する。 2 .対象と方法 対象としたのは東京都大 111 区に位 'i(;~ する、 T 大学医学部附属 O 病院の外来忠者である。 データの解析 W J問は、病院に情報処理システムが導入された 1983年から 1996{ fまで の1 4年間とした。 mの各々の年の 6月のみの全外来患者診療記録を解析対象とし 解析にあたり、対象期 1 た。患者の毎回の診療記録より、患者番号に対応した患者登録年度を SASで求めると 共に、受診年 J毎に年齢、診療科、来院日数を求めた。ここで忠者登録年度とは、患者 が当該病院を受診して、始めて患者番号の登録をした年と定義した。 解析の結果、忠、者データは患者番号、受診年、受診月で識別され、患者登録年度、年 齢、診療科、来院日数より構成される 318015件となった。 解析には IBMPS/55 と PC‑SASVcr .6 ̲ 0 4および E x c e 1 5 ̲ 0 を川いた。 3 .結 果 3 ̲1 . 患 者 登 録 年 度 に よ る 解 析 各年の 6月における患者受療の実態を、患者登録年度を用いて分類した。その結果、 凶 lに示すように新規登録患者数は翌年に一度大きく減少した後、以後なだらかに減少 していた。また、毎年の新規の登録忠者の数は大きな変化は見られなかった。一度登録 した患者は、登録後 10年程度経過するとほぼ定常状態になった。 これより外来患者数の増加は、継続して受診する忠者の累積が次第に増加するためで あることカ河川らカ当になった。 患 図 1外来患者登録年度 35000 者 30000 数 25000 20000 15000 10000 5000 。 、主J ‑ N u " l 、D 1'‑ ro 。 Eコ口、口、口、 r o r Eコ Eコ Eコ r 、 口 、 口 、 口 、 口、口o 、口、 口、o 口 、 口 、 口 円 寸 ー一一 一一 一一一一 u " l。 。 口 口 、 口 、 、 。 、 口 、 口 、 、 、 口 円 寸 一一 口1987 図 1992 ‑ 3 2 8

327.

3 . 2 .患者登録年度の年齢人口別による解析 01 4t 長)、生産年齢人1‑. 1 年齢別の年経過による患者数の減少率を求めた。年少人口 ( , ( 1 5 . 6 4議)、老年人口 ( 6 5歳以ヒ)では l年後に忠才;数が各々 35.9%、33.6%、54.9%に減 ' 1 % 、 58%になだらかに減少した(図 2) 。 少した。そして 12午後に各々が 3.9%、 10. 守 nUQJ 只 U r %6 0 06 06 06 06 06 06 06 06 06 o O ﹁ にJ A Y 2 J i ﹁/﹄司 o 図 2年齢人口別患者数の変化 1 2 3 4 5 6 7 8 9 10 1 1 12 経過年数 l J J J匂;人工)ー産時人瓦一一老ふ長人一 1 4 .考 察 4 .1.従来の研究との比較 マーケテイングリサーチの分野では顧客の層別化を行い、どの顧客がどのような属性 を持っかを解析し経常戦時の立案に役立てている。そのため顧客を時間取1 I で、分析し、既 存顧客の引き摺めと新規顧客獲得を重視する戦略が提案されている九 今回の報告は、 L i 己の考えを参考に新規に忠者番号登録年度を患者属性とし、 H常の 外来患者受療データを解析しなおした結果、外来患者の増加が継続して受療する忠者の 累積による点を明確にした点が新しい点である。 本研究と類似の研究としては、新来院忠者とその後の再米院率を調i 1 をした山地らの報 )外来患者の増加が継続して受療する患者の累積に起凶すること 将司がある。本報告は 1 ) 患者を年齢人口別に桝析し、高齢者が継続して受療する忠者になる を明確にした点、 2 することをゆjらかにした点が異なっている。 本が高く、その結来忠者数が増加 1 これらの事より、 i j i .純に大病院に患者が集 11 するという事実のみで大病院の外来機能 3 2 9一

328.

を全て紹介制にするという提案は早急であるといえる。 4 . 2 .本 研 究 の 応 用 悶定客が年月の経過と共に減衰する現象は、 Trackerモデルなどいくつかのモデルが 提案されている九図 lに示した外来患者数の減少傾向が、どのようなモデルに適応す るかはまだ、明確で、ない。しかし、施設毎の年齢人口別の忠者数減少 I l t l根を求めると、新 規患者の実績から将来的な患者数の子測が可能になる。 長期にわたって同一病院を受診する忠者は、一種の I~il 定顧客と見倣すことができる。 そのため、この固定患者についての、診察回数、間隔、診療科、一同当たりの医療費な どの背景を解析すれば、どの分野の忠者を多く獲得すれば、より効果的病院経営が司.能 になると考えられる。 4 . 3 .老 年 人 口 の 患 者 変 化 図 2より明らかなように、老年人Llの患者数はどの経過年度においても他の年齢人 u ほど減少せず、常に 50%台を維持していた。これは、老年人口の忠者総数は他の年齢 層に比較して急速に増加することを立l 床している。 高齢社会を迎えるにあたり、老年人口の医療費の抑制が医療政策上問題となっている。 しかし、単純に医療費の抑制という対処療法をするのでなく、今別示した老年人口の継 続受療の動 ] I t Jを考慮して、始めて本質的な老年人口の医療費の抑制が可能になると考え られる。今後は医療費と継続して受療する忠者の関係を解析する必要がある。 5 .結 語 外来忠者の増加要因について検討した。その結果、長期間継続して受診する忠者が累 積されて患者数が増加した。継続して受診する忠者の割合は年齢人口により異なった。 6 .参考文献 1 )丹羽雄哉:生きるために、日経メデイカル開発.p . 2¥ t2 .1998 2 )厚生省:厚生白書(平成 9年版).発行財 l 司法人厚生問題研究会、 1997 3 )山地正三、他:診療録管理、 4 ( 2 )ふ 3 8 ‑,1 1 . 1992 . 1 6 7 ‑ 1 8 9 . 1 9 8 7 4 )片平秀貴:マーケテイング・サイエンス、東京大学出版会、 p 5 )江尻弘:最新データベースマーケテイング、中央経済社、 p . 1 0 1、 1 9 9 6 . 3 3 0一

329.

その他

330.

日本 S A Sユーザー会 (SUG I‑J) PROC TRANSPOSE 活用方法に関する一考察 三島徳雄 産業医科大学産業生態科学研究所 精神保健学教室 A ConsiderationonHowt oU t i l i z ePROCTRANSPOSE N o r i oMishima Departmento fM e n t a lH e a l t h,I n s t i t u t eo fI n d u s t r i a lE c o l o g i c a lSciences U n i v e r s i t yo fO c c u p a t i o n a landE n v i r o n m e n t a lH e a l t h 要旨 PROCTRANSPOSEは重要な機能を持つプロシジャであるが、一般のユーザーには余り使用さ れていない。その理由のーっとして,プロシジャの説明が行列の転置に基づいて行われているた めに、その機能を理解しにくいことが考えられる。そこで、このプロシジャを活用するための新しい 視点として、「複数の変数の情報を一つの変数にまとめる、即ち、変数を横(変数方向)から縦(オブ ザベーション方向)に並べ替えるプロシジャで、ある。」との考え方を提案する。また、その具体的な 応用例として多肢選択項目の分析やデータの再コード化等の例を示す。 キーワード: PROCTRANSPOSE、多肢選択項目の分析、データの再コード化 1 . はじめに PROC T孔生NSPOSEは PROC SORT等と同じユーティリティ・ソフト的なプロシジャで、あるが、一 般のユーザーには後者ほど頻回には使われていないようである。実は、筆者も数年前までは同様の 状態で、あったc しかし、最近使い込むにしたがって、これは PROCSORTと並ぶ重要なフ ロシジャで、 O あると考えるようになった C これまで、一般のユーザーにとって使いにくかった大きな理由として、マニュアルにおける説明が考 えられる。例えば、 S ASヘルプρには iTRANSPOSE プロシジャは, SAS データセットを読み込ん で,変数(行)とオブ戸ザベーション(列)を入れ替え,出力デ、ータセットに書き出します」と説明されて RANSPOSEとしづ名前の由来と考えられる行列の転置に基づいた説明である。し いる。これは、 T かし、一般のユーザーが行っている解析の実際では、変数とオブ、ザベーションを一度に入れ替えて しまう必要性が生じることは、ごく希である。その為に、このようなプロシジャを使う必要はないであろ うと考えがちである。 後ほど説明するように、この説明で、はこのプロ、ン、ジャの持つ重要な特徴を直ちに理解することが 出来ない。そのために活用されない状態が続いているものと考えられる。そこで、本論文では、このプ qd qd ηd

331.

ロシジャの利点を引き出すための理解の仕方をまず提案し、次いで具体的な応用方法を例をあげ て説明する。 2 .基本的な考え方 ここで提案する視点は、 r PROC TRANSPOSEは、(内容的に関連のある)複数の(横方向に並 んだ)変数を、オプザベーション(縦)方向に並べ替えて、複数の変数の内容を一つの変数にまとめ るプロシジャである」と理解する考え方である c この考え方はこのプロシジャが本来持つ機能のごく一 部しか説明したことにならないが、このように考えると応用が非常に楽になる。本論文では総てこの 考え方に基づいた説明を行うため、フ。ロシジャの処理が常にオフ守ザベーション単位で行われるよう にフ。ロシジャを使用する。従って、この論文では常に BYステートメントを用いた使い方になる。 以上の説明は、使用経験のないユーザーには理解しがたし立思われるので、詳しい説明に進む 前にまず、このプロシジャの基本構文について必要最小限の説明をする乙詳細な解説はマニュアル 等を参照していただきたい乙以下は Windows版 SAS(R6.12)のヘルフ。からの抜粋で、ある C 表1 .PROC TRANSPOSEの基本構文 PROCTRANSPOSEDATA=SAS‑data‑set PREFIX=name OUT=SAS‑data‑set LABEL=name LET; NAME=name VARvariable‑list; 工Dvariable; IDLABELvariable; COPYvariable‑list; BYvariable‑list; この構文の中で、もっとも重要なポイントになるのが、 VARステートメントと BYステートメントの使い 方である。なお以下の記述ではオフ。ション、ステートメントなどの SAS キーワードは原則として大文 字で記す z 特に、記述の内容からステートメントであることが明らかな場合はステートメントの記載は 省略する。また、変数名は原則として小文字で、記す。 VARには処理の対象となる変数(群)を指定する。 BYを指定すると、 BY変数が同じ値を持つ 番号といった変数を割り当てることに なるが、これらの変数が対象のデータ 国亡臣蓮田 セットの中にない場合には、 DATA ステップ。で、 caseno̲ ̲n̲;といった代 図1 .基本的な処理の流れ 国 EE に指定した変数を縦に並べることと同 じになる。 BY にはケース番号、 ID 司 ことになる。これは実質的には、 VAR 同樹園︹圃幽同一岡幽園局随園 BY 変数として指定してやると、オブ ザ、べーション単位で、転置が行われる 田⁝出国凶回国凶回記凶回 ョンに固有の値を持つキ一変数を 川盟国耳目田 が行われる。そこで、各オブザベーシ 町田回回囚回 オブザベーション単位に転置の処理 歯 バ斗 ο η ο η

332.

て内︒そオ︑ 心のめばの吟 ↓数立れて︒閉 山/変凡いべ泊司 でる出てす Ih cれのポ u 数な E UI 変保相自外 町対数指内村壮 b団変が一現制 一 か JJ は ル デ 出 た 点式でべ新しの 銀出川初ム惚哩 J 指一劉川鴇山川 おいれ︺ A ︑t ヵ↓ hJ 今一ア山中断︑ チ る vc 存促ラ九 ある呆るやま がヘ八あ Jj す 3 J 時的収日れ一一一⁝開問 一園口盟国民国一嵐 山盟国間 山田盟理富 山田 Z 回 目 囚 戸 一 一 ‑ く kdM 数 ‑/b d 内 ゆ ヴ h 一一時日晴 山U 柏打俳加持口性初村崎一胞のは市撒一一﹂粉時閣附 古川一ド附蜘ぬ初期投句蜘坊市慨歎蜘制批蜘吋恥町 H H囲 子一コ毎目名の F NJ札範タ多主主得構注指まにじ一ボを 川山ン数数 知山畑白抜ぽ功社内ト制同口数駄附加味比閣は川︑ずれ V 返図 M 変れ一す元なれの新場そ比法はる変そ 示 図2 .BYに複数の変数を指定した場合 J ぬ基山山伍凱則一刻敵片野外山間い 慨 Y川コ個そ乱体 め 弘 崎 町 変 ︐ d一 リ ハ 処 町 必 セ 日 門 番 す の B れ 凡 M 3 3 具 ? 尚 動 州 代 ︑ i一 ︑ バ 仰 の す サ h m 加 Y Z仙 そ ん り 矧 す 引 札 い要変 R ヨカてこ向移デタ数槌仰すムタこ現まと H 旧一変 )C 要る一日岨一一日 行必 YT シ容べ村方 をく B を一プ内︑ザこ数ツ︒デ Y 可のをすデ定︑万つ 2 入お容オのブ変セい新 B 数文意定新指値す表 ベルとして自動的に使用されるとし、うことも、操作を簡単にしている理由の一つである。 届 目 置 田口 二主霊園 表2 .PROC TRANSPOSE 活用のポイント ①対象のデータセットには必ず各オブザベーションに固有の値を持つ変数(例.症例番号) ②実際に使用する BYステートメントには、 キ一変数"だけではなく、 キ一変数"に付随し を作っておき、その変数を キ一変数"として BYステートメントで指定する。 て移動させたい変数も指定するヨ ③ VARには横(変数)方向から縦(オブザベーション)方向に並べ替える変数を指定する。 ④結果として元のデータセットの変数名やラベルも分析の対象とすることが出来る。 3 .オプション等の指定方法 実は PROC T孔生NSPOSEは縦方向に並べた変数を再び元の横方向に並べ変えることにも使用 できる。 VARに対する指定が異なるのみで、ほとんど同じフzロク守ラムで、非常に簡単に行うことがで、き る。これは、本質的には横を縦にすることと縦を横にすることは同じ操作であるとし、うことによる。それ NAMEニや LABBEL=により変更しない限り、これらの変数の内容が新しいデータセットの名前やラ a b e lとしづ名前の変数があると、 に加えて、このフcロシジャのデフォールトの機能として name、 l Fhd 司u qd

333.

特にオフつションを指定 Transpose の使用方法:標準値柿 [TRANSPOSE前のデータ] 神 OBS CASENO AGE SBP 36 40 55 44 38 32 6 1 58 48 43 39 50 49 120 1 3 5 1 4 6 1 6 0 1 3 2 1 1 0 1 5 4 134 1 2 8 1 2 2 1 4 0 1 1 6 1 3 0 I T E M 1 I T E M 2 しなくても、実際には十 I T E M 3 I T E M 4 I T E M 5 分使いこなすことができ るが、オフ。ションの使い 2 3 4 5 6 2 3 4 5 6 7 7 8 9 10 1 1 1 2 1 3 8 9 1 0 1 1 1 2 1 3 方を知っているとさらに 活用方法が広がる。しか し、このプロシジャには 似たような説明がなされ ているステートメントやオ プションがあり、マニュア ルをたた、読んだだけで、は その役割の違いがわかり proc sort data二 w l ; by caseno age s b p ;r u n ; l outニt l ; by caseno age s b p ; proc transpose data二 w var iteml‑item5; r u n ; で T R A N S P O S E すると... にくい。例えば、 ID と PREFIX=はし、ずれも転 置後の変数名を指定す るのに用いられるが、な ぜ二通りの指定の仕方 があるのだろうか。これは 神 OBS 2 3 4 5 6 7 日 9 1 0 1 1 1 2 1 3 1 4 15 1 6 1 7 Transpose の使用方法:標準値柿 [TR州 SPOSE後のデータ] 表 3の様に理解すると分 CASENO AGE SBP NAME LABEL 2 2 2 2 2 3 3 3 3 3 4 4 36 36 36 36 36 40 40 40 40 40 55 55 55 55 55 44 44 120 120 120 120 120 135 135 135 135 135 1 4 6 1 4 6 1 4 6 1 4 6 1 4 6 1 6 0 160 I T E M 1 I T E M 2 I T E M 3 4 I T EM I T E M 5 I T E M 1 I T E M 2 I T E M 3 4 I T EM I T E M 5 I T E M 1 I T E M 2 I T E M 3 4 I T EM I T E M 5 I T E M 1 I T E M 2 項目 1のラベル 項目 2のラベル 項目 3のラベル 項目 4のラベル 項目 5のラベル 項目 1のラベル 項目 2のラベル 項目 3のラベル 項目 4のラベル 項目 5のラベル 項目 1のラベル 項目 2のラベル 項目 3のラベル 項目 4のラベル 項目 5のラベル 項目 1のラベル 項目 2のラベル ∞L1 かり易い。 表 3のように複数の変 数を横から縦に並べる目 的で用いる時には、 PREFIX=. NAME= LABEL= 等 で PROC TRANSPOSE に 直 接 オ フoションを指定する。一 方、ある一つの変数の内 容を複数の変数に戻 す、即ち、縦から横に並 べ変える場合には、 ID や IDLABELを使用する 図3 .PROC TRANSPOSE活用の具体例 と考えると分かり易い。こ の二つのステートメントを 使用しないのであれば、予め name , l a b e l といった変数を作っておき、そこに変数名と変数ラベ ルの内容を保存しておく必要がある。 4 .活用の実際 4 . 1 多肢選択項目の分析の場合 b ハ qu ο η

334.

表3 .ステートメント及びオプションの使い分け 文・オフション 指定したときの機能 標準値 VAR変数の転置後変数名の接頭辞 c o l l ( ‑ coln) 転置前の変数名を保存する変数名 name 転置前のラベルを保存する変数名 l a b e l 横から縦にする場合 P旺 F I X = NAME= LABEL= 縦から横にする場合 I D VAR変数の転置後の変数名を持つ変数 IDLABEL I Dで、指定した新変数に与えるラベル name があれば使用 l a b e l があれば使用 筆者が最も有効と考えている活用方法である。多肢選択 (multiple choice)式の質問項目をデー タ化する場合には、いくつかの方法が考えられる O 最も単純でデータのロスが少ないやり方は、各選 択肢毎に変数を作り、ある選択肢が選択されている場合には対応する変数の内容を 1とし、選択さ れていない場合には 0または欠損値のままとするとしづやり方である。この場合はデータの損失はな いものの、選択肢の数が多いときには対応する変数の数もそれに比例して増加するとしづ問題が残 る。ここではこの型のやり方を仮にタイプ 1の多肢選択と表現しておく。 一方、最高幾つまで、選択するかを回答者に指示するか、事前に予想しておいて、その選択数分 の変数を用意してデータ化するとし、うやり方もあるこの場合は、各変数に選択肢の番号や具体的 な内容等をデータとして入力することになる。この方法では効率的にデータ化できるが、指定または 予測以上に多くの項目を選択した回答者がいた場合には、データの欠落が起こる。この型のやり方 をタイプ2の多肢選択とここでは表現しておく。 いずれの場合も、各選択肢の頻度は SASの PROCFREQで分析することになる。タイプ 1 の場合 は対象変数を個別に集計するだけでよいが、タイプ2の場合はやや複雑になる。タイプ2の分析を 行うには DATAステッフ で、新変数を作り、全対象変数に特定の項目が含まれているか否かチェック O した結果を新変数に格納し、それを集計する必要があるごいずれのタイプにしても、実際には 1連の 関連した選択肢であるにも関わらず、分析結果はバラバラに表示されることになる。ところが PROC TRANSPOSEを用いると、こ の問題を非常にスマートに 解決することができるつ 神多肢選択問題の例 1 :項目毎に変数を作った場合判 [TRANSPOSE後のデータの集計] 前の変数名 タイプ 1の場合は 2 . に記 した方法で、各選択肢に対 応する変数全部を横から縦 に並び替え、 c o l l にその内 容を保存する。すると同時に name や l a b e l (変数ラベ ルがある場合)が新データセ NAME Frequency P e r c e n t I T E M 1 I T E M 2 I T E M 3 I T E M 4 I T E M 5 5 6 7 4 3 20.0 24.0 28.0 1 6 . 0 1 2 . 0 CumuI a ti v e C u 叩 l a t iv e Frequency Percent 5 1 1 1 8 2 2 2 5 20.0 4 4 .0 7 2 .0 8 8 . 0 0 1 . ∞ ットに作成されるむここで WHEREなどを用いて coll 図4 . 多肢選択項目の分析結果の例(対象データ l ま図 3) ηd ヴ ‑ nJ

335.

が 1で あるオブザベーションのみを抽出し、 nameまたは l a b e lを PROC FREQの TABLESに指 定して集計すると、求める各選択肢の頻度が一覧表で得られる。但し、 l a b e lを使用する場合に は、変数毎に固有の異なった内容を変数ラベルに与えておく必要がある また、このときラベルの先 O 頭に分析者が好む順のアルファベットや数字を付加しておくと、出力が非常に分かり易くなる。具体 例を図 4に示す。 タイプ2の場合も分析は本質的にはタイプ 1 と変わらない。但し、最終集計の場合に c o l l の内容 を対象とする点が異なるっさらに注意しておくべき点として、欠損値の取り扱いがある。 c o l l の欠損 値は本来の意味での欠損ではないため、 WHEREなどを用いて欠損値を集計から除いておいた方 が出力が見やすくなり、後で、誤った解釈を行うおそれが少なくなる。 以上は基本的な度数集計に関する応用であるが、 PROC TRANSPOSEの有用性はこれのみに 止まらない。 BY変数にキ一変数以外の変数を指定してフつロシ、ジャを用いると、これらの変数との関 係を一度に分析することができる。例えば、各選択肢毎に別の変数の平均を求めようとする場合、平 均算出用の変数を BY 変数に追加する。その│ 上で、タイプ 1であれば CLASS に nameを指 定し、 VARに求める変 林多肢選択問題の例:他の分析変数を同時に使用する場合紳 [TRANS問 SE後のデータの分析] NAME N Obs Variabl e N Mean Std Dev Minimum Maximum 一一一一一一一一一一一一一一一一 1 T E M 1 5 AGE SBP 5 5 43.40 132.8 5.899 17.75 36.00 116.0 5 0 .00 160.0 1 TEM2 6 AGE SBP 6 6 40.67 129.5 4.274 7.688 36.00 120.0 4 8 .00 140.0 1 T EM3 7 AGE SBP 7 7 45.14 127.4 7.734 12.74 3 2 .00 110.0 5 5 .00 146.0 1 TEM 4 4 AGE SBP 4 4 49.50 140.5 10.25 13.60 3 9 .00 122.0 61 .00 154.0 場合に比較すると、この 1 TEM5 3 AGE SBP 3 3 54.00 136.7 4.583 8.327 49.00 130.0 5 8 .00 146.0 方法では非常に分かり 一一一一一一一一一一一一一一一ー一一 数 を 指 定 し て PROC MEANSを用いれば、│ 簡単に平均が求められ るこしカ喝、どの選択肢 の平均か一目瞭然であ る 。 従来の分析の仕方 で個別に平均を求める 易い結果を得ることが 出来る c その様子を図 5 図5 .多肢選択項目と他の変数を同時に分析した例 に示すc 4 . 2 関連変数の度数分布の一覧表示 タイプ 1または2の場合の分析方法は、実は多肢選択項目の分析だけではなく、普通の変数の分 析にも応用することが出来る。例えばアンケートなどで、関連する複数の質問項目について度数分 布を検討する場合、普通に PROC FREQを用いたのでは個々の変数の結果は別々に表示される。 出力をコンパクトにして、関連する変数を一つの表で、出力したいと考える場合がある。この場合、 PROC TABULATEを用いる方法も考えられるが、その指定の仕方はこのフ。ロシジャに独特で、熟練 が必要であり、また、欠損値がある場合には注意して指定する必要がある。 これに対して、 PROC TRANSPOSEを用いると簡単に一覧表示させることが出来る。この場合の フ。ロシジャを用いる手順は、基本的には前述と同様である。そして PROC FREQの TABLESの指 定において name (または l a b e l) と co l1のクロス集計を行う。これ以外に特別なことをすることな ‑ 3 3 8

336.

く、一覧表示の出力を得ることが出来る。因みに、 name が表側に来るようにして、オフ。ションとして PROCFREQに FORMCHAR , l C2 , 7 ) = 'ーを、 T ABLESに nopercentnocolを指定すると非常に見や すい表を得ることが出来る。この分析方法をマクロにした場合の一例を次に示す D もmacroana( data=,id=caseno,var=, ユ istニname,opt=); procsortdata=&data; by&id; run; /安ソー卜されていれば不用*/ proctransposedata=&dataout=txname=vnameユ abel=vlabeユ ;by&id; var&var; run; procfreqdata=txformchar(1, 2, 7 ), ニ ‑一'; tabユesv&list*coll/nopercentnocol &Opt; run; %mendana; このマクロ使用時には data=にデータセット名を、 id=には各オフずザベーションに固有な値を持 つキ一変数を指定する o var=に処理対象の変数リストを、 list=には出力時に変数名を使用する ときには nameを、変数ラベノレを使用するときには labelを指定する。また、 opt=missingとす ると欠損値を含めて一覧表にするれ 4 . 3 数量化 1類 ・ 2類におけるサンプルスコアの計算 林の数量化 1類 ・ 2類の結果により得られたカテゴリーウェイトを用いて新たなサンフ。/レについてサ RANSPOSEを用いることができる c その場合の手順は ンフ。ルスコアを計算する場合にも、 PROC T 次のようにするご ①カテゴリーウェイトが保存されているデータセットについて、以後の計算が簡単になるように、 対象変数の名前をその内容として持つ変数の名を nameとし、各変数のカテゴリー値を保持し o l lとしておく。ウェイトの含まれる変数名は任意の変数名(ここでは仮に ている変数の名前を c wtとする)でよい。そして B Y name̲c o l l ; によりソートしておく。 ②スコアを求めるデータセットの力テゴ、 1 )一計算の対象となる変数をこれまで 述べてきた要領で、 TRANSPOSEする。すると、 name̲{こ変数名が、 c o l lに各変数の実際のカテゴリ一値が保存さ れる。そこで、転置後のチータセットについても B Y̲name c o l l ; によりソートしておく。 ③②で、作成されたデ一タセツトに対して①で のM ERGEを行う弘。ここで、ウエイトの変数 C w t ο )が追加される。 多対 1 されたデータセットを再びキ一変数(及び必要に応じて name̲を追加)でソートし、そ ④ MERGE 変数に指定する。 V A R Iこはウェイト変数 Cwt)を指定して再度 TRANSPOSEする。この れらを BY 結果、元の計算対象の変数の内容がカテゴリーウェイトの値に置き換わったデータセットが作 成される。 ⑤④で、作成されたデータセットの中の対象変数の和を計算すれば、求めようとしているサンプ ルスコアが算出される。 文章で説明すると大変な操作のように思えるが、やってみるとそれほど大変な作業で、はない。少 なくとも全てのフ。ロセスを DATAステップ。で、行う場合に比べれば、 PROCTRANSPOSEを使用する 円ud q u q u

337.

とプログラムの手聞が大いに省ける仁 4.4 分類の再コード化 4 .3に類似した方法により、閉じ分類基準によりコード化された一連の変数について、その内容 を新たな分類基準でコードイヒし直す場合にも PROC TRANSPOSEを応用することが出来る。その 概略を以下に説明する。 o l 1に、新分類基準を任意の変数(仮に n e w d x )に保存した、再コード化対応表 ①旧分類基準を c o l 1によりソートしておく。 からなるデータセットを作成し、 c す ②再コード化の対象とするデータセットの中の対象変数をこれまでと同じ要領でTRANSPOSE a m e ̲ (こ変数名が、 c o l 1に現在の分類(=旧分類基準)が保存される。転置後のデ る。すると、 n o l 1でソートしておく。 ータセットも c の BY c o l 1 ; による MERGEを行う。す ③②のデータセットに対して、①のデータセットを多対 1 e w d xが追加される。 ると、 n ④ MERGE後のデータセットをキ一変数で、再ソート後、 V A R fこn e w d xを指定して TRANSPOSE す れば、対象変数が新分類基準で、再コードイヒされた内容に置き換わったデータセットが作成され る 。 この方法のメリットは、①再コード、化対応表作成の手間以外は分類の複雑さに処理が影響を受け ないこと、②対象変数が増加しても手間は変わらないこと、③フ。ログ、ラムと再コード、化の内容が独立 しているため再コードイヒの具体的なプロセスをフ。ログ、ラムする場合のうっかりミスを防止し易いこと、 などである。 5 .おわりに 紙数の関係から限られた応用方法しか示すことが出来なかったが、一度 PROCTRANSPOSEの 使い方に慣れてくると、様々な場面で応用できることに気づくはずである。その基本的な考え方は、 同じ種類の内容からなる複数の変数を一つの変数にまとめると共に、変換後に新たなデータとして 得られた(旧)変数名やラベルを処理対象とすることにある。本論文で説明したこのような考え方に 基づいて、このプロシジャの活用に挑戦してみていただきたい。これまで、ならば複雑な DATAステッ 丸生N SPOSEを用いると簡単に片付くとし、うような新しい発見をす フ。で、行っていた処理が、 PROC T るはずである。また、ユーザー独自の新たな応用方法が見つかるかもしれない。 ※本論文の要旨の一部は大学ユーザーグ、ループ第 2回九州地区分科会において発表した。 参考文献 ・B a s eSASソフトウェアプロシジャガイド. V e r s i o n6 ,F i r s tE d i t i o n . SAS出版局, 1 9 9 3 . ‑340

338.

日本 SASユーザー会 (SUGI‑J) 1年生の目で見直す SASシステム SASシステムのプログラミングは難しい? 山橋愛子 有限会社電助システムズ L e t ' sr e c o n s i d e rt h eSASsystemi nt h eb e g i n n e r ' se y e s I si td i f f i c u l tf o rab e g i n n e rt ow r i t ep r o g r a m sf o rt h eSASsystemワー A i k oYamahashi DENSUKESYSTEMSC o ., L td . 要旨 初めて SASシステムに触れる人たちへの教育の経験をもとに、今回は、 SASシステム 1年生がプログラミングを習得するうえでつまずき易いと思われる点について報告し、 SAS システムでのプログラミングの習得などについて考察する。 キーワード: プログラミング,初心者,教育 1 . はじめに 掲題の iSASシステムのフ。ログラミングは難しい?J の答えは、一般的には iNoJでしょう c でも、本当に単純にそうなのでしょうかc SASシステムのプログラミングとしづと、馴染みの深い DATA ステップ、 PROCステップ。が 頭に浮かびますが、その他にも、全く毛色の異なるところでは SAS/AFソフトウェアや SAS/FSPソフトウェアで、使用されるスクリーンコントロール言語もあります。また、 Base SASソフトウェアの範曙であるマクロ言語、 SQLプロシジャでサポートされている SQL ( S u t r u c t u r e d QueryL a n g u a g e :構造化照会言語)なども、ごくごく普通の SASシステムのプ ログラミンクやというよりは多少特殊なところに位置するかなと思われます。でも、まず最初、 SASシステム 1年生が習うのは、やはり基本のDATA ステッフ。と PROCステップで、しよう。 ‑ 3 4 1

339.

この文中で何の断りもなく iSASシステムのプログラミング」というときは、初心者レベルの DATA ステップ。および、PROC ステップ。のプログ?ラミングを指しているものと考えてくださいと さて、私たちはこれまで、数年に渡っていろいろな人たちに SASシステムの初期教育を フ。ロシジャ、 FREQフ。ロ、ンジャ、 TABULATEプ 行ってきました。初期教育では、 iPRINT ロシジャを使って基本的なレポートが作れるようになる Jのを目標としていますが、そのため には、 DATA ステップで、簡単なデータ加工がで、きることーデータ加工のフ。ログ、ラミングPがで、 きることーが必要ですので、ごく初歩的かっ簡単なフログラミング?をマスターしてもらってきま した内 教育の対象者は、主には製薬会社の臨床開発部門や市販後調査部門に所属する 20代の 人たちで、したが、いずれも iSASシステムに触れるのは初めて」としウ人ばかりでした。でも、 その中には、たとえば BASIC や COBOL等の SASシステム以外のフ。ログラミング言語で プ ログ?ラミングをしたことのある人もいれば、コンピュータ自体触るのが初めてで、ディレクトリや ファイル等の概念から教えなければならないという人もいました。このように、ひとくちに iSASシステム 1年生」と言っても、背景はさまざまです。ここでは焦点を絞るために、皆一様 に少なくともキーボードが打ててデ、イレクトリやファイルのことは知っており、プログラミングを 始められるスタートラインには立っているとしウ前提で、その後のお話をしたいと思います。 ところで、もうすで、に SASシステムで、のプログ、ラミング戸に精通しておられ、特に何も悩んだり ステップ。を書いていらっしゃる方、初めて SASシステムのフ。ログyラ せずにすらすらと DATA ムを見たときのことを覚えていらっしゃるで、しようか。私の場合プログラミングは SASシステ ムが初めてで、最初はそれこそ「こう書けばこうなる」式で、特に何も悩まずにプログラムを 作っていました c その頃は単純に、初心者の私で、も使えるのだ、から SASシステムのフ。ログyラ ミングは易しいと思っていました。ところがその後、スクリーンコントローノレ言語や SASシステ ステッフ。の特殊性に気が付いたの ム以外の言語で、のフ。ログ、ラミング、を知って初めて DATA です。そうし、えば、初期教育をした人の中で、 SASシステムのフ。ログラミンク。は分かり難し、とい う感想、を漏らしたのは、プログラミングが初めてとしづ人ではなく、むしろ他の言語で既に一 人前のフ。ログPラマーとして仕事をこなしているような人でした c そこで、最初の質問に戻ります。 本当に SASシステムのフ。ログ、ラミングは易しいのでしょうか、それとも難しいのでしょうかむ 本文では、これまでに接してきた「初心者のつまずき」の例を挙げ、 SASシステム 1 年生に 戻って新しい目で、見ながら掲題の質問について考えていきたいと思し、ます。 nL 4q qu

340.

2 .初期教育の概要 さあ、これから SASシステムのプログラミングのお勉強を始めます。まず、パーソナルコン ヒ。ュータの前に座って頂きます。一昔前まで、は PC版 SAS、ンステムを使っていましたが、今 はWindows 版 SASシステムを使ってフ。ロク、、ラミングの教育をしています cSASのアイコンを ダブルクリックして SASシステムを起動して下さい。これが SASデ、イスフ。レイマネージャで、 す... と 、 SASシステムの基本的な操作方法や名称などを説明した後、本題のフ。ロク、、ラミン グに入ります。 ところで、 11.はじめに」で、「フ。ログ ラミング、を始められるスタートラインには立っている Jの P を前提としましたが、その前後の微妙なあたりにも「つまずき jがあったりします。つまり、 Windows版 SAS、ンステムになってからは、例えばメインフレームでの仕事以降ブランクが あった人やコンピュータに触るのが初めてとしヴ人など、 Windowsの仕様 l こ慣れていない 人にとっては、まずこの入り口の IWindows仕 様 jが第一の関門になるようです。どこをどう こ覚えなくてはいけないことが山のように 触っていいものやら、フ。ログPラミング1こ行き着くまで、 i あるんですね、とため息まじりに感想、を漏らした人もいます。でも、そのほとんどは、周りにた くさん用意されている「知っていると便利なツーノレ jの操作がよくわからないとし、うもので、確 かに知っていればフ。ログ、ラムを書くうえで、も何かと役には立つけれど、全部知っていなけれ ば SASシステムが使えないとし、うものではないし、使っているうちに自然と覚えるから心配し なくていい、まず最初は書いたフ。ログ ラムの「新規保存 jと既存のフ。ログ、ラムの「オープン J、 そしてプログラムの「実行 jくちいが分かればよしとして進みますこそうし、ったことで、悩んで、時 間をとられるより、自分でプログラムを書いて実行して知りたい結果を得られるとしづ実感を 少しでも早く手にしてもらいたし、からです。 教育はほぼマンツーマン、多くても一度に 3~4 人程度で、各人の理解度をみながらそれ ぞれのベースに応じて進行していきますコ短期間にあまりにも多くのことを詰め込んでも、結 局は 1 f 可をやったのかよくわからなしリとし、うことになってしまい、自分でプログラムが書けるよ うにはなりません。特にプログラミング自体が初めてとしづ人には拒絶反応を起こされてしま し、かねませんこまた、理解の度合しも人によってさまさやまなので、平均的なところで統一して 進めてしまってはあまりよい効果は得られないと思いますっ 教材にも気を使います。架空の人たちの氏名、年齢、住所といった、誰にでもわかる一般 的なデータを予め用意して使うこともありますが、教育の対象者が製薬会社の臨床開発部 門や市販後調査部門の人の場合には、 CRF( C a s eR e p o r t Form:症例報告書)のデータを 343‑

341.

想定して、実務上よく求められる情報を手に入れる方法を各人が身につけられるように、そ の目的にあった SASデータセットとサンフ,0;レフ。ログラム、練習問題、回答例を用意します。 条件が許せばより実践的にとし、うことで本物のデータを使うこともありますが、通常は、 lつの CRFが lつのオブ、ザベーションに対応するようにして変数の数も 1 0程度に絞った SASデー タセットを使っています。ご参考までに教材の例を一部示します(図 1 )。 ここで、 CRF とは何かを少し簡単にお話しますと、例えばある薬剤を患者さんに使って もらったときにどうし、ったことが起きるかを知るために、その治験において調査する項目が予 め決められているのですが、それらの項目について治験の担当のお医者さんに書き込んで、 C a s eR e p o r tF o r m :症例報告書)です。 l つの CRF には l 人の患者さん もらう書式が CRF( について、例えば、患者さんの年齢や性別、薬剤を使ってもらった量や期間、効果を知る目 安となる値(降圧剤なら血圧など)の経時的な変動、何か有害な反応があったかどうか等々 の情報が書かれます。 実務上よく求められる情報としては、簡単な例では、「症例(治験に参加した患者さん)は 全 部 で 何 人 ?JI そのうち有害反応があった症例は?JI 男性は何人で女性は何人?JI 何 歳代の人が多かった?JI 薬剤が効いた人は何%だ、った?J ...など。初歩ですとこんなとこ ろでしょうか。こうし、った知りたし、情報が SAS システムで、プログ、ラムを書くことによってリストや 表の形で素早く入手できる、しカもそれぐらいのものならプログラミングはそんなに複雑怪奇 なものではないー ISAS って使えるじゃなし、か!J そう思ってもらえることが私たちの初期 教育の第一歩です。 3 4 4一

342.
[beta]
JJAS 品 川 診 絹
d

気

】

,

音ヨ膏
;:,,';To!I,.. :'I.'
己 1":
ゆ.);〆
J 〆~ 7:
1
1
.
T
o
Q
鐸
'
"
ヲ
.
.
.
.
;
守F

ぅ1
.ユ
.
, t'1)r:J,.1‑
I
I
‑
=
‑,.t','割 引 り 〆 向 夕 刊 昨 b ー グ 州 唱
"t'l:' tt r.r ユ九 Fιn.e ~"ι

,
t
'
:
;
.
.
,

,",--,!:.~,-::<s.)CJ. (~ロ~骨.~_ '
l
'
I
.
.
.
.
A
h
.

1
) ぉ
〆・〆,,/パー昭"'ル令ム Fい

"
'
.
.
'
ι
f
rな・ !I‑I

‑
(.ttSAS ,f:'-,..,.".!り

ι ,..司・~~Jf~宅,.(!;,,~~,.'" T

r
s
.
.
.
s

帽

θ
.

h ふてつ "'''.l:且 f晶一 '-""~'_~"I 年I:'.tfJ ユ I-~"'''I!.''' 多 7 ", 711~1l ι
.
'
J
oJ
砂.
/
.
5
.
.
l
.
"斗'
'
'
'
'
'
.
1
.ι
1
.
'
,,<
;
也ノ'"‑
‑
:
,
,
‑ f"〆 vr, 多,~!.~. "
川

juJWLW wmm

え ~-'CI ~.l.I'~ 叫'"冒向A 内 U 九 P 付開札骨川山

内川町伊

占,,'_'ω九占,~にιy ヲ {.'I)σ

・
州
︑ v

,
ト
そ
守
?
の
..
.
吟 ,ハ、 ,_バA"_,〆冷"~_'I1..t,...::r:'-~"" ‑
, I-::J e~'.浬a ι
'
.
'
,
乍
'
̲ "
fKρ
の叫叩<
ν
.
叫
.
ι
山
.叫 叫
J
ι
J
乞r玄ば r
.
.
.
.
"
" !I~n"刊,副(;;'::1べtμ近1"'7'グν均.. ...~智F九淀 eιa 九"の?よi!'~玄t rJ",.

バ

S A Sシステム入門

H4

倒的

軍基康被験データ処理のための

持 ;0.1め ~Jl IC 正白 .1.(,.1.二
,

.
.
.
.
M
f

w

、 yグ

石

ηe
可宰て句会必 ョι.
,~'...-'f4'. fH寺町住司F円台めにZちに'‑l!

ー 固 な ' " 。 で " 町 、 久 れ る た め 旬 )1‑,
,
‑
,
.

電防;守[
1
主l
i
lS

J
ラ
ム「多

p

契

f
字

=
臼
.
.
.
山

-"~'"‘'噌tJ" ・<I";"~.., ~..,.,...‘

̲
:
7
:
.
J
劫
ぷ
'
;
f
‑で 己 点 呼 い れ 場 勺 鳥 山 《
w

[
S
8
m
pI
e
0
1
̲S8S] 年齢合致。 bs 選 択 リ ス ト 表 示 proc prlnt 判 咋 材 判 中 伸 同 中 同 判 中 本

功斗ヰ

本

本
本

「年齢30歳以下の男性の採用症例」を選び、
CaseID、イニシャル、年齢、性男 I
L 採否を表示する。

本

*

*

本

木

本宇和わ桝*+*l目--一I*lー ιι 判ヨドドド岡本同 e~~占~十十._._,_._.0<,体同中陣仲桝判神;

data set01;
set S3S.sasedul;

1
*dataステップ開始行:作業用データセット [set01]作成本/
1
*使用する既存データセットの指定本/

i
f ageく=30 国 l
ds
8
;
:
=
1 and sa工hュデ l
';

/本条件に合うオブザベーションの選択 *
1

白血;

ド
ノ procステップ:データ内容の表示 *
1

proc prェ
nt data=set01;
var caseid inエ 札 a1 age s
e
:
.
: saihi;

/ォ表示する変数の指定本/

r
n
n
;

(
図1
) 初期教育の教材の一例

一3
45

343.

3 .初心者のつまずき事例集 ケース 1 :SAS日付がどうもよくわからない 他言語のフ。ログラミンク、を経験している人で、もフ。ログラミング自体が初めてとしづ人でも、ど ちらにも共通してまず難解なのは何といっても ISAS日付」ではないでしょうかc さすがに ISASJと付くだけあって他にはあまり見られない概念のようです。 SASシステムではデータ のタイプはいたってシンプルで、文字と数値の 2種類しかありません。 ここで少し話が横道にそれてしまいますが、データタイプについてもちょっと触れておきた いと思います。 SASシステムのシンプルさに比べると、例えば Oracleのデータタイプ。には、 文字データとして CHAR(s)、VARCHAR2(s)、LONG、数値データとして NUMBER(p, s )、 九久W (s)、LONGRAW、さらに日付データ DATEがあります本 1)。また、 C言語で扱えるデータ タイプとしづのを挙げてみると、数値だけでも、小数部をもたない整数型の s h o r t、i n t、l o n g、 それらの符号なし型の unsigneds h o r t、u n s i g n e di n t、u n s i g n e dl o n g、小数点付きの数を表現 する実数型の日 o a t、d o u b l e、l o n gd o u b l巴とこれだけの種類があり、フ。ロク、、ラムで、変数を使おう というときには最初にその変数がどのタイプかを宣言しておかなければなりません *2)。プロ グラミンク、、が初めてとしづ人だと、もうこの段階で恐れをなしてしまうカもしれません。そうし、っ た人にとっては、この点だけでも SASシステムはとてもありがたし、ものなのです。 さて、 C言語でのプログラミング経験者Nさんは、 SAS日付というタイプの日付データがあ るのだ、と思ってしまい、最初の頃、 SAS日付の取り扱いがどうも苦手のようでした。 PRINT プロシジャなどで日付の入っている変数の値を出力してみるとただの整数。日付ではない。 どうして...? SAS日付は数値データであり、フォーマットをかけない状態、ではただの「整 0 数」にしか見えないので、それが日付を表しているだなんでわかりません。 SAS日付は、「日 付データを扱うための特別な数値」で 11960年 1月 1日から指定の日付までの経過日数」 として表されたもので、、読み取ったり表示したりするにはそれぞ、れ適切なインフォーマットや フォーマットを使う必要があります州。「その説明は分かったけど、で、も何で、 SASってそんな わかりにくし、ことをわざわざするのだろう ?Jと思ってか、ついつい不満そうな顔をする人もい ます c でも、この SAS日付のお蔭で、巷では今その対応に追われて大変な 2000年問題も ほとんどたいていの場合には無関係で、いられることなどを説明して、 YYMMDD8.のフォーマ ットの説明などをしつつ「生年月日から今日現在の年齢を計算して、その結果を OUTPUT ウインドウに出力する」といったフ。ログラムの演習を繰り返すうちに、だんだんと SAS日付が 理解されていくようです。 ‑ 3 4 6一

344.

ケース 2 n=n+1 ; ? フ。ログラミングが初めての人には「えっ ?Jと思われてしまうものです。 S君は提示されたサ <Jの間違いではなし、かと質問 ンフ。/レプロクマラムの中にこの記述を見つけて、この「ニ Jは 1 してきましたc この記述はかなり違和感があったようで、す c 日常的には、等号(=)は右辺と左 辺が「等ししリことを意味するものです。でも、この例のように 1= Jには右辺を左辺に「代入 J するとしづ意味もあります。 a=1 ;とあれば、 l aは 1に等ししリとし、う意味ではなく l aに 1を代 入する」意味です。 1= Jにはこれら 2つの使い方があるということは、プログラミングに慣れて しまうと当たり前になってしまいますが、初心者の方には忘れずに説明しておくべきだと思い ました。 ケース 3 つい忘れてしまうセミコロン(; ) 誰もがよくやる初歩的ミスですコ日本語の読点(ご)や英語のピリオド(.)と同じで、 SASシ ステムのフoログラム 1文の終わりには必ず付ける決まりになっていて、付け忘れるとエラーに なる、と説明していますコでも、慣れるまでは(あるいは慣れてからも)、フ。ロク。ラムが書けたと 思った瞬間にセミコロンをつい忘れてプログラムを実行してしまい、 LOGウインドウは ERROR!!の嵐、とうし、状況に陥りがちです。これは注意する以外ないのですが、深く考えて 1文の終わりってどこで、 いくと、「どこが 1文の終わりか Jというのがわからなくなりませんか。 1 f…・・ t h e nd o ; e n d ; e l s e す か ?Jと聞かれた場合、明確に定義できるでしょうか o i . . . . . . . , e n d ;と羅列してみるとどうでしょうごセミコロンを付ける位置は理屈で、覚えるという d o ;. よりはむしろ、いくつもプログラムを見たり書いたりするうちになんとなく経験的に身につくも ののような気がします。 ケース 4 2レベルのデータセット名における勘違い Microsoft Excelや MicrosoftWordを使い慣れている Kさん l 土、プロク、、ラムの中で 使っている SASデータセットがエクスフ。ローラで、捜すと見つからないと言いました。例えばそ れが ISAS.SET01Jとしづ名前だとすると、 ISASJがファイル名で ISET01Jが拡張子だと 思ったようで、すc実際には後ろの ISET01Jがファイル名にあたる部分で、このデータセット . SD2Jです cSASシステムのような をエクスプローラで見るとその実ファイル名は ISETOl ファイノレ管理のしかたはちょっと珍しいためか、実ファイル名での扱いのほうに慣れている人 ‑ 3 4 7

345.

はしばしば戸惑ってしまうようで、す。ライブラリ参照名の説明をするとだいたい分かってもらえ るのですが、ライブラリ参照名の説明はあまり早い段階でしてもなかなか理解してもらえない ことが多いので、教育のスケジュールとしてはフ。ログ、ラムに少し慣れた段階で、お話しすること や UNIXな にしています。そのため、こうし、った勘違いが生じてしまったようで、す o Windows ど、で、ファイルを実ファイル名で扱うことが身についている人には、先にライブラリ参照名につ いてと SAS システムの中で、は実ファイル名を気にする必要がないことをきちんと説明してお くほうがよし、かもしれません。 ケース 5 SASシステムのプログ、ラムって、何か特別なファイルなの? SASシステムのフ。ログ ラムは i .SASJとしづ拡張子をもった何か特別なしかけのあるファイ P ルだ、と思われるようで、 SAS テ守イスフ。レイマネージャの PROGRAMEDITOR ウインドウで、 ウインドウでは SAS システムのプ しか書けないと思っていたり、逆に PROGRAMEDITOR ログ、ラムしか書けないと思っていたり。他の言語でのプログラミングの経験がある人にも、コン パイルせずにプログ?ラムを実行で、きるせいか、なんとなく特殊なファイルだと思われてしまう SASシステムのプロク、、ラムはただ、のテキストファイルだよ」と言うと驚か ようです。ですから、 i 也、どんなテキストエディタででも れることがしばしばです。当然、 Windowsの Notepadf SASのプログラムは書けるし、 SASのPROGRAMEDITOR ウインドウで普通の文章を書 いてテキストファイルとして保存したって構わないのですが、「そう言われでもやっぱりちょっ と不思議...J c まあ、これはわざわざ説明しなければプログ、ラミングがで、きないということで もないので、「宿題や翌日の練習課題の予習を家でしたいと思っても、家のパソコンには SASがなし、からフ。ログ、ラムが書けなし、」といった申し出があると、「し、やいやどっこい、それが ね、プログラムを書くだけならできるんだよ..J と教えることになります。 ファイ jレ( SASデータセット)のオープンやクローズをしなくていいの ?J ケース 6 :r 他の言語でのプログラミングを経験してきた人たちが、たいてい共通して疑問に思うことの ようです。たいていの他の言語、そして SAS システムの世界で、もスクリーンコントロール言語 では、データファイルを使うにはまずそのファイルを「オーフ。ン」する必要があります。そして ステップや PROC 使い終わったら必ず「クローズ」します c でも、 SASシステムの DATA ステップ。で、は、プログラムを書く人がいちいち意識して「オープン」したり「クローズ」したりする ことはありません。データセットの名前を書くだけで OK 、後は SAS システムが全部面倒を見 ‑ 3 4 8一

346.

てくれているのです。 、ンステムの方で、面倒を見てくれてい その他にもプログラムの書き手が知らなし、うちに SAS ることがたくさんあります。例えば、 DATA ステップ。で、 i S A S .SETOlとしづデータセットのす べてのオブ ザベーションについて、既存の変数xとyの和を新しい変数 z (こもたせる」とし、う処 理をしたし、ときには、 data sas.setOl; set sas.setOl; z=x+y; run; といった具合に書くだけで、もいいでしょうっ一般的な言語では、 SAS データセットに相当する デ、ータファイルをオーフ。ンして、 1レコード(オブ、ザベーション)をつかまえては処理をして、ま た次のレコードをつかまえて...をレコードの数だけ繰り返し、処理が終わったらデータファ イルをクローズ、します。また、使用する変数についても、どうし、ったデータ値を扱う変数か、あ らかじめ宣言しなければならかったりします亡この点で、 SAS システムのフ,ot コ グPラミングPはかな り特殊だと思われるようです。一般的なプログラミングを身につけている人にとっては、この 簡単な書き方がかえって「レコ -I~'( オブザベーション)がどう扱われているのか見えなしリた めに、最初の頃は「したい処理をどこにどう書けばいいか戸惑ってしまった」、としづ感想に つながるようです c データファイルのオーフ。ンやクローズ、を意識しなくていい、レコードの読み取りゃ書き込 みのステップ を意識しなくていい、使用する変数にもほとんど気を使わなくていい、こうし、っ o た特徴は外から見れば実に特殊な驚異の世界なので、一般的な他の言語で、フ。ロク守ラミング をしてきた人には、 DATA ステッフoで、のオブ、ザベーションの処理のしかたと一緒に、こうし、っ た特徴については最初のうちに説明しておく方がよし、かと思います。(逆にプログラミング自 体が初めてとしづ人にはかえって混乱を招くので、初期教育の段階ではお話しない方がよ いようです c ) ‑349

347.

ケース 7 :変数に,思いも寄らない値が入っている!? 例えば、データセット SAS.SETOlで、変数xの値が 1だ、ったら新しい変数 a, こ ,A A A 'と し 、 う A '、3だ、ったら, A 'で、それ以外では, B 'にしたいとき、 値を入れ、変数xの値が 2だ、ったら, A data sas.setOl; set sas.setOl; if x=l then a='AAA'; else if x=2 then a= AA'; 官 if x=3 then a='A'; else else a= B I 1; run; のように書いてしまったりします。すると、最初のオブ ザベーションでxが 3だと文字変数 aの 長さは自動的に 1バイトになってしまい、次のオブ ザベーションで、xが 1で 、 も aは ,A A A 'ではな , くA 'しか入っていません。プログラムとして一見誤りはないし実行時にエラーにもならない c でも、実行後にデータ内容を見てびっくりじプログラムを書いた本人は説明されるまでどこ が悪いのかさっぱりわかりませんc プログ、ラムの書き手が DATAステップの中で、初登場の変数を何気なく使ってしまっても、 と思っても嫌な顔ひとつせず(たまには警 SASシステムの方では「何だこりゃ?唐突な...J 告のひとつも出しますが)淡々と処理してくれます。最初に出会った値が文字なら文字変数、 数値なら数値変数、変数の長さも自動的に決めて処理してくれるのです。そのため、 iSAS にお任せ」の癖がついてあまりにも無頓着にしていると、こうし、った失敗も出てきます。そこで、、 このような例を挙げて、文字変数に限つては、初めて使うときには [englh ステートメントで 3 ; のように)長さを指定してから使うようにと説明しています c (例えば [englh A $ ケース 8 数値変数の長さ 先ほどの文字変数の長さの話のついでに、コンピュータの基礎知識があまりない日さんに iSASシステムでは特に指定しなければ数値変数の [englh(長さ)は自動的に8バイトにし てくれるので、たいていの場合はそのままで問題なしリ言ったところ、「それじゃあ 9桁以上の FhU nU つd

348.

数字は扱えないのですか?J と聞かれたことがありました。また他にも、十の位とーの位の 2 桁の数値しか扱わない変数なら l e n g t h は2で十分で、すよねと言った人もいました。確かに 文字の場合には半角文字 lつが 1 ノ〈イトで、表されるので、 l e n g t hが8なら 8文字と考えても間 違いではないのですが...。ご存知のように、 [ e n g t hは決して文字の桁数ではありません c コンピュータの中ではデータはすべて 1か Oかの 2種類、すなわち 2進数で扱われており、 l バイトは 8ヒずツトですので2の8乗個、 8バイトだとそのさらに 8乗個の表現が扱えるわけですc Windows版 SAS、ンステムで、は、例えばこのデフォノレトの 8バイトで、正確に表現できる整数の , 0 0 7,1 9 9,2 5 4,7 4 0,9 9 2とし、う日常ではお目にかかれないくらい大きな値になり 最大値は 9 ます判)一こういったたぐいのお話は別に SASシステムのフ。ログラミンク、、に限ったことで、はなく、 本来はプログラミングをしようとしづ人なら誰でも最初に習う基本中の基本といったところで、 しよう。でも、 SASシステムのフログラミングなら、こんな基本的なことを知らなくてもプログ、ラ ムを書けてしまうのです。それがいいことか悪いことかはまた別の話として、一般の他のフ。ロ グラム言語と比べると SASシステムで、はフ。ロク、、ラムを書くときに要求されるコンヒ。ュータの周 F 辺知識が少なくてすむ、そうし、ったいろいろなことを意識しなくてすむ、とし、うことが言えるの ではないでしょうか。 その他 おもしろいところでは、昔、 PC版 SASシステムを使って教えていた頃ですが、コマンドライ ンにいきなり i D a t as e t O l ; Jと書き始める人がいましたc 私の説明が悪かったので、しようか、こ D a t a . . . Jと書き の方は「あ、わかった」と言いつつ、また次には同じようにコマンドラインに i 続けていました。フ。ログFラムとコマンドの違いの説明は結構難しし、ものだと思いました。幸い、 Windows版 SAS、ンステムになってからはこの苦労はありません c そうそう、コマンドと言えば、ラインコマンドもありますねc これは編集に便利なものですが、 初期教育のカリキュラムにのらずに自習から入ったNさんの場合、「よく使うラインコマンド一 覧」を最初に渡してあげていなかったので、自分で、 SASのマニュアルをあっちこっち捜した けどどこに書いてあるのかわからず、かなり苦労してしまったそうで、すコ言われてみればこの ラインコマンドもちょっと珍しい仕掛けですよね。 その他では、ライブラリ参照名がよく理解できない、フォーマットとインフォーマットの意味 や使い方や両者の区別などがよく分からない、関数とフォーマットの区別がつかない、などと し、ったところが多かったと思いますコ EA 唱 Fhu q u

349.

4.考察 ここで挙げてきた事例はあくまでも経験的な印象に過ぎず、アンケートの結果などの客観 的な数字もなければ何ら統計的な裏付けもありません c また、私たちの教育のしかた自体に も教育の対象者にも多少特殊なところがあると思いますので、ごく一般的な話としてとらえる には問題があるカもしれません。しかし、敢えてこれらのことを材料に SASシステムについて 考察してみようと思います。 11.はじめに」にも書きましたが、 SASシステム 1年生と言っても、プログラミングが初めて の人もいれば他の言語ではかなりのベテランとしづ人もいます。われわれの経験では、「他 言語でのプログラミングの経験があるかなし、か」で、 SASシステムのフ。ログpラミングに対する 疑問点・理解に苦しむ点が内容的に多少違うように感じられました。もちろん共通するところ もありますが、特に他言語で、のフ。ログ、ラミング、の経験がある人が抱く疑問(つまずく点)を見 直すことで、あらためて SASシステムのプログラミングの特徴について知ることができたよう に思います。 今まで、見てきた実感として、 SASシステムは、プログラミンク守自体が初めてとしづ人にとっ てはおそらく他のプログラミング、言語に比べれば習得が容易で、とつつきやすいのではなし、か と思います。とし、うのも、通常のプログ、ラミングで、は必須のコンピュータの知識が SASシステ ムのフ。ログ、ラミンク。で、はそれほど必要で はない、そうし、ったことを意識しなくてもプログ,‑ラムが こなっている、と思えるからです。これは私の SASシステムに関する私見なのです 書けるよう l が 、 SASシステムはもともと、できるだけ本業(もともとは統計解析)に集中できるように、その 解釈のもとになる数字を得るためのプログラミング(手段)はできるだけ簡単に、余計な労力 や手聞をかけずに、すなわち、コンピュータ自体のことーファイルやレコードの取り扱いや データの性質など に煩わされることなく済ませたい、とし、うところから出たものではなし、かと 思うのです。そうであれば当然、プログラミングは「易しし、」はずで、コンピュータ特有の難し し、ことなんか気にしないで取り掛かりたい初心者にとっては好都合なので、はないでしょうか。 逆に、他の言語で、フ。ログ、ラマーとしてやってきた人にとっては、易しすぎて(?)面食らってし まい、特徴をつかむまでは「かえって分かり難しリのカもしれません。 さて、ではなぜこのように初心者には比較的習得し易いであろう SASシステムがメジャー になれないのか、私なりに考えてみました。まず、個人で所有できない点。そこらへんのパソ コン、ンョップで、売られているソフトと違って、 SASは販売形態として個人での購入ができませ ‑ 3 5 2

350.

ん。気軽に買って気軽に使うことがで、きないので、ユーザが広がらないのではないでしょうか。 例えば iCD‑ROMから起動して使える教育用のシンプル SASJなんていうパッケージソフ トでも販売してもらえれば、爆発的に広がるカもしれないと思うのですが。次に、今や SASシ ステムは機能が豊富すぎ、守備範囲が広すぎる点。最初はシンフ。ルな統計解析ツールとい う印象だ、ったので、とっかかり l こ苦労することはなかったように思うので、すが、今では「ああもで きるこうもできる、すごいシステム J(こなってしまったようで、 SASシステムに興味はあっても、 マニュアルだ、ってたくさんあるし、いったいどこから手をつければいいのか、 SASのどのプロ ダクトをどのように使えば自分に役立つ使い方ができるのか、簡単には読めない手強い相 手だと、ちょっと尻込みしてしまうので、はないでしょうか。 SASワールド、に踏み込むには手慣 れた案内人(あるいは案内書)が必要になってきたカもしれません。そして最後に、これはよ く耳にする話なのですが、一般法人向けの価格は気軽に使うには高すぎる点。 SASシステ ムの能力を考慮すれば決して高くはないのでしょうが、買い取りでなく毎年の費用になると 言われると、やはり契約台数がしぼられてしまい、おのずと SASシステムに触れられる人の 数も限られてしまうのではないでしょうか。さらにもう一つ付け加えると、 SASシステムを本当 の意味で使いこなすには、 SASシステムのプログ、ラミングがで、きる、あるいはそれに相当す るだけの SASシステムに関する知識が必要である点《最近は「たった 1行だ、ってフ。ロク、、ラムら しきものは書かずにマウス操作だけで、簡単に使える Jことが求められるようで、プログラミング の勉強をしないと使えないようなものはダメだとしづ人もいます, SASシステムにも、例えば SAS/ASSIsr ノフトウェアのようにノンフ。ログ、ラミング、をうたったものもありますごでも、結局 はPROC何某かのフ。口、ンジャのシンタックスを全く知らない人には使いこなせないとし、うのが 実状のようです。私としては、定型業務を紋切り型に行うようなアプリケーションソフトではな し、し、使い手の自由な発想、で多種多様のことができるのだから、その後に得られる思恵とそ こまでに費やす労力を考えると、ちょっと勉強してみる価値は十分あると思うので、す c 特に SASシステムについては、フ。ログ、ラミングの勉強といっても超えなければならない努力の山 はそう高くはないと思っているので、 SASシステムがフ。ログ、ラミングを理由に食わず嫌いで 遠巻きにされるのはとても残念ですc こうして初心に戻っていろいろ見直してみると、欠点かなと思うところを差し号 l し、てもやはり SASシステムはとても素晴らしし、ものだと,思えるのです 2 だから、より多くの人に知ってもらい たいし、是非使ってもらいたい c プログラムも書いて実行してみてもらって、その便利さや面 白味を知ってもらいたいハそのためにできることは、微力ながらしていきたい。そして SAS社 さんにも、もっと頑張れ!とエールを送り続けたいと思うのです。 d 内 Fhu ηd

351.

拙い文章を長々と書いてしまい、たいへん失礼致しましたが、最後までお付き合い頂き誠 にありがとうございました。これで結びとしたいと思います。 参考文献 1 )IOracle7 入門コース J(セミナーテキスト),日本オラクル(槻, 1994 C言 語 J ,側ナツメ社, 1990 2 )河西朝雄 I 入門ソフトウェアシリーズ① 3 )ISASランゲージ:リファレンス V e r s i o n6,F i r s tE d i t i o n J,(掬サスインスティチュートジャ パン, 1995 e r s i o n6,F i r s tE d i t i o n J,閥サスインスティ 4 )IWindows版 SASシステム使用の手引き V チュートジャパン, 1995 A 生 Fhu n o

352.

日本 S A Sユーザー会 (SUG I‑J) Windows版SASシステムと JMPソフトウェアのデータ互換 佐藤元昭 力スタマサポート部テクニカルサポート 株式会社 SASインスティチュートジャパン C o m p a t i b i l i t yForTheD a t a s e t sBetweenWindowsSASSystemAndJMPSoftware M o t o a k iSato CustomerSupportDepartmentT e c h n i c a lSupport SASI n s t i t u t eJapanL td . 要旨 現在Windows/MAC版JMPソフトウェアバージョン 3 . 2がリリースされ、多くのユーザに利用さ れている。これに伴い、 SASシステムとのデータ互換や他の Windows版アプリケーションとの データ互換のニーズが高まっている。 本論文は、 Windows版JMPとWindows版SASシステムとのデータ互換と、 JMPデータをマイク ロソフト社Ward.EXCEL へのデータ移送について述べている。 キーワード:データ互換について 現在ビジネスユースによる Windowsマシン市場の拡大により、 SASシステムはもちろん統計解 析ソフトである JMPソフトウェアの需要が大幅に伸びている。このため、近年の傾向として SAS システムと JMPソフトウェアを平行利用し、それぞれのソフトウェアの特化した機能を使用し 解析や分析を行なっているユーザが増えている。 これは、 SASシステムや JMPソフトウェアに 限らずマイクソフト社製Wardや EXCELも同様と言えよう。この状況のなか当然ながら双方で作 成したデータセットに対する互換性を持つことが重要になる。 以下!こWindows版SASシステムで作成した SASデータセットや JMPソフトウェアで作成したデ ータセットをそれぞれのソフトウェア上での取り込む方法や、 Ward.EXCEL でのデータ移行方 法について紹介する。 1 . JMPソフトウェアから Windows版SASシステムへ JMPソフトウェアで作成したデータを Windows版SASシステムへ取り込む場合、移送方法と して、テキスト形式を使用する場合と SAS移送形式を使用する場合の 2種類の方法がある。フ ァイルサイズとしては、 SAS移送形式よりテキスト形式の方が役半分程度の容量となるが実際 にSASシステムへ取り込む場合、テキスト形式では SASデータステップで INPUTステートメン トを使用し個々のデータへ変数を割り当でなければならない。 SAS移送形式の場合は、ファイル容量がテキスト形式と比較すると大きいが、 SASシステムの COpyプロシジャで簡単に取り込むことがでるため、移送形式の使用を推奨する。 ‑ 3 5 5

353.

.JMPソフトウェアでデータを保存する方法 JMPソフトウェアのプルダウンメニューの FILEから SAVEASを選択し以下の画面を使い保存 する。 この時のファイル拡張子は、移送形式の場合は XP 丁、テキス卜形式はTXTになる。 』町一..園田ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー 保存する場開3 ?Ix ゴ 到 旦l E 3 7 三 割 │ 匂 temp2 目 主 Animals.jmp │ 保存匂 ファイル名~; I A n i m a l ),1帥li;~り |JMP F i J e s(*.JMP) ゴ F羽fForma~ 「円e‑Vcfsion3CompalibleFormat ( "SAS‑Tran.po.tForm司 ( "Te x lFOlmat Help キ ャ ン セ ル I Appe出~ と竺巴止J QSAS 移送形式で保存する場合 画面 1の SASTranspoパF o r m a t ' を選択する Oテキスト形式で保存する場合 画面 1の TextFormat' を選択する 次!こ Windows 版 SASシステムにて、この 2種類のファイルを取り込む場合の例を説明する ・移送形式を使用する場合 f i l e n a m ei n' c : t r a n s p o r t . t x t ' ; d a t af i r s t; i n f i l ei n; i n p u tv a r 1v a r 2v a r 3v a r 3… ・ ; 0 r u n ; ・SAS移送形式を使用する場合 移送形式の場合は、 SAS移送形式のファイルを変換する 'SASV5XPT'エンジンを使用し する。移送エンジンの指定は、LlBNAMEステートメントにて指定する。 m l i b n a m e jmpxpt sas 主塁茎 ' c : s a s t r a n . x p t ' ; p r o ccopyi n = j m p x p tc a t = w o r k ; r u n ; 2. .Windows版 SASシステムから JMPソフトウェアへ JMPソフトウェアでは、 Windows版 SASデータセット移送などの変換ファイルを使用せず、 直接データとして取り込むことができる。方法としては、 JMPソフトウェアのプルダウン メニューから F I L E ' 一〉 OPEN' を選択する。この操作により以下の画面が表示され、 ファイル拡張し 'S02' を持つファイルを選択する。 ただし、現在の JMPソフトウェアで は、日本語機能はサポー卜されていないため、英数文字のみのデータが対象となる。 ρO Ru nd

354.

?IXI 同 国 園 間E冒 回 調 四 r M 帥 場 開p , 司 te叩 2 ヨ旦j~封医霊i 1111 フ ? イ ル : & ( W : JWnda. t sd2 フバ同種訴:r>. ISASD a t 二 自 何D 2 ) o盃 コ ヨー」竺~ Help r SelectColumns I その他、 Windows版 SASシステムテ ータを作成した場合、変数に英数で指定したラベル情報を 定義している場合、 JMPソフトウェアではそのラベル情報をそのまま取り込む。ただし、フォ ーマット情報については反映することは不可である。また、ファイル拡張子XPTを持つ移送SAS 移送形式のファイルは、 JMPソフトウェアのプルダウンメニュー FILE'‑>'IMPORT'からも同様 に取り込むことができる。 e 3 . JMPソフトウェアのグラフをマイク口ソフト社Wordソフトウェアヘ JMPソフトウェアでは、グラフ機能による統計解析が可能である。ディスクトップ機能とし て他のワープ口ソフトヘ取り込む機能がサポー卜されている。操作としては、 JMPソフトウェ アのプルダウンメニューの COPY' 機能によりビットマップ形式で保存できる。 このため、 WardソフトウェアでJMPからのグラフを貼り付ける場合は、 Wardのメニュー 編 貼り付け'にて簡単にグラフを取り込むこめる。 集 , ‑> 4. JMPからマイクロソフト社 EXCELへのデータ交換 最後に、先に述べたWindows版 SASシステムのデータ交換同様、 JMPソフトウェアのデー タをマイク口ソフト社 EXCELソフトウェアヘ取り込む方法について説明する。 .JMPソフトウェアでのオペレーション 移送するデータの JMPソフトウェアのテキス卜形式で保存する。本文ではデータのデルミ ツターをカンマで行っている。 JMPソフトウェアのプルダウンメニュー下i l e ' 一〉 SaveAs' を選択すると以下の画 面が表示される。 一回一回盟副ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー ?lxl 僻 す る 場 所φ 』 l 包 Data ヨ皇Jf ! ]g呈l 斗 Variabi! i恒'叫~App 帥lia問J押 mp 嗣品F n2.jmp 困 ampJmp i 凶 亘 日 日町 c ! e j . 叩 mp E 邑 E 1 括 , 日均』唱炉巴 1 .AmpIl600j . mp I l I I l lAmp!i2ljmp ! " 1 8 日l 旧 ∞d 中 p目町J叩 同 .j iB o 引田 x , c ex 町J 叩 m p 回8,巾h bj . 叩 mp 叩 叩。 畑けAn scomb.jmp 剖 ~日山 de th.jmp 国Cho ~B y r n e t a g . j l 副 C. . 凹 I j . mp 恒l C i t 叩扇町 e 姐 CI. ~~erealjmp ~C e r e a J : s b j . mp 週Clil 宝~ C e r e a , ! . .2j . mp 副C J i l ヱ J [J!歪己 f J M P 陥s⑩ JMP) ヨ ー ユ . / 1 ! i >I 土 」 iJMPFormat H rp 問 V ersion3CompalibleFormat rSASTransportFormat r.~両市~~~ J A竺 出 と 土竺止~ t ヴ ηJ p h u

355.
[beta]
ここで、
TextFormat' と TextO
p
t
i
o
n
s
' をクリックすると、以下の画面の表示され
Endo
fF
i
e
l
dの Comma' 、Endo
fL
ine <CR+LF>' をクリックする。
EE
言語置面冨E直
面
:
I
i
I
I
:
I
・E・‑笹ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー ?Ix

選却したデー知立区切り文字で区切られています.
じ
)
;
:
"
‑
]
を
つ
リ
ヅ
う
す
る
力L区
切
る
テ
'
‑
'
I
O
)
J
!
完t
を指定してくださ弘、
ー元のヂサめ形式
デ』掛77イ晶形式在選択してくだ:
e
い:

1

t

Cõ]2.Î盟控控~:t;聖Z問主主三宝2f_:Ji位Þ=~I4_f!j己批Eヨ霊]

「スヘ.-;>:1 こよって右または左I~l晶えられた固定長引哨ト初予~

[1ーヨ

~J込み開始行(8):
フ
"
1
1
J
!
,C
:
.
t
.叩 2
'
Animals.TXTの九七ト

3

OX:1
.O
.f.11I
OX. 1
.O
..
.jnter
OX. 1
.5
.sprjng
OX. 1.3. summer

斗

l

J

とJ
‑‑,‑与と」仁三三コユZ旦
」
J些

FE園 田 園 調 開 D : r . ' I m r . ' I ! : 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 圃 x
l

r
.DeteOnly rLebels
Endo
fF
i
e
l
d

ine:
Endo
fL

rHeeder

rTeb

.
rComme

rSpece
rOther

r<LF> r
.<CR+LF>
rOther
rSemicolon
r<CR>

IT

口ß::.::.~.:::.JI

Cencel

• EXCELでのオペレーション
EXCELのメニューの ファイル'一〉 開く'をクリッ夕、 JMPソフトウェアで保存し
たファイル拡張子TXTを持つファイルを選択すると、以下の画面 5が表示される。
E

留置岡田園一一一一一一一一一一一一一一一一一 ?
0
1

選択したデ→は区制文字で区切られてし ます.
[次へ]をつリヲりするか、区切るデ寸の形式を指定してく1
ミ
E
乱、
「元の子初形式
一一一一一一一一一一一一一一一一一一一一一一一一一ーー
lデ→の77イル形式を選択してGさ
さ
し1

!r. [~~Ï予~:![ç~医J開拓百i盟主主l三度明}~.El."@J
rス
ヘ0
‑
;
1こよって右または左!こf
耐えられた固定長7
<
‑
!
レドのテ」恒'
!
f
}
取J
'
込;,.;制作8):

!

i

f
I
ー
ヨ

771ル C:~te mp2¥Anima ls.1X了のフ VIヒ',-

OX. 1,O
. faI1

OX. 1
.O
. wi nter
OX. 1
. 5. spring

ヨ

I~
斗

OX. 1.3. summer

~盟斗ーと~三口

"'7(F)

I

データファイル形式のカンマ区切りを選択し、
次へ のボタンをクリックすると、以下の
画面 6が表示され、完了ボタンのクリックでJMPソフトウェアのデータを簡単に EXCELへ
取り込める。

3
5
8
‑

356.

EE割置町四・ïlii量~-ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー ?Ix 12 峨蔀諜鶴?ください・[刊のア比百判明に 区 切J 文字一一一一ー一一一一一一一一 ir m : D r悶 池 1 什rì:~'-ì:~ rその他。 内有堅│:肝F 附│用問「一一一ヨ r 「連~した区切J文字[;1 1 文字として扱う (_g) a11 1 nter pr I n g ~盟斗」豆旦J[2三三コ一主主」 最後に、今後コンビュータソフトに対するさまざまなニーズに対応したソフトウェアが開発さ れ販売されていく。 SASシステムや JMPソフトウェアにおいても、今後ユーザが求めるニーズ に対し吸収し、より品質の高いものが提供できるよう努力していきたい。 に1 u 司U n u

357.

チユートリア) 1 1 1

358.

日本 SASユーザー会 (SUGI‑J) ファイナンスにおけるハザード・モデル 青沼君明 東京三菱銀行商品開発部東京大学大学院数理科学研究科 H a z a r dM o d e l si nt h ef i n a n c ef i e l d Kimiaki Aonuma The Bank ofTokyo‑Mitsubishi a n d University ofTokyo 要旨 金融分野での新しいテーマとして,プリベイメント・リスクとクレジット・リスクの測 定がある.プリベイメント・リスクとは,定期預金や住宅ローンなどの金融商品が,満期以前に 途中で解約された場合に金融機関が被るリスクのことであり,クレジット・リスクとは企業が倒 産した場合に被る損失のことである.こうしたリスク評価では,ハザード過程に何らかの確率モ デ、ルを適用し,金利の期間構造モデ、/レを組み合わせて用いられるのが一般的であるが,プリベイ メントやデフォルト(倒産)のそデ、ルを表現するために,ハザード理論を用いた統計的な外性モデ ノレが適用される場合もある.ここでは,プリペイメント・リスクの表現に利用される,コックス の比例ノ¥ザードモデルの適用例について概説する.詳細については,青沼・木島 [ 1J ,木島・青 沼[ 2 Jを参照されたい. キーワード:S A S / S T A T, P H R E G 1.はじめに プリベイメントとは期限前解約のことであり,定期預金,住宅ローンなどの預金者もし くは債務者による期限前解約が,金融機関の立場からは資金運用の修正を余儀なくされる などのリスクを生じさせることになる.こうした期限前解約が可能な商品については,ア メリカン・オプションが含まれているとしてその解約権の持つリスクを算出することは可 能であるが,個人投資家(預金者)は合理的な行動をとらない場合がしばしばあり,アメリ カン・オプションのように全ての顧客が合理的に行動するとしてリスクを評価した場合に はそれを過大評価することになる.したがって,顧客の非合理性を適切に取込んだプリベ イメント・リスク評価モデノレの開発が不可欠となっている. プリベイメント・リスクを評価するためには,プリベイメント率を知何に算定するかと いうことと,それをどうやってリスク評価に反映させるかという 2つの課題がある.期限 前 解 約 が 可 能 な 代 表 的 な 商 品 と し て そ ー ゲ ー ジ 証 券 が 挙 げ ら れ る が , Schwartz and Torous[15]はハザード関数を明示的に与えてプリベイメント率を算定し,この明示的な関 3 6 3

359.

数を使ってリスク・プレミアムが満たす偏微分方程式を導いた 1 しかし,一般的な期限前 解約(プリベイメント)が可能な商品では,解約は可能であるが早期の解約は不利となるなど, モーゲージ証券とは異なる固有の構造を持つ場合が多く,しかもこの期間構造は単純な関 数では表現されないので,彼らのようにハザード関数を明示的に与えることは難しい.本 稿では,こうしたプリベイメント・リスクの評価について定期預金の例を用いて金融機関 の立場から検討する. 本稿におけるプリベイメント・リスク評価モデノレの特徴は以下の 2点である.プリベイメ ント率の算定では,解約には商品固有の要因によって生ずる何らかの構造があると考えら れ,また,モデルに用いる共変量としては,金融機関の立場からも使い易く,しかもリス ク・プレミアムの算出が可能なものを選定する必要がある.本稿ではオプションの期間構 造モデ、/レとの整合性の取り易さという面から, i スプレッド J , i 季節変動性(月別ダミー 変数)J を共変量とする, Cox の比例ハザード・モデルを用いている.このモデ、ルを利用す る狙いは,商品固有の要因から生ずる期間構造などをベースライン・ハザード関数に集約 して取り込み,オプション評価に不可欠となる共変量のみを取り出してパラメータを推定 することにある.次にプリベイメント・リスクの算定では,金利期間構造の格子モデ、/レの フレームワークの中で,比例ハザード・モデルで推定されたプリベイメント率は各ノード における期限前解約(早期行使)の確率となり,プリベイメントの持つオフ。ション価値は格 子モデルのアルゴリズムで評価される. 本稿は次のように構成される.まず第 2節でプリベイメント・リスクの理論的ベースとな るハザード理論の概説を述べ,プリベイメント・リスク評価モデ、ルの構築に必要な定式化 を行う.第 3節では,このリスクを評価するために比例ハザード・モデルを適用して,プ リベイメント率を求める.さらに,第 4節では,第 3節で求めたプリベイメント率をオプ ションの期間構造モデ、ルに適用してプリベイメント・リスクを算定する.そして最後に, 第 5節で全体的なまとめを行う.なお,本稿におけるデータ解析は, SASの PHREGプロ 1 5 ]を用いて行った. シジャ [ 2 . プリベイメント率の算定モデル 途中解約を認めるという ことは,金融機関の立場か らはリスクとなる.また, 顧客にとっては解約がいつ でも同じ効果をもたらすの Table2 .1 .Thecouponr a t eo f3yearstimed e p o s it . 預入期間 3 6ヶ月未満での解約 6ヶ月以上 1年未満での解約 l年以上 2年未満での解約 4 2年以上 1 2 適用利率 解約時点での普通貯金利率 2年物定期預金利率 XO.4 2年物定期預金利率 契約利率 .1 . ではなく,例えば Table2 に示すように,定期預金の受け取り利率は預入期聞に応じて段階的に異なっている.この モーゲージ関連商品のプレミアム評価モデルとして,他に DunnandMcConnell[ 3 ],McConnell l o l d i,GourierouxandMonfort[ 1 6 ]などがある. andSingh[ 1 2 ],T ‑364一

360.

階段構造"が他の金融商品と異なるプリペイメント行動を生み出すことが考えられ,例 えば,預け入れてから 1年に近づいた時点では解約をなんとか押さえ, 1年を超えてから 解約するといった特性が予想される.以下,本稿では解約率を 特定月の解約金額 ( 2 . 1 ) 解 約 率 ‑ ‑ •• • ー ーー と定義する. プリペイメント・リスクを評価するためには 2つの課題 ( a )プリベイメント率の算定 ( b )オプション価値(プリベイメント・リスク)の算定 について検討する必要がある. a )では,商品固有の要因によって生ずる構造を考慮する必要が プリベイメント率の算定 ( あり,ここでは Coxの比例ハザード・モデル (proportional hazard mod巴1)を用いる.この モデルを用いる理由は,商品固有の要因から生ずる解約率の期間構造を後述のベースライ ン・ハザード関数に集約して取り込み,オプション価値評価に不可欠となる共変量 (covariat巴 )2のみを取り出してパラメータを推定することができるからである.解約率に影 響を与える要因としては様々なものが想定されるが,このモデルに用いる共変量としては, 説明力の高さは勿論のこと,実務面からの整合性が取り易く, しかもオプション価値の算 出が可能なものを選定する必要がある.ここでは,金利オプションの期間構造モデルとの 整合性の取り易さという観点から, (1)季節変動性(月別ダミー変数) ( 2 )スプレッド を共変量として用いるものとする. プリベイメント・リスクの算定 ( b )については,金利オプションの格子モデルのフレーム ワークの中で,各ノードにおける早期行使確率を上記の比例ハザード・モデノレにより推定 することで,プリベイメント・リスクを算出することができる.ここでは評価の簡便さに 6 Jによりプリベイメン より Kijima and Nagayama[10Jの格子を用いた拡張 Vasicekモデル [ ト・リスクを求める.プリペイメント・リスクの算定については第 4節で述べる. 2 .1生存関数とハザード関数 Tを生存時間を表わす非負の確率変数とする.生存関数 (survival function)とは生存時間 分布関数とも呼ばれ,確率変数 Tが t以上となる(ここでは t以上預金が現存する)確率 ( 2 .1 ) S( t )=Prob(T2:t ) のことである. { t, . ,ηとなる条件の下で,次の瞬間にイベント(この場合は解約)が起きる率 2 回帰分析における説明変数に対応する概念であり,予後因子 ( p r o g n o s t i cf a c t o r ), リスク因子 ( r i s k c o n f o u n d i n gf a c t o r )とも呼ばれる. f a c t o r ),交絡因子 ( ‑365

361.
[beta]
(
2
.
2
)

r
o
b
(
t:
s
;T<t
+
M
IT注 ,
t
)=一一一一一一一
d(
lo
g
S
(
t
)
)
h
(
t
)= l
i
mP
~ .
̲
‑
,
‑‑
~
, ~-,~ ‑
‑
tJM

o

~

をハザード率と呼び,これを tの関数と見たものをハザード関数 (
h
a
z
a
r
df
u
n
c
t
i
o
n
)という.ま
た
,

(23)H(t)=i均 )
d
.
← 附(
t
)
を累積ハザード関数 (
c
u
m
u
l
a
t
i
v
eh
a
z
a
r
df
u
n
c
t
i
o
n
)と呼ぶ. (
22
)式より確率密度関数は
,

(
2
.1
(
t
)= hり
)
.S
(
t
)= h
(
t
)
.exp{‑H(t)}

と表わされる.

2
.
2C
o
xの比例ハザード・モデル [
7
J[
1
2
J[
1
4
J
ある母集団に属する個体 Jの生存時間,つまり預金の残存期間のハザード関数を
(
2
.
5
) h
/t)= h
(
z
jt
)= h
o
(
t
)
e
x
p
{
z
;
β}
と仮定する.ただし,九 (
t
)はベースライン(基準)ハザード関数,

z
;は個体 lについて観測され

る共変量のベクトノレ Z
jの転置, βは観測される共変量に対応する係数(全ての個体に共通の値)
である.ベースライン・ハザード 関数 h
o(
t
)に対応する生存関数を
(
2
.
6
)

九(
t
)=叫何。 (
t
)
}
, H
o
(
t
)= f
o
lho(l
I
)
ぬ

また,
(
2
.
7
)

H(zjt
)= e
x
p
{
z
;β
}.H0(
t
)

とおけば,個体 jの生存関数は
(
2
.
8
)

S
(
Z
jt
)=


い

}=叫ト仲β
;}Ho(t)}

(
Z
jt
)

で与えられる.

2
.3比例ハザード・モデ、ノレの特徴
比例ハザード・モデルの特徴は,個体聞のハザード比が H
寺点 tに依存しないということで

;
,= 1,
2,に対して (
2
.5
)式から
ある.つまり,任意の共変量ベクトノレ Z,
(
2
.
9
)

h
(
Z
jt
) e
x
p
(
z
;
β)

一一一一一=一一一一一一

h
(
Z
2t
)

exp(z~ β)

が成立する.この比例ハザード性が仮定できれば,ベースライン・ハザード関数に特定の分布を
仮定することなく共変量の効果が推定可能となる.共変量についてはパラメトリックな仮定がお
かれるが,ベースライン・ハザード関数にはそうした仮定が不要であることから,比例ハザード・
モデルはセミ・パラメトリックなモデルである.
比例ハザード性 (2.9)の検証には 2重対数プロットが用いられる.共変量が zである時,

t
)とし,
その生存関数を S(Z,

(
2
.
8
)式において 2重対数をとれば

3
6
6
362.

( 2 . 1 0 ) log{‑logS(z, t ) }=z' s+logHo( t ) が得られる.したがって,共変量 Z の値で層別して. l o g (‑logS( I ) ) と l ogtの 2重対数プロッ トを作成すると,比例ノ¥ザード性の下ではこれらのプロットは平行になる. 2 . 4 比例ハザード・モデルと部分尤度 上ヒ例ハザード・モデルで, リスクの大きさ(中日対ハザード)を ( 2 .1 1 ) φ ( z )=exp(z' s ) とおき,個体 j のハザード関数を hj • φ(zj) を φjと表わすと,後述するタイがないデータの場 合には ( 2 .1 2 ) L = H f k により部分尤度が求められ,打切りを受けたデータは分母にのみ影響を与える.ただし 1 1は μ H 昧 i 個体の数で.):匂は第 f C o x 回帰は,この部分尤度を最大にするようにパラメータを推定するのであるが,一般的 には N e w t o n ‑ R a p h s o n法などによって部分尤度を最大にするようなパラメータを推定し,尤 a l d検定. R a oのスコア検定を適用して適合度が評価される(詳しくは,例えば 度比検定や W [ 3 J[ 5 J[ 7 Jを参照). 2 .5ベースライン・ハザード関数の推定 o( 1 )を特定することなく 比例ハザード・モデルの特徴は,ベースライン・ハザード関数 h 共変量のパラメータを推定できることであった.一方,ベースライン・ハザード、関数 h o( 1 ) 自体の推定方法もいくつか研究されている.本稿では K a l b f l e i s c ha n dP r e n t i c e [ 7 Jによ a p l a n& M e i e r型推定量を用いる.この方法は,推定された共変量のパラメータ値を用 るK o( t ) を K a p l a n &M e i e r いて各個体のリスクの違いを調整し,ベースライン・ハザード、関数 h 法と同様の方法で推定するというものである.タイがない場合には,時点 t k を越えて残存 e w t o n 法などの反復計 する確率引を明示的に解くことができるが,タイがある場合には N 算法が必要となる. 3. 実証分析例 Coxの比例ハザード・モデルで取り扱うのは解約する(イベント)までの期間ではなく,あ ( t )であり,本来なら個々の預金者を個体として解約件数を算出す る時点で解約される確率 h る必要がある.しかし,データの制約により個々の預金者を取り扱うことができないため, 各時点での新規預金の件数が平均して 7~8 千件程度になるように,預金金額を一定値で割 ることで個体数を認識した.このとき,総個体数は約 1 0 0 万件となる.また,データの観 測期聞が一定期間であることによる打切りと,月次データであることによるタイが発生す る.この節では,まず打切りとタイについて述べ,定期預金の解約率の推定,ハザード・ ρhu つd ワー

363.

モデ、/レの安定性について述べる. 3 .1打切り (censor) ある時点まで現存していた預金において,その時点以降に解約があったかどうかが分か らない場合,つまり特定時点までの情報はあるがそれ以降の情報が無いような状況を「生 存時間は打切りを受けている」と言う 3 定期預金の場合には,途中でデータが欠落すると いうことは無いが,観測時点までに満期が到来しなかったデータは打切りを受けているこ とになる.また,ある時点で満期が到来しているがそのまま引き出されていないデータに ついては,満期時点で定期預金としての商品性が失われることから,満期で全ての預金が 終了するという考え方も可能である.しかし,満期以降の残金がそのまま普通預金として 放置されるなど,満期以降の顧客の解約行動が不明なため,ここでは満期が到来しでも放 置されている預金は打切りとして処理した. t i e s )データの処理 3.2 タイ ( 預金の解約データにおいては,測定時間が離散的であることから,生存時間におけるタイ (同順位)が発生する.つまり,月次データを分析に用いた場合には, 日々の解約が 1ヶ月 単位で纏められたデータを観測することになり,特定時点(月末)でイベントが纏まって発 生した形となっている.こうしたタイ・データがある場合,部分尤度を ( 2 . 1 2 )式で表現さ F R O N することが出来ず,近似計算法により部分尤度を求めることになる.本稿では以下の E 法を採用した 4 … tは l個のイベント発生時点を表わすものとし . d を時点 tで解約された個 t 1 <t 2< < k 1 k で解約された個体ベクトノレ Zjの和 体の集合 D kの大きさ . S kを t k Sk = 2 j 叫 Zj と等しし、かそれより遅い集合とする. とする. また . (T k .はイベントもしくは打切りが時点 t k この時, EFRON法による βを推定するための尤度関数は,次の式で与えられる. ( 3 .1 ) mhexp(s;J) I T I 1 1 2 1 L- ~P) = II J k‑l • j p ( z ; s )I h2 ;l l " ・目p(z;ß) 一三~ 叫 目 3.3 提案モデ、ル 定期預金の解約率をスプレッドと月見J Iダミー変数により説明した,比例ハザード・モデル の結果を以下に示す. 3 このタイプの打切りは,時間打切り ( t y p e1打切り, n o nー i n f o r r n a t i v eな打切り)と呼ばれる. 4 他に E X A C T ( 正確)法, B R E S L o w y 、 去 D r S C R E T E法などがあるが.計算時聞が早く E X A C T法に近い値が得られ F R O NI'去を採用した. るという理由から,本稿では E ‑368一

364.

全期間のデータによるインサンフ。ルで推定されたハザード関数は, Zle ZI をスプレッド, Z̲ ~ Z を月別ダミー変数としたとき h ( t )= h o( t )e x p (‑0. 182804z1 +0. 359592z2 +0. 417272z3 +0. 493666z4 +0. 255904z5 +0. l94645z6 +0.187475z7 +0. l52202z8 ( 3 . 2 ) +0. 322228z9 +0. 343776zI0 +0. 327402z1 .257111z1 1 +0 2) となり,月別ダミー変数を除 いたハザード関数をグラフ化 i g . 3 .1.である. したものが, F 0 . 0 0 0 0 経過期間 ‑ ー ー ー ← 7 1 0 J l スプレッドー3 『叫占、.̲スプレッド+1 スプレジ向 布市弓す子 F i g . 8 .1 .Thep roposedbasel i n ehazardf u n c t i o n . 4. プ リ ベ イ メ ン ト ・ リ ス ク の 評 価 本節では,プリベイメント・リスクの評価値を Kijimaand Nagayama[lOJの格子を用いた 拡張 Vasicekモデル [ 6 Jによって計算する. 期間 [ 0,3]における停止時の集合を 7 とおけば 1円預金した顧客のアメリカン・オプシ 8 Jの 7 7ページ参照) : ョンのプレミアムは以下の式で計算される(例えば木島 [ ( 4 .1 ) 日] c =ヂ [ Z (t).e ‑1 E : リスク中立測度に関する期待値オペレータ r ( t ): 市場金利のスポットレート Z( t ): 時点 Iで解約した場合に得られる金額 これに対し,本稿のプリベイメント・リスク評価モデルでは,ハザード関数 h ( t )は時刻 fの 直前で解約されていない顧客に対する,時刻 tで解約する顧客の占める割合を定義している. u s )であるとして代表的な顧客の投資行動を考えれば,確 これは顧客全員が一様 (homogen巴o tまで預金が現存する)という条件のもとで,次の瞬間に解約さ 率変数 Tが時点 tを越える ( れる確率として外性的に与えられる.したがって,本モデ、ルにおけるオプションのプレミ アムは 品 e ﹃EEEEEEEEEEEEEd ア ポ ' ' s s T Z︑ . ‑ ・ E FaEEEEEEEEEEEE﹄ C ( 4 . 2 ) となる.一方,プリペイメントが許されない場合に顧客が得るプレミアムは 円同d nぺU b ハ

365.

( 4 . 3 ) Co= E IZ(3)'eJo 、, 1 ‑1 ‑f r(s)ds I ~I であるから,結局プリベイメントによるリスク・プレミアムは 市 l ll1l ﹄ J 匂i rh J 今 e 〆 ︑ ﹄ ノ ' t Z ︑ FtIll111L E 出 し V haEEEEEBEE‑za 司 ﹂ P rh T f'E ︑ ︐︐︐ T Z︑ E FEEEEEEEEEEE''﹄ n u 一 一 c pし 一 一 C 3 .2 )式ではスプレッド(すなわちスポットレート)に依 で与えられる.注意すべきことは , ( 存して解約の確率が決定されるので ,Tによる新たな不確実性は導入されない. リスク中 立化とは平均回帰のレベルを調整することに対応し,預金の価値は(金利の上に書かれたデ リパティブなので)将来得られるであろうペイオフの現在価値をリスク中立確率に関する期 待値で、評価すれば良い.したがって,スポットレートの格子モデ、ルを作成し,季節性の月 ( 3 . 2 )式で決定されるプリベイメント率を持 別ダミー変数を各ノードに対応させることで, 4 .2 )は以下のように計算される. つ顧客のリスク・プレミアム ( 5 .1格子の作成とシフト関数の計算 拡張 Vasicekモデルでは,スポットレート r ( t )が , リスク中立確率の下で次の確率微分方 程式に従うと仮定する: ( 4 .4 ) c か( t )= α( t ) ( r / J ( t )‑r ( t )知+σ ( t ) d B ( t ) ここで B ( t )は標準ブラウン運動 , a, p r, σは正の実数値をとる確定的な関数である.最初に 0 に回帰する確率過程 dX( t )=‑ a ( t ) X ( t ) d t+σ( t ) d B ( t ) ; X(O)=0 を考え,次に ( 4 .5 ) ra(, ')dv Y ( t )= 計 、 , X ( t ),t< ! :0 とおくと , Y ( t )は確率微分方程式 ( 4 .6 ) f a( 、叶 b J o dY= σ( t ). e , dB,t注 o; Y ( O )= 0 を満たし,これはブラウン運動の項だけを持つので, F i g . 4 .1.に示す 3項格子モデ、ルで、近似 される . Y ( t )に対する格子を ( 4 . 5 )で X ( t )に変換すると , X ( t )の格子として Fig. 4. 2 .の 3 項格子が得られる. 門ft ハリ nぺU

366.
[beta]
F
i
g
.
4
.
2
.L
a
t
t
i
c
ef
o
rX.

Fig.
4
.
1
.L
a
t
t
i
c
ef
o
rY
.

Kijima and Nagayama [
1
0
Jによれば,確定的な関数 θ(
1
)
(シフト関数と呼ぶ)に対し,
(
4
.7 ) σ (
1
)(
/
)= θ'
(
1
)+σ(
1
)θ(
1
) ;θ(0)= 0

が成り立っとき,スポットレートは
(4.8)

r(
l)=θ(
1
)+X (
t
) ;θ(0)= r
(
O
)

で与えられるので,

(
4
.
8
)式から X の格子上の値をスポットレート r
(
t
)の値に変換できる 5

以下では,近似の期間を [
0,
3
],分割数を N =36,f~íÊ 散時点を 0=10 </1 < …くん =3とする.
より一般的な l ファクターモデ

ルの格子の生成方法については K
i
j
i
l
l
l
aa
l
l
dN
a
g
a
y
a
l
l
l
a
[
l
l
J

を参照されたい.
4.2 リスク・プレミアムの計算

t
)の格子モデ、/レ {r(n)),
p(n
,
Ij
)
;i
,
j=0
,
…
、 ±n
,fl=O,
lf‑,
N)が得られた
スポットレート r(
4
.
2
)で定義されるオプション・プレミアムを計算する.ノード (
n,
i
)でのプリベ
とする.まず (

イメント確率を h(n,
i
), オプション価値を V(n,
i
), 解約したときに受取る金額を z(n))とす
ると,スポットレート過程のマノレコフ性より以下の関係式が成り立つ:
(
4
.
9
)

川
仙
の‑
h(n,
i
)
)
・
"
ip(n,i,j)'V(n+1,j)(11))・
z(n,
i
)

V(n,
i
)= e‑
I

満期では z
(
3
6,
i
)= Z
(
3
)であるから

nに関して降順に (4.9)式を計算すれば,定期預金設定

時点でのオプション・プレミアム V(O,
O
)が計算される.一方,アメリカン・オプションの
4
.1
)は,ノード (
n,
i
)における価値を A(n,
i
)とすれば,
プレミアム (1
0
)1山

で与えられる. (
4
.9
)(
4
.1
0
)を比較すると,顧客が合理的な評価を取った場合(すなわち

5拡 張

Vasicekモデルで、は,シフト関数 θ(
/
)は現時点のイールドカーブに完全に整合する形で計算

される.詳しくは Kijimaa
n
d Nagayama [
1
5
Jを参照.

‑:m

367.

( 4 . 1 0 ) ) には,プリベイメント確率は 0 か l となり,より有利な方策を選択することが分 かる.したがって A(n , i )注 V(n, i )が成立する.計算方法の詳細については [ 9 Jを参照せよ. 5. まとめと今後の課題 本稿では,金融機関の立場から,定期預金のプリベイメント評価モデ、ノレについて検討した. プリベイメント・リスクを評価するためには,プリベイメント率を如何に推定するかとい う課題と,それをどうやってオプション価値の算定に用いるかという 2つの課題がある. 最初のプリベイメント率については, r スプレッド J , r 季節変動性(月別ダミー変数)J を共変量とする C o x の比例ノ¥ザード・モデ ルを適用した.このモデ ルを適用する狙いは, 商品固有の要因から生ずる期間構造等をベースライン・ハザード関数に集約して取り込み, オプションの期間構造に利用しうる共変量のみのパラメータを推定することにあった.ま た,プリベイメント・リスク価値となるオプション価値の算定では,拡張 Vasicek モデル のフレームワークの中で, Kijima and Nagayamaの格子モデ、ノレによりプリベイメント・リス クの価値を求めた. 372

368.
[beta]
<参考文献>
[
1
]青沼君明,木島正明(19
9
8
),

定期預金のプリベイメント・リスク評価モデル"日本応用数理学会論

文誌, Vo
.
18,NO.1
.

[
2
]木島正明偏著,青沼君明(19
9
8
), 金融リスクの計量化(下巻)クレジット・リスク"きんざい.P38
‑98.
[
3
]C
o
l
l
e
t
t,
D
.(
19
9
4
),ModellingS
u
r
v
i
v
a
lDatai
nMedicalResearch,ChapmanandHall,London
.
J
.McConnell(
19
8
1
),"
V
a
l
u
a
t
i
o
no
fGNMAmortgage‑backeds
e
c
u
r
i
t
i
e
s,
"
[
4
]Dunn,KB. andJ

JournalofFinance
,363753
9
2
.

.
R
. andD
.
P
. Harrington(
1991
)
, C
ountingp
r
o
c
e
s
sands
u
r
v
i
v
a
la
n
a
l
y
s
i
s
,John
[
5
]Fleming,T
WileyandSons,NewYork.
. andA White(
1
9
9
0
), P
r
i
c
i
n
gi
n
t
e
r
e
s
t
‑
r
a
t
ed
e
r
i
v
a
t
i
v
es
e
c
u
r
i
t
i
e
s,
" TheReviewo
f
[
6
]Hull,J

F
i
n
a
n
c
i
a
lS
t
u
d
i
e
s
,3,573‑5
9
2
.
.
D
.andR
.L
.P
r
e
n
t
i
c
e(
19
8
0
),TheS
t
a
t
i
s
t
i
c
a
lAnalysisofF
a
i
l
u
r
eTimeData,
[
7
]K
a
l
b
f
l
e
i
s
c
h,J
JohnWileyandSons,NewYork
.
[
8
] 木島正明(19
9
4
),ファイナンス工学入門,第日部:派生証券の価格付け理論,

日科技連.

[
9
]木島正明・長山いづみ・近江義行(19
9
6
),ファイナンス工学入門,第田部:数値計算法,日科技連.
[
1
0
]Kりima,M. andL Nagayama(
19
9
4
), E
f
f
i
c
i
e
n
tnumericalproceduresf
o
rt
h
eHull‑White
extendedVasicekmodel,
"J
ournalofF
i
n
a
n
c
i
a
lEngineering
,32
752
9
2
.
19
9
6
),"Anumericalproceduref
o
rt
h
eg
e
n
e
r
a
lo
n
e
‑
f
a
c
t
o
r
[
1
1
]Kijima,M. andL Nagayama (

"Jo
山
u
J
刀r
nalof
叉
丹
F
i
"
nanα
c
ulEng1~古'1冶nee
泊 臼'1"由 g
,5317337.
i
n
t
e
r
e
s
tr
a
t
emodel,

.
T
.(
19
9
2
),S
t
a
t
i
s
t
i
c
a
lMethodsf
o
rS
u
r
v
i
v
a
lDataAnalysis
,JohnW
ileyandSons,New
[
1
2
]Lee,E

.
York
[
1
3
] McConnell,J
.
J
. and M.K Singh (
19
9
4
), R
a
t
i
o
n
a
l prepayments and t
h
ev
a
l
u
a
t
i
o
no
f
" TheJ
ournalofFinance,3,891‑921
.
c
o
l
l
a
t
e
r
a
l
i
z
e
dmortgageo
b
l
i
g
a
t
i
o
n
s,

[
1
4
] 大橋靖雄・浜田知久馬 (
1
9
9
5
),生存時間解析,東京大学出版会.
[
1
5
] SAS I
n
s
t
i
t
u
t
eI
n
c
.(
1
9
9
1
), The PHREGP
r
o
c
e
d
u
r
e
.
" SAST
e
c
h
n
i
c
a
lReportP‑217 SAS
I
n
s
t
i
t
u
t
eI
n
c
[
1
6
]Schwartz,E
.
S
.andW.N.Torous(
19
8
9
),Prepaymentandt
h
ev
a
l
u
a
t
i
o
no
fmortgage‑backed
"J
ournalofFinance
,2,3
75‑3
9
2
.
S
e
c
u
r
i
t
i
e
s,

.GourierouxandA Monfort(
19
9
4
), Prepaymenta
n
a
l
y
s
i
sf
o
r
[
1
7
]T
o
l
d
i,M.De,C
山
l
山r
i
比
t
i
包
z
a
抗t
i
ぬ
o凡
n
1
,
"ゐ
J;O 【u
山
山
1l~
刀
r-nal o
fEmp1:
山
'
1
η
1
ゴ
Y
て
"
ぜ
1
.
白 1F
inance
,2,
45‑70.
s
e
c
u

ワ
i

っd

qd

369.

日本 S A Sユーザー会 (SUG I‑J) SASによる信頼区間の計算 0 浜田知久馬 東京大学医学部薬剤疫学教室 C a l c u l a t i o nofc o n i i d e n c el i m i t u s i n gSAS Chikuma Hamada University ofTokyo u,Tokyo,1 1 3 Hongo 7‑3‑1, Bunkyo一k 要旨 研究結果を評価する際に,検定の結果のみを判断の拠所とすると, しばしば解釈に苦しむことに なる.これに対し信頼区間は,結果を評価する上で有用な情報を与えてくれる.本稿ではテュート リアルとして,信頼区間の意義と構成原理の一般論を解説し,特に並び替え検定(正確な検定)と 尤度比検定に基づく信頼区間について構成原理を紹介する.またよく用いられる平均値,平均値の 差,比率,比率の差,オッズ比などの様々な指標の信頼区間の, SASでの計算例と解析結果の読み 方を示す. キーワード: 信頼区間 並べ替え検定 FREQMULTTEST LOGISTICGLM 勺 民U t q o

370.

しはじめに(検定と信頼区間) 多くの研究者が,医薬データの統計解析=検定と考えているのではなし、かと思われるほど,医薬 関係のジャーナルでは頻繁に検定が用いられている.この最大の理由は,検定では結果が有意差な し・ありの 2通りになり,結論が明陳であるという利点のためである.多くの種類の検定があるが, その結果は p値によって統一的に表現することができる. p値は,帰無仮説の下で,得られたデー タ以上に大きな差が,偶然によって生じる確率を表している. したがってこの確率が小さいときは, 帰無仮説はもっともらしくなく,データの差は偶然を越えた意味あるものとして解釈できる.この ように検定とは,差がないという帰無仮説からの希離を,確率的に記述するものである.通常は p 値が 0.05を越えるか否かによって,なし・ありの意思決定がなされるが,実際の医学研究,特に探 索的な段階では,複数の項目の結果を総合的に評価することが要求されるため,検定のみを判断の 拠所とすると, しばしば解釈に苦しむことになる. 例えば複数の時点に渡って観測を行なう経時型の実験で,時点ごとに繰り返し検定を行なうと, 3時間目と 7時間目では有意差があるが,聞の 5時間目では有意差がないという結果がしばしば起 こる. 5時間目で消失した効果が 7時間目で復活するとは考え難く, 5時間でもある程度の効果は あったものの, 5%水準ではたまたま有意にならなかったと考える方が合理的である.このような解 釈上の矛盾を避けるために,有煮差の*だげではなく,実際の P11直を示す~とを主張する統計の専 門家も多いが, p値がある程度小さくなると, p1 直自身の実質的な意味の解釈は困難で、ある.例え ばp=O.OOIとp=O.OOOOIの場合で,効果の大きさにどの程度の違いがあるかは明瞭ではない. p1 直は 帰無仮説の確からしさを表す指標であり,ある程度低ければ,帰無仮説を捨て,対立仮説の状況, すなわち効果の大きさを定量的に示し,結果の生物学的意味を評価することが必要になる. 検定の結果がミスリーディングであるもう 1つの代表例は,検定の結果が有意でないことによっ て,同等であると主張する場合である.検定の精度はサンプルサイズ N に依存している.したがっ て卜分 N が大きい場合は精度が高く,有意差が検出されなければ,同等であると主張するにはそれ なりの正当性があるが, Nが小さい場合は,実験の精度が十分でないため,本来ある差が見逃され た可能性がある .Nを小さくして統計的な精度を下げれば有意差がでにくく,同等だと主張しやす いという矛盾が起こる.このため最近では信頼区間に基づく同等性検証が要求されている.このよ うに検定の結果では,実験の精度に関する情報が直接示されない. 検定に対し信頼区間を用いると様々な利点があり,結果を解釈する上で有用な様々な情報を与え てくれる.例えばあるパラメータについての 100( 1一α) %の両側信頼区間を構成し,それが 0を含 まなければ,そのパラメータは水準 αで有意に 0 と異なることになる.この意味で信頼区間は検定 結果に関する情報を全て含んでいる. I点と問題点 表 1 信頼区間の手J 信頼区間の利点 し検定結果についての情報を含む(信頼区聞が 0を含まなければ検定結果は有意) . 2 . 効果の大きさが定量化できる. 点推定値(最もらしし、値) 信頼下限(悲観的な値) 信頼上限(楽観的な値) 3. 実験の精度を示すことができる(イ言頼区間の幅は f n!乙逆比例). 4 . 帰無仮説と対立仮説の双方の状況を矛盾なく記述することができる. 5. 様々な仮説(優越性,同等性,非劣性など)を同時に検証できる. 信頼区間の問題点 し様々な方法が存在する. (分散を帰無仮説,対立仮説のいずれの状況で評価するか, 適用した検定の種類) 2 . 計算が困難な場合がある. (例並べ替え検定に基づく信頼区間) 3 7 6

371.

2 . 信頼区間 ( c o n f i d e n c el i m i t )とは 信頼区間とはいったい何を意味しているのだろうか?あるパラメータ 0の両 f J l l J1 0 0( 1 α)%の信 頼区間を求めることは,数学的には P r{ L C L豆 O豆U C L } lα ( 1 ) 二 となる統計量 L C LとU C Lをデータに基づいて求めることである. 表 2 赤血球数データ (単位: X1 0 4 / r n m3) 群番号群用量 生データ 対照群 平均 SD SE O m g 9 2 59 1 79 1 29 1 2 949908 9 0 89 8 9931909 9 2 6 . 0 2 5 . 7 8 . 1 2 3 低用量 l r n g 8 9 89 2 59 0 88 7 39 0 89 4 18 9 39 2 09 2 29 3 1 9 11 .9 中用量 3 m g 8 7 48 7 69 1 69 0 88 7 38 0 78 7 49 1 99 5 29 1 6 8 9 1 . 5 2 0 .1 6 . 4 3 9 . 8 1 2 . 6 4 高用量 1 0 叫 3~4 8 6 99 1 98 7 48 5 2 830906 914898933 9 3 5 8 9 3 .0 1 1 . 2 表 2はある雄ラットの毒性試験の R B C (赤血球数)のデータである. 対照群のデータに基づいて母平均 μの両側 1 0 0( 1 α)%の信頼区間を求めてみよう.母平均の点 推定値は標本平均 x .になり,群ごとの分散を用いる場合,信頼区聞は次のように構成される. x. ー t111(α/2) ・ SE~μ 豆 x. ト t ,,‑ 1(α/つ ) S E ( 2 ) ここで t. "1 (α/2) は , 自由度 n ‑ lの t分布の上側 1 0 0(α/2)%点である. α=0.05とすると, 九 ( 0 . 0 2 5 )= 2 . 2 6 2であり, 95% ,の信頼区間は次のようになる. 926.0‑2 . 2 6 2・8 .1~玉 μ 三;926.0+2.262 ・ 8. 1 9 0 7 .7~三 μ 壬 944.3 母平均 μの9 5 %の信頼区間は 9 0 7 .7~944. 3となり,このことはこの範囲に μが含まれる確率が 9 5 % であることを意味しそうであるが,実はそうではない.母平均はある決まった lつの値であるので, その値を含むかは 0,1の事象で,確率的には表現されない.でドは信頼区間は何を意味しているのだ ろうか?この信頼区間は 1 0匹のデータに基づいて構成されたが,もう 1回実験を行なって,信頼 区間を構成すれば,前とは異なった区間になるはずである.実はこのよっな原理に基づいて信頼区 間を構成した場合,個々の信頼区間は μを含んだり,含まなかったりするが,確率的には 1 0 0田中 9 9 5 % )は真の値を含むことになる.逆にいうと,真値を見逃す確率を 5 %に抑えることができる. 5回 ( 表 3に母平均 9 2 6 . 0,標準偏差2 5 .7の正規乱数を 1 0個発生させて,両仮[ J 9 5 %の信頼区間を計算する試 行を ; : ; 0回繰り返すプログラムを示した. S U M M A R Yプロ、ンジャでは O U T P U T文で L C L M =U C L M =オプション を指定することにより,母平均の信頼区間の下限と上限が出力される. F i g l l r e1 では, 5 0個の信頼 区聞を G P L O Tプ口、ンジャで並べて示している.ほとんどの信頼区聞が真値である 9 2 6 . 0 (水平線で与表 示)を含んでいるが, 5 0田中 2回 ( 8,4 7番目の信頼区間)は外している.このように 100(1α)%の 信頼区間を構成すれば,真値を見逃す確率を α に抑えることができる. 表 3 信頼区間の計算プログラム d a t ac l d a t a : d oi =1t o5 0 ; 【1 0j = 1t o1 0 ; ; e n d ; e n d ; y = 2 5 . 7 * r a n n o r ( 5 9 6 3 ) + 9 2 6 . 0 ; 0 1 1 t pl1t r yd a t a = c l d a t a ; v a ry ;Ol1t pl1tOl1tcllcl皿= 1 l1c l皿= 1 1; b yi ; p r o cSl1凹 a l 1t = c l; v a r 1u ; b yi ; p r o ct r a n s p o s ed a t a = c lo p r o cg p l o t ; p l o tc o l l * i / v r e f = 9 2 6 . 0 ; s y m b o l li = h i l ocr e dV = n o n e ; 二 ニ 3 . 信頼区間の構成原理 3. 1 パラメータの分布の理論分布による近似 2節で示した例では, R B Cの分布に正規分布を仮定し,標本平均の標準誤差を計算し, ‑377‑ t分布

372.

の%点で幅を付けることにより信頼区聞を計算した.このようにデータに何らかの分布を仮定する ことにより,パラメータの分布を導き,信頼区間を計算するのが 1つの構成原理である.この信頼 区間の妥当性は,厳密にはデータの分布形の仮定の正当性に依存するが,多くの場合 Nが大きくな れば理論分布による近似の精度は高くなる.例えばS A SのL O G I S T I C,LIFEREGあるいは PHREGプロシ ジャでは,パラメータの推定法として最尤法を用いており,正規分布を用いてパラメータの信頼区 間を構成するが,その妥当性は漸近正規性による.すなわち最尤法によってパラメータ推定を行な えば,データの数が多くなると,パラメータの分布は正規分布で近似できる.先の R B Cの例でも, 標本平均は正規分布を仮定したときの母平均の最尤推定量でもあり Nが大きくなれば, t分布の 代わりに正規分布で幅をつけても問題ない.自由度が大きくなれば t分布は正規分布に近づくから である.このように Nが大きくなれば,パラメータの分布を正規分布などで精度よく近似できるが, パラメータ化の仕方によって近似のよさは大きく異なる.例えばオッズ比,ハザード比の場合,対 数変換した方が正規分布での近似がよくなることが知られており,通常対数変換した値で、i 帽をつけ てから,元のスケーノレに戻している.また Pearsonの相関係数の信頼区間を求める場合には, z 変 換 (Z= ( 1 / 2 )・log{ (1 汁)/( l ‑ r )}を行なう.様々な信頼区間の構成法が存在する 1つの理由は,近 似の精度をよくするために,様々な工夫が行なわれるためである. 960 950 940 930 R B C 920 111 9 1 0 900 B90 BBO 。 1 0 20 30 40 50 number F i g u r e1 官 uev alue andCon 五dence l i m i t 3. 2 検定ベースの方法 3. 1の方法は,パラメータの分布をどのように近似すべきかについての知識が必要で、あり,こ の意味で汎用的とはいえない.これに対してより一般的な方法は,検定ベースの方法である.信頼 区間とは,あるパラメータが存在する可能性が高い範囲と考えることができる.パラメータに対す るある仮説が棄却されれば,その値はもっともらしくないし,逆に棄却されなければその値はもっ ともらしいことになる.実は 1 0 0(1‑α)%の信頼区間は,有意水準 αで検定を行なってパラメータに 関する仮説が棄却されない範囲(帰無仮説の集合)である.これは信頼区聞が 0を含まなければ, 検定が有意であることの裏返しである.例えば, R B Cの信頼区間の例では Ho:μ=μ 。 を 1標 本の両側 t検定によって調べた際,棄却されない μ。の集合が信頼区間になる(表 4参照) .この 例では検定ベースの信頼区間は, 3. 1節の方法で構成された信頼区間に厳密に一致する.原理的 ‑378一

373.

には全ての検定に対応した信頼区間を求めることができる.検定ベースの信頼区間の大きな利点は, ノンパラメトリック検定に基づいた信頼区間を構成することができることである.検定ベースの信 頼区間は必ずしも左右対称にならず,より一般的な信頼区間の構成法は,信頼上限を求める場合は 下傾J I 検定(日。 :μ=μ 。 H 1:μ<μ 。 ) ,下限を求める場合は上側検定 (Ho:μ=μ 。 H 1:μ> μ。)を行い, p 1 1 直が α/2になる点を探すことである.下側検定では μ。が小さいときは下側確率が 大きいが, μ 。を大きくしていくと p値がノトさくなりやがて有意になる. したがって高くてもこの 点までという上限を求めることができる.逆に上側検定では, μ 。をノトさくすると,帰無仮説は棄 却されるので,下限を求めることができる. 表 4 信頼区間の構成原理 1.パラメータの分布の理論分布による近似 1 ‑ 1(α/2) ・ SE~μ 三 X. + t1 1 ‑ 1(α/2) ・SE 例) X.‑ t1 2. 検定ベースの方法 例)一標本の t検定で Ho:μ ニ μ。 が棄却されない範囲二信頼区間 t= (X.μ )/SE It I 壬 . t1 1 ‑ 1(a/ 2 ) となる上うな μe:l)>信頼区間 t1 1 ‑ 1(α/2) 豆 (X.一 μ。 )/SE壬 t,,‑ 1(α/2) t1 1 ‑ 1(α/2) . S E三 (X.μ 。 ) 孟 t1 1 ー1 (α/2) ・ SE X.‑ t,,‑1(α/2) ・ SE豆 μ。 壬 X .+ tn‑I (α/2) . S E 。 ‑検定ベースで両側(1 α)%の信頼区間を求めるための一般論 信頼下限:上側検定で p値が α/2になる点 信頼上限:下側検定で p値が α/2になる点 以下ー 2標本の t検定と枚べ替え検定を例にとって,検定ベースの信頼区間について解説する. • 2標本 t検定 表 5 2群の平均値の差の信頼区間 :μ2μ1+ム (μ2 μ1二ム) 仮説 Ho 検定統計量: t= (X2 . ム X1.)/SE + 1/n2 ) 02poolニ 2 :(Xij‑ X i・) 2/2 :(ni‑ 1 )] [SE=0 0001' SQRT(1/ n1 上傾J I 検定で棄却されない範囲: (X2' ム ‑ X1 .)/SE 孟 t01 '( α/2) → X 2 • ‑ X1・ tD F(α/2) ・ SE三ム 下側検定で棄却されない範囲. (X2 ' ーム ‑ X1 .)/SE 量 一 t01 '( α/2) → X2.‑ Xぃ+tDF(α/2) . S E孟ム 両侭I J 9 5 %の信頼区間: X2.‑Xぃ一 t01 '( α/2) ・ SE三ム三 X2.‑ X1 SE ・+tDF(α/2) ・ 例) t= ( 9 11 .9 ム 926.0)/SE= (‑14.1 ム)/SE いま DF=36であり, α=0.05とおくと t36( 0 . 0 2 5 )二2.028であるので, tの絶対値が 2 .028以内に入る範囲が 95%の信頼区聞になる.この例では(Jpoolの推定値は MSEの平 .2 1となり, SEはこれから 1 3 . 9 6と計算される. 方根をとった 31 したがって信頼区聞は, X2'‑ Xぃ 士 tD F(α/2) ・ SE=‑14.1士 2.028・1 3 .9 6ニ 4 2 .4~14. 2 表 2のデータでは,薬物の投与によってラットの赤血球数が低下傾向にあることがわかる.対照、 群と低用量群で t検定(正確には 4群間で分散をプールするので LSD法)を行なうと, t値 :1 .0 1, %水準で有意な差はない.また 2群の平均値の差(低用量群から 両侭Jp値 :0.319となり, 2群聞で 5 対照群を引く)は 1 4 .1 であり,この両側 95%の信頼区間は 4 2 .4~14. 2になる t検定では帰無仮説 t検定に基づいて を日。 :μ1‑μ2として検定するが,これは Ho:μ2 μ1=0とおいても等価である ‑379

374.

信頼区間を構成する場合, 仮説 Ho:μ2μl十ム (μz μ1=.6.)について検定を行い,棄却され ない範囲を探すことになる. . 6 .=0とすると,通常の検定と等しくなるが,この例では棄却されない ので,信頼区間は0を含むことになる,仮説 Ho:μ2μl十Aを検定するには, .6.の違いを補正す るため,低用量群の平均値から Aだけさしひいてから検定すればよい.上側検定の場合( H1: μ2>μ1+. 6 . ) .6.の値を小さく(負の方向)すると,逆に下側検定では( H 1:μ2<μ1十 ム ) .6.を大きく(正の方向)すると, t統計量の絶対値は,やがて棄却限界値を越え, Ho:μ2 μl十 Aは棄却されることになる.このようにして求めた信頼区聞は,表 5に示したように通常の信頼区 間に一致する. 二 ‑並べ替え検定 表 2は本来 4群で行われた実験ではあるが, しばらくの問説明を簡便にするため, 対照群と低 用量群の 2群で実験が行なわれたとして説明する. 毒性試験あるいは臨床試験では,通常,無作為化害J Iり付けが行われる.並べ替え検定では,観測 されたデータの差を,帰無仮説の下で無作為化割り付けが行われたときのデータの差の分布と,比 2 6 .0, 9 11 .9であり, べることによって p値を計算する.いま対照群と低用量群の各群の平均値は, 9 1 4 .1 の差がある同無仮説が正しい壬きに,得られたデータ以上に極端な芦:が出るのは,ど今程 度の確率だろうか?帰無仮説の下では,薬剤は赤血球数に影響を与えない.この例では 20匹のラ 0匹づっ無作為に割り付けたので, 20匹から 1 0匹を選ぶパターンが,全て等しい確率 ットを 2群に 1 (1/20C 1 0 ) で得られるはずで、ある.得られたパターンはこのうちの 1つのパターンとみなすこ とができる.この全てのパターンについて 2群の平均値の差を計算することによって,平均値の差 の並べ替え分布を計算することができる.この分布で,得られたデータ(一 1 4 .1 )以上に大きな差が 生じるパターンの割合が,並べ替え検定の p値である.この p値が大きければ, ‑ 1 4 .1という差は 帰無仮説の下で、生じたと考えてもおかしくないが, p値が小さい場合は帰無仮説はもっともらしく ないことになる.可能な並べ替えパターンの数は,この例では叩 C1 0=184756であり,この程度で あれば,全てのパターンを数え上げることも可能であるが,もう少し Nが大きくなると計算は不可 n p l i n g (事後的な無作為割り付け)を繰り返すことによ 能に近くなる.そこで通常はデータの re回 r って,正確な並べ替え分布を近似する (Westfall a n c l Young(1992)) 表 6 並べ替え検定の手順 1 得られたデータの平均値の差を計算する ( 9 11 .9 ‑ 9 2 6 .0 =一1 4 .1 ) 2 帰無仮説の下で 2群の平均値の差の並べ替え分布を計算する. 可能な組み合わせの数:20CIQ=184756 ‑ 1 4 .1)以上に極端なパターンの頻度を数え上げる. 3 並べ替え分布で得られたデータ ( (この頻度が全パターンに占める割合が,並べ替え検定の p値) SASでは MULTTESTプロシジャを用いて, re日 r n p l i n gによる並べ替え検定を実行することができる (浜田・吉田 (1992)). プログラムは表 7のようになる. 表 7 並べ替え検定のプログラム data p e r r n ; d og r o u p = lt o2 ; d oi = lt o1 0 ; i n p u t y自 由; output;end;end; c a r d s ; 9 2 59 1 79 1 29 1 2 949 908 908 989 9 3 19 0 9 898 9 2 5 908 8 7 3 908 9 4 18 9 39 2 09 2 29 3 1 p r o cr n u l t t e s t data=perm p e r r n u t a t i o n seed=4989;test m e a n ( y ); c l a s sg r o u p ; 380一

375.

PROC MULTTEST文で PERMUTATIONオプションを指定することにより,非復元再抽出 (pennutatio n ) による並べ替え検定が実行できる. リリース 6 .1 1からデフォルトですま 20000回の resarnplingによ る両側検定が行なわれる.結果は次のようになる. Contrast Raw̲p Perm̲p Trend O . 1885 O . 1999 Raw̲pが通常の 2群の t検定の p値 , Perm̲pが並べ替え検定の p値を表す. 20000回の resampling のうち平均値の差が, +14.1以上または 1 4 .1 以上になるパターンの割合は O .1999である. t検定の場合,等分散性と正規分布を仮定するため 2群聞の分布の違いは平均値に要約できる. これに対し,ノンパラメトリック検定では,分布形の仮定を必要としない.仮定するのは処置を施 Ho: すことによって,分布の形状は変わらないが,分布の位置がムだけシフトすることである μ 2 μ 1 +ムを t検定する場合,ムのズレを修正するため,用量群の平均値からムをヲ l し、たが,用 量群の 10匹の個別データから一律にムを差し引し、てから検定しでも,同じ結果が得られる.分布全 体がムだけシフトしでも,分散は不変であり, t統計量の分母は影響を受けない. このように分 布のずれがムであるか,より一般的に検定するためには,片方の群の個別データ全てについてムを ヲl し、ィから,検定を行なえばよい.ムの値を 40から 10まで,=づっ変化させて並べ替え検定を行な うプログラムを表 7に示す. 両側(1 α)%の信頼区間を求めるためには,上側検定でp値が α/2 (信頼下限)と下側検定で p値 が α/2 (信頼上限)になるムを見つければよい. 表 7 Ho:',12 μ1+ムの並べ替え検定のプログラム 二 data perm;set perm; do delta=‑40 to 10 by 5 ; i f grol 1p =1 then x=y; i f grol 1p =2 then x=y‑delta; Ol 1t put; end; proc so1 't d ata 二 r bc;by de1ta; proc l s 1 1 1 t t e s t data=rbc permutation noprint seed 4989 Ol 1t =l 1p per̲p; 二 test 皿ean(x/uppertailed);class grol 1p ;by delta; proc multtest data ニr bc perml 1t ation noprint seed=5963 ollt=lower̲p; test rnean(x/lowertailed);c1ass group;by delta; MULTTESTプロシジャの TEST文で, オプションを指定することにより上側検定, lower l Ip pertailed tailedを指定することにより,下側検定を実施している.上側と下側のそれぞれの検定で p値が O . 025になる点が両側 95%の信頼区間になる. 表 8 上側検定の結果(データセット UPPER P) OBS 2 3 4 5 6 7 8 9 1 0 1 1 DELTA ‑40 3 5 3 0 ‑25 2 0 ‑ 1 5 ‑10 5 。 5 1 0 TEST MEAN MEAN MEAN MEAN MEAN MEAN MEAN MEAN MEAN MEAN MEAN Y A R X X X X X X X X X X X LABEL Trend Trend Trend Trend Trend Trend Trend Trend Trend Trend Trend CONT 259 209 1 5 9 1 0 9 5 9 日 4 1 9 1 1 4 1 一1 9 1 2 4 1 SE 1 0 3 . 1 6 6 1 0 3 . 1 6 6 1 0 3 . 1 6 6 103.166 103.166 1 0 3 . 1 6 6 1 0 3 . 1 6 6 1 0 3 . 1 6 6 1 0 3 . 1 6 6 103.166 1 0 3 . 1 6 6 ‑381一 N 1 8 1 8 1 8 1 8 1 8 1 8 1 8 1 8 1 8 1 8 1 8 RAW P 0.01091 0.02893 0.07033 O .1 5 2 3 5 0.28723 0.46572 0.65213 0.80532 0.90573 O .95970 0.98437 PERMP 0.01180 0.03160 0.07215 O .15330 0.29880 0.47445 O .64625 0.79525 0.90510 O .96365 0.98890 SIMSE .0007636 .0012370 0018295 .0025475 .0032367 0035309 .0033809 .0028533 .0020724 .0013234 .0007408

376.

上側検定,下仰l 検定の結果をそれぞれ表 8, 9に示した.表中で PERM Pが並べ替え検定の p値を 示している.上側検定では,用量群の方が赤血球数が高くなる傾向を検出する.ムの値を低用量群 から引し、て検定を行なうことになるので,負の方向でムを大きくしていくと,用量群の平均値は大 きくなるので,上側検定は有意になり易くなる. 2群の平均値の差は一 1 4 .1 であるので,ム二 15と すると, p値は o .50にほぼ近くなる.ム二 35のとき, p値は 0.03160,ム二 40のときは, 0.01180で あるので,この聞に,信頼下限が存在することがわかる.用量群の平均値が 40以上低い可能性は 否定される. ) 表 9 下側検定の結果(データセット LOWER P O B S R DELTA 40 ‑ 3 5 3 0 2 5 20 一1 5 1 0 5 9 1 0 1 1 5 1 0 2 3 4 υ F G 7 。 TEST MEAN MEAN MEAN MEAN MEAN MEAN MEAN MEAN MEAN MEAN MEAN V A R X X X X X X X X X X X LABEL Trend Trend Trend Trend Trend Trend Trend Trend Trend Trend Trend CONT 2 5 9 2 0 9 1 5 9 1 0 9 5 9 9 4 1 9 1 1 4 1 1 9 1 2 4 1 S E 1 0 3 . 1 G G 1 0 3 . 1 G 6 1 0 3 . 1 G 6 1 0 3 .1 6 6 1 0 3 . 1 6 6 1 0 3 . 1 6 G 1 0 3 .1 6 6 10~. 1 6 6 i 0 3 . 1 6 6 1 0 3 . 1 6 G 1 0 3 . 1 6 6 N 1 8 1 8 1 8 1 8 1 8 1 8 1 8 1 8 1 M 1 8 1 8 RAW P 0.98909 0.97107 0.929G7 8 4 7 6 5 0 . 7 1 2 7 7 O .53428 O .34787 0.194G8 u . 0 9 4 2 7 O .04030 0 . 0 1 5 6 3 . 。 PERMP 0.98740 o .97275 0.92980 O .8 4 8 4 5 O .70970 O .5 3 9 7 0 0.36235 0 . ?l )3 6 5 0.09915 O .0 3 7 3 5 0.01100 SIM S E .0 0 0 7 8 8 7 0 0 1 1 5 1 2 . 0 0 1 8 0 G 5 . 0025356 0032096 0035244 0 0 3 3 9 8 9 0028476 0 0 2 1 1 3 : 3 0013408 .0 0 0 7 3 7 5 下側検定では,用量群の方が赤血球数が低下する傾向を検出する.正の方向でムを大きくしてい くと,用量群の平均値は低下するので有意に出やすくなる.ム =5,10のときそれぞれ p値は 0.037 35と0.01100になるので,この辺が信頼区間の上限値となることがわかる.仮説ム =0を検定すると 棄却されないが,ムニ 10は棄却されるので,低用量群の平均値が 10以上高い可能性は否定される. このようにムの値を動かして,検定したときの p値を Figllre 2に示した.上側検定が実線, 下傾j I . 検定が点、線で示されている.この 2つの曲線が 0.025の水平線と交わる点が信頼区間の下限と上限 になる. 並べ替え検定に基づく信頼区間の構成法を述べたが,他の検定ベースの信頼区間も容易に構成で きる.例えばムの値を変化させて,並べ替え検定の代わりにウイルコクソン検定を用いれば, ウイ ノレコクソン検定ベースの信頼区間を構成できる.実際一標本のウイルコクソン検定に基づいた点推 定値は Hodges‑Lehmann推定量として知られている.また平均値の差の信頼区間を構成するために, 2群からムを引し、て検定したが,比の信頼区間を構成するためには 2群の個別データをムで害j Iって から検定すればよい.浜田・大橋等 (1994)は,再発事象データの解析で,再発率の比について並べ 替え検定に基づいた信頼区間を求めることを提案している.このように検定ベースの信頼区間は非 常に汎用的で応用範囲が広い.ノンパラメトリック検定に基づく信頼区間は,分布形に関して仮定 を置く必要がなく,また外れ値の存在に対してロバストになることが期待できる. 並べ替え検定に基づく信頼区間の場合,少し注意が必要である. resamplingに基づ、く p値はサン プリングに伴う誤差を伴う. resamplingの回数を増やすことによって精度を上げることは可能であ るが,信頼区間を計算するには,逐次的にムの値を p値が α/2に近くなるように変化させて計算す る必要がある.このため計算時間を短縮するための工夫が必要にある.この例ではそれぞれのムに ついて, 20000回の resamplingを行なったが,本来の目的は片仮jp値が 0.025になるような点を見つ けることであった.この意味では p値が 0.50に近いところで,ムについて検定を行なうことは意味 がない. p値が 0.0251こ近くなるようなムを早く見つけて,その点に近いところでなるべく多く res ampling することが望まれる.このために 1回ごとの resamplingの結果に基づき,ムの値を修正す るのが Garthwaite法でおある (Garthwaite(1996)) • • Garthwait法 i 二1 , 2, ・・・, Mまでステップがあるとする. パラメー夕日の両側 100(1α)%の信頼上限を e uとおく . e uを求めるためには ‑382‑ H1: e <Uj

377.
[beta]
!
p

¥

︑
一

︑
︑
︑

︑
︑

︑
︑︑
︑︑
︑
︑
︑︑
︑

va‑‑ue

‑
1
‑
'

[‑1 了 寸 「

‑40

‑30

。

‑‑,‑了

‑20

│丁「寸

‑10

"..‑ーア

1
0

DELTA

F
i
g
u
r
e2 Per
m
u
t
a
t
i
o
nt
e
s
tbased95%CL

j
r…

~

C
L

~竺竺=-

。

1i i

1000

j

2000

i ;‑
1

j‑‑ j

1
‑
1了寸

3000

4000

F
i
g
u
r
e3 95%Confidencel
i
m
i
tbyG
a
r
t
h
w
a
i
t
<
!
m
e
t
h
o
d

‑383

5000

378.

に対し Ho:白 Ui の下側検定を行い p値が α/2になる点を求めればよい. このとき iステッ e s a r n p li n gの結果に基づいて Uilの値を次のように更 プ目の信頼上限の推定値を Ui とすると , r 新する I F T(U)>T' (Ui) U j • 1 = U j ー c(α/2)/i ( 3 ) I F T (U;)~ T' (Ui) U j'l= U j +C ( 1一 α/2)/i ( 4 ) ここで T (Uj )は,帰無仮説 Ho:白 Uj を検定する際の,実際のデータの検定統計量(例え , T(U;)は r e s a r n p l i n gを 1回行なった際の再標本における検定統計量の値である. ば平均値の差) また cは適当な大きさの正の定数である. U j が信頼上限に近ければ,下側検定の結果が有意にな る確率 (T(U)壬 T (Uj ))は α/2に近くなる. ここで α/2=Pr [ T (U;)豆 T (Ui)]と置くと,各ステップ当たりの変化量の期待値 E [UP1‑ U j J は α/2X c(1α/2)/i一 (1‑ a/2) X (cα/2)/i c(同 /2α/2)/i となる .α/2 >α/2のときは,信頼上限より下にあるので値を上げ, α/2<α/2のときは,上 にあるので下方に修正を行なう. α/2 ニ α/2であれば,変化量の期待値は 0である.このような 逐次的な修正を行なうと i →∞で、は, Uj は e u~こ収束する.実際にはM=5000 回程度の resampling で私かなりよい推定値が得らわる. 信頼下限を求めるときは,次のょっに修正を行なう. I F T(L;)<T (Lj) L川 Li +c(α/2)/i ( 5 ) I F T (L)~T 去 (L i ) Lド 1 ‑ Lj ー c(1α/2)/i ( 6 ) 定数 cと初期値の与え方については Garthwaite(1996)を参照されたい. Figure 3に RBCデータ e s a r n p l i n gを行なった場合の信頼区間の推定値を示した. について Garthwaite法によって逐次的に r . 初期値は 2標本の t検定に対応する通常の信頼区間に基づき,下限・上限の初期値は ‑35.7744,7 5741と設定した. Figure 3には横軸に試行回数 ( i ),縦軸に信頼区間の推定値を示した.また通常 の信頼区間の値を水平線として示している.試行の回数が少ないときは,不安定で、あるが, 4000回 を過ぎた付近から,安定した推定値が得られることがわかる.並べ替え検定に基づいた信頼区間は, 通常の信頼区間と比べて上限も下限もやや低めの値をとることがわかる. 十 去 寓 二 旗 4節以降,いくつかの指標について SASのプロシジャを用いて信頼区間を計算する方法について 解説する. 4. 割合と害IJ合の差の信頼区間 次の仮想、データに基づいて割合と割合の差の信頼区間を計算してみよう. 改善なし 標準薬 新薬 30 20 改善あり 70 80 計 1 0 0 1 0 0 改善割合 70% 80% 表 10 害1 合と割合の差の信頼区間のプログラム datae x a m p l e ; d od r u g = Ot o1 ; ニo t o1 ; d oy i n p u tw @ 曲; o u t p u t ; e n d ; e n d ; c a r d s ; 3 07 0 2 08 0 p r o cf r e q data=example;tables d r u g * y / n o c o ln o p e r c e n tr i s k d i f f ; i f f ; weightw;outputo u t = o u t risk【l ‑384

379.

F l i E Qプロ、ンジャではリリース 6 .1 2から,割合と割合の差の信頼区間を計算することができるよう になった.ただしこの機能は行変数と列変数が 2値の場合に限られ,多群の場合には計算できない ことに注意してほしい.プログラムは表 10のようになる. TABLES文で, RISKDIFFオプションを指定することにより,信頼区聞が計算される.また OUTPUT文 を指定することにより,計算結果をデータセットに落とすことも可能でおある.出力結果は表 11の ようになる. ,¥ Iow 2 ), 2つの群を合わせた場合 (Tota1 )につい 最初に C011I1ll1l 1について,各群ごとと (Row 1 て,割合 (Risk),ASE(漸近的な標準誤差),漸近的な 95%の信頼区間,正確な 95%の信頼区聞が出力 され,その下に DifferCllceとして 2群の割合の差 ( R i s k ) ,割合の差の標準誤差 ( A S E ) ,割合の 差の漸近的な信頼区聞が出力される.割合の差についての正確な信頼区間の計算は簡単ではないた め出力されないが, SASを用いたマクロがある (Coe( 1998)). 続いて C o 1 l l l l l l l n 2についても同様の結 果が出力される.デフォル卜では両仮I J 9 5 %の信頼区聞が出力されるが, alpha二オプ、ンョンを指定す ることにより両側(1 α)%の信頼区間を計算することができる. 表 11 割合と割合の差の信頼区間の出力結果 T A B L EO FD I W G[ ] YY D R U G Y F r e q田 町 y l R o wP c t 0 1 I 1 T o t a l 一 一 一 一 一 +ー + + 一 一 一 o1 3 01 7 01 13 0 .0 01 7 0 .0 01 一 一 一 一 一 一 + 一 一 一 一 +一 + 11 2 01 R O1 12 0 . 0 01 8 0 . 0 01 T o t a l 5 0 1 0 0 1 5 0 1 0 0 2 0 0 S T A T I S T I C SF O RT A s L EO FD I W G[ ] YY C 0 1 U I I I I l 1R i s kE s t i m a t e s 9G%C o n f i d e n c eB o u n d s 9 5 %C o n f i d e n c eB O l l n d s R i s k A S E ( A s y m p t o t i c ) ( E x a c t ) 0 . 3 0 0 R o w1 O .2 0 0 R o w2 T o t a l 0 . 2 5 0 D if f c r e n c e 0 . 1 0 0 ( R o w 1‑R o w2 ) R i s k R o w[ O .7 0 0 0 . 8 0 0 R o w2 T o t a l O .7 5 0 0 . 1 0 0 D if f e r e n c e ( R o w 1‑R o w2 ) O .0 4 6 O .0 4 0 0 . 0 3 1 0 . 0 6 1 0 . 2 1 0 O .1 2 2 0 . 1 9 0 0 . 0 1 9 0 . 3 9 0 0 . 2 7 8 0 . 3 1 0 0 . 2 1 9 0 . 2 1 2 O .[ 2 7 0 . 1 9 2 0 . 4 0 0 O .2 9 2 0 . 3 1 6 C o l u m n2R i s kE s t i r n a t e s 9 5 %C o n f i d e n c eB O l l n d s 9 5 %C o n f i d e n c eB o u n d s ( A s y m p t o t i c ) ( E x a ct ) A S E O .0 4 6 0 . 0 4 0 0 . 0 3 1 . 0 6 1 。 0 . 6 1 0 O .7 2 2 O .6 9 0 ‑ 0 . 2 1 9 0 . 7 9 0 O .8 7 8 0 . 8 1 0 0 . 0 1 9 0 . 6 0 0 O .7 0 8 0 . 6 8 4 0 . 7 8 8 0 . 8 7 3 0 . 8 0 8 0 0 S a r n p l eS i z c= 2 0.80になり,その漸近的な標準 C 0 1 l l l l l l l 2については,標準薬群と新薬群で割合はそれぞれ 0.70, A S E )はそれぞれ O .046と0.040になるが,これは 2項分布の分散の公式 ( 7 )に基づく.各群のサ 誤差 ( ンプルサイズを N,割合を p としたとき, ( 7 ) ASE=SQRT( p( l ‑ p )/N) ‑ 3 8 5一

380.
[beta]
となる. SQRTは()内の平方根を計算することを意味する.例えば新薬群では
¥
tSE= SQRT(p(
l‑p)/N)=SQRT(O.80・(1‑0.80)/100)=0.040
となる.
2項分布は pが0または lに近くなく,かつある程度 Nが大きくなれば,正規分布で近似できるの
で,正規分布の%点で、幅をつけて,信頼区間を計算する.正規分布の上側 α%点を Zoとすると.両
8
)式のょっに計算される.
側(1一 α)%の信頼区間は (
p
:
:
!
:
: Zα/2 ・ ASE= p士 Zα/2 ・ SQRT(p(l‑p)/N)
(
8
)
α=0.05とおくと Zα/2二し 96であり,新薬群では両倶I
J
9
5
%の信頼区間は次のようになる.
p士 Z /2' ASE= O
.8
0
0
:
:
!
:
:1
.96・O
.040= O
.722~0. 878
この信頼区間は割合の分布を正規分布で近似した信頼区間である.これに対して正確な信頼区間
は 2項検定に基づいて計算される.上側 2項検定によって信頼下限が,下側 2項検定によって信頼
上限が決定される.
: π > π 。の上側検定を試み
最初に改善割合が πだとして,帰無仮説I‑Io:π=π 。,対立仮説I‑I[
る.新薬群では 100人中 80人が改善していたが,真の改善割合が π。だとして 80人以上改善する確率
は
, 2項分布に基づいて次のように計算される.
0

1
0
0

P1
I
=
.
E[
u
oCi
π ぷ(1一 π。
)[ 叶 l

(
9
)

i=80

この確率が小さければ, π。の値はもっともらしくないといえる .πoの値を下げていくと 80を超
える確率は小さくなっていく
PlI=0.025になる π。
が πの信頼下限となる.この値以上に πが低
いことは確率的にありそうではない.
;=π 。,対立仮説 H[:π<π 。の下側検定を試みる.真の改善割合が π。
だ
、
と
次に帰無仮説J‑Io:n
して,改善する人が 80人以下である確率は次のようになる.
)
ハ
U
(

80

EA
唱

P[=~ 1
U
OC iπUi
(1 π 。
)1
∞
一i
j=O

πOの値を上げていくと 80以下になる確率は小さくなっていく
P[=0.025になる π。
が πの信頼
上限となる.計量データの並べ替え検定の例とは異なり,割合については, π。の値を逐次的に変
えて p値を計算しなくても F分布を利用して解析的に正確な信頼区間を求めることができる. FR
EQプ口、ンジャではこの方法を採用している.ここでは正確な信頼区間の下限と上限において 2項倹
I
合は 0.80,両側 95%の信頼
定の p値が α/2になることを確認しておく.新薬群については,改善害J
.708~0. 873となった.少数点以下 3桁と桁数が十分でないので,データセットに落とした
区間は O
結果から 5桁まで拾うと,信頼区間は O
.70816~0.87334 となる. 2項分布の累積確率は PROBBNML
関数を用いて計算することができる
PROBBNML(p,n,m)と指定すると,改善割合が pのとき,
n人中,改善する割合が m人以下で、ある確率を計算する.この関数に基づき,信頼下限における上
側検定と,信頼上限における下側検定を計算するプログラムは次のようになる.

表 1 2 PROBBNML関数による上側確率と下側確率の計算
datab
i
n
p
;
pu=l‑probbnml(O.70816,1
0
0,
7
9
)
;
p1
=
p
r
o
b
b
n
m
l(
0
.8
7
3
3
4,1
0
0,
8
0
);
p
r
o
cp
r
i
n
t
;

結果は次のようになる.
CO
Ru

n
u

PU

PL

0
.
0
2
5
0
0
3

0
.
0
2
5
0
0
8

‑386一

381.

有効桁数の範囲で,確かに p値が 0.05/2になることを確認できる. 2群聞の割合の差の信頼区間については,正規分布で近似する方法のみ可能である. 2つの群のサンプルサイズ,改善害J I合を,それぞれ N p N2, P l' P2とすると, 割合の差は P1 ‑ P2=0.7 0 ‑ 0 .80=‑0.10 ) ‑ l ( その標準誤差ASEは , ASE= SQRT(Pl(I‑Pl)/N +p2(I‑P2)/N2 ) ニ SQRT(0.70・ ( 1‑0.70)/100+0.80・(1‑0.80)/100) 0.061 となり,正規分布で近似した両側(1一 α)%の信頼区間は , ‑ , , , , P P2士 Z 1 2 ・ ASE= P ‑P2士 Znl 2 ・ S QRT(p (I‑p)/N +p2(I‑P2)/N2 ) α=0.05とおくと Z は 12=1 .96であり, P1 ‑ P2士 Zα 1 2・ A SE 0 . 1 0 0 : : ! : :1 .96・0.061=‑0.219~0. 019 け ( 1 2 ) 二 となる. 5. 7十ッて比の信頼民間 SASではオッズ比の信頼区間として Wald,尤度比検定に基づく信頼区間,正確な信頼区間の 3種 を計算することが可能で、ある Waldの信頼区間は,対数オッズ比の分布を正規分布で近似するこ とによって計算される.正確な信頼区間は並べ替え検定 (Fisherの正確検定)に基づいた信頼区間で ある.正確な信頼区間については FREQプロシジャで計算可能であるが,浜田(1997)に詳述されてい るので,ここで、は Waldと尤度比検定に基づく信頼区間について説明する. 次のデータは経口避妊薬 (OC)と心筋便塞の関連を調べるために行われた,ケースコントロール研 究のもので、ある (Mann( 1975)). 心筋使塞を起こしたケース 58人に対して 166人のゴシトロールを選 んで, OCを服薬していた人の割合を比 l絞している. OC‑ OC+ 計 心筋便塞 132 34 1 6 6 a ! J 心筋梗塞+ 35 23 58 c d この結果に基づいて経口避妊薬の心筋便塞に対するオッズ比を求めると, ( 13 ) bXc )= 132X23/(34X35)=2.551 オッズ比 =aXd/( となる.心筋梗塞の頻度は希であるので,オッズ比は相対リスク比をよく近似し,経口避妊薬は心 筋梗塞のリスクを 2.551倍に増大させることがわかる. また対数オッズ比の標準誤差は次のようになり, SE{logOR} =SQRT(I/a+l/b+l/c+l/d) SQRT(I/132+1/34+1/35+1/23) 0.3302 二 二 ( 1 4 ) 対数スケーノレでのオッズ比の両側(1‑α)%信頼区間は,次のようになる. l o g O R : : ! : :Z,, / 2X SE{ logOR} いま, α=0.05とおくと zα/2二1.96となり logOR士 ZαX SE{logOR} =0.9366士1.96XO .3302=0.2894~ 1 .5838 ( 15 ) これを指数の肩に乗せたものが,実数のスケールでのオッズ比の両側 95%の信頼区間になる. exp( logOR士1.96X SE{ logOR} 二 )exp( 0 .9 3 6 6 : : ! : :O .3302)=1 .336~4. 873 オッズ比の信頼下限が 1を上回るので0である可能性は否定され,これが 5%水準の検定で有意に なることに対応する.この信頼区聞は,いわば対数オッズ比の分布を正規分布で近似したものであ る.このオッズ比については FREQプロシジャでも計算可能であるが,ここでは LOGISTICプロシジ、ヤ を用いてオッズ比とその信頼区間を計算する. 387‑

382.
[beta]
13

Xが 0.1変数の場合のロジスティックモデルとオッズ比

。

I
o
g
(
p
/
(
I・
p))=β +β1・x

薬剤一群 (Xニ 0) : log(pj(
l‑pー
))ニム

:薬剤一群の対数オッズ

l‑p+))=+s1 :薬剤+群の対数オッズ
薬剤+(X=1) : log(p+/(

上の 2つの式で,下の式から上の式の右辺と左辺同士を引き算すると,次のようになる.

。

。

I
o
g
(
p
+
/
(1
‑
p
+
)
)一 I
o
g
(
p
̲
/
(l
‑
pー
)
)
二 β +β1一 β

=Iog{ p
+
/(
l‑p+)/(/(
l‑p̲))}=β1
p
+
/
(l‑p+)/(/
(
I
‑
pー ))=exp(β1)= p+:

exp(β1) = 1 β 1=0

pー< p+:

exp(β1) > 1 β 1>0

Pー > p+:

exp(β1) < 1 β 1<0

.対数オッズ比
:オッズ比

玄 13に示したように, W;
ジスティックモギルにおいて,説明変数として 012値変数のみを
指定した場合,推定された β1は対数オッズに相当し,

zαX SE{β1) で幅をつけて,指数の肩に

乗せて,元のスケールに戻したものがオッズ比の Waldの信頼区間になる.
プログラムは表 14のようになる.
表 14 ロジスティックモデルによるオッズ比 (Wald法)の計算プログラム
datao
d
d
s
;
【
1
0o
c ot
o1
;
d
o y=O t
o1
;
申;
o
u
t
p
u
t
;
e
n
d
;
e
n
d
;
i
n
p
u
tw @
c
a
r
d
s
;
1
3
23
53
42
3
二

p
r
o
cl
o
g
i
s
t
i
cd
a
t
a
=
o
d
d
sd
e
s
c
e
n
d
i
n
g
;
I
l
lo
d
e
1y
=
o
c
/
c
lr
l
; weight

w
;

MODEL文の CLオプションが推定値 s
,RLオプションがオッズ比についての信頼区間を出力するた

めの指定である.デフォルトでは両側 95%の信頼区聞が出力される. ALPHA=オプションで値を指定
すると,両側 (
1
‑ALPHA)%の信頼区聞が出力される.結果は表 15のようになる.
さてこれに対し尤度比検定ベースの信頼区間を計算するプログラムは表 16のようになる.
MODEL文の PLCLオプションが推定値 s,PLRLオプションがオッズ、比についての尤度比検定に基づい

た信頼区間を出力するための指定である. p
lはprofile likelihoodの略である.結果を表 17に示
した.

3
8
8
383.

表 1 5 Waldの信頼区間 M o c l e l Fitting Information and Testing Global N l l l l Hypothesis BETA=O Intercept Intercept and Crite1'ion Only Covariates C h i ‑ S q l l a r ef o1' Covariates AIC 258.226 252.358 .1 3 1 SC 2 51 257.612 7.868 with 1DF ( p 0.0050) 256.226 248.358 2 LOG L 8.329 with 1DF ( p = 0 . 0 0 3 9 ) Score Analysis of M a x i m l l m Likelihood Estimates ・> S t a n d a r c l i z e d Odds Parameter S t a n c l a r c l W a l c l P l Variable DF Estimate Error C h i ‑ S q l l a r eC h i ‑ S q l l a r e E s t i r n a t e Ratio INTERCPT 1 ‑1.3275 0.1901 48.7489 0.0001 OC 1 0.9366 0.3302 8.0449 0.0046 1.943436 2.551 二 Parameter Estimates a n c l 95% Confidence Intervals W"ld C o n f i c l e n c eL i r n i t s Parameter Upper Variable Lower Estimate 1 .7 0 0 1 O .9548 1 .3275 INTERCPT 1 .5838 0.2894 0.9366 OC Con【l i t i o n a l Odds Ratios and 95%Confidence Intervals Wald im iL:; Confid日nじ巳 L Odds Lowel ・ Variable Unit Upper Ratio 1 .0000 OC 2.551 1.336 4.873 表 16 尤度比検定ベースの信頼区間の計算プログラム proc logistic data odds descending ; 阻o del y=oc/ p l c lp l r l ; weight w ; 二 表 17 尤度比検定ベースの信頼区間 Parameter Esti皿ates and 95% Confidence Intervals Profile Likelihood Confidence L i r n i t s Parameter Upper Variable Lower Estimate ‑0.9671 ‑ 1 .3275 ‑ 1 .7148 INTERCPT 1 .5844 0.9366 0.2854 OC Conditional Odds Ratios an【19 5百 Confidence Intervals Profile Likelihood Confidence Limits Odds Lower Upper Variable Unit Ratio 1 .0000 2.551 1.330 OC 4 .876 389

384.

2 * l o g( L ) ‑248.37 ‑265.43 ‑282.48 ‑299.54 ‑0.70 ‑ 1 . 1 3 BETAO 2 . 0 0 ‑1.57 ‑2 . 0 00 . 0 0 F i g u r e4 P r o f i 1 e1 i k e 1 i f o o ds u r l a c e !B ETAO ‑0.70 │ー1.02 114J11t4114 司 I1111 寸 JI‑‑j 寸 l 4A4iqL phnonu qJRunu .• 0 . 0 1 .5 1 .0 0 . 5 BET A1 21 0 g ( L ) ‑252 合 F i g u r e5 Uk e l i f o o dc o n t o u r ‑390一

385.

パラメータ s1とオッズ比の推定値自体は同じであるが,信頼区間の値は若干異なってくる. 。の 点推定値は 0 . 9 3 6 6に対し下限 ( L o w e r )はO .2 8 5 4であるから,その差は O .6 5 1 2,これに対し上限 ( U p p e 8 4 4であるので点推定値との差は 0 . 6 4 7 8であり,左右対称にはなっていない.この尤度比検 r )は1.5 定に基づいた信頼区間はどのように計算されたのだろうか? L O G I S T I Cプ口、ンジャでは,最尤法に 基づいてパラメータの推定を行なう.この方法ではデータに対して , s0' s1 を動かして最もあ k e l i h o o d ) てはまりのよいモデ、ルを探す.このときモデルの当てはまりの良さを示す指標が尤度(li であり,最尤法では,尤度が最大になるようなれ , s1 の組み合わせを見つける.このようなプ ロセスで得られたのが 3の推定値である.またパラメータ s0' s1 の値を変化させて尤度を計算 させたものをプロファイル尤度関数とよぶ.表 15では尤度の対数をとって ‑2倍したものが‑ 2L O .3 2 7 5, s1 = 0 .9 3 6 6のとき尤度が最大になり,この点 GLとして出力される.この例では so 1 O GL = 2 4 8 . 3 5 8 ( I n t e r c e p ta n dC o v a r i a t e s )になる.対数尤度のマイナスをとっているので, で 2L この値が小さい方がモデルの当てはまりがよいことになる.この統計量の左隣には,説明変数 O Cを 含めない (s1 Oに固定する)で , s。のみを動かした場合の最大尤度が示されている ( ‑ 2L O G L=256. 2 2 6 ) . パラメータの数が多い方が,データに対するモデ、ルのあてはまりがよくなる.尤度比検定で 0 )の下で, は変数を追加したときの,尤度の変化に基づいて検定を行なう.すなわち帰無仮説 (s1= 2~円G L (変数を入れ 3前)‑ 1 ‑ 2I . O GL (変数を入れた後)) の分布はカイ 2乗分布にしたがうことが知られている. したがって,この値がカイ 2乗分布の 5 %点 3 . 8 4より大きければ, 5 %水準で、 s1 Oは棄却されることになる. 尤度比検定に基づいた信頼区間では,パラメータ s1を最尤推定量の周辺で変化させて,尤度比 検定で有意にならない範囲を見つける.最尤推定量の点で 2L O GL = 2 4 8 .3 5 8であるので ‑ 2L O G がこの値より 3 .8 4高し、 2 5 2 .1 9 8になる点までが slの9 5 %の信頼区間である. L 二一 二 二 II 1 1 1 o 1 BET A1 F ig u r e6 P r o f i l el i k e l i h o o d ‑ 3 9 1

386.

F i g l l r e 4に 3 。の値を O .70~-2. 00, s1 の値を 0.00~2.00 まで動かしたときの尤度関数の曲面を 示した.図中では 2X対数尤度をプロットしているので値が高い方があてはまりがよいことになる. もちろんム二1.3275, s1 =0.9366の点で対数尤度が最も高くなる.この図から 2つのパラメータ の推定量には負の相聞があることがわかる.すなわち s1が大きいときはんを負の方向で大きくし た方が尤度が高くなる. Figllre 5にこの曲面を 2X対数尤度が ‑252.198になる点で切断したときの 断面(等高線)を示した.楕円の左端と右端カ~ s1 の信頼区間の下限 ( 0.2854)と上限(1.5844)になる. s oと s1 の推定量には負の相聞があり, s1 を固定したときに最大の対数尤度を与える s oの値は, s1 の値に依存して異なってくる.したがって s1 の信頼区間の下限と上限では s oの値が異なる こ 日 1 ,縦軸に s1を固定した上でんを自由に動かしたと ことに注意してほしい. Figllre 6に横軸 l きの最大となる対数尤度を 2倍したものを示した . s0' s1を同時に動かしたときの 2X最大対数 尤度と比べて, 3.84落ちる点までが 95%の信頼区間である.このようにして求めた日についての信 頼区間を eの肩に載せたものが,尤度比検定に基づいたオッズ比の信頼区間である.この例では尤 度比検定ベースのオッズ比の信頼区間(1.330~4. 876)は,通常の信頼区間(1.336~4. 873)とあまり 異ならない.理論的には 2種類の原理から導かれる信頼区間は, サンプルサイズがパラメータの 数に比べて大きくなると,ほぽ一致するはずである.逆にし、えば, 2種類の信頼区聞が大きく異な る場合は,友;さりたちのよい推測でない可能性がある.参考までに FRE0.プ口、ンジャで.斗ツズ比の 正確な信頼区間を求めると, 1 .260~5. 09¥:1となり,他の方法と比べて,若干大きめになる. 6. 多重性を考慮した平均値の差の信頼区間 3節では, 2つの平均値の差の信頼区間を構成法を示した.この方法はいわば 2標本の t検定の 結果に対応した信頼区間である.表 2のデータは実際には 4群からなり,このようなデータの群間 比較では,検定の多重性の問題を避けるため,多重比較の手法が用いられている.信頼区間を構成 する際,検定の多重性を考慮すべきかどうかについては議論の余地があるが,用いた検定結果と信 頼区間の表示が矛盾しないように,多重性を調整した信頼区聞が必要となる場合もあるだろう. SA SのGLMプロシジャでは,数多くの多重比較の手法が可能でトあり,対応した信頼区間を出力すること もできる. MEANS文に多重比較のオプションが用意されているが,これは一元配置型のデータ構造 のときのみしか用いることはできない.より一般化した状況で利用することが可能な, LSMEANS文 による信頼区間の構成について紹介する.プログラムは表 18のようになる. 表 18 多重性を考慮した信頼区間のプログラム data r b c ; d o group=l t o2 ; d oi = lt o1 0 ; i l l p l l t y @@;outpllt;end;end; cards; 925 917 912 912 949 908 908 989 9 3 1 909 898 925 908 873 908 9 4 1 893 920 922 9 3 1 874 876 916 908 873 807 874 919 952 916 869 919 874 852 830 906 914 898 933 935 proc g l皿 data=rbc;class group; model Y g r o l l p ; 1smeans g r o l l p /tdiff pdiff c 1a d j l l s tt ; lsmeans g r o l l p /tdiff pdiff c la d j u s t = d l l n l l e t t; tdiff pdiff cl adjllst=tllkey; lsmeans g r o l l pI 二 二 LSMEANSのCLオプションが平均値の差の信頼区間を計算するための指定である.デフォルトでは 両側 95%の信頼区聞が出力される. ALPHA=オプションを指定すれば, 100( 1一α)%の信頼区間を構成 392‑

387.

することができる. AD]UST=Tを指定すれば,多重性を調整しない 4群で、プールした通常の信頼区聞 AD]USl 可) UNNETTの指定によって,対照群と各用量群の比較の多重性を調整した信 が出力される 頼区間が出力される.また AD]UST=TUKEYによって,全ての群問の対比較の多重性を考慮した信頼区 聞が出力される.結果は表 19のようになる.ここでは平均値の差の信頼区間に関連した出力のみ In nett→ Tl Ik eyの1 ) 買に信頼区間の帽が広くなることがわかる. を抜粋した. t→ Dl AD]UST=Tを指定すると LSD法に対応した信頼区聞が次の式に基づいて計算される. Xi.‑ Xj. : ! : tDF( α/2) ・ SE ( 16 ) ここでSEは SE a0001 • SQRT(1/ n i十 l /l1j ) として計算される. 二 表 19 多重性を考慮した信頼区間の出力 L e a s tS q l l a r e sM e a n sf o1' e f f e ctG RO l f l > 9 5 首 C o n f i r l e n c eL il l l i t sf o1' LSMEAN( i) -LS~1EAN(j) 1 J . 1 1 1 2 2 3 2 3 4 3 1 ' 1 下側 信頼 限界 ‑ 1 4 .206829 6 .1 9 : 1 1 7 1 1 .G93171 ‑7.906829 ‑9.105829 ‑29.806829 平均 の 差 1 4 .100000 3 ' 1 .500000 33.000000 20.400000 18.900000 ‑1.500000 上側 信頼 限界 42.406829 G 2 .806829 61.306829 48.706829 J 47.20582! 26.806829 N O T E :T oe n s u1'eo v e r a l lp r o t e c t i o nl e v e l,o n l yp r o b a b i1 i t i e sa s s o c i a t e dw it h p 1 'e ‑ p l a l l l l e dc o m p a1'i s o n ss h o l l l db el Is e d . A d j l l s t l l l e n tf o r1 I1 1 1 t i p l ec O l l l p a r i s o l l s :D l In n e t t L e a s tS q u a r e s¥ l e a n sf o re f f e c tG R O U P 95% C o n f i d e n c eL il l l it sf o rL S M E A N (i ) ←L S M E A N( j ) 1234 同時 下側 信頼 限界 4 8 .32569! J 6 8 .725699 67.225699 平均 の 差 H.IOOOOO 34.500000 33.000000 同時 上側 信頼 限界 2 0 .125699 0.27 ' 13 0 1 1 .225699 A d j u s t m c n tf o rl I Iu l t i p l ec O l l l p a r i s o n s :T u k e y L e a s tS q u a r e sM e a n sf o re f f e c tG R O U P 9 5 百 C o n f i d c n c eL i m it sf o rLS~1EAN ( i ) ーL S M E A N( j ) y J q ︐ L q u A U ι n z J AA 崎 A吐 1111223 同時 下側 信頼 限界 23.490347 ‑3.090347 J0 347 4.5! 1 7 .U)0347 ‑18.690347 39.090347 平均 の 差 14.100000 34.500000 3 3 .000000 20.400000 18.900000 ‑ ] .500000 同時 上伊. I J 信頼 限界 51 .690317 72.090317 70.590317 5 7 .9 9 0 : 1 1 7 56.490317 : 1 6 .090347 RBCの例では DF=36であり, α O .05とすると t分布表の上側%点より, なる.またサンプルサイズが等しいので, SEは全ての信頼区間で等しく 二 393‑ t36( 0 .OS/2) =2.028と

388.

SE=3し 2 1・SQRT(1/10+1/10)= 1 3 . 9 6 と計算される.したがって多重性を調整しない信頼区間は Xi : ! : tDF(α/2) ・ SE= Xi.‑Xj・ ! : 2 8 .3 1 士 2.028・13.96 X j • -X j • : ・ Xj・: となる.これに対して Dl In nett法の信頼区間は, Xi.‑ Xj• : : ! : dDF(α/2) ・ SE ( 1 7 ) として計算される.ここで dDF(α/2) は Dl In nettの数表の上仮l 同点である. 4群で DF 36, α=0.05 のとき d3G( 0 .O S / 2 ) 2.452で,信頼区間は X i.‑ Xj' : : ! : dD F( α/2) ・ SE X j • -X j • :!:2.452・13.96= Xi . ‑Xj' : : ! :3 4.23 となる.ただし対照群と各用量群聞の信頼区間しか構成できない. Tl Ik e y i 去の場合,信頼区間は, Xi.‑Xj. : : ! : ( S TDF(α)/;‑2)'SE ( 18 ) となる.ここで STDF(α)はステューデント化された範囲の上側 α%点である. Tl Ik e yの方法は本 質的に両側検定であるため, α/加点ではなく, α%点を参照することに注意されたい. 4群で DF=3 6, α=0.05のとき STDF(α)=3.809で,信頼区間は Xj ‑X官::!: (STド ( . , )/;‑2)・ S. F 二 X j • -X j • 士 2.693 ・ 13.~6 二 X j ・ Xj . : ! : : 37 .6 1 となる. 二 二 二 7. 終わりに 信頼区間の計算は比率,平均値などの極限られたパラメータについてのみ行われてきたが,実は 検定ベースの構成原理を用いることによって,様々な検定に対応した信頼区間を構成することがで きる.最大の利点はノンパラメトリック検定に対応した信頼区間を構成することができる点である. 多くの医薬系の論文では検定の結果のみが提示されているが,信頼区間は結果を評価する上でより 多くの情報を与えてくれる.重要なパラメータについては,検定の次の解析のステップとして,信 頼区間を示すのが結果を解釈する七で、有効で、ある. 参考文献 P . I I . W e s t f a l l 日n dS.S.Yollng(1992).Resampling‑Based Ml Il tiple Testin~John Wiley &Sons 浜田知久馬・吉田道弘(19 9 2 ) MULTTESTプロシジャの紹介. SUGl]1 0論文集, 357‑370 浜田知久馬・大橋靖雄他(1 9 9 4 ) 臨床評価における再発事象データの統計解析 薬理と治療 22‑10 21‑34 ~1I .Garthwaite(1996) C onfidence Intervals f r o m Randomization t e s t s . Biometrics 5 2,1387‑1393 ~R.Coe(1998) A S AS Macro t oC a l c l l l a t e Exact Confidence Intervals f o r the Difference of Two Proportions.Proceedings of t h e2 3A n n l l a l SUGI 1400‑1405 浜田知久馬 ( 1 9 9 7 ) SASによる正確な検定. SUGl]1 5論文集, 17‑34 J .I .Mann e t a1 .( 1 9 7 5 ) Myocardial infarction i n youngwomen with special reference t o oral contaceptivep r a c t i c e . British J .M e d .2, 241‑245 一3 9 4