SASユーザー総会論文集 2008年

280 Views

April 21, 25

スライド概要

SAS9 BI Server 環境での統計解析システム開発事例 佐藤耕一
SAS による統計解析チュートリアル 石橋雄一
生存時間解析における症例数設計方法の性能比較 水澤純基
日本における初回献血者数の推定 田久浩志
経時臨床データに対するRobust Linear Mixed Models の適用- SAS /IML を利用したMCMC法 による推定- 橋詰公一
ラグタイムとコンパートメント数 勝田啓子
SAS によるSpearman の順位相関係数のp 値の 計算-p 値計算方法選択のための検討- 畑山知慶
ある種の状況におけるκ係数の挙動について 丸尾和司
計量的にみた寄席興行の時代変遷 坂部裕美子
全国学生調査に基づく実演芸術鑑賞行動の規定 要因の分析 有馬昌宏
普及理論の医薬品マーケティングへの応用 武藤猛
SAS9 BI Server 環境におけるマーケティング分析 システムの開発事例 加藤弘貴
POS データを用いた消費者のブランドスイッチ行 動予測モデル構築法の提案 坂巻英一
ジニ係数の計算とロレンツ曲線を描くSASプログラム 周防節雄
新入生がいだくコンピュータ操作に対する不安の程度とその内容 安田晃
SAS によるコクラン・ アミテージ( Cochran- Armitage)検定 浜田知久馬
HTMLアプリケーションを用いた簡易SASツールの開発事例-臨床試験における症例数設計用ツールの構築- 舟尾暢男
統計解析結果の英訳に対する効率的な業務モデル確立への取り組み 東島正堅
製造販売後臨床データ集計に関する支援システムの構築-調査、試験の安全性定期報告から再 審査申請まで- 岩崎智昭
SASを用いた臨床データのチェック仕様の検討 西野美沙
BITAPアルゴリズムによるマッチング 中村竜児
SASシステムオプションを用いたパフォーマンスの 調整 深井剛史
WEEDS SAS-Trace セキュリティのご紹介 豊嶋正裕
デフォルト確率推定モデル作成におけるWOE 変 換の役割とその利用方法 大勢待利明
EM アルゴリズムを利用した不動産賃料の推定モ デル 小野潔

profile-image

SAS言語を中心として,解析業務担当者・プログラマなのコミュニティを活性化したいです

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

2008 口 SASユーザー総会 アカデミア/テクノロジー Sソリユーションセッション 論文讐

2.

SAS、 SASを構成するプロダクト群は、 SAS Institute I n c .の登録画標です。 その他、本論文集に記載されている会社名、製品名は、一般にそれぞれ各社の 高標または登録商標です。 本論文集の一部または全部を無断転載することは、著作権法上の例外を除き、 禁止されています。 本論文集の内容を実際に運用した結果の影響については、責任を負いかねます。

3.

目 次 E璽 量Z墨画益逼 S A S 98 1S e r v e r環境での統計解析システム開発事例.....•. • • • .• • • • • • . . .• • .• • .• . .• • 3 佐藤耕一(株式会社タクミインフォメーションテクノ口ジー) 石田和也 S A Sによる統計解析チュートリアル・・・・・・・・・・・・・ ..• • • .• • • • • • ..• .• • • • .• • • • .• • .• • 1 3 石橋雄一(株式会社スタットラボ) E 塁彊週雇監軍E量盗誼重量 生存時間解析における症例数設計方法の性能比較・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 1 9 7 } < ; 畢純基(東京理科大学大学院) 浜田知久馬(東京理科大学) 日本における初回献血者数の推定 ...............................................29 田久浩志(中部学院大学) 岩本晋(徳山大学) 今井常彦(東邦大学) 経時臨床データに対する R o b u s tL i n e a rM i x e dM o d e l sの適用 ‑ S A S / I M Lを利用した M C M C法による推定一 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 0 橋詰公一(住商情報システム株式会社) ラグタイムとコンパートメント数・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・.• . .• .• • .• 5 6 勝田啓子(塩野義製薬株式会社) 落合俊充 田崎武信 S A Sによる S p e a r m a nの順位相関係数の p値の計算 ‑p値計算方法選択のための検討ー・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 6 4 畑山知慶(株式会社 A C R O N ET) 矢田真城 秋谷一平 林行和 ある種の状況における κ係数の挙動について・・・・・・ーー・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 7 4 丸尾和司(興和株式会社) 中西豊支 菅波秀規

4.

室温E届~置彊垣Eß長5・ 計量的にみた寄席興行の時代変遷・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 8 7 坂部裕美子(財団法人統計情報研究開発センター) 全国学生調査に基づく実演芸街鑑賞行動の規定要因の分析.• . . .• .•... • . . .• • . .. . . .• .9 3 有馬昌宏(兵庫県立大学) 普及理論の医薬品マーケティングへの応用....• • .• • • • ...• • ..• .• • • • ..• • .• • • .• • ..• 1 0 3 武藤猛 ( 1T B P O株式会社) S A S 9B IS e r v e r環境におけるマーケテイング分析システムの開発事例...• • • .• ....• 1 1 3 加藤弘貴(財団法人流通経済研究所) 佐藤耕一(株式会社タクミインフオメーションテクノロジー) P Q Sデータを用いた消費者のブランドスイッチ行動予測モデル構築法の提案....• • . .1 2 2 坂巻英一(坂巻総合研究所) E 密詰 i Et1詰‑建言書 ジニ係数の計算とロレンツ曲線を描く S A Sプログラム・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 1 3 9 周防節雄(兵庫県立大学) 新入生がいだくコンビュータ操作に対する不安の程度とその内容・・・・・・・・・・・・・・・・・・ 1 4 7 安田晃(島根大学) 平野章二 阿部秀尚 中国秀章 花田英輔 津本周作 Ea置:1置~ S A Sによるコクラン・アミテージ ( C o c h r a n ‑ A r m i t a g e )検定...• .• • • • ..• • • ..• • • .•• 1 6 5 浜田知久馬(東京理科大学) EE 藍普請詰伝通審車話量2 3 事語 H T M Lアプリケーションを用いた簡易 S A Sツールの開発事例 0 5 一臨床試験における症例数設計用ツールの構築ー・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 2 舟尾暢男(武田薬品工業株式会社) 高浪洋平

5.

統計解析結果の英訳に対する効率的な業務モデル確立への取り組み............. ー. . 2 2 0 東島正堅(株式会社 A C R O N ET) 竹田昌 製造販売後臨床データ集計に関する支援システムの構築 3 6 一調査、試験の安全性定期報告から再審査申請まで一.• • • • •. • .• • • . .• .• • • • .• • • • • • • 2 岩崎智昭(株式会社アームシステックス) 小柳寿雄 木村彰男 S A Sを用いた臨床データのチェック仕様の検討.......・ー・・・・.....................2 4 5 西野美沙(イーピーエス株式会社) 今野聡 堺伸也 B I T A Pアルゴリズムによるマッチング....................................・・・・・・ 2 5 4 中村竜児(国立保健医療科学院・株式会社インクリース研究所) 角真理子(国立保健医療科学院) S A Sシステムオプションを用いたパフォーマンスの調整・・・・・・・・・・・・・・・・・・・・・・・・・・ 2 6 4 深井剛史(住商情報システム株式会社) E謂聡~君事事a W E E D SS A S ‑ T r a c eセキュリティのご紹介.• • • • • • • • • • • • • • .• • • • • • • • • • • .• • • • .• • • • .• • 2 8 7 豊嶋正裕(ウイーズ・システムズ株式会社) デフォル卜確率推定モデル作成における W O E変換の役割とその利用方法・・・・・・・・・・・・ 2 9 8 大勢待利明(株式会社数理技研) EMアルゴリズムを利用した不動産賃料の推定モデル........... ・ ・ ー ・ ・ ・ ・ ・ ・ ・ .• • • • • • • 3 0 6 小野潔(株式会社三菱東京 U F J銀行)

6.

応用システム開発

7.

SAS8 1Server環境での統計解析システム開発事例 佐 藤 耕 一 l 石田和也 株式会社タクミインフォメーションテクノロジー 情報解析部統計解析グループ Developmentcaseo fS t a t i s t i c a lA n a l y s i sSystem i nt h eSAS8 1s e r v e renvironment K o i c h iSatoh/KazuyaI s h i d a S t a t i s t i c sA n a l y s i sGroup I n t e l l i g e n c eA n a l y s i sDep . t TakumiI n f o r m a t i o nTechnologyCo.,I n c . 要旨 SASB1S e r v e r環境で稼動する統計解析システムの開発事例を紹介します。昨年より 開発を進めて参りました、 SASB1S e r v e r環境での統計解析システムをリリースするこ とになり、今後の SASBIS e r v e r環境でのシステム開発の参考例として役立たせて頂く ために、 SASB1S e r v e r環境に即した機能と開発手法を紹介致します。 キーワード:SASBIS e r v e r、統計解析 1 機能概要 紹介する統計解析システムは、 S t a tP r e c l i n i c a (以下、 SPC) と命名し、 SAS前臨床パ ッケージと同等の統計解析機能と SASB1S e r v e rがサポートしている機能を利用して開 発を進め、このたびリリース致しました。機能概要は、以下の 6点にまとめられます。 ①システムのセキュリティ強化 (Windows認証、 MSAD認証、 SASM e t a d a t a認証) ② CSV (ComputerSystemV a l i d a t i o n ) への対応 ③使いやすいユーザーインターフェースの提供 ④システムの拡張性 ⑤豊富な検定手法の提供 @出力結果の監査証跡 qd

8.

2 . システム要件 システム要件は、 Windows2 0 0 3S e r v e rでの SASB 1S e r v e r環境で稼動する非臨床分野 における統計解析システムであることを目的とし、システムのライフサイクルにおける ソフトウェアの開発時のバリデーションを CSVの手順に則って行います。ログインユー ザー認証、入力データや解析結果のユーザー権隈設定、監査証跡用の解析結果の保存を 基本機能とします。 2 . 1 . ユーザー認証 システムへのログイン認証は、 MetadataS e r v e rのプロセスによって管理します。予め WindowsS e r v e rにログインユーザー(アカウント)とグループを登録し、合わせて SAS B1S e r v e rのメタデータにユーザーとグループを登録し、認証プロパイダーの設定を行い ます。現時点での導入実績は、全て MSAD環境となります。 「的斗以内五… ……一…… ロ ク イ ン 詳細設定 一… 一一図l j ホスト(日 ! " ' f‑Ii‑五l トト(.E) 阿 ヨ リボ州(B) I F o u n d蜘 n F i g u r e 2 . 1 上記画面 ( F i g u r c 2 . 1)は、 SPC 起動時のサーバー接続用画面のサーバーの詳細設定を 1S e r v e rでの MetadataS e r v e rが起動して 行うタブです。「ホスト」フィールドは、 SASB e r v e rへ いるホスト名(サーバー名)を指定します。「ポート」フィールドは、 MetadataS の接続ポート番号でインストール時に設定されます。「リポジトリ」フィールドは、標 準の Foundationが指定されていますが、新たにカスタムリポジトリを定義することも可 能です。これらの設定情報は、 Windowsネットワーク環境でも MSAD環境でも基本的 には共通の情報となります。 4

9.

下記画面 ( F i g u r e 2 . 2 ) は、サーバー接続時のログインユーザーの設定を行うタブです。 「ユーザー」フィールドは、ログインユーザーの IDを指定します。書式は、「ホスト名 D J、MSAD 環境では、「ドメイン名¥ドメインユーザー I D J の指定となりま ¥ユーザー I 、 MetadataS e r v e rで、ユーザー認証を実施しされます。パス す。指定されたユーザ ‑IDは ワードは、定期的なパスワードの変更に対応する場合、メタデータのログイン情報の登 録時には設定を行いません。 亙 トm 二人ゐ援会…………一一一一一一一一一極│ ロ ク イ ン j詳細設定 j ユーザー ω 行‑/¥‑割問demo パスワ』ド(.E) * 1 柿柿柿柿柿 に亙亘]̲1笠 包j キャン白~(Q? I F i g u r e 2 . 2 ログイン認証に関する情報は、ログインの日付と時分秒、ユーザー ID、ログインに成 功したか失敗したか、失敗した場合のエラーメッセージなどが、 MetadataS e r v e rのログ ファイルに保存され、ログアウト時の情報もログファイルに保存されます。 2 . 2 . ユーザーインターフェース ユーザーインターフェースは、直感的で使いやすく、操作のトレーニングに多くの時 間を費やすことのないユーザーインターフェースが理想です。ユーザーインターフェー スの検討は、慎重に以下の 3つの SASBIS e r v e r環境でのクライアントツールを検討し ましたが、機能の拡張性の観点からカスタマイズした画面 ( F i g u r e 2 . 3)を採用すること にしました。 ① SASS t o r e dP r o c e s sの SASコードのパラメータ定義により作成される標準画面 ② SASE n t e r p r i s eGuide (以下、 EG) ③ SASAdd‑Inf o rM i c r o s o f tO f f i c e (以下、 AMO) F同U

10.

F i g u r e 2 . 3 クライアント環境でのユーザーインターフェースツールの要件は、 1 .NETF r a m e w o r k 2 . 0 J を配置することが条件となります。 M SE x c e lからの解析データのカットアンドベ ースト、サーバー登録の解析用品S データセットの入力、解析手法の選択 (Figure2.4 、 ) 出力結果の確認などの指定もマウス操作を基本とします。 一 同公平均 亙I ,一 亡至理塾窒: : ] 1 1 うメー信提 │伝果I])i皐存 i l j ' J; l .H8 ) ‑ 今完γ ; ③測定項目 2 ③測定項目 3 圃 日霊童回コ忠史旦J F i g u r e 2 . 4 ‑6‑

11.

ι │滋分意分 一 一 一 一 パラメ唱錠 変重豆宜主 一 E i邑果め保存 i 実験担イト}~ 前市事干 有: ! i T 陣 「一一一 日 日5 対数変換の有無 !なし 」 ニ 入力デー担。出力的有無 !あ~ I J ラフ出力の有無 i 初 ヨ ヨ ヲラフ明量頒 !平祉問9 5 縦割目区間 ゴ 一 一 山 日主主語ユユ竺虫色j F i g u r e 2 . S !場分散分析 軍 主 短 信 い1 ラメー莞程 …図 . 信果のf 牌│ I 言 S A S パ、沖』ヲとして信畢を保存 フ 州L 名 聞 研̲ S a l o l 削ロ P ̲ s a s l 申m o j ' lwiJO7 . 7 5 4 2 0 . " " f 果存先 p 宙開凶デモ用出力先 日主主主ゴ J竺巴旦J F i g u r e 2 . 6 解析手法ごとのパラメータの設定 ( F i g u r e 2 . S ) や結果の保存 ( F i g u r e 2 . 6 ) に関しでも、 マウス操作を基本とします。 ‑7

12.

2 . 3 . システムの拡張性 解析手法の修正や新規追加に対する対応は、外部のファイル (XML ファイル)から 情報を取得してインターフェース画面に反映させる仕組みを採用しています。また、解 析手法のプログラムは、解析手法ごとに SASS t o r e d p r o c e s sの形式でプログラムを構築 しています。従いまして、解析手法の修正や新規追加による再ノ〈リデーションの作業は、 対象となる個別の検定プログラムに限定されるため、統計解析、検定手法の拡張性に優 れたシステム構成となります。 C クライアント P 言語li‑‑̲̲" サーノ〈ーマシン ̲割 前 ~ . li k I . ‑ ・ 咽 "..・・ 日 剛 " 1 検定プログラム 1 5toredprocess 圃 wω . ' 。 1 1 1 1 " 咽 1 1 "U 噂 . 1 拘司 m. 1nl 聞 1 闘 均 国 F i g u r e 2 . 7 ︒ 日

13.
[beta]
2
.
4
. 出力結果の監査証跡
解析結果は、クライアント環境への確認用の結果とサーバー環境への監査証跡用の 2
パターンを出力します。

①クライアント環境の出力
F
i
g
u
r
e
2
.
8
) の出力となりま
クライアント環境への解析結果は、 PDFファイル形式 (

す。この解析結果はクライアント環境の任意のフォルダに保存で、きます。検定プロ
グラムの実行時に作成される「出力データ(出力結果)J I
実行ログ」には、プログ
ラムを実行した日時、ユーザ ~ID、実行プログラム、実行時のパラメータ情報など

の履歴情報(電子認証情報)をシステムが自動的に付与します

同
一
一
一…
1

aChent

フ71M
E
) 偏 重 @ 挿入申

斗附限ExceI1ん分取洲市

む
詞
望
号1

…

葺示 '
I
i
) サーバー(a) 惜崎〈印

i

想論議員・可画験己..;12

e母 11̲00'¥モブ対面
,スト・e

sl!]設定情報
蜜フロパティ
宅

E測定項目 l
ち分散分析

巴適合度統計量
I!]要約統計量
芭入力デー担
E平均と吾の 95%信
恥 I
Jラ
コ
頼区f

瞳機懇轟紘
審議意

か‑込

制

'
0

機厳重犠輯

構

話
語

•

パ予イ

議経

実
・ 9イ炉凡・

テスト鋼Oi

S
4
5
/
¥ ージョン

国5
9
.1
.3S
en.q開f'atk<

解町ブログラ ιパージョン

1
.
0
.
1

割Si<‑;.tケージファイルの侵存

あリ

SI.Sパヮケージファイル倶存唱所

E

S回パッケ』ジフ?イ,.ファイ M I 分償分析S.tol即 t
C
P
.
.
$
‑
白d
割。百 田1
0
17
5
4
2
0錦旗

λヵデータ

開
.
.
b
:
c
:
骨1
1

‑・括!I;理

むし

.
E
"
'
'
'

005

緒豊聖宜自負

花
王
し

1lI'事項目訓定項目 1

F
i
g
u
r
e
2
.
8

‑9

14.
[beta]
②サーバー環境の出力
サーバー環境への解析結果は、 SPK ファイル形式の出力となります。

Publishing

Frameworkの機能を利用して、予め設定したチャネル (
F
i
g
u
r
e
2川 へ SPKファイルを

出力します。チャネルは、アーカイプファイルとして設定された解析結果をチャネ
ルに割り当てられたフォルダ

(
F
i
g
u
r
e
2
.
1
0
) に
、 SPKファイルとして出力します。

|~1;l管理ヨン Y ール- EMiner
フ7イル<E) 編集() 表示

ω アクション@ ツール匂 ロート

巴
r
.
t
rl
̲.xj詞
同 Fロund蜘 n

リポジトリの:

一

種 目S管理コンソール
1
3L
藍環境管理
[!J(.3)権限マネージャ

1Manager
[!J治量 8
包括議デ‑:;!ライブラリマヰ

ジャ

[!J(.~9-:;!マヰージャ

[!Jなおスケジュールマネージャ

g蕗 C
伽m
耐
町
}
げ
凶
f
均山
u
J
周
r
叩哨
r
聞
胤
峨
説
a
副
刷
i
t
口n
川T
r
悶o
凹l
叫
引
旬
蜘
!
羽
肌
帆
馴
目
凱
釦
仰
帥

包;即サ一バ一マヰ一ジヤ
省[)ユーザーマヰージャ
田冶高 V~AI "Ao"" ゥ ラ ‑~j

巴事!パプリ山ンクフレームワ ク
白羽口附j
后説。回同口匹 8
5611A0000001.A55A5JH
回亀サプスクライバ

I

白話チャネル

.こ‑雪量調

L

:
:
6
措幅五品冒

国佐穂用チャネル

出 事i.Jrノ ァ ー ソ ヨ ノ リ ー ヒ λ マ
ヰ

日必至ニ 9
[
!
JC
淘 SASOLAPサーバーモ二 9
[
!
J
夜Bアプリケーショツモ二 9

1
3
:
姐保守
自画ライセンスマヰージャ
El{薗アプリケーション管理
回繭 E
肘吋e
r
肌 s
e附
MI
n
回 温
L
函R
陶e
叩p
口
叫
吋g
卸u
叫
制
岨
蜘
d
i
峨
i
o
口惰 戚
制

F
i
g
u
r
e
2
.
9

‑1
0

ツ

15.

議ふが…一一一一…一一一十十……一一一……轡 数題提 I1 1 ラメー持提 ご 士 伝畢の保存 I i 一 日 四. . . . I s 佐蔵用チャネル 属産密画 ヨ 窪 田 2 主 性j F i g u r e 2 . 1 0 ーよ 1よ

16.

3 . 今後の課題 SASBIS e r v e r環境における統計解析システム SPCについての今後の課題をまとめま す 。 3 . 1 . Pa削 1への対応 CSVについては、ド キュメントの整備を含め、問題はないと感じています。しかし、 P a r t l lへの対応は、ログイン時のログイン情報、解析実行時の実行情報、解析結果の監 査証跡の取得は行われていますが、細かな作業履歴については取得し切れておらず、現 時点では P a r t l lに対応している訳ではなく、それを支援している状況となります。今後 a r t l lに対応したシステム構成を模索していき は、解析手法のさらなる拡張と同時に、 P ます。 最後に 非臨床向けの SASBIS e r v e r環境での統計解析システムをご紹介するにあたり、今後 の SASBIS e r v e r環境でのシステム開発の可能性を確認して頂けましたら幸いです。 1 2

17.

SASによる統計解析チュートリアル 石橋雄一 (株式会社スタットラボ、東海大学医学部) T u t o r i a lf o rS t a t i s t i c a lA n a l y s i su s i n gSAS Y u i c h iI s h i b a s h i ( S t a t L a bI n c ., T o k a iU n i v e r s i t yS c h o o lo f M e d i c i n e ) 要旨 統計手法の理解から S A Sによるデータ解析までを学習できる。手法の理解においては、アニメーシ ョンを用いて直感的に理解でき、手法ごとに SASによるデータの入力から結果の解釈までが完結して いる。 キーワード:チュートリアル、教育システム、学習 1 .はじめに 農林水産省科学技術計算システムにおける W E Bによる統計の教育システムとして開発しており、農林 水産省関連の各種研究所の研究者が利用対象者である。統計解析を行うためのソフトウェアのーっとして SASが利用されており、この統計解析チュートリアルでは、統計手法の理解から SASでのデータ解析 までを学習できるようになっている。特に、手法の理解においては、アニメーションを用いてできるだけ 直感的に理解できるようにしたことと、 SASの使用については、手法ごとにデータの入力・グラフ表示・ データの変換や抽出・結果の解釈などが完結しており、利用しやすいものとなっている。 2 システムの構成 現在は、以下のような手法が含まれており、今後も多変量解析などを順次追加する予定である。 統計的検定と推定 ・判別分析 実験計画法 ・主成分分析 多重比較 クラスター分析 回帰分析 ノンパラメトリック検定 一般化線形モデ ル 手法ごとの構成要素は表 1のとおりである。 3 .アニメーションによる直感的理解 一般には、図示やグラフ表示により分かり易く理解させる努力をしているが、アニメーションによる動 きのある表示により、直感的な理解や、強調した解説などにより、さらに王甲 解を深める効果を生むことが A できる。たとえば、次のような効果である。 1A ︒ 円

18.
[beta]
1
)
頂序を示す。

②

違いを強調する。

③

式や意味の直感的な理解。

表 l 手法ごとの構成要素
構成要
素
手法の
考え方

番号

2

3

I

、

1
1

,最長ま~.p 聞女同C問 @βー;占c;;;. ,
,
;i
l
ij
.
品
v 留守陣

手法の意味を直感的に理解で
きるように、アニメーションと
解説を組み合わせている。
詳細な 多重比較であれば、
Tuk
e
y
‑Kr
amer法 や S
c
h
e
f
f
e法
手法
などの詳細な手法をアニメー
ションや数式を用いて解説し
ている。
S A S データ入力、グフフ表示、デー l
に よ る タの抽出・変換、統計手法によ
分析
る解析と結果の評価などを、詳
細な手法ごとに解説する。用い
るデータは各研究所で実際扱
ったも山比しており研
究者の身近なものとなってい
る
。

l

• • • • • • • • • • • • •&!ilit

E"i~. ,l;iI__'" 何百~.・一一Z!!I:m
.
"
.
イ
ル
匂 av 1
L
T
.
(
'
:
d I:!則正λ
q
ω .
,
‑
,
I
I
,
(
D I"
1
ω

田
。.0

内容

~lJ!- .
.

E
前面互銀E!
I
.l'"
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
...
回・

....~法王語盆三s ・lIi:ìJ
司
聞
・
・
園 円。...岬‑司区...、

重重
町
I
l
t
I
I
l )~At・E河内宮崎巳..,・・

, 1+, 2

重重

品

l

マ
,nン
ゼ
,
̲
,

4
凶

図 1 解説の画面

アニメーションだけでは分からない場合が多いので、図 lのようにアエメーションの右側に解説を付加し
ている。音声による解説についても検討したが、現時点では文字による解説で十分とのことで、音声は入
れていない。アニメーションは MacromediaFLASHを用いて作成されている。アニメーションは図 2の
ような動作をする。図 2の例は多重比較についてである。左から右に変化する。

高
話

者
お

ミ
語

=毒
事

瞳踊働胃盟通語強靭頭開園園田園田園E

・・
‑
E

包:..
.
滋揖~診・;g

お=遣冨

絞t努努議LZvt議辺主務滋主主認調~Jj笠官邸緩義務苦w'l~惨
1): ~1 叫ん同一

……嗣~,,-;,
"
,
.
a
;
;
.
.
.
,
岬W
宮沢陣。C 縛ぬ l~ヂ:..~^.l

胡[O
11
8
C
蜘
"
".
't鴫量規ぽ,,,,.ν方ア'~s'/l;

…
・・ " ' ‑ ,
一一一色除、一

明
…
一
}一回
…ー咋
…
一
町
一
‑
酬

毒
事

芝lj~~

u
.
.ρ.{)J. IJ.
I
'
"
,

t
J
j

.
,

".υOL"・
ομ

4

し
.

G

~~‘
凶 e・,悔悟曹向凶~.
A

μ
υ
"
"
J
J<AA.)'‑1P'I:;ゅ4
島同軍強列島偽‑副

.明隠密崎梶隣..
季、手,

"
‑
;
.
ι詩t
品目申咽
:
;
潔
聖
!
¥
液
晶E
b
咽,

時間抑制裁が-':..~ I
‘~,同・~"'~''4.,^"..

'
i

λht.t;笈~<の'‘ωa、"....ョι 。.'"‘護
柑 a:;t~"'''~'''1"、"併合・ピ同

*
"
"1
:
;
問。品川明主
あ " 司 ,
.
争

主捻-~ .
.
,叫叩昨今川l;I. ".u~.

図 2 アニメーションの例

a

y u..
'..岡 引 ・

図 3 SASによる分析の例

4
.SASによる分析
SASを用いた分析の例では、以下のようなステップで解説している。図 3は分析のための SASプログ
ラムと解説の例である。
①

主

データの説明

1
4

19.

データはできるだけ農水省の研究所で実際に用いられたデータを事例として使っている。 ② データ入力 データステップにおける各ステートメントの書式や文例を説明し、事例のデータの入力の解説を行う。 ③ グラフの描画 入力されたデータの分布の確認などのため、統計手法ごとに散布図・ボックスプロット・ヒストグラ ムなど適切なグラフ描画の方法について解説すると同時に、 SASのコマンド・についても詳説している。 ④ 変換や抽出 データに問題がある場合のデータクリーニングなどの変換や、グループ分けなとやの抽出の方法につい て解説している。 ⑤ 解析手法の適用 多重比較法では、以下のような手法について解説がなされており、最初に必要とするものについては 十分である。 Tukey‑Kramer法[対比較の検定] Scheffe法[対比の検定] 多段検定による多重比較法 Dunnettの方法 ⑥ 解析結果 検定などの結果の評価のしかたや、各統計量の意味などを示す。 学習者は、最初は示された手1 ) 頂のパターンに当てはめて解析を行うが、応用が利くように SASのコマンド の書式(全体ではなく必要最小限な一部分)を示している。 5 .謝辞 このシステムの開発の機会を与えていただいている農林水産研究情報総合センター(旧:農林水産研究 計算センター)および日本電気株式会社に感謝の意を表します。 6 .参考文献 「統計的検定と推定」、数理統計短期集合研修 独立行政法人農業技術研究機構短期集合研修(農林水産試 験研究のための統計的手法)テキスト、平成 14年 11月 phU 1よ

20.

医薬品開発・生物統計

21.

生存時間解析における症例数設計方法の性能比較 0水j 宰純基,浜田知久馬 東京理科大学大学院工学研究科経営工学専攻 Theperfonnancecomparisonofsamples i z ed e s i g nons u r v i v a la n a l y s i s J u n k iMi 回 s awa, ChikumaHamada TokyoU n i v e r s i t yofScience F a c u l t yo f E n g i n e e r i n g, 要旨 生存時間解析における症例数設計方法として, SAS 9.1の power プロシジャで用いられている Lakatos の方法の他に, Freedman,Schoenfeld の方法も多くのソフトウェアで広く用いられている.浜田,藤井 [ 7 ] により, Freedman の方法は Schoenfeld の方法より必要な症例数が多くなることが示されており,その k a t o s の方法と両方法の症例数の違いについての評価は十分に行 分検出力もやや高くなる.しかし, La われていない.そこで本稿では,生存時間解析の症例数設定方法の考え方および 3つの方法の数理を解 説し,実際の検出力をモンテカルロシミュレーションによって比較する. キーワード・症例数設計,生存時間解析, powerプロシジャ, Lakatos,Freedman,S c h o e n f e l d 1はじめに ある目的の反応(死亡など)が起きるまでの時間を対象とする解析手法の総称を,生存時間解析 ( s u r v i v a l a n a l y s i s ) と呼ぶ.生存時間解析の特徴は,打切り ( c e n s o r (i n g ) ) と呼ばれる正確な生存時間の不明な個体の存 在を考慮した点にある.通常の症例数設計と異なり,生存時間解析の症例数設計では症例数が直接解析の精 度を表す情報量となるわけで、はなく,死亡などのイベント数が情報量となる.そのため設計時に,解析時点 までに発生するイベント数を見積もる必要がある.表 Iに示したのは,生存時間解析の症例数設計に使用さ れるソフトウェアおよび引用されている文献である [ 1 ] . ここに挙げたソフトウェアの中では S c h o c n f c l d の方 a k a t o s の方法が用いられていることがわかる.NQuery で採用されて 法が最も多く採用されており,次いで L し 、 るL a k a t o sa n dLan の方法と SAS で採用されている L a k a t o sの方法は,同一著者ではあるが基になる論文が 6 ] .同様に, PSpowcr などで採用されている S c h o e n f e l da n dR i c h t c rの 異なるため,異なる症例数設計法である [ 方法と, S t a t i s t i c aPowcra n a l y s i s ( v c r . 6 ) などで採用されている S c h o e n f e l d の方法も各群の割付の割合を考慮し ているかどうかで若干の違いがある.本稿では, SAS で採用されている L a k a t o sの方法 [ 3 ]と , S t a t i s t i c aPowcr a n a l y s i s ( v e r . 6 ) に採用されている S c h o c n f c l dの方法 [ 4 ],Frccdmanの方法 [ 2 ] を取り上げることにする. 匂}ム Qd

22.

表 1 :症例数設計に用いられるソフトウェアと引用文献 ソフトウェア名 価格 引用文献 ART 合e e 8 a r t h e 1e ta . I cpower 合e 巴 L a c h i nandF o u 1 k e s .S c h o e n f e 1 d $299 F r 伐 d man. R u b i n s t巴i ne ta . I EGRETS I Z ( v e r . 1 ) $465 S e 1 fe ta . I Ex‑sampJ e( v e r . 3. 0 ) $125 S c h o e n f e 1 dandR ic h t e r NCSSPASS(2004) $ 8 9 9 . 9 5 L a c h i nandF o u 1 k e s NQucrya d v i s o r ( v e r . 5 . 0 ) $995 L a k a t o sandLan N s u r v ( v巴r . 2 . 2 ) $140 L a c h i nandF o u 1 k e s POWER(ver.I. 4 ) $10 S c h o e n f e l dandR i c h t e r in i c a 1t r i a 1 sD e s i g n CI p r o g r a m ( v e r . 1 ) Power& P r e c i s i o n ( v e r .2 ) $995 Scho巴n f ( 巴I d .L a k a t o s PSpower 仕' e e S c h o e n f e l dandR i 凶t e r 巴1 d S c h o e n f i 合e e S c h o e n f e 1 d SIZE 合e e L a k a t o s S t a t i s t i c aPowera n a l y s i s ( v e r . 6 ) e619 S c h o e n f e l d U n i f y P o w ( v e r . 2 0 0 2 . 0 8 . 1 7 a ) 仕e e S e l f e ta . I これらの症例数設計方法は,ノンパラメトリックなログランク検定の症例数設計の方法ではあるが,浜田, 藤 井[ 7 ] に示されているように.Freedmanによる方法と S c h o e n f e l dによる方法は生存時間分布に指数分布を 仮定した症例数設計方法と考えることもできる.L a k a t o s による方法は指数分布を拡張した区分指数分布を仮 定した方法である.この 3 つの方法について,実際の生存時間分布が各方法で仮定する生存時間分布以外に なった場合の,検出力の定量的な評価は現在まで十分には行われていない.またどの症例数設計方法を用い ることが適切であるかのコンセンサスはない.本稿では,生存時間分布にいくつかの確率分布を仮定し,各 方法で求めた症例数で想定した検出力を保てているかを定量的に評価する.またその結果を基にしてどの症 例数設計方法を使用すべきか指針を述べる. 2 比較する症例数設計方法 2 . 1Freedman の方法 生存時間分布にハザードが一定の指数分布を仮定し,比較する 2 群の母ハザードをそれぞれ,ん. A2 と表 すと,帰無仮説 Ho と両側検定の対立仮説 H lは次のようになる. Ho:λ1λ2 Al • H 1 : λl~λ2 A2 の最尤推定値を h 1 とh 2の差をその標準誤差と比較 1 .んと置くと,帰無仮説を検定するために. h 2 . 1 )式の Z 統計量を検定統計量として用いる. する.すなわち .( ‑ 20

23.

z= h2 ‑h} =~ 一 ‑ ( 2 . 1 ) J広コ百応づ ‑ ‑7 ‑ d2 d } , ( 2 . 1 ) 式で ,d , めは各群のイベント数を表す. 帰無仮説の下ではん=ん = λ なので. 2 つの群でほぼ ' 内 'hH 一 一 ヲニ 一 + 一 角 y‑ ‑ hl 一 2 1 n 1 n +d d . d、 = 一d. ι一ーニ =d ‑ー 2 吋 , , " が成り立つ. ( 2 . 1 ) 式の分母を 2つの群の平均の h と d で置き換えると z= h2‑h } " h2‑h } =h2‑h }= ̲ ̲ ̲ ̲ . : h ̲ ‑ ̲ ! . h } 2 一 一 一 一 一 日巨作平~~ ( 2 . 2 ) となる.ここで,最尤推定量の分布は漸近的に正規分布に従うので. z統計量の帰無仮説の下での分布は正 規分布で近似できる.よって, z=zα +zβ とおく.この等式は各群のハザード h ] . hzを与えると .dのみが未知数であり,この式を d について解くこ とにより 1群あたりに必要なイベント数を求めることができる. 、 ‑ ( h h ] ) 2 ,2 =ーι」で =(z~ +Zfl)" ( h2 +h})ι F 2d ー ( h2/ h }一1 ) 2 ( h2/ h }+1)2 2d (HR̲1)2 ( 2 . 3 ) (HR+I)2 2d ここで HRはハザード比 ( H R = h h ] ) を表す.これを dについて解くと, 21 dー (Z"+Zβ ) 2(肌+1 ) 2 ‑ ( 2. 4 ) 2(HR̲ 1 ) 2 2.4)式は. F r 巴巴 d man の方法による l群あたりに必要なイベント数を表している.これを 2 群を併 となる. ( せたイベントの割合で除すことで. 1群あたりに必要な症例数 (N) を求めることができる.対照群,薬剤J 群の最終生存割合をそれぞれ , ' l J ,1C} とすると, 仮説の下で想定される 2 群を平均したイベントを起こした 症例の劃合は, 1‑Jr唱+I‑J r 吋 ヲ Tr.‑Jr, , . ,2 一一~ 2群 を 併 せ た イ ベ ン ト の 割 合 , 1 r 2 2 ( 2 . 5 ) となる.よって. Frccdman の方法による l群あたりに必要な症例数 ( N )は , N=~Zα+zβ )2(HR+I) 2 2 一‑‑‑‑'‑‑‑‑:‑‑‑xー ー ー ー ー ー 一 一 一 一 一 2(HR̲ 1 ) 2 2‑Jr] ‑ Jr2 ( 2 . 6 ) となる. 2 . 2S c h o e n f e l dの方法 F r 巴 巴d man の方法は. 2 群問でハザードの差が 0 であるとして検定統計量を導いたが,次のように帰無仮 説を設定することもできる. 唱1l ワ

24.

Hn:HR=主 =1 uλ1 すなわち,帰無仮説として 2 群のハザード比が l とおいてもよい.この式の対数をとると Ho:logHR=l o gん 一 logλ1=0 となる.このような帰無仮説の基での症例数設計方法が S c h o e n f e l dによる方法である. ( 2 . 1 ) 式では,変換前 のハザードが 0 であるかどうかを検定したが,ハザードは正の値しかとらない.そのためハザードの推定値 ( h ) は右に裾を引し、た分布になるので,症例数が少ないときは正規分布による近似はあまりよくない.これ に対して,対数変換した場合ハザードが l未満のときは負, 1より大きいときは正の値をとり,正規分布の 定義域と合うようになる.このため正規近似の精度が改善される.ハザードの推定値を対数変換した logh の 分散はデルタ法により近似的に ( 2 . 7 ) 式のようになる. r dloghl 2 1 ‑ ~;ート V[h] V[logh]" " 1 h2 1 h2 d d ( 2 . 7 ) したがって,対数ハザードの差が 0 であるかを検定する場合の Z 統計量は 噸的ユ笠h]) 2=̲1 ‑ 叫ん)‑1略的) z l I J ̲+土 "V[log(h2)ー l o g ( h ] ) ] Vd2 ( 2 . 8 ) d ] d .+d, となる. F r e e d m a nと同様,帰無仮説の下では d]""d2""ー」ーム =dが成り立つので , d], d2を dで置き換え 2 ると Z-log(h 2 ) ー log(h] ~=~og(h 2 ) 一 log(h] ) FlE となる. ここで,最尤推定量の分布は漸近的に正規分布に従うので, ( 2 . 9 ) z統計量の帰無仮説の下での分布は正 規分布で近似できる.よって, 2= Z α +Zp ], h2 を与えると とおく.この等式は各群のハザード h ことにより dのみが未知数であり,この式を dについて解く 1群あたりに必要なイベント数を求めることができる. 2=~g(h 2 ) ‑ l o g ( h ] ) = 1 2 = z α +Zp 百d ヲ& β 2 ) α + ﹄ .JF z ( 一 一 2 ︑ ︑ .J‑ ウゐ 1‑ t n 一 ( ‑ σ一 b o ‑ 斗一2 一 d )‑ 2‑ L n 一 ( ‑ σ一 b O一 l (‑ ‑ 一 一 Z ( 2 . 1 0 ) これを dについて解くと, d =2 ( z a+zp)2 = 一 ( l o g ( H R ) ) " 2 2 ( 2 . 1 1 )

25.

となる. ( 2 . 1 1 ) 式は, S c h o e n f e l d の方法における l群あたりに必要なイベント数を表している. Freedman と 同様に,これを 2 群を併せたイベントの割合で除すことで, 1群あたりに必要な症例数 (N) を求めること c h o e n f e l d の方法における l群あたりに必要な症例数 ( N )は , ができる.よって, S d=2 ( zα +Zp)2. 2 一 ( I o g ( H R ) ) 2 一 ( 2 . 1 2 ) 2‑7r1‑ 7r2 となる. 2 . 3Lakatos の方法 L a k a t o s の方法では,観察期間をいくつかの区間に分けて区間ごとに期待イベント数を算出する.生存時間 分布に指数分布を拡張した区分指数分布を想定する.比較する 2 群の区間 ( i ) のハザードを λ l i ' λ2 iと表し て,すべての zについて Ho・λliλ2i を検定することを想定する. T 年の観察期間を M 個の区間 (M=TXb) に分劃する.対照群,薬剤j 群の区間 ( i )の群ごとに必要な症例 数を N1 ( i ) , N2(i)とする.この時, N1 ( 2 ),N2( 2 )は 2 群を併せた必要症例数 (N) の半分である.よって, 1 )=O.5N N1( ( 2 . 1 3 ) 1)=O.5N N2( ( 2 . 1 4 ) となる.次に, N 1 ( 1 ), N2( 1 )は,ハザード λ l i ' λ2 iを考慮して, N1(日 (り1lI 一川 ~)一 ¥ rb ,,~ ,1 1 、' I . ̲ b) . (T‑())1 I ( 2 . 1 5 ) 1 ー λ川 ~)一 1-;-;::;;判 1 (1)1│ 、 ' I . ̲ b) . l b ( T ‑ I 1 ) ) 1 D.10 1 1 N2(日 となる 1 ,,ト 2 1一一|はそれぞれ l 番目の区間の観察期間,打切りを考慮している.これを区間 I~M ま .¥ . b ( T ‑ I1 ) ) で続けていけばよいので , i + l番目の区間の群ごとに必要な症例数は 1 [九I ({ i )‑ ( 古 ) ] 川( i+ 山 i ) i { I ‑叫 ) ‑ ( 古 ) ] N2(i+1)=叫(i 。 l i N I( i )+λ2 iN2( d ;ー λ 一 b ( 2 . 1 7 ) ( 2 . 1 8 ) ( 2 . 1 9 ) となり,また区間 iの必要症例数比を, ( 2 . 2 0 ) とする.ログランク検定の検定統計量の期待値は ηJ ヮ

26.

J i d z [ 品一合] ( 2 . 2 1 ) d 一一一 Z 2 2 ム ( I+O 1 ' )2 i となる.この Eの要素として N2が存在するので,取り出すと ャM J ' [ O iHR O i [ L . ..~I "-'i~l~i 1 1 +ムHR 1+叫│ E=NιE‑=N21 エ T I d ‑ ‑ A L ".J ( 2 . 2 2 ) l~j ( I+oj)2 となる.ここで J‑ ﹄ ) ‑ ・ 1 ‑ ( ‑ ・ 2‑ N一 2‑ A一 +7b ) ‑ ・ 1 ‑ E‑ ' Al 一 l N一 ︐ d 一 一t • (‑ ・ N2は E 'と1 虫立である.また, ( 2 . 2 3 ) ( 2 . 2 4 ) ( 2 . 2 5 ) ー ん 引 ‑ ( 出 ) ] N ;( i+ 川1 [ ) 1 { I ‑ん ( I i { i )( ‑~ 巧(i+ =巧(i b(T 1))] ( 2 . 2 6 ) ( 2 . 2 7 ) 1 である. Eは近似的に正規分布に従うので l群あたりに必要な症例数 ( N )は , E=N2E'= z α +zp ヂ) N=H ( 2 . 2 8 ) となる. 3 生存時間分布とハザード関数 日指数分布 生存時間解析において基本となる分布である [ 5 ] . 時点 t における生存関数 S(I),ハザード関数 h ( t ),確率密 度関数 j (l ) はそれぞれ次のようになる. S ( I )=e x p ( ーλ 1 ) ( 3 . 1 ) h ( I ) =λ ( 3 . 2 ) f ( l )=λ .e x p ( λJ ) ( 3 . 3 ) ( 3 . 2 ) 式より,指数分布のハザードは時間に依らない定数 λであり,どこまで生存したかによってその後のハ ザードが変わることはない. ‑24

27.

3 . 2 ワイブノレ分布 生存時間解析で,応用上もっともよく用いられる分布は,指数分布を拡張したワイブ、ル分布である. 1) S ( t )=exp(λt ( 3. 4 ) h ( t )=1 ‑ λ. t1ー1 0.~ 1 1 •e / ( t )=1 ‑ λ.t ‑ x p ( ーλ ( 1 ) ( 3 . 6 ) この分布はハザード関数が時間 tのベキ関数であらわされる分布であり,ベキ次数をどのように設定するか によってハザード関数の形状が大きく変化する.このためベキ次数を表す yのことを形状母数と呼ぶ. y=1 とおくとハザード関数が定数となり,ワイブ ル分布は指数分布に帰着する. 3 . 3 区分指数分布 区分指数分布は指数分布を拡張したものである.ある時点 bp( b r e a kp o i n t ) の前後でハザード関数が変化す る.第 k番目の b r e a kp o i n t を bpkとし, λ tを区間 zでのハザードとする.また 斗 勿 町 )=exp[‑ i孟 2 とする. J j ( λj+l ‑ A . ) ( 3 . 7 ) h ( t )= λ r 山ロ{斗 ( 3 . 8 ) J ) ( 3 . 9 ) bpj(λj+1 ‑ A . 4 シミュレーションによる評価 本シミュレーションでは, 2 群(対照群,薬剤j 群)の並行群問比較試験を行なうことを想定する.また比 例ハザード性が成立しているものとする.変動させたシミュレーション条件を表 2 に示す. 表 2・変動させたシミュレーション条件 群=一時 )‑ π一 (‑ A 口一 割一 存一則一 生一但一布 終一比一分 最一ド一間 照一ザ一存 対一ハ一生 70%, 50%, 30% . 5 0,0 . 2 5 0 . 7 5,0 指数分布・区分指数分布・ワイブル分布 (γ=0 ふ 2 . 0 ) 始めの 1 年間で全イベント数の 6 割が起こり,その後徐々に減少していくような生存時間関数を想定し, 区分指数分布は表 3 に示す生存時間割合を設定した.なお, L a k a t o sの方法の bは pow 巴rプロシジャのデフォ ルトである b= 1 2,b r e a kp o i n t数 は l年を l区間とするためを 4 とした.よって区間数は 5 である. 表 3:区分指数分布の時点における生存時間割合 時点における生存時間割合 区間 1 2 3 4 5 π=70% 82% 79% 76% 73% 70% π=50% 70% 65% 60% 55% 50% π=30% 58% 51% 44% 37% 30% 民u q白

28.

シミュレーション手順は以下の通りである. I .HR,対照群の最終生存割合 ( π ) を与え, F r e e d r n a n,S c h o e n f e l d,L a k a t o s の症例数設計方法で検出力 80% を保つために必要な l群あたりの例数 N を算出する. 2 . 薬剤群の最終生存割合,ハザードを導出する.区分指数分布を想定する場合は,各区間ごとに導出する. 3 . 表 2 に示す生存時間分布に基づく乱数を l群 N 例ずつ発生させる. 4 . 2 . において,生存時間が 5年を越えた場合は打切りとする. 5 . 発生させた乱数について,有意水準 5%でログランク検定を行なう. 6 . ログランク検定の結果, p値が 0 . 0 5 未満であれば有意とする. 7 . 3.~6. を 10000 回繰り返す. 1 0 0 0 0 回繰り返して,有意になった割合を検出力の推定値とする.検出力が 80%に近くなっているかどう かを評価する.また,過程 3 . の区分指数分布で生存時間乱数を発生させる際には,以下のように行った. I.一様分布 ( F ( t ) )を発生させる.ここで , F ( t ) は( 3 . 9 )式 f ( t )の累積分布関数である. 2 .S ( t )=1‑F ( t )の関係から,発生させた乱数がどの区間に入っているのかを表 3 を参照して確認する. 3 .( 3 . 7 ) 式より, I を求める. 5 シミュレーション結果と考察 5 . 1 必要な症例数 表 4 に各症例数設計方法における l群あたりに必要な症例数を示した. F r e e d r n a n の方法で求めた l群あ c h o e n f e l dの方法, L a k a t o sの方法で求めた症例数 N よりも多くなっている.またどの症 たりの症例数 N が S 例数設計方法においても, HR と最終生存割合が小さいときは l群あたりの症例数が少なくなっている. 表 4:1群あたりに必要な症例数 HR 0 . 7 5 0 . 5 0 0 . 2 5 最終生存寄j 合(π) 70% 50% 30% 70% 50% 30% 70% 50% 30% F r e e d r n a n 720 425 298 1 5 3 90 6 2 57 34 2 3 L a k a t o s 714 420 293 1 4 9 8 5 5 8 5 3 30 1 9 S c h o e n f e l d 710 419 294 1 4 2 8 3 57 43 2 5 一 1 8 5 . 2検出力の比較 表5 :指数分布を仮定した場合の検出力 0 . 7 5 HR 0 . 2 5 0 . 5 0 最終生存割合(π) 70% F r e e d r n a n 80.9% 80.7% 80.3% 8 2. 3% 82.8% 82.7% 85.8% 87.6% 87.7% L a k a t o s 79.8% 79.8% 79. 3% 80.9% 80.0% 80.5% 82.5% 83.2% 82.0% S c h o c n f e l d 79.6% 79.8% 80.3% 79.0% 79.6% 79.2% 74.6% 7 6. 3% 79.4% 50% 30% 70% 2 6‑ 50% 30% 70% 50% 30%

29.

表6 : ワイブル分布 (r=2.0) を仮定した場合の検出力 0 . 7 5 HR 50% 0 . 5 0 70% 0 . 2 5 30% 最終生存割合(π) 70% Freedman .5% 82.2% 83.5% 85.3% 87.9% 88.7% 80.9% 80.2% 80.3% 81 L a k a t o s 4% 79.9% 80.0% 81 .1% 80.1% 80. 4% 82.5% 83.5% 81 80. .9% 巴I d S c h o e n f i 79. 4% 79.3% 79.8% 78.5% 79.9% 80.0% 73.9% 76.2% 30% 50% 70% 50% 30% ~.4%1 表7 : ワイブル分布 (r=0.5) を仮定した場合の検出力 0 . 7 5 HR 0 . 5 0 0 . 2 5 最終生存割合(π) 70% Freedman 79.7% 80.3% 80.7% 81 .9% 82.8% 82.9% 85.8% 87.7% 88. 3% L a k a t o s 79.6% 79.8% 79.2% 80.1% 80. 4% 80.9% 83.2% 83.5% 81 .7% S c h o e n f e l d 79.5% 79.8% 80.1% 78.5% 79.2% 80.2% 74.3% 76.1% 79.9%I 50% 30% 70% 50% 30% 70% 50% 30% I 表8 :区分指数分布を仮定した場合の検出力 0 . 7 5 HR 50% 0 . 2 5 0 . 5 0 70% 30% 最終生存割合(π) 70% Freedman .0% 81 79.8% 81 . 1 % 81.8% 82.8% 83.2% 85.3% 88.0% 88.3% L a k a t o s 80.1% 79.8% 80.2% 81 .0% 80.3% 80.9% 82.8% 83.0% 81.3% S c h o e n f e l d 79.8% 79.5% 79.6% 79.2% 79.3% 79.5% 74.5% 76.2% 79.8% 30% 50% 70% 50% 30% 表 5,表 6,表 7,表 8 より, HR が Iに近いときはどの症例数設計方法を用いても想定した検出力 80% に 近くなっている.また, HR が lから大きくずれると,想定した検出力からの君離が大きくなることが定量 直に関わらず指数分布と同様に検出力 的に示された.生存時間分布にワイブル分布を仮定した際には, γ のf が保たれており,また,シミュレーション条件において生存時間分布に区分指数分布を仮定した際には,指 数分布と同様に検出力が保たれることが示された HR が l から離れるにつれて Freedman の方法は検出力が名義水準に比べて過剰になっているが, S c h o e n f e 1 dの方法は検出力が想定した 80% を保てていない. L a k a t o s の方法は HR が lから大きくずれると きは少し過剰になる傾向があるが,どの条件においてもほぼ 80% に近い値をとっている.検出力が常に 80% 以上になっているという意味では Freedman の方法が最もよいが,倫理・経済的な観点、から検出力が名義水 a k a t o s の方法が優れていることがわかるただし HR が lから大きくずれるときは L a k a t o sの 準に最も近い L a k a t o s による方法は区間ごとにイベン卜数 方法でも検出力が過剰になる傾向があるため注意が必要である.L c h o e n f e 1 d による方法よりも適切に症例数を算出することができると考え を算出することから, Frcedman,S られる. 6 まとめと今後の課題 本積では,生存時間分布にいくつかの確率分布を想定し,生存時間解析における各症例数設計方法のシミ 円 i qム

30.

ュレーションによる検出力の比較を行なった.結果, L a k a t o s の方法は生存時間分布にワイブル分布,区分指 数分布いずれを仮定したときでも,他の症例数設計方法よりも検出力が名義水準に近くなり, L a k a t o s の方法 を用いることがよいと結論づけられた.ただし, HR が lから大きくずれるときは想定した検出力以上にな るので注意が必要である.本研究では,限定したシミュレーション条件で各症例数設計方法を比較した.そ のため,今回得られた結果が,より広い条件でも同様に適用できるかはわからない.実データでは,比例ハ ザード性が成立していない場合や,患者の登録期間,途中脱落を考慮して症例数設計を行なわなければなら ない場合がある.よって,先に挙げたような様々な状況を含む場合で性能比較を行し、同様の結果が得られる かどうかが今後の課題となる. 参考文献 [ 1 ]F .M . ‑ S .8紅白e l, A . B a b i k e r , P . R o y s t o , n andM.K.B.Parmar.Evaluationofsamples i z eandpowerf o rm u l t i a r m s u r v i v a lI r i a l sa l l o w i n gf o rn o n ‑ u n i f o r ma c c r u a l, n o n ‑ p r o p o r t i o n a lh a z a r d s, l o s st of o l l o w ‑ u pandc r o s s o v e r .S t a t i s t i c s , Vo. l2 5, p p .2521‑2542, 2 0 0 6 . i nM e d i c i n e [ 2 ]L .S Freedman.T a b l e sof血enumberofp a t i e n t sr e q u i r e di nc l i n i c a lt r i a l su s i n gt h el o g r a n kt e s. tS t a t i s t i c si n Vol .l , pp.121‑129, 1 9 8 2 . M e d i c i n e, [ 3 ]EL a k a t o s .Samples i z eb a s e dont h el o g ‑ r a n ks t a t i s t i ci ncomplext r i a l su s i n gt h el o g ‑ r a n kt e s. tS t a t i s t i c si nM e d i c i n e, Vol .44, p p .229‑241, 1 9 8 8 . [ 4 ]D S c h o c n f e l d .Thea s y m p t o t i cp r o p e r t i e so f n o n p a r a m e t r i ct e s t sf o rc o m p a r i n gs u r v i v a ld i s t r i b u t i o n .B i o m e t r i k a, Vo . l6 8, p p .316‑319 ,1981 . [ 5 ] 大橋靖雄,浜田知久馬.生存時間解析 SAS による生物統計.東京大学出版, 2005 [ 6 ] 中西豊支,五所正彦,菅波秀規. Powerプロシジャを用いた生存時間解析における症例数設定方法の統計 学的 考察.SASForumユーザー会学術総会 2006 論文集, pp.16ト 1 6 9,2 0 0 6 . [ 7 ] 浜田知久馬,藤井陽介.生存時間解析の症例数設計.日本 SAS ユーザー会論文集, p p .73‑98,2 0 0 3 . [ 8 ] 福田治彦,新美三由紀,石塚直樹米国 SWOG に学ぶがん臨床試験の実践 臨床医と統計家の協調をめ 0 0 6 . ざして.医学書院, 2 ∞ [ 問 列 9 ]SASO凶 n I l i n e 泊D∞ o c9 . 1 山h t 句 t 中 p : ゴ : / ρ / ゐ s 釦u 押 pp o r 託 ts a s . 心 . ∞ c om o 凶 n J 汐 9 引 別I d ω oc / d ω o c M 臼a i 加 n 戸 pa 伊 g e ι . おP 阿(最終関覧日 20 0 8 / 0 6 仙 / / 凡1 6 ) 2 8‑

31.
[beta]
!5t.;.a話器内示ふ山山-二11 凡ッJぷ三一川"""川一昨川内川--川~

日本における初回献血者数の推定
田久浩志、岩本晋ヘ今井常彦**
中部学院大学リハビリテーション学部、徳山大学福祉情報学部¥東邦大学医学部 H

Howt
oe
s
t
i
m
a
t
enewb
l
o
o
dd
o
n
o
r
si
nJ
a
p
a
n
TakyuH
i
r
o
s
h
i、IwamotoSusumu,I
m
a
iTsunehiko
TokuyamaU
n
i
v
e
r
s
i
t
y
*,TohoU
n
i
v
e
r
s
i
t
y
*
*
ChubuGakuinU
n
i
v
e
r
s
i
t
y,

I
SA
vh

千 円 川 ザ

ケ

ペ

イ

い

引

ル ザ ー 総 会 内 子 げ 子"
'
l
.IiiJ:I$'JtftiIシヨジセ!'Bllン

要旨:
今回、我々はネット調査で~19-26歳の約 2 万人の献血経験

の有無のデータを入手した。この調査は 1
9
‑
2
6歳の若年層
の無作為抽出調査と仮定できるので、このデータからわが
国の初回献血者、未経験者に影響を及ぼす要因を検討し
た
。
そのため最初に単変量分析を行い内容を検討した。その
後、献血未経験者数の変化に与える要因を力プランマイ
ヤ一法とコックスの比例ハザードモデルで検討した。
最後に、幾つかの仮定をした上で初回献血者数の推定を
行なった。
キーワード:献血者、生存期間分析

‑29 ‑

I
‑

32.
[beta]
「Sf引
い
.;1;
:jユーザ}総会アカデミ 7 テ苧ノロジ・・晶 Yリ三四シ耳ンセッシ釜ン
f

叫

川

川沿‑

はじめに
我々は新規献血者を確保するために、実際の輸血現場で
どのように血液が使われているかを提示すると、新規献血者
がどの程度、増加するかを検討している。
献血に関する簡単な説明と、輸血現場レポートの提示で新
規献血者は有意に増加したが、従来の献血者の年齢分布と
どの程度異なるかが定かでなかった。
そこでネット調査で入手したデータから、どの程度の情報が
得られるかを検討したので報告する。

2

(SAS.:J.-ザー総会均三r ージー&~'}.l.-;;'l/ t";'3ン

ヤ

i

質問内容
基本属性
一性別、年齢、居住地、婚姻の有無、子供の有無
‑
2回
、 3・4回
、 5回以上
一献血の経験ない、 1
一献血に対する認識
.献血は必要だと思い、いつか献血に協力しようと思う
・献血は必要だと思うが、進んで献血に協力しようとは思わない
.献血は必要だと思わない
・種々の理由で献血はしない
献血未経験者のみ、下記のできない内容を質問
ー貧血、服薬、病気などで
妊娠中・授乳中
‑輸血歴・臓器移植歴
‑1
年以内にいれずみを入れた
一海外渡航から帰国して4
週間以内

ピアスをあけて 1ヶ月以内
1
年以内に予防接種を受けた
その他の理由で献血ができない

ーいずれもあてはまらず、献血ができる
30 一

3

33.

「 γ s ヤ vμ 川 川 s !l.Iカチ芝~〆〆子てウ?ノロジ申畠",1 リ):1.主唱シ寄ンセツシ脅ン .1 三川一山十 川一引川い一‑川一 I E I i l ユ 山 ザ 凶 叫 砂総華会 :勺片日川 ω 川 戸 川 叫 : 日 川 : 円 ; 叫 年齢と献血経験 0 6, 0 7年度 1: な し ,2 : 1・2回 ,3 : 3 ‑ 4回,4: 5回以上 年畠 E 量 箇 H::ULK 血0:.の分重量轟 l 二鋪茸る分街年度司師 ~ f 年 畠E 量値 H:U 1 .K血 0 : . の 分 割 義 仁 鋪 茸 る 分 柄 年 康 司 口 町 モザイク箇 ‑nHHHU肉回目MMn 日 同 HH 悶日目 禽母国閣誕百 S05 000 芸 田 752 富島町 S 降 . 曲 O C Ia2S a o o 1920 2 1 2 2 2 3 2 4 2 s 。 0 0 1 92 02 1 2 2 2 3 2 " 2 5 2 5 年齢(数値〕 否語調達一一一一一一一 分割轟 日1.献血経験 度空間1 3 4 1 8 1 38 5 2 827 197 55 6 7 1 1印 2 66 235 8 8 1 1日74 日1 1 134 1287 264 248 83 133 1225 Z拍 110 1 6 1 1327 170 470 286 2 5 542 180 3 2 1 2 2 19 803 1 日9 77 2426 2 4 2 1 日重叡 1 19 20 2 1 22 23 ' 2 4 25 26 門事訴)鍾肘 ︹担額)鐘尉 1 9 556 20 693 6 8 5 2 1 2 2 ; 7 8 8 2 3 7 6 1 24 1 767 2 5 108 日 2 6 1 1 7 6 6506 26 年齢〔数値〉 ∞ 一一一 日1.猷血経験 3 E 465 1 0 6 520 176 518 1 8 5 5 7 1 229 6 3 1 255 695 332 7 5 3 363 852 396 50窃 2042 4 2 9 26 3 8 7 1 6 6 8 1 8 6 140 8 7 1 5 3 1白 204 1 1 5 239 140 234 665 1148 626 806 850 1026 1 1 2 6 1335 1470 1622 8860 2006年 10977人 (M:4284人 F:6693人) 2007年 8860人 (M:3192人 , F:5668人) 4 1山 献血未経験者分析の問題点 • 通常のグラフのように、ある年齢の経験の有無ではない • 横軸が連続変数で、献血経験者発生により、献血未経験者 が累積して減少する形になっている。 • いつ、献血したかでなく、献血者の属性で未経験者の存在が 有意に異なるか否かを考える必要がある • 献血経験をイベント発生と考えると、解析方法は生存時間分 析つまり、未経験者の生存率の話になる。 5 31

34.

!.ユーザー総会必ザテヲノ……ム シミン ‑ 一 山 I 年度ごとの基本属性の比較 空言 項目 人数 2 0 0 6 1 0 9 7 7人 2 0 0 7 8 8 6 0人 1 9 ‑ 2 2歳の割合 3 8 . 2 6 % 3 7 . 3 2 % 男性割合 3 9 . 0 3 % 3 6 . 0 3 % 東京大阪近郊の割合 1 ) 5 8 . 8 5 % 5 8 . 1 1 % 婚姻 1 6 . 8 7 % 1 4 . 7 4 % 子供の有無 1 1 . 1 8 % 1 0 . 0 8 % 献血経験 4 0 . 7 3 % 4 3 . 5 1 % 1)東京都・神奈川県・千葉県・埼玉県・太阪府・京都府・兵庫県・和歌山県・奈良県・滋賀県 6 i ~斗ーが総会ルミァ子守ノロジ~シ山山ン ペザ山氏 パ 川 二 I 生存期間分析による解析指針 2006年度と 2007年度で特別に献血者確保のイベントを行なってはいな 一年度の遣いは考慮しない ‑ 若い時に知何に献血者を増やすか、あるいは未献血者を減少させるか ‑ Wilcoxon検定は観察期間の初期に生じたイベントに重点を置く 一口グランク検定は観察期間の後期に起きたイベントに重点を置く ‑→Wilcoxon検定に注目して解析する ‑ 性別の違い、未婚か既婚、子供の有無などの基本属性による遣い ープロモーションのターゲ、ツトをどこにするかを絞り込む 一子供の有無は未婚か既婚かにいれでも良い 7 qJ 臼 つ

35.
[beta]
a
.
;
;
.
;
e
川

川
J じ川引

心い什
μ
λ

山
一
一
ぷ
ん
川
川
州
作

…
吋
一

川

川 川 ‑ 川 … や 川n…

ι

守
:
守
千恥
I !

s~ユ一ザ一主総華会 ?古デミ!lI予ヲノ口ジ岬畠 νg
リ
'
1
立乏‑シ耳ンセツタ鍵ン

打ち切りに関する考察
‑献血ありをイベントとするか、献血なしをイベントとするかが
難しし、
‑調査は 1
9歳からの連続追跡調査とみれるが、献血経験をし
た後も調査をしている形になる白つまり、ある時点での献血
経験あり、は過去のどこかで経験した事になる白それであれ
ば、献血なしをイベントとし、献血経験ありを打ち切りとする
方がリーズナブルになる。
いずれにしろ、献血の有無の両者を打ち切りとして、結果が
大きく異なるかを検討する
8

「
1
1
ムド話会ァ五日 叫
口
九
ァ
…
…
…ζ ‑
T

二
二 :
γ
i

V

性別による累積未経験率
1
:男 2
:女左:献血ありイベント

司{

⁝め
ま
羽散

6
2

5
2

P<O.0001

0
.
0
2
7
8
1
0
.
0
2
0
7
1
0
.
0
1
6
6
2

グループ
1
2
組み合わせ
分位車
グルプ

故障数打ち切り敷
平問
3
3
3
8
4
1
3
8 2
4
.
4
9
4
7
4
9
8
8
7
3
7
3 2
4
.
7
8
0
2
8
3
2
6
1
1
5
1
1 2
4
.
6
7
3
9

‑‑

棟皐鼠差

E599
望
日75

平問

2
3
.
9
9
4
2
4日制
2
4
.
0
5

伽000

要釣…

2
5
7
4
E
z
‑
‑D
E
O
D

イベントまでの時間・年齢(数値)
打ち切り変数:献血の有無
打ち切りの値 o
グルァプ変数二性別

4
2

3E
21

2

P=O.027

あ日齢
る;年

i
‑
‑.

2
6

K

イベントまでの時間:年齢{数値)
打ち切り変数 :
i
献血の有無
打ち切りの値
グル=1.重要~:性別
要約
グループ
故障数打ち切り敵
1
4138
3
3
3
8
2
7
3
7
3
4988
組み合わせ
1
1
5
1
1
8
3
2
6
分位車

2
5

よ
こ一
ト!
=
﹃
1
:
‑

n 2
] 2
4
年齢{数値)

品開祈一罰

2
1

一+富一宮幽二
一バ川一ロ山二︑︐
帽プ山一司

W

‑
一
団
幽F
2
1
:9
1
⁝剖障す
‑89878543210

2

0
.
1

0
.
0
1
9

i

huan

。

L 司? 8 6 0 0 0 8 9 0 0 0
一
⁝叩 生 一 時 除 制

0
.
8
0
.
7
時0
.
6
倖0
.
5
刻。A
0
.
3

右:献血なしイベント

中 央 値 時 間 下 側9路 上 側 9見 2見寿命 7
5
%
寿命
5 25%
寿命 7
均寿命
グループ
中 央 値 時 間 下 側 95% 上側 9
1
H
H
H
II
B
1
H
H
B
n
B
2
2
5
2
5
25
23
2
6 2
B
B
B
~
組み合わせ
2
5
2
5
2
5
22
2
6 組み合わせ
2
6
2
6
2
6
2
4
グループ聞での蹟定
グループ聞での蹟定
績定
力イ 2乗 自 由 度 p
値 (Prob>ChiSq)
検定
力イ2乗 自 由 度 pf
直(Prob>ChiSq)
ログランヴ
0
.
1
8
7
1
1
0
.
6
6
5
3
ログランヲ
9
3
.
2
7
1
9
1
<
αl
O1
叩
4
.
8
8
7
5
1
0
.
0
2
7
1
W
i
l
c
o
x
.
刷Ico
x
叩
9
5
.
2
2
4
4
1
<
.
0 1

・

∞・

・

9

qJ

nJ

36.
[beta]
lm

ユ ー ザ 唯 一 戸 ? 円 ノ ロJ
凡 ソ

未婚か既婚による累積未経験率
1
:未婚 2
:既婚左:献血ありイベント
LK~Í',I~~7,~~!管法にき善努空界め

J
I

2

1.0i

0
.
9
0
.
8
0
.
7
冊0
.
6
i
牢0
.
5
制M
0
.
3
0
.
2

ー…

川 山 一

J

j

生存分続プロット

生存分額ブロヲト

I

右:献血なしイベント

.
.
; J\~pl~n:!oIei~[法によるおτi幸俊

三号と│凶

母1
0
.
'

0
.
1
0
.
0

1
9

a

2
1

2
2 2
3 2
4
年齢(敵値)

イベントまでの時間年齢(骸値}
打ち切り変致:献血の有無
杭ち切りの也、

2
S

H

年齢(敵値)
イベントまでの跨間年齢{数値)
打ち切り董敵:献血の有無
打ち切りの鍾 O~._. ̲.

P<O.0001

'fl"'="1..~車掌丞蛍詮管な一一一『一一一一一一一一「
ゲルプ
1
2
組み合わせ
分位卓
ゲループ
1
2
組み合わせ

故障敵打ち切り散
平均
標準鼠差
9788
6
8
9
1 2
3
.
8
1
6
2
0
.
0
1
8
7
8
回 目0
2
4
7
5
1
7
2
3
1435 2
5
.
1
8
1
1
5
1
1
8326
2
4
.
0
5
0
.
0
1
6
6
2

検定
ロゲランウ
Wico
間同

力イ2乗 自 由 度 p値(Pr曲>
C
h
i
S
q
)
6
6
9
.
1
5
4
3
1
ι由国1
8
7
2
.
9
4
0
3
1
<.白河 1

ゲループ
1
2

組み合わせ

珂聾命
中 央 値 時 間 下 側95 上 側9珂 2部寿命 7
d
d
d
n
H
2
6
26
2
6
2
5
2
5
25
25
2
2
2
6

:
1
'!
k
:
:
:
?
'
1i'L'ii側兵二一一二二二

P<O.0001

二一……………
、要鈎………一一 一一一一………一一

グループ重県;輔が否か

要約

故障政打ち切り散
平均
視準鼠差
回9
1
9
7
8
8
24.51ω1686
1
4
3
5
1
7
2
3 253952
0
.
0
2
1
1
5
8
3
2
6
1
1
5
1
1 2
4
.
6
7
3
9
0
.
0
1
4
5
9

分位卓
ゲループ
1
2

目 上 側9
5 2田寿命 7
5 寿命
中 央 値 時 間 下 倒9
d
d
H
n
H
H
H
d
組み合わせ
2
6
2
6
2
6
2
4
rゲ矛孟プ間壱の積定
一 「

町

力イ2
乗 自 由 度 p値 (
P
r
曲>
C
h
i
S
q
)
ロゲランヲ 3
曲 2
674
1
<凪J01
W
i
c
o
x
間 切7
.
7
2
5
3
1
ι
αJ01
'
横定

・
・

・
1
0

l~一同会子長一一-&'/')… U以
一一-~
子供の有無による累積未経験率
下

1:子供あり 2
:子供無し左:献血ありイベント

右:献血なしイベント

1
.
0
0
.
9
‑
0
.
8

0
.
7
型
軽0
.
6
j
!
j
:0
.
5
剖M
0
.
3
0
.
2

2
0
6
0
.
7

0
.
5

制。A

0
.
3
0
.
2
0
.
1
0
.
0

R

0
.
1

m

~

D M
年齢{敏値}
U

H

0
.
0
1
9

H

組み合わせ

2
1

2
2 2
3 2
4
年齢(散値}

2
S

2
6

要約

要約
ゲループ
1
2

2
0

イベントまでの時間:年齢{数値}
打ち切り置敵:献血町有隅
打ち切りの値 o
ゲループ置敵:子供の有無

イベントまでの時間年齢(数値}
打ち切り変数日献血の有無
打ち切りの値 1
ゲループ変数:子供の有無
故障散打ち切り敵
平均
1
1
7
9
9
4
1 2
5
.
1
0
1
8
1
0
3
3
2
7
3
8
5 2
3
.
9
1
5
8
1
1
5
1
1
8
3
2
6
2
4
.
0
5

視準眼差
且0
3
1
2
2
且1
8
0
3
0
ω1662

分位点
ゲループ
1
2

5 2
5 寿命 7
時寿命
中 央 値 時 間 下 側 g同 上 側 9
H
H
H
d
d
d
d
n
H
組み合わせ
2
5
2
5
2
5
2
2
2
6
グループ聞で由積定
横定
力イZ
乗自由度 p
(
直(Prob>ChiSq
)
ロゲランウ 3
0
且5
8
回
1
<D
回1
W
i
co
x
o
n 4
4
7
.
5
1
3
8
1
<凪J01

・
・

グルプ
1
2
組み合わせ
分位車
ゲルプ

1
2

故障致打ち切り敵
平均
9
4
1
1
1
7
9 253341
7385
1
0
3
3
2 2
4
.
5
8
1
9
8326
1
1
5
1
1 2
4
.
6
7
3
9

標準眼差

0
.
0
2
7
2
6
0
.
0
1曲 1
0
.
0
1
4
5
9

中 央 値 時 間 下 側g
路 上 側9
5
混 25
包寿命 7
叫寿命
H
H
H
d

H

H

H

M

組み合わせ
2
6
グループ闘での積定一

26

26

2
4

償定
ロゲランヲ

w
i
c
回開

力イ2乗 自 由 度 p値(Pr曲,>Ch
i
S
q
)
1
8
2
.
8
3
9
2
1
ι血目1
2
6
1
.
3
2
6
8
1
<β佃 1

・
・

1
1

d斗ム

qu

37.

トい吋九川 川 s 一一辻九…川 川 似f …州一一詩み民→一t ν i 小 ι │ SASユ町ザ 山伽縫華会 ?カデ芝r.子子ウノロジ‑晶 yリユ‑シ書!i!.iセツシ祭ン " r , ' < 'ヲメ一手推定値 比例ハザードモテ、ルによる検討 項 推定値標準誤差下値Ij信頼隈界上側信頼隈界 未婚か否か[ 1 ] 0 . 2 9 6 0 8 1 9 2 0 . 0 1 2 6 2 0 2 0 . 2 7 1 3 4 8 0 . 3 2 0 8 1 8 5 要因 未婚か否か パラメータ数自由度尤度比カイ2乗 p 値( P r o b > C h i S q ) 1 1 6 2 8 . 7 5 6 1 3 2 < . 0 0 0 1 . 主一一 1 . 0 体0 . 7 * H0.6 と0.5 l 〈 h K 0 . 4 0 . 3 0 . 2 0 . 1 。 。 19 …〉 時間 生存率 2 6 0 . 2 4 2 4 4 1 2 25 0 . 4 2 7 3 7 7 1 24 0 . 5 5 7 7 0 0 4 23 0 . 6 6 1 2 7 5 22 0 . 7 4 6 9 9 2 6 2 1 0 . 8 2 5 1 7 1 6 20 0 . 8 8 9 3 4 1 4 1 9 0 . 9 5 0 3 0 1 9 察0 . 9 担0 . 8 20 2 1 2 2 2 3 2 4 2 5 献血経験ありを打ち 切りとする 変数を選択した結果、 未婚か否かのみが、 ~I スク比 項 リスク比下側信頼隈界上側信頼限界 未婚か否か[ 1 ] 1 . 3 4 4 5 8 1 . 3 1 1 7 3 1 1 . 3 7 8 2 5 5 l 1 J I果 の 尤 度 比 検 定 有意にリスク比が 1 . 3 4 5 1こ上昇。 つまり累積未経験率 は減少した 2 6 年齢(数値) 1 2 一 円 一 一z 川 七 弓 引 い トι I I I I I I I I I I I I 戸 川 川 小 川 川 川 川 ‑ 引I I I I I I I I I I I I I I I r~ザー総会?カデミア I子ヲノロジー&ソリ耳目シヨジセ 7 シ議ン ここまでのまとめ • JMPの生存期間分析を用いて、累積献血未経験者という観 点から献血者増加に影響を与える要因を探った。 ‑従来から言われていた、独身者の方が献血にきやすいとい う点が確認された。 ‑子供の有無、性別による違いがあるように見えても、独身か 既婚かの関係による差異で、あった。従って社会人を対象に 9 ‑ 2 4歳ぐらいの学生を相手にプロモーションをす するよりも 1 る方が効果的と考えられる。 1 3 nJ FD

38.
[beta]
2mb.

ドふ斗云主会?カチミアテヲノ戸二両

ン

I

戸

初回献血者数の予測
‑今回、手に入った資料を使って、年齢別の初回献血者数の
予測ができないか
‑ 日本赤十字社の統計資料では H
17年度で2
0
‑
2
9歳で
1
8
9
0
8
3人の初回献血者数があった。これは同年齢の人口
.
2
1
%にあたる。あとは 10歳階級での初回献血者の数が
の1
公表されているのみである。
‑しかし、初回献血者数の効果を求めるには、年齢別の予測
値が欲しい
‑そこで幾つかの仮定をして、初回献血者数を推測する
14

I

i
~日一総会問…ノロト&γ!.:=ふ戸ζ未経験者の中で貧血で献血が出来ないのは一定数
しかし、種々の理由で出来る人は減少する
;毒菌語{数極極 Q3.献血がモきない理由 7
極分割表 f
: .年齢〔数値)正Q3._1献血が~さな L\理由里ゐ分部表 i二

一

二
二
二
コ

~1.00

浅女子ク函…一一
、
。

但

母

%ザ'.:(~~--一

一

事
。
,
̲ 75

二:一一三

智0.7
旬

草
」

J

品
‑
t
l
U

。
官 50

V

v
明

哲

星0.25

西
経

σ
M

M

σ0.00
1920 2
1 22 23 24

2
5

1
920 2
1 22 23 24

26

25

26

年齢(数値)

年齢(数値)

‑出来る人の減少→実際に献血をすると仮定
15

ρhu

qJ

39.

f ~ユーザー総会均一子示..ソムふセふシ(以 下 ... … ‑ 建前と本音と矛盾 デ 0 3 .古車ができない理由 gと0 2 .古血ピ対する意識の モザイク園 ‑献血が出来ない理由 9= 色々な条件を除外して献血 ができる ( 1 ) といっても、献 血は必要だと思うが、進んで 献血に協力しようとは思わな い(緑)の場所の人がいる 鰭 4 同 t { aU . . n 守 E 叫 が ‑ 者0.50 種。 25 Z 可 σ 0 . 0 0 。 0 3献血ができない理由 9 ‑つまり、献血できるといって も3832/5207=0.736が本当に 献血できる人と考えられる。 :分割表 1 6 l~斗ーサー総会開ミ 7 …山=……ーンヨン I J 未経験者、対象者、すすんでする者、貧血でない者 、年齢 ( e . JとQ1.・. J I I 径一・白分割褒にぎT号分析 J 献血ができない理由 9 1 7 ウt qJ

40.

ι ‑E !~ユーザー総会-初日子 1&&認ンいヨン 山 献血未経験者の変化による推定 一歳毎の減少割合=初回献血率 0. 4 ‑献血できる ・すすんで献血する A 貧血考慮 一指数(献血できる) 一指数(すすんで献血する) 一指数{貧血考慮) 4 [ 10 . 3 制E 押 遺0.2 4 民 団 . 1 種0 y=3.2428e‑乱1 5 1 1 x 。 R2=0.9763 1 8 20 24 22 26 28 年齢 18 川寸l 「…‑ーザー総長ふ7 巧ムぷ二一山ム 日赤統計による初回献血率の推定 0 . 0 1 5 y=O.074ge‑0.0696X 0 . 0 1 0 . 0 0 5 。 20 30 40 50 年齢階級 代表値 初回献血者数 2 0 ‑ 2 9 3 0 ‑ 3 9 4 0 ‑ 4 9 5 0 ‑ 5 9 6 0 ‑ 6 9 2 4 . 5 3 4 . 5 4 4 . 5 5 4 . 5 6 4 . 5 1 8 9 0 8 3 1 1 4 5 1 1 6 4 1 2 2 4 6 1 6 6 9 4 9 7 3 8‑ 6 0 H 1 7人口 初回献血率 1 5 6 3 0 6 4 7 0 . 0 1 2 0 9 6 9 4 1 8 4 9 0 6 3 8 0 . 0 0 6 1 9 2 9 2 1 5 8 0 6 4 5 7 0 . 0 0 4 0 5 6 7 . 0 0 2 4 2 3 2 1 9 0 5 1 6 6 3 0 1 5 9 7 7 2 3 9 0 . 0 0 0 5 9 4 4 1 70 1 9

41.

「五五五五二平こ泌 日赤の統計から求めた近似式と 今回求めた近似式による初回献血者数の推定 ~軒今回の近似日赤の近似 1 9 20 2 1 2 2 23 2 4 2 5 26 2 7 28 2 9 0 . 0 2 6 0 . 0 2 2 0 . 0 1 9 0 . 0 1 6 0 . 0 1 4 0 . 0 1 2 0 . 0 1 0 0 . 0 0 9 0 . 0 0 8 0 . 0 0 7 0 . 0 0 6 0 . 0 2 0 0 . 0 1 9 0 . 0 1 7 0 . 0 1 6 0 . 0 1 5 0 . 0 1 4 0 . 0 1 3 0 . 0 1 2 0 . 0 1 1 0 . 0 1 1 0 . 0 1 0 H17人口 今回の推定 日赤統計の推定 1442590 1471327 1481329 1469413 1485939 1546900 1 5 8 8 5 5 1 1655017 1701624 1787957 31944 2 8 0 1 1 24247 20679 17979 1 6 0 9 1 14207 12726 11249 10163 187295 26859 25552 23996 22203 20943 20336 19480 18930 18155 17793 214247 計 • 2 0 ‑ 2 9の初回献血者数 1 8 9 0 8 3人 人 口 1 5 6 3 0 6 4 7人 . 0 1 2 ‑人口に対する初回献血者率 0 「 肘 川 川 市 山 村 山 内 ‑ 守 : 一 川 川 : 明 兵 一 S!:.R!われ総会アカヂ~子ヲふる-ーシヨンセ山ン 4 引 い 川 20 ..... 門 川 や 怖 心 まとめ ・ネット上のアンケート調査データより、各年齢における初回 献血者数の推定を行なった。 ‑その結果、実際の初回献血者数 1 8 9 0 8 3人に対して 1 8 7 2 9 5 人となり、実際の値より早く減少する傾向はあるものの、 2 0 歳台の献血者確保の評価の参考資料になると考えた。 ‑上記推定と、独身既婚の別が累積献血未経験者に影響を与 える点は、今後の初回献血者確保手法に応用できると考え られる。 本研究の一部は厚生労働科学研究費補助金、医薬品・医療機器等レギュラ卜 ) 1 サイエンス総合 研究事業、「献血者の増加に資する教育教材の開発とその効果の検証 (H19‑医薬ー一般. 033)J Iこ ょ っf こ 。 2 1 Qd つd

42.

経時臨床データ!こ対する RobustL inearMixedModelsの適用 ‑SAS/ lML を利用した MCMC 法による推定一 0橋詰公一 住商情報システム株式会社 統計解析ソリューション部 ARobustL i n e a rMixedModelA n a l y s i sf o rLo n g i t u d i n a lData MCMCI m p l e m e n t a t i o nu s i n gSAS/IML 一 K o i c h iHashizume(k.hashizume ( a ) ; o t a . s c s . c o品 ) S t a t i s t i c s& A n a l y s i sS o l u t i o n0唱p a r t m e n t, SumishoComputerSystemsC o r p o r a t i o n 要旨 線形混合モデルは経時臨床データの解析に多く用いられるが,変量効果及び誤差の分布に正規性を仮定 することが多いため,外れ値の影響を受けやすい.今日,この外れ値の影響を弱めるためのロバストな解 析手法がいくつか提案されている. o s aela l( 2 0 0 3 )が紹介している,誤差の分布 本稿では,外れ値を含みやすい経時臨床データに対して, R にN o r m a V i n d e p e n d e n td i s t r i b u t i o n sを仮定した線形混合モデ、ルを適用する.そして,このモデルのパラメー タをマルコフ連鎖モンテカルロ法で推定するための SAS/IMLプログラムを紹介する. 直 , SAS/IML キーワード:マルコフ連鎖モンテカルロ法,線形混合モデル,経時データ,外れf 1 はじめに 臨床データは得てして外れ値を有するものであるが,その中でも特に,繰り返し観察される経時臨床 データはその傾向を強く持っている.しかしながら,経時臨床データがこのような特徴を持つにもかか わらず,現在これらのデータ解析に多く用いられている線形混合モデルは変量効果及び誤差の分布に正 規性を仮定していることが多いため,この外れ値の影響を受けやすい.そのため,この問題を解決する ための方法がいくつか提案されているが ( S t r a n d e n& G i a n o l a ,1 9 9 9 ;G i l l,2 0 0 0 ;P i n h e i r oela l ,2001;Rosael a l , 2 0 0 3 ;R o s ae la l , 2 0 0 4 ),これらの解析手法を実装するための SASプロシジャは現在提供されていない. そこで本稿では,外れ値の影響を軽減するモデルの lっとして,誤差の分布に裾の重い N o r m a l / i n d e p e n d e n t分布 ( A n d r e w s& M a l l o w s,1 9 7 4 ;L a n g e& S i n s h e i m e r ,1 9 9 3 )を仮定した線形混合モデル を適用し,このモデルのパラメータをマルコフ連鎖モンテカルロ法(以下, MCMC法)によって推定す るための SAS/IMLプログラムを紹介する. 4 0

43.

なお,経時臨床データにおいては外れ値にもいくつかの定義が考えられるが,本稿では. r ある対象者 内に推定される回帰直線から著しく外れている観察値」と定義する. 以下では. 2節で線形混合モデルの定義と Normallind巴pend巴n t分布について述べ. 3節で誤差の分布に Normallindepend 巴n t分布を仮定した線形混合モデ、ルのモデルパラメータを MCMC法で推定する方法につ いて述べる. 4節 で MCMC法において乱数発生に少し工夫がいる内容を中心に SAS/IMLプログラムを 5節でいくつかの外れ値パターンに従う仮想データを用意し,正規分布及び Normallindepend巴n t 紹介する . 分布を仮定したモデルを適用した結果について議論する.最後に 6節でまとめと考察を行う. 2 . 線形混合モデルと N o r m a l / i n d e p e n d e n t分布 2 . 1 . 線形混合モデル 一般的に線形混合モデ、ルは次の式で、定義される. ( 2 . 1 ) Yj=Xjs+Zjbj+ej ここで Yjは対象者 i(i=I.2....m;mは対象者数)に対する n i次元の反応変数ベクトル. Xjと み は そ れ ぞれ既知の説明変数に対する叩 pと nixqの計画行列. sは固定効果を意味する p次元ベクトル. bjは患 i次元の誤差ベクトルで、ある.変量効果 bjは全ての患 者 iの変量効果を意味する q次元ベクトル, ejは n J Dの正規分布に従い 者において,平均 O. 共分散行手I Dは ( i . j )要素が d j i= d i jの qxqの共分散行列であ 土平均 O. 共分散行列 Rj(nixnJの正規分布に従い,添え字の iは次元町にのみ関係しており,そ る. ej1 の未知パラメータ数は対象者 iに依存しない.また,変量効果 bjと誤差 ej1 土互いに独立であると仮定す , Ri=σ2I る.なお,線型混合モデルを適用する場合において Rjは jとした互いに独立であるとし寸仮定 をおくことが非常に多いため,本稿ではこの仮定を前提とする. 2 . 2 . Normal/ in d e p e n d e n t分布 No r m a l l i n d e p e n d e n t分布は. Y=μ+e/JWとした k次元の確率変数ベクトルとして表現する. )に従う確率変数 ここで, μは位置ベクトル. w は確率密度関数 p(w[v vはスカラーまたはベクトル . 共分散行列 Zの正規分布に従う確率変数である となるパラメータ.e1土平均 O で w が与えられたもと Yは,平均 μ,共分散行列I:/wの正規分布に従う. Yの周辺分布を以下に示す. p(Y[μ, I : , v)=fp作 μ │, I : , w)p(w[v)dw No r m a l l i n d e p e n d e n t分布は p(w[v )を変えることで,いくつかの裾の重い分布を与え, しばしばロバス l a s h分布を以下に示す. トな推測に利用される.本稿で取り上げる多変量 t分布と多変量 s 2 . 2 . 1 . 多変量 t分 布 w が以下に示すガンマ分布白mma( v/2 , v/2 )に従うとき, Yの周辺分布は多変量 t分布 t k( μ, , : Iv )に従 う.ここで vは自由度を意味するパラメータであり w と vの取りえる範囲は w >0 , v>0である. Aせ よ ー

44.

W 1 4 バ 2 . 2 . 2 .多変量 s l a s h分布 w が以下に示す確率密度関数に従うとき Yの周辺分布は多変量 s l a s h分布に従う ( R o g e r sandTukey , 1 9 7 2 ;Langea n dS i n s h e i m e r ,1 9 9 3 ) . w とvの取りえる範囲は, 0<w壬 1, v>0である. p(wI v )=vw ,,‑ 1 3 . Normal/independent分布を仮定した線形混合モデル ) ‑ ( 勾 式( 2 . 1)の線形混合モデ.ルを次のように考える. J Yj=Xjl J+Zjbj+ I :j ここで , "i=ei/j 可であり,それ以外の記号は式,(2 . 1 )で説明した通りである.前述した通り Wiは確 率密度関数 p(WiI v )に従う確率変数であり(i = 1ム … m), vはスカラーまたはベクトルとなるハイパーパ ラメータである.なお R1=σ21 2 . 1 )のモデルは,全ての iについて W i=1とした式( 3 . 1) 1と仮定した式( のモデ、ルの特殊な場合である. 本稿で、は式( 3 . 1)のモデルをベイズ統計学の枠組みで考え,事後分布に基づく推論を行う. 3 . 1 . ベイズ統計学と MCMC法 本稿では Normal / i n d e p e n d e n t分布を仮定した線形混合モデルのモデルパラメータ θの不確実性を確率 分布 p ( θ )として表現し, θは確率変数として考える.この場合,確率分布に推測の興味があるため,観 ( θ , Ix )に 測したデータを用いて条件付けして,データの情報が付加された θに関する条件付き確率分布 p 基づいた推測を行う.一般的にベイズの定理を利用して,条件付き確率分布を次のように定義する. p ( < θ, x )̲p(θ)f(xl θ) ー p ( θ Ix ) 計 二 了 p~θν(xlθ) F応戸 fp()f(xl θ θM o cp~θν(xlθ) ここで,ベイズ統計学の枠組みにおいては , p~θ) を事前分布 , p~θI x )を事後分布とよび,さらに p ( θ) f ( x lθ )を事後分布の「核」とよぶ.なお , f ( x lθ ) は尤度関数である. 実際の推測においては,事後分布の期待値(ベイズ推定値)に興味があるが,モデルパラメータの数 が多く,モデ ルが複雑な場合は 1 積分が複雑J. 1 高次元 J ,1 解析的な解がない」というような問題がし ばしば生じるため,簡単にはこの期待値を求めることができない.よって本稿では,事後分布からの確 率標本を MCMC法によりサンプリングし,得られた確率標本から事後分布に関する要約や,事後分布 に基づく推論を行う.具体的には, MHアルゴリズムに基づき,同時事後確率密度から導出した完全条 件付き事後分布を用いてサンプリングを行う.なお,サンプリングが容易にできるパラメータは MHア ルゴリズムの特殊な場合であるギブスサンプラーを用いる. 4 2

45.
[beta]
3
.
2
. 完全条件付き事後分布の導出
3
.
1節で述べたように,完全条件付き事後分布を導出するための同時事後確率密度を尤度関数と事前分
布から導く.まず R
osaela
l(
2
0
0
3
)を参考に. MCMC法の実装を容易にするための尤度関数を以下のよう
な w とY の同時確率密度として考える.

白p(W1ゆ
作jIw.s.bj.(2)

2

i

i

今

)4
(
︑
句
d

寸till11

ν九 十

n
m

k
u

1JU
什J

nnv

z

x

Y

k
u

Ta

z

i

一

UV

﹂
xE

Fll'h''11111
﹂

i一
が

吉
Mrm

山市

nvaρLV

l
w f l判

EX

iEKX

m
H
H 川

い
.

p Y1
s
.b
.a • v
)
=

工n .p(w v)=ITp(w v)

n=

1

i

i1

つぎ、に,事前分布はモデ‘ルパラメータ ~.b.D.σ2.V) に関して,式(3 .3) のような同時事前分布を仮定し,
v以外の各パラメータの事前分布は表 3
.
1 に示す分布に従うと仮定する.ここで H はハイパーパラメー

.
S
.C
!
J2
.札)を意味する
タの(伊I

p~.b.D. σ 2. V1
H)=p
(
s)
p
(
b1
D)
p
(
D1
C
!
JI
.S
)
p
(
σ21C
!
J2
.s2)
p
(
v
ll
;
)

(
川

表3
.
1:事前分布
ノ号ラメ

b

タ

分布

I
分布
事円J

一様分布

p
(
s
)o
cc
o
n
s
t
a
n
t

正規分布

バbl山

27
:
j

。

D

ウィシャート分布

バD1C!JI'S)OC[D[い

σ2

ガンマ分布

ん21伊 制 作+
1
)e
xp
{

)
/
2exp{-~畑一1 )
} .
[
D
[
>

2.S2)

到

,
σ2>0

事後分布の核は事前分布×尤度関数から以下になる.

p(w.ß.b.D.σ2. v I Y • H )り(Y 1
w
.s
.b.a2
)
p
(
W1
V
)
xp
(
b1
D)
p
(
D1
C
!
JI
'
S
)
P
(
'
σ21
伊2,
S2)
p
(
V1
1
;
)

(
3.
4
)

この事後分布の核に,表 3
.
1の事前分布を採用した同時事後確率密度は以下になる.

川 b.Dσa 2 • 川
v
一
叫
悶
Y
│
川
叫
川
叫
H
川
)
ド
φ
叫
桝
州
桐
阿
│
阿
同
D
阿
阿
阿い
(
E

副昨「
n竹 一

j
州
ザ
川
イ
(
古
(
伊
的斗
2 叫州何 砂
Xj
ル
μ
日
j
p
s
μ
ト
山
s
叫
‑
山
Z
却
j
帆
向
j
b
削
川
川
y
y
吋
(
何 "

p
却
X
x
{

T

ベ叶指~[匝
2 帆村什吋ゆゆ
r中柿初炉防防
叶-→
γ
Dび
-1

)
]

‑4
3

川
!

似
附)

46.
[beta]
式(
3
.
5
) から導出される各パラメータの完全条件付き事後分布を表 3
.
2に示す.このモデ ルの場合,完
全条件付き事後分布は全て既知の確率分布に帰着する.よって,この表に示したパラメータは全てギブ
スサンプラーによるサンプリングが可能である.なお,本稿では完全条件付き事後分布の導出に関して

R
o
s
ae
ta
l(
2
0
0
3
)から多くの部分を引用・抜粋している.
.
2
: 完全条件付き事後分布 (
wと v以外)
表3

パラメータ

分布

p

正規分布

ベ

完全条件付き事後分布

(
2
w
X
7
X
i
)
l
(
Z
w
X
7
(
Y
i

b
;

正規分布

(i=I,
2
,
.
.
, m)

D

T
σ
1
I T
f
"
"
I
T
.
,
.
1
‑
1
[
(
T
z
‑
1
J
一1
z
T
(
y
;
-x;p~(;;
!
Z
;
+
D
‑
fl
N
I
I
z
;
'
Z
;+
+:~
w
一
t
D
L
(
Y
i
‑
L
P
L
‑
σ
7Z
;
'
Z
;

内

ャート分

n¥ W j ,
.

,
.

b
;‑

逆ウィシ

川 や XTx;fl
'7'

ー

I
>‑inverse‑Wishαr
t
(
λぃ
1
1
'1
)

芝
川

11
=
(
8
+

布

Iー+伊 ,
1
1
'

i
=
1

,
v
)のとき , y‑1=inverse‑Wishart(n,V
)
y=W(n

σ
2

逆ガンマ
分布

&2 inverse Gamma(λ2,
1
1
'2)

ん=川

l

Iニ

=

y Gamma(n
,
V
)のとき , y‑1=inverse‑Gamma(n,
V
)

つぎに , p(wlv
)の選択によらない w と vの完全条件付き事後分布は以下になる.
p
(
w
;I
p
,
b,
D,
σ2,げ, H
)
o
c

吋
wf
t
戸
n

町机』

1 1
.
σ

J

p
(
vI
w,
p
,
b,
D,
(]"2,
Y,
H
)
o
cp(vI~)白 p(w; I
v
)

p(wlv
)に 2
.
2節で示した確率密度関数を定義した場合の多変量 t分布と多変量 S
l
a
s
h分布の完全条件

付き事後分布を以下に示す.

3
.
2
.
1
. 多変量 t分布
2
.
2
.
1節で定義した p(wI
v
)‑Gamma(ν/2,vl
2
)から

叫
)

p
ん
(
,
ト
い
w
予
刊
竹
う
F
;ゆ
I
p
,
帥
bρ
,
D,
σ
d
2,
げ ,H
刈虻 川
w
叫什(やい
(
n

wの完全条件付き事後分布は以下になる.

I 2 l σ 2,
‑
,

4
4

‑‑Ir

‑'‑1/

,
‑
,

‑
‑
,
.
.
‑
‑ ,
‑ 1
1
)
ハ
│

47.
[beta]
この分布は以下のガンマ分布よりサンプリングが可能である.

叶(}
H
ν
+去何吋叫 同吋一川)
T

つぎに, νの事前分布として p
(
ν)zv‑2を採用すると

川

b.Dσ2.Y

昨甘(4r
川

叶i
Z

糾 log

2

111111114

寸

m

)

4

勾

r

一
B2

﹁1lili‑‑ItL

一
一
)
(ν
z

ω
ν

O
C
t
r

p
(
v
j叶 b.D山

vの完全条件付き事後分布は以下になる.

件

H
)
o
c
t
r
(
ν)
xG
側 m

l iZ(w b

この分布に従う乱数は容易に生成できないため, M H アルゴリズムか棄却サンプリングを用いる必要
がある.本稿では独立サンプラーを用いた M Hアルゴリズムを適用する.

3
.
2
.
2
. 多変量 Slash分布
22節で定義した p(wjv)=vw'一lから

W

の完全条件付き事後分布は以下になる.

↓

p(W
p
,
b,
D,
0"2
,
げ, H
)
o
cW
j
n
j
/
2
‑
r
lーIX吋 止 す (
Yj‑XjP‑Zjbjy(Yj‑XjP‑Zjb;)
jj
、
I 三σ
│

この分布は以下の切断ガンマ分布よりサンプリングが可能である.なお

W j の取りえる範囲は

u<w<1 である.
Wj ‑

1
]
T
r
u
n
c
a
l
e
d‑Gamm~ I +
ν1
.
‑
‑ 7(
Yj‑XjP‑ZjbjY
(Yj‑XjP‑Zjbj)
.
¥.
¥2
)2
σー
j

与

つぎに, νの事前分布として p
(
ν
j~)oc va‑Ie
x
p
{
‑b
v
}を採用すると, νの完全条件付き事後分布は以下に
(,
b
)であり, αと bは小さい正の数とし
なる.なお, ~ =α

bくく αとする

十‑
2
l

んjw,p,b,Dσ2,y,H)oc

m aI
V +‑ x
e
xp{
‑

この分布は以下のガンマ分布に従う.

叶

v‑Ga

川

n+α b Z

‑45 ‑

句

48.
[beta]
4
. SAS/IMLによる実装
M Hアルゴリズム(ギプスサンプラー)に基づき. 3
.
3節で導出した完全条件付き事後分布からサンプ

リング、を行って,各モデ ルパラメータの確率標本を得る.具体的には以下の手順に従う.

•

M Hアルゴリズム(ギプスサンプラー)の手順
t= 0 とする.
(1)パラメータの初期値 11(0)• b(O).0(0).(σ2)(0).W(O).V(O)を設定し. ド

(
勾
2) 均(炉
p~.P 凶
1b
(
ο約
ヘ
ベ
)
ぺ
け
t.
O
(
引
の
f
約
)
川
(
刃
3) 坤
p
炉I
P加
+
(
I
υ
l
+
l
),
O(勺 め
σ州
勺
2
d
叩
)
戸(
1
)
に
,
川
ザ
W
w
〆
例
引
l
(
ぺ
υ
1
)
い
,
1)
,
パ
川
v
ω
(
1
け
)
づ
)
か
ら bνb
加
引
(
1
l
+
1
り)をサンプリング

べ
ω
)
L

め

が

(
の
4
) p(O[11加
(
1
+川 υ
加
(
川
r
件
川
+
叶1
),
(σd
勺
2
)
戸(
I
),
W(
引
ぺ
け
f,
川
v
川
(
ν
引
J
サ
1
約
)
)
づ
)
か
らD
0(
加
引
+
1
件
f+
1
)をサンプリング

p
(
σ
,2[p
(l
),
b( l
),
0(1
+1
),
W 円。))から (
0
"2
)加1
)をサンプリング
(
6
) p
(
w[p(I+l),b( l),O(ベ(σ2)(1+1),V(t))から W( l)をサンプリング
(
5
)

l+

l+

l+

l+

ベ

(7) p(v[
1
1
(1
+
1
),
b(

川 σ 2)
(
1
+1
),
W(I+引当ら V(
I+
l
)をサンプリング

0(1+

(
8
) tを t+1 として (
2
) に戻る.

(
2
)から (
8
)の手順を不変分布に収束するまで十分な回数繰り返す.なお,ギプスサンプラーを適用でき

ないパラメータは厳密にはこれに従わない.本稿では 3ユ1節の多変量 t分布のパラメータ νがこれに該
当し,この場合は(通常の)M Hアルゴリズムを用いなければならない.ここでは独立サンプラーに 3ユl
節の νの完全条件付き事後分布ではなく,ガンマ分布を用いる場合について示す. (独立サンプラーに完
全条件付き事後分布を設定したのがギブスサンプラーである)
現時点の νを ν(1)とする.まず,過去の値に依存しない独立サンプラー q
(
・)より,

ν
(
1
+
1
)の新しい候補と

4.1)式の採択確率により決定する.採択
して刊をサンプリングする.そして,この刊を採択するかを (

された場合は ,V(I+l)=日とする.もし候補日が採択されない場合は,

ν(
作 1
)=ν(1)とする.この手順を上

記の (
7
)の箇所で順に繰り返す.

山

V
(
I
+
l
): m

J
}

i
l

Aν(1) [
p(I+l),
b(
1
+1
),
0(1
+1
),
(σ2)仰 1
),
W 加1
) (V*

… l" A 〆[
p
(1
),
b(l+l
),
0(1+1),
(σ2)(1
+1
),
W(I+l)J
}lV(I)))

(
4
.
1
)

仲

これらの手順は S
AS
江MLを用いることで容易に実装が可能である.やや難しく注意が必要な点は行列
演算と乱数の発生方法である.前者は付録のプログラムを参考にして頂きたい.後者の乱数の発生方法
は,逆 W
i
s
h
a
r
t分布と切断ガンマ分布についてのみ S
A
S
/
削 Lプログラムを具体的に紹介する.

‑

逆ウィシャート分布
2分 布 と 正 規 分 布 に 従 う 乱 数 か ら 発 生 が 可 能 で あ る . 表
逆ウィシャート分布は x
3
.
2の

1
)I
こ従う乱数は. ¥
1
/1を S
ASの R O O T関数を用いてコレスキー分解した行

O ‑I!附r
s
e‑W
i
s
h
a
r
t
(
λl'¥
1
/

2
分布に従う乱数(各要素の自由度は
列 A を用意し¥1/1と同じサイズの正方行列 T の対角要素に x

λ1‑i+l
.i
は行数)を発生させ. i
手 j
,
i<jとなる要素 d
i
jに正規分布 N
(
O,
I
)に従う乱数を発生させ,
ASのコードを
それ以外の要素を 0とした行列を用意し,下記の行列演算により求める.具体的な S
以下に示す.

‑ 46

49.

。 ‑ A) (ATTTT ーI ー 逆Wisha吋分布に従う乱数を発生 ;/*ψ1= PUSAI1,λ1= LAMDA1. / (NROW(PUSAI1, ) NROW(PUSAI1), 0);合初期化, T=J A =ROOT(PUSAI1); = DO̲ I 1TONROW(PUSAI1); J=̲ ITONROW(PUSAI1); DO̲ ̲ I= ̲JTHENT[ ̲ I ,̲ J ]= SQRT(RAND('CHISQUARE',LAMDA1‑̲ I+1) ) ; I F ̲ I ,̲ J ]= RAND('NORMAL',0,1); ELSEI F̲ I<̲JTHENT[ END END: D=GINV(A 、* T ・ 7 A); . ・ ‑ 切 断 Gamma分布 切断分布に従う確率変数の簡単な乱数発生方法は,切断区間に入ったサンプルを全て捨てること である.ただし,受容区聞が狭い場合は,ほぽ永久的にサンプリングを続けてしまう.そこで本稿 では逆関数法を用いて効率的にサンプリングを行う方法を用いる. ガンマ分布 Gamma(a, b) に従う乱数 w を 0~1 の範囲内だけで発生させたい場合は , G amma(a, b )か らの乱数が 0~1 の範囲に入る一様乱数を発生させて,その一様乱数から逆関数法により w を得る. SASのコードを以下に示す.なお, QUAN T lLE関数は SAS V9から追加された新しい関数であり, CDF関数と逆の操作,すなわち,与えられた確率から分位点を計算できる. 官 Gamma(a , b) からの乱数が0~1 の範囲に入る = 篠乱数を生成; UNI RAND('UNIFORMγCDF('GAMMA', 1, a, b); 合一様乱数の{直に相当するW をサンプリング, w =b・ QUANTILE('GAMMA',UNI, a) ; 5 . 仮想データでの解析 5 . 1 . 仮想データ 以下に示す様々な外れ値パターンの仮想データを基にして,本稿で紹介したモデルの性能評価を行う. 仮想データの枠組みとして, 治療群 :2群(実薬群,プラセボ群) ‑ 症例数 :50例/群(計 100例) ‑ 時点の数 :5時点 (week= 0, 1 , 2 ム4) とし,下記のモデルに従うデータを作成する. 。 Xυ1+βJ Y i j=β +βj w e e k i j+β2 ( w e e k i jx X i j l ) + b ; o+bnweekij→‑ e i j ここで乃 w e e k i jおよび e i jは,それぞれ, 1番目の対象者の J時点目における観測値,投与週および ,プラセボ群のとき 0をとる変数である.また,固定効果として時期 誤差である . x i j lは実薬群のとき 1 4 7̲

50.

効果 β l ' 薬剤効果んおよび薬剤×時期の交互作用 s ; oと時期効果 b ; )を含んだモ 3'変量効果として切片 b デルとする.本モデ ルにおけるパラメータの真値を次のように設定する. ( b m~ I ( 0~ ( 0 . 6 0 . 0 6 iI so=6 . 0, s1=‑0.02, ん =0 . I, s3=‑0.3,1 1‑NII~ 1 , 1 1 l b ; )) I l0/ l0 . 0 6 0 . 0 2 )1 川 n n/ n n̲ 誤 差 eijI 土,表 5 . 1に示す 6つの外れ値パターンに従う確率変数とする.なお,仮想データの作成およ び MCMC法での乱数生成には MersenneT w i s t e r を用いる. . 1・外れ値パターン 表5 パターン 2 3 4 種類 誤差 外れ値なしのパターン N(O, O.4)に従う e i j 両群ともに外れ値(両 合 で N(O , O. 4 ) , 1 %の割合で N(0 , 3 )に 両群ともに 99%の寄l 側)をもっパターン 従う 両群ともに外れ値(上 合 で N(O , O. 4 ), 1% の 割 合 で 両 群 と も に 99%の苦手l 側)をもっパターン Gamrna( l ,5 )に従う. 両群ともに外れ値(上 パターン 3の Gamma(I, 5 )を Gamrna(2, 5 )に変更する. 側)をもっパターン 5 両群ともに外れ値(上 パターン 3の Gamma ( l ,5 )を % 2 ( 1 0 )に変更する. 恨のをもっパターン 6 実薬群のみ外れ値(上 O .4)に従う.実薬群は week>2の投与 プラセボ群は N(O, 仰j)をもっパターン 週において, 99%の 割 合 で N(O, O. 4 ) , 1% の 割 合 で G a m r n a ( 7, 1 )に従い,それ以外の投与週は N(O, O.4)に従う. 5 . 2 . 比較する推定方法 5 . 1節で作成した仮想データに対して,次の 4つの方法でモデルパラメータの推定を行う. ・ MLE 誤差の分布に正規分布を仮定. Mixedプロシジャを利用して(制限付き)最尤法で推定. • MCMC(No r m a l ) 誤差の分布に正規分布を仮定 (w= 1 ) . SAS/IMLを利用して MCMC法で推定. • MCMC(t ) 誤差の分布に多変量 t分布を仮定. SAS/IMLを利用して MCMC法で推定. • MCMC(s l a s h ) 誤差の分布に多変量 S l a s h分布を仮定. SAS 汀M Lを利用して MCMC法で推定. MLE と MCMC(No r m a l )の結果が変わらないことを確認するとともに,外れ値を含む場合について MCMC(No r m a l ),MCMC(t )および MCMC(s l a s h )を比較する.なお,興味のあるパラメータは,期間全体 の効果を意味する薬剤×時期の交互作用んとし,以降はんの推定値についてのみ議論する. 5 . 3 . 結果 5 . 3 . 1 .1 " ¥ターン 6の仮想データの推定結果と収束診断 パターン 6の仮想データについて解析した結果を表 5 . 2と図 5 . 1に示した.図 5 . 1の上段の推移図から, この仮想データは実薬群のみが外れ値を含んでいるのが分かる. 4 8‑

51.

表5 . 2より, MLEと MCMC (Normal)の推定結果が類似した結果になっており, MCMC(t)と MCMC(s l a s h ) はこれらの推定結果よりも真値に近い値を推定できているのが分かる.図 5 . 1 の右下の事後分布からも . 1の左下の標本の時系列プロット(複数の初期 その違いは明確である.また , s3のサンプリングは図 5 Rから不変分布へ収束していると考えられる. 値からサンプリング)と収束診断の結果 J 工事後分布の要約 表5 T r u eV a l u e E s t i m a t e SD MLE MCMC(N o r m a l ) ‑ 0 . 3 0 0 ・ 0 . 3 0 0 ‑ 0 . 2 5 6 0 . 2 5 9 0 . 0 5 6 ( S E ) t ) MCMC( ‑ 0. 300 ‑ 0 . 2 9 5 ・0 . 3 0 0 ‑ 0 . 2 9 6 反復数 5000回 , B山百ーi n1 0 0 0回 司 MCMC(Slash) • • J R P 2. 5 P97.5 0 . 0 5 7 ‑ 0 . 3 7 1 ‑ 0 . 1 4 7 1 .0 0 0 . 0 4 0 ‑ 0 . 3 7 4 ‑ 0 . 2 2 0 1 .00 0 . 0 4 0 ‑ 0. 376 ‑ 0 . 2 2 0 1 .00 E s t i r n a t e列の MLEの行は最尤推定値,それ以外は事後分布の平均値 J Rは Gelman‑Rubin法による収束診断(Gelman& Rubi,n 1992) P l o to fA c t i v eGroup P l o to fPlaceboGroup ~ ~ ︒ ﹄ ︒ ﹄ 2 2 W~k W~k SamplePath P o s t e r i o rD i銭円 b u t i o n illl/ λ 日ru111111a'88a 四 山 h ﹄冒血WZ@ 己﹄︒t ‑ ‑ ω o a 864 , I~ ︐ 叫 0 8 a ~ 4 ︒ ﹄ " " "'" JOlO α ' " キ 0 焔 " 0 . 6 1 le r a t l o n ‑ 0 . 5 0 . 4 ‑ 0 . 3 ロ1 . 0 8剖.3 図 5.1:パターン 6の仮想データの推移図(左右上段)と MCMC(t)のんの標本の時系列プロット(左下)と 3つの MCMC法を適用した場合のんの事後分布(右下) 5 . 3 . 2 .シミュレーションによる評価 5 . 1節で定義した 6つの外れ値ノ fターンに従う仮想データについて,それぞれ 1 0 0回のシミュレーショ . 2節に示す 4つの推定方法の比較を行った.その結果を表 5 . 3に示す.なお,以下で、はパタ ンを行い, 5 ‑4 9

52.

ーン Xについて,表中では P a t t ernX,文中では PXとして表現する. . 3 :1 0 0回のシミュレーションによる推定値の比較 表5 MLE MCMC 小l o r m a l ) MCMC { ! 2 MCMC ( s l a s h ) P a t t e m1 Mean(s3) ‑ 0 . 2 9 5 ‑ 0 . 2 9 6 ‑ 0 . 2 9 7 ‑ 0 . 2 9 8 R e l a t i v eMSE* 1 .0 0 1 .0 0 0 . 9 9 0 . 9 2 95%CI ‑ 0 . 3 6 9 ・ ,0 . 2 2 1 心. 3 7 1 ー ,0 . 2 2 2 ‑ 0 . 3 7 2 ・ ,0 . 2 2 1 ・ 0 . 3 7 9 ・ ,0 . 2 1 8 P a t t e m2 Mean(s3) ‑ 0 . 3 0 1 ‑ 0 . 3 0 2 ‑ 0 . 3 0 5 ‑ 0 . 3 0 0 R e l a t i v eMSE牟 1 .0 0 l .0 0 l .0 6 1 .1 2 95%CI ・ ,0 . 2 1 9 ‑ 0 . 3 8 4,‑ 0 . 2 2 0 ‑ 0 . 3 8 2,‑ 0 . 2 2 7 ・ 0. 374,‑ 0 . 2 2 7 ‑ 0 . 3 8 3 Pa 仕em3 Mean(角) ‑ 0. 31 0 ‑ 0. 31 1 ‑ 3 . 1 2 ‑ 0 . 3 1 1 R e l a t i v eMSE* l .0 0 1 .0 0 l .62 1 .6 8 95%CI 38 3,‑ 0 . 2 1 9 ‑ 0 . 3 8 4 ・ ,0 . 2 2 0 ‑ 0. 394,‑ 0 . 2 3 6 ‑ 0 . 3 8 8,‑ 0 . 2 3 5 ‑ 0. P a t t e m4 Mean(角) ‑ 0 . 2 9 0 ‑ 0 . 2 9 0 ー 0 . 2 9 3 R e l a t i v eMSE* l .0 0 1 .0 0 2 . 1 8 95%CI 司 0 . 2 9 1 2 . 2 3 0 . 2 1 2 0 . 3 7 1,‑ ‑ 0. 46 8,‑ 0 . 1 1 3 ‑ 0. 46 8 ・ ,0 . 1 1 3 ‑ 0 . 3 7 4 ,‑ 0 . 2 1 1 ‑ P a t t e m5 Mean(s3) ‑ 0 . 2 9 8 ‑ 0 . 2 9 9 ‑ 0 . 2 9 8 ‑ 0 . 2 9 7 R e l a t i v eMSE牟 1 .0 0 1 .0 0 2 . 0 0 2 . 0 5 95%CI 45 5, ‑ 0 . 1 4 0 ‑ 0. 45 6 ・ ,0 . 1 4 1 ‑ 0 . 3 7 7 ー ,0 . 2 1 9 ‑ 0 . 3 7 4 ・ ,0 . 2 2 0 ‑ 0. P a t t e m6 Mean(s3) R e l a t i v eMSE* . . 95%CI ‑ 0 . 2 8 3 ‑ 0 . 2 8 4 ‑ 0 . 3 0 2 ‑ 0 . 3 0 1 1 .0 0 1 .0 0 l .1 8 1 . I 3 ‑ 0 . 3 6 4 ・ ,0 . 2 0 1 ・ 0 . 3 6 5 ・ ,0 . 2 0 2 ‑ 0 . 3 7 1,‑ 0 . 2 3 3 ‑ 0. 373,‑ 0 . 2 3 0 MCMC:反復数 5000回 , B出 子i n1 0 0 0回 R e l a t i v eMSE*:MLEの MSE (分子)に対する他手法の MSE (分母)の比 MLE と MCMC(Normal)の結果は,全てのパターンでほぼ類似した期待通りの結果となった.よって, 以降では MLE,MCMC(t)および MCMC(s l a s h )の手法について比較した結呆を述べる. 点推定値に最も偏りが生じたのは片方の群にのみ外れ値を含む P6の場合であり,それ以外のパターン P 3,P4において少し偏りがみられるが,これはシミュレーション回 ではほとんど偏りが生じなかった ( 0 0 0回実施した場合の MLEの点推定値はそれぞれ ‑ 0 . 3 0 3,‑ 0 . 2 9 8 となる. P6 数が少ないためであり, 1 はシミュレーション回数を増やしても偏りは減少しなし、).なお,本稿で結果は示していないが, P6 に ついて,外れ値の発生に week>2の条件がない場合は偏りが生じなかった.また, P6の偏りは(外れ nU RU

53.

値の発生に week>2 の条件がある下で)外れ値が大きくなるに従し、増加する傾向にあった. e l a t i v eMSEを用い つぎに, MLEの MSE (分子)に対する他手法の MSE (分母)の比を指標とした R て,各推定方法の推定値のバラツキを相対的に評価した結果について述べる ( P 6は除く). MLEに最適 な状況である P lは , MCMC(t )と MCMC(slash)の R e l a t i v eMSEがそれぞれ 0 . 9 9倍 , 0 . 9 2倍となり MLE の方が優れていた.それ以外のパターンは全て MCMC (t )と MCMC( s l a s h )の方が優れていた.それぞれ, MLEとほとんど変わらないのが P2 ( 1 .06倍 , 1 . 12イ苦),やや優れたのが P3 ( 1 .62倍 , 1 . 6 8倍),大きく 優れたのが P4と P5(2.00~2.18 倍, 2.05~2.23 倍)であり,外れ値の分布が左右非対称な場合に, MCMC(t) と MCMC(slash)が優れる傾向にあった.興味深い結果として, P 3よりも P4の結果が優れることから, 外れ値の分布が同一で、あっても,その期待値が大きくなることにより推定値のバラツキが大きくなるこ P 4のガン とが分かり, P4と P5の結果から,外れ値の期待値が同じであっても,右側に裾が重い分布 ( マ分布)の方が推定値のバラツキが大きくなることが確認できた. 95%信頼区聞は R e l a t i v eMSEの結果と関連が強く, MLEは外れ値の影響を受けることにより信頼区間 l a s h )は全てのパターンでほぼ一定の信頼区間 の幅が広くなっている.それに対し, MCMC(t)と MCMC(s が得られた. l a s h )は,全てのパターンにおいてそれほど結果は変わらず,明らかな傾向 最後に MCMC(t)と MCMC(s は確認できなかった. 6 . 結論 反応変数に外れ値を含む経時臨床データに対し,誤差の分布に正規分布を仮定した線形混合モデルを 適用すると偏りを生じる可能性があるが,裾の重い分布を仮定することによって,その偏りが減少する ことが示唆された. つぎに, 5 . 3 . 2節のシミュレーションの結果から, 1%程度の確率で外れ値を含む場合は,誤差の分布に 正規分布を仮定するよりも裾の重い分布を仮定した方が相対的に推定精度が高まり,特に外れ値が大き な値をとる場合その傾向がより顕著になることが示唆されたまた,外れ値を含まない場合についても, 正規分布を仮定した場合と比べて推定精度が大きく劣ることはなかった. よって,外れ値を含むことが事前に懸念されている場合で,かつ,平均的な効果に推測の興味がある ならば,線形混合モデ ルの誤差に裾の重い分布を仮定する方法は有用であると考える. 7 . おわりに SAS/IMLを用いて MCMC法による推定を行う利点は,プログラムが直感的に速く組めることと,有 用な乱数や関数が充実していることである.欠点は,実行速度があまり速くないことと,プログラムの ミスに気づきにくいことである.これ以外にも様々な利点・欠点が存在するが,一度しっかりとプログ ラムを作成すれば,使いまわせるパーツが増えていくため,複雑なモデルを適用する機会が多く,様々 なアルゴ、リズムを設計・検討したい人には有用かもしれない.なお, SASV9.L3の評価版として B a y e s i a n プロシジャが登場し, MCMC法を用いた推定が可能となるが,本稿で紹介したような複雑なモテ、ルはま だ解析できない 今後の拡張に期待したい. rD ‑ A

54.

参考文献 Andrews, D .F .& Mallows,C .L .( 19 7 4 ) .S c a l em i x t u r e so f n o r r n a ld i s t r i b u t i o n s .J o u r n a lo f l h eR o y a lS l a l i s l i c a lS o c i e t y 36, 9 9 ‑ 1 0 2 . S e r i e sB ., A .& R ubin,D .B .( 19 9 2 ) .I n f e r e n c e仕omi t e r a t i v es i m u l a t i o nu s i n gm u l t i p l es e q u e n c e s .S l a l i s t i c a lS c i e n c e .,7, Gelman, 457‑ 472 .S .( 2 0 0 0 ) .Ar o b u s tmixedl i n e a rmodela n a l y s i sf o rl o n g i t u d i n a ld a t a .S l a l i s l i c si nM e d i c i n e .,19, 9 7 5・9 8 7 . G i l l,P ,M.& L a c h i n,J .M.( 2 0 0 1 ) .A p p l i c a t i o no fr o b u s te s t i m a t i n ge q u a t i o n st ot h ea n a l y s i so fq u a n t i t a t i v el o n g i t u d i n a l Hu l a l i s l i α i nM e d i c i n e .,20, 3 4 1 1 ‑ 3 4 2 8 d a t a .S L a i r d , N.M.& Ware,J .H .( 19 8 2 ) .R a n d o m ‑ E f f e c t sModelsf o r1 ρ n g i t u d i n a lD a t a .Biomel 1 ・ i c s ., 38,9 6 3 ‑ 9 7 4 . Lange,K .& S i n s h e i m e r ,J .S .( 19 9 3 ) .N o r r n al /i n d e p e n d e n td i s t r i b u t i o n sa n dt h e i ra p p l i c a t i o n si nr o b u s tr e g r e s s i o n . JoumalofI h eAmericanS l a l i s l i c a lA s s o c i a l i o n ., 2 ,1 7 5・1 9 8 . Matsuyama, Y .& Ohashi,Y .( 1 9 9 7 ) .Mixedm o d e l sf o rb i v a r i a t er e s p o n s er e p e a t e dm e a s u r e sd a t au s i n gG i b b ss a m p l i n g . S l a l i s l i c si nM e d i c i n e .,16,1 5 8 7 ・1 6 01 . P i n h e i r o,J .C .& L i u ,C .H .& W, . uY .N.( 2 0 0 1 ) .E f f i c i e n tAlg o r i t h m sf o rR o b u s tE s t i m a t i o ni nL in e a rM i x e d ‑ E f f e c t s ModelsU s i n gt h eM u l t i v a r i a t etD i s t r i b u t i o n .J o u r n a lo f C o m p u l a l i o n a landG r a p h i c a lS l a l i s l i c s .,10 ,249‑276 ,G J .M.& G i a n o l a ,D .& P a d o v a n i,C .R .( 2 0 0 3 ) .R o b u s tL in e a rMixedM口氏 I sw i t hN o r r n a1 /1 n d e p e n d e n t Rosa D i s t r i b u t i o n sa n dB a y e s i a nMCMCI m p l e m e n t a t i o n .Biome l 1 ・ i c a lJ o u r n a l ., 45,5 , 5 7 3・5 9 0 . , GJ .M.&G i a n o l a ,D .&P a d o v a n i,C .R .( 2 0 0 4 ) .B a y e s i a nL o n g i t u d i n a lD a t aAna l y s i sw i t hMixedModelsand Ro回 T h i c k ‑ t a i l e dD i s t r i b u t i o n su s i n gMCMC.Joumalof A p p l i e dS l a l i s l i c s ., 3 1, 7 ,855・8 7 3 . .J .& G i a n o l a ,D .( 19 9 9 ) .Mixede f f e c t sl i n e a rm o d e l sw i t ht ‑ di s t r i b u t i o n sf o rq u a n t i t a t i v eg e n e t i ca n a l y s i s :a S t r a n d e n,I B a y e s i a na p p r o a c h .G e n e l i c s ,S e l e c l i o n ,E v o l u l i o n .,3 1, 2 5‑ 4 2 . 伊庭幸人・種村正美・大森裕浩・和合肇・佐藤整尚・高橋明彦 ( 2 0 0 5 ) . 計算統計 I I マルコフ連鎖モンテカ 2 .岩波書底. ルロ法とその周辺一,統計学のフロンティア 1 2 0 0 0 ) . 統計モデ ル入門朝倉書庖. 丹後俊郎 ( 2 0 0 1 ) . 医学統計のための線型混合モデル‑SAS によるアプローチ 松山裕・山口拓洋編訳 ( スト社. .サイエンティ L 円 Fhu

55.

付録 本 稿 で 紹 介 し た RobustLinearMixedModelsを 適 用 す る た め の SASプ ロ グ ラ ム を 以 下 に 示 す . な お , 紙 面 の都合上,多変量 S l a s h分 布 の み 紹 介 す る . 本仮想デ一宮 古注意 1:IML で用いるデ-~に欠損値があってはならない 牢注意2 症例番号は意でなければならない, PROC I I I l s e e d =1 2 3 4 C A L LS T R E A M INI T( s e e d ) n 5 0 水症例数 ti m e =5 事時点数 b e t a O=6 b e t a1=O .1 b e t a 2=‑ 0 .0 2 b e t a 3=‑ 0 .3 e rr =O .4 ;*モデルパラメ一世の真値 = C R E A T Ed a t O lV A R !p td r u gw e e k yJ 事 p t 症例番号. y 目的変数, w e e k 投与週. d r u g 役与群, D Od r u g= 1T O2 ;本薬剤書草分ループ, D Os s = 1T On ホ患者数分ループ p t =d r u g * 1 0 o+ s s * (一意の)症例番号 bm e a n =R E P E A T(0, 1, 2) ̲ parm= !0.6 0.06 , b ̲ c o v 0 . 0 6 0 . 0 2J bt 町I P =bm e a n 再J( 1 ,N ∞L(b ̲ c o v ̲ pa r m ),1) +R A N D(,N O R M Aじ , 0,J( 1, N C O L(b ̲ c o v ̲ pa r m ) )キ )R O O T( b ̲ c o v ̲ p a r同 ;..変量効果 多変量正規分布に従う乱数生成 DOw e e k=0 T Ot i m e̲ 1 ;キ投与週分ループ: * モデルに従うデ一世の発生一一一本 y=b e t a O+ ( d r ug =l )キ b e t a l+w e e k *b e t a 2+ ( d r ug =l ) *w e e k *b e t a 3 +b ̲ t e m p [ l,1 ]+b ̲ t e m p [ , l2 ]吋 e e k+ R A N D( 'N O R M 札 ,, 0 .e r r ) 本行の足し己み A P P E N D; E N D E N D E N D QUIT ∞ 1 本M ix e dプロシジヤで解析する場合, PROCM I X 印 D A T A=d a t O l C 凶S S p td r u g; M O D E L y=w e e k dr u gw e e k*dr u g/S O L U T IO N; R刷 D O Mi n tw e e k/S U B J E C Tニ p tT Y P E =u n 刷 R l 本R o b u s tL i n e a rM i x e dM o d e l sで解析する場合 PROC I I I l; *一一一デ-~の読み込み キ U S E d a t O l R E A Da l l *一一一諸定義一一ー* l o o p =1 0 0 s e e d =2 4 5 1 5 4 e e d) C A L LS T R E A M I N IT(s ∞ e , 本 f 叩M Cのサンプリング数 ;*吉L 数の種 ι *一一ーデーヲ加工ー一一一本 y =y .*反応変数を yベクトルとして定義 n =NROW (y) ;*デ一台数 a r r a y s =U N I O N (pt ) キ 症 例 番 号 を 意にした記列 p t ̲ r a n k=N C O L (a r r a y s) 事 症 例 数 n ̲ o b s =V E C D I A G (D E S I G N( p t ) D E SI G N( p t ) )田本症例ごとの O B S数を格納した配列 、 本 固定効果の計画行列の定義一一一* ( M i x e dプロシジャと同じ計画行事) 1を用意) ̲ d r u g=D E S I G N (d r u g) I RU つd

56.

̲drug=̲ d r u g [ .1: N C OL( U N I O N (d r u g)) ー1] =J ( n . 1 .1 )[ [w e e k[ [̲ d r u g[ [̲ d r u g非 w e e k :*画定効果の計画行吾1 1: *一一一変量効果の計画行列の定義一一一* ( M i x e dプロシジャと悶じ計百行列を用意) z ̲ a1 1 =p t[ 1 J( n .1 .1 ) 1w e e k :*全症例の変量効果をまとめて定義 Z ̲ G O1 =N C OL( z ̲ a1 1 )ー 1 *症例ごとの変量効果の数 0 0̲i=1T Op t ̲ ra n k: :*変量効果の計百行列を症例ごとに構成; z ̲ s u b=z ̲ a l l[L O C (( z ̲ a l l[ .1 ] =a r r a y sLi])渇)目 2・N C OL(z ̲ a l l ) ] :*対応する症例のデ‑';1の披き出し 1 F i 1T H E Nz z ̲ s u b z=B L O C K ( z. z̲sub) :*BL K行列として足し二み E L S E E N O = = ∞ ヰ (1)初期パラメー告の設定一一一*。 b e t a ̲ O =J(N C OL( x) .1 . 0 ) : 本 βの初期値 b ̲ O = J(N C OL (z) .1 .0 ) : *bi の初期値 d ̲ si g m a ̲ O = 1(z ̲ G o lヰ )1 0 本分散共分散行手1 1 0の初期値 引 g m a ̲ O =1 0 0 0 : *誤差分散 σY の初期値 w ̲ O =J( p t ̲ r a n k .1 .1 ) *wの初期値 v ̲ O =4 ヰ vの初期値 ∞ : * 事前分布の初期値(無情報事前分布とするか事前情報ありとするかで切り替え)一一一* • =O . 1 *0の事前分布の骨 1の初期値 = 1(Z ̲ G O1)崎. 0 0 1 : 本 D の事前分布の S の初期値 =0 . 0 0 1 :.σ の事前分布の骨 2の初期値 目 。 =0.001 :* σ の事前分布のど 2の初期値 v ̲ a =2 本S Ia s h分布のvの事前分布の a の初期値, vb =1 ¥ S Ia s h分布のvの事前分布の bの初期値, ∞ f a i10 s ̲ O f a i 2 ̲ 0 *ニニニその他の処理̲‑‑ 本 症例ごとにデー告を銭き出すための行列を準備一一一*. y ̲aI 1 p t1 [y x ̲ aI 1 =p t1 x = *一一ー保存変数名の作成 本 G o I ̲ n a m e= " r " *サンプリングN o 0 0 i=1T ON ∞L(x) 本固定効果用 G o l ̲ n a m e= G o l ̲ n a m e[ [ (、e t a "+ T R I M ( L E円 ( C H A Rしi ) ) )) E N O o l ̲ n a m e[ 1 "sigma̲1" : ヰ誤差分散用 G o I ̲ n a m e=G 0 0̲ i = 1T Oz ̲ G o l 本変量効果の共分散行列用 0 0ーj=̲ iT Oz ̲ G o I o l ̲ n a m e1 1 ("b̲Gov"+ T R I M ( L E F T ( C H A Rしi ) ) ) +T R IM( L E F T( C H A Rしj ) ) ) ): G o I ̲ n a m e=G E N O E N O: e *デ ';1をためる用の F u n G t i o nの定義, S T A R Ta p p e n d ̲ w (̲ n u lI̲) g l o b a l(a r .̲ r • beta̲O. s i伺 a̲O. z ̲ G o I .d ̲ s i g m a ̲ O• v ̲ O .w̲O) a r =̲ r[ 1 (beta̲O)、[[ sigma̲O :本固定効果と誤差分散の格納 0 0̲ i = 1T Oz ̲ G o l j=̲iT OZ ̲ G O1 a rニ a r[ [d ̲ s i g m a ̲ OLi. ̲ j ] :*共分散行列Dの格納 a ∞ 印D E N O: a r= a r[ 1v一oI [w̲O F I N I S H: 本v .wの格納 ヰー一一保存用デ‑';1セット作成 一事 rニ 1 RUN a p p e n d ̲ w( 1 ) [G o l n a m e= G o I ̲ n a m e] C R E A T Ed a t 0 2F R O Mar A P P E N OF R O Ma r ネデ‑';1セットに足しこみ M C ; 去の実施ニ * = ニ 削C λιz rD

57.
[beta]
0
0̲
r =2 T
Ol
o
o
p;
= (,,̲O事( OESI
G
N(
p
t
) )、)非 I(
n
) ;家計算用パラメ一世の準備
"a̲O
*一一̲M
Hアルゴリズム{ギブスサンプラー)による事後分布からの凱数生成

NxN ;
手順 (2)‑手練 (
8
) 一一一

事

2
) 固定効果 βのサンプリングー一一本
本一一一 (
b
̲
m
e
a
n
= (GINV(ピ柑a一口町)事(ピ柑a̲O*(y̲z*b̲O))) ,
b
̲
c
o
v
̲
parm=sigma̲O*GINV(ピ柑a̲U*x
)
= (b
̲
m
e
a
n
制
(
1
,N
∞L(b
̲
c
o
v
̲
pa
r
m
),
1
)i
*多変量正規分布に従う乱数を生成不/
b
e
t
a0
+R
A
N
O('
N
O
R
M
A
L
',0 ,J(
1
,N
C
O
L(
b
̲
c
o
v
̲
p
a
r
m
)
))
事R
O
OT(b
̲
c
o
v
̲
pa
r
m
) )、;
I

3
) 変量効果b
iのサンプリング一一ー宇
事一一一 (

g

t
a
m
eb
l
=0
0
0̲
i = 1T
O pt̲rank; *症例ごとに処理,
z
̲
s
u
b=
z
̲
a
l
l[L
O
C
((
z
̲
a
l
l,
[1
]=
a
r
r
a
y
sLi]) >
0
) ,2
;
N L(
z
̲
a
l
l
)]
; 事対応する症例のデー習を取り出す
y
̲sub=y̲all[LOC( (
y
̲a
l
l,
[1
] =a
r
r
a
y
sLi]) >
0
) ,2
;N
C
OL(y
̲
aI
1
)]
;
x
̲
a
l
l
[L
O
C
((
x
̲
a
l
l
[,I
]=
a
r
r
a
y
sLi]) >
0
),2
:N
C
OL(x
̲
a
l1
)]
;
x
̲
s
u
b=
b
̲
m
e
a
n
= (GI
N
V(
(
z
̲
s
u
b事
、z
̲
s
u
b
) + (s
i
g
m
a
̲
O)* I
N
V
(
,,̲OLi]) *GINV(d̲sigma̲O)
)
事z
̲
s
u
b、
事
(y
̲sub̲ x̲sub事beta̲O))、'
b
̲
c
o
v̲
pa
r
m=G
I
N
V
(,
,̲OLi]ホ INV(si伊 a
̲
O
) 事 zs
u
b事
、z̲sub+GINV(d̲sigma̲O)) ;
‑
I
)
*
2
+
1・
(
̲
i‑
I
)*2+2,1]ニ(b
̲
m
e
a
r
岬J
(
I,N
C
O
L(
b
̲
c
o
v
̲
p
a
r
m
),1
)i
本多変量正規分布に従う苦L
数を生成町
b
̲
O
[ しi
+R
A
N
O
('
N
O
R
M
A
L
',0 ,J(
1
,N
C
OL(b
̲
c
o
v
̲
pa
r
m
)
))
ホR
O
O
T(
b
̲
c
o
v
̲
pa
r
m
) )、'
t
a
m
e
̲
b
l=t
a
m
e
̲
b
l+ ((
b
̲
O[
(
ーi
̲
1
)*
2
+
1 しi
‑
l
)ぜ +
2,
1
]
) *(
b
̲
0
[(
̲
i
‑
1
)*
2
+
1
:ー
(i
‑
I
)
*
2
+
2,1])、) ;* L
b
、 bを計算しておく
E
N
O

∞

l

孝一一一 (
4
) 変量効果の共分散行事J
'0 のサンプリングーーー*
p
u
s
a
i
l =G
I
N
V
(S
̲
O+t
a
m
e
̲
b
l)
I
a
m
d
a
l =f
ai
1
̲
0+ p
t
̲
r
a
n
k
*コレスキー分解を利用して I
n
v
‑
l
li
s
h
a
r
t分布に従う乱数を発生 (
B
a
r
t
l
e
t
t分解)
T=J(N
R
O
W(p
u
s
ai
1,
) N
ROW(p
u
s
ai
1) ,
0) ;本初期化。
0
0̲
i = 1T
ON
R
O
W
(p
u
s
a
i
l)
0
0̲
j =̲
it
oN
R
O
W
(p
u
s
a
i1)
I
F
i ̲
jT
H
E
N TL
i
,̲
j
] S
a
RT( R
A
N
O
(
'
C
H
l
s
a
U
A
R
E
', l
a
m
d
a
l 一一 i+ 1))
;
jT
H印 TL
i
,̲
j
] =R
A
N
O
(
'N
O
R
M
A
L
',0 , 1)
E
L
S
Ei
f̲i<̲
E
N
O
E
N
O
NV(R
O
OT( p
u
s
ai
1)、事T
*
T R
O
O
T(p
u
s
ai
1))
d
̲
si
g
m
a
̲
O=GI

=

=

、

本一一一 (
5
) 誤差分散 σ Yのサンプリングー一一本,
I
a
m
d
a
2 = (n+ fai
2
̲
0)/
2
p
u
s
ai
2 =(
1
/
2
) 本 (s
s俳 句 i
2
̲
0+ (y̲x
*
b
e
t
a
̲
O̲z
功。)、柑a
̲
O
*(y
a
m
d
a
2
/
2 *p
u
s
ai
2)
*G
a(I
a
m
d
a
2
1
2, I
s
i
g
m
a
̲
O=1/ ((1
/p
u
s
a
i
2) ホ 陥N
O
(
'臥 M
M
A
',I
a
m
d
a
2
))

榊 b
e
t
a0̲ z
吋 ̲O) )

本=ニ=S
l
a
s
hd
i
s
t
r
i
b
u
t
i
o
nS
t
a
r
tニニニ*,/ホ正規分布を仮定したい場合はここでwとvを?に固定すればよい事/
*~_~ (6) wのサンプリングーー守本;

t
e
m
p
̲
r
O=p
t 1 (y 貯 b
e
t
a
̲
O̲ z
均一0) ;本残差を先に求めておく
0
0̲
i =1T
Op
t
̲
r
a
n
k;
開 p
̲
r
O
[L
O
C
((
t
e
m
p
̲
r
O
[
.
I
] =a
r
r
a
y
sLi]) >
0
),2
:
N
C
O
L
(
t
e
m
p
̲
r
O
)
] ;本対応する症例のデー告を取り出す
t
e
m
p
̲
r
l =t
s
l
a
s
h a = (n
̲
o
b
sL
i
,1
]
/
2
+
v
̲
0)
s
l
a
s
h
̲
l
a
m= 1/ (1
/
(
2
*
s
i
g
m
a
̲
0
)*
ie
m
p
̲
r
l*
t
e
m
p
̲
r
l)
s
l
a
s
h
̲
u
n
i =R
A
N
O
(
'U
N
I
F
O
R
M
')*CO
F
('
G
A
M
M
A
' , 1,s
l
a
s
h
̲
a ,slash̲lam); 本 O
ι
.
.
<
1の範囲仁入るー憾乱数を生成
,,̲OLi] = slash̲lamホaUANTILE('臥MMA',sI
a
s
hu
n[,sI
a
s
h
̲
a)
*一線乱数の{直に棺当するwをサンプリング
E
N
O
本
(
7
)v
のサンプリングー‑*;
v
̲O= (1/ (v
̲
b ̲S
U
M(
1o
g
,
,
(̲O)) ))本 RANO('GA酬 A
' , (pt̲rank+ v
̲
a))
本 ニ2ニ S
l
a
s
hd
i
s
t
r
i
b
u
t
i
o
nE
n
d= ニ *
本一一一作成したデ一世のためこみ一一一 ,
R
U
Na
p
p
e
n
d
̲
,
,
(
1
)
APPENO F
R
O
Mar
キデ~9 セットに足しこみ,
E
N
O
Q
U
J
T;

u

F同

D
﹁

58.

ラグタイムとコンパートメント数 O 勝田啓子・落合俊充・田崎武信 塩野義製薬(株) 解析センター LagTimeandnumbero fcompartments KeikoKatsudaIT o s h i m i t s uO c h i a iITakenobuT a s a k i , . tSHIONOGI&CO., LTD. B i o s t a t i s t i c sDep 要旨 薬物動態解析で用いられるコンパートメントモデルの利点のーっとして,薬物量の体内時 間推移にラグタイムを組み入れた評価がある.ここでいうラグタイムとは,例えば,薬物 投与時点から血中濃度が検出されるまでの問の時間を指す.本稿では ,n個のコンパートメ ントをー列に並べた直列コンパートメントモデルを想定し ラグタイムが表現される仕組 みを数理面から考察する.また,コンパートメントモデルの関数は, E rlang分布の確率密 度関数の一次結合で表されることを紹介する. キーワード:ラグタイム 直列コンパートメントモデル Erlang分布 1 はじめに 薬物動態学では,薬物の生体内における動態(吸収,分布,代謝,排池の各過程)を簡単 に表すモデルとして,コンパートメントモデ、ルが利用されている.薬剤が吸収され体循環 血液中に到達するまでの時間を考慮したモデ、ルにより,薬物を投与した時点から血中濃度 が検出されるまでに要する時間(ラグタイム)を推定することが可能である.なおラグタイム は,血液などの生体試料中の濃度推移で観測される以外に,薬剤投与時点から薬効出現時 56

59.

閉までの時間のズレとしても定義することができる.このため,コンパートメントモデル は,経時的に変化する薬剤l の効果を表す(数理)モデルとしても利用できると考えられる. コンパートメン卜数を増やすことによってラグタイムが考慮、されることは,模式的には 理解しやすい.一方で,ラグタイムが,数理的にどのように表現されているのかに関心が わく.本稿では,n個のコンパートメン卜を一列に並べた直列コンパートメントモデ、ルを考 え,ラグタイムが表される仕組みを数理面から考察する.また,一般に n‑コンパートメ r l a n g分布と関連付けられるとのことから, ントモデ ルは,待ち行列理論で用いられる E v の点について調べた結果も紹介する. 2 . 直列コンパートメントモデルにおける末端コンパートメントの動き 2 . 1 . n‑コンパートメントモデルと微分方程式 ,吸収速度定数を 図 1のような n‑コンパートメントモデ ルを考える.消失速度定数を k e k。とおき,時刻 tにおける第 iコンパートメン卜の薬物量を Xj( t )( i=1 , 2 ・ . ,,.n )とおく.こ こでは,第 nコンパートメン卜の薬物量 Xnが,時間経過とともにどのように変化するのか に着目する. 巳与日与与日与 第 1コンパートメント第 2コンパートメント 第 nコンパートメント 図 1 n個のコンパートメン卜を用いた直列コンパートメントモデル 図 1の直列コンパートメントモデルは,次の連立 1次微分方程式で表される. 笠 !..=‑kX, d t , u 笠 乙 =kX,‑kX d t 司 U 守E4 笠己 . X, 、 k ̲X̲ , d t =k. . ‑ . , . ‑ , U U 笠 ι=kX.,‑kX d t , . , U " 時刻 t =Oにおける各コンパートメン卜の薬物量を X ; ( O )=D j( i ニ 1, 2, …, n )とおくことと する . Xjのラプラス変換を ︑︐︐︐ ( U ウt FD

60.
[beta]
Xi=L(XJ=fe‑,
X
i
(
t
同
s

(sはラプラス演算子)

1
)の連立微分方程式をそれぞれラプラス変換して整理すると,
とし, (

(s+kJX1ニ DI
‑kaXI+(s+ka
)X2=D2
(
2
)

̲
n
̲
1
‑kaXn
̲
2+(s+kJXn
1=D
k
a
X
n
̲
1+(s+ke)Xn=Dn

α
rのラプラス逆変換が

と表される. Cramerの公式により連立方程式の解を求め, 1
/
(
s+

(
tn
‑
1
e
‑
a
l
)
/
(
n‑
1
)
!であることに注意して, (
2
)の各式をラプラス逆変換すると
)=X1
rl(
X
(
t
)=DI・e
x
p
{
‑
k
e
t
},
1
k̲D, r ̲ . .
. . .1
r¥xJ=X2
(
t
)=D2・exp{‑k
.
t
}+k
,
"a‑
ι
l
e
x
p
{
‑
k,
t
}‑exp{
‑
k
a
t
}J
a‑k
e
U'.
L

L‑1(Xn) = X

e.

. '

.'

叶

を得る.よって,第 nコンパートメン卜の薬物量は

X1
(
t
)=DIexp{‑k
.
t
}

(
n=1
)

引古f
'
D

X
n
(
t
)=D"exp{‑k
̲
t
}

e
x
p
{
‑
k
e
t
}

i

44lHfkln‑t‑J+l│kl‑l

一
一71

):~) 1
:

告 lt
i
'
l
,
̲k
a‑k,
)

,

D トームー t
,exp{‑knt}
'
1(j‑1)!
‑I

(
n日 )

で与えられると考えられる. なお,あるデータに関数 X
n
(
t
)をあてはめる場合 , X,
,
(のの
パラメータ k
a,
k
e,
D
iを推定するツールのひとつとして, SASの NLINプロシジャが利用で
きる.
2
.
2
. ラグタイムとコンパートメント数

x

初期条件を X
1
(
0
)ニ Dp i
(
0
)=D
i=0(
ο
iニ 2,
.
.
,
ンパ一卜メン卜の薬物量は , n2
>
.2のとき

‑5
8

61.
[beta]
( k y ‑ l ι dk Y
‑
'̲ kj‑l
Xn(t)=1ー 」 ー IDIexp{-k)} 幻~ aー │DI‑L‑tl exp{kat}
~k
a‑ke)
廿¥kα k
e) .(
j‑
1
)
!
i

で表される.このとき,コンパートメント数 nとX
n
(
t
)の関係について考察する.消失速度

,
ke=1とした場合と,九=4,k
e=2とした場合の関
定数と吸収速度定数をそれぞれ九 =2
数X
n
(
t
)の推移を図 2に示す.図 2より,吸収速度定数と消失速度定数の値に依存するこ

t
)がピークに達するまでの時間は遅くなるこ
となく,コンパートメント数が増えると ,X,, (

n
(
t
)のピーク時の
とが伺える.また,吸収速度定数と消失速度定数の比が一定であれば ,X
n
(
t
)がピークに達す
値は等しいが,吸収速度定数と消失速度定数の差が大きくなるほど ,X
るまでの時聞は短くなることが示唆される.

ka=4.
ke=2

ka=2• ke=1
S
'
‑
lt

言

S
'

I ¥̲
,

I~

1
0

0

2

8

.
:
1

1
0

n
げn

T
げM

白

図 2 コンパートメント数 nとX
n
(
t
)の関係

さらに,図 2 に対応してコンパートメント数と消失速度定数を一定とした場合,吸収速度

aの変化に伴う X
n
(
t
)の形状を ,n=3の場合を例に考察する(図 3参照).図 3より,
定数 k
吸収速度定数が減少すると ,X
n
(
t
)がピークに達するまでの時間は遅くなる.そして,吸収
速度定数と消失速度定数の差が大きいほど,第 3 コンパートメントでの薬物量がピークに
達するまでの時間は短くなることが伺える.図 2と図 3の考察より,コンパートメント数 n
の増加と吸収速度定数九の減少よってそれぞれ , Xn(
t
)にラグタイムが発生することが示
唆される.

Qd

FD

62.

n=J, ke=2 n=JI ke=1 。 o ー , z z x 4 6 ︒マ 豆 4 1 0 Tlme 6 1 0 了汀同 図 3 吸収速度定数 K 。 と X3( t )の関係 2 . 3 . X n ( t )の推移 ここでは,関数 X n ( t )を各項に分解することによって,ラグタイムが生じる仕組みを検討 j ( t )( i= 1 , 2, 川n )の初期値を X}(O)=10 ,Xj(O)=O する.各コンパートメントの薬物量 X ( i=2, 3 , … ) , k =2 , k e=1とおき nニ 2,3の場合を例に考える. Q n ; : 2 2日 ¥ 第 1項 10 、 1 ¥ 1 1 [r 、 司 、 、 、 "、、去、 r 包 ) ( 口 ‑ 1 , X( t ) ̲̲ ‑ー ー , , ‑ 1 0 1/ 第2項 ‑ 2 0 口 4 5 6 7 1口 TIme ) = 許 可 (‑k)}+ ( 仕 ) 図4 ‑ 1 2 ‑コンパートメントモデルで, 第 2コンパートメントの薬物量 X2( t )の推移と X2( t )の各項の推移の関係 6 0

63.
[beta]
n=3

40

3
0
1
γ

項

、
̲
二
子
、

1
0
1

I

X,
(
t
)

ー
ー
=

"
e O
>
<
~~ V

̲
.
‑
:
:
:
‑
‑
‑
‑
ー
‑
¥ア'第 3項

2
0
1{
第2項

0
1

aO

0d

a
u

‑
H

i( ヲ D
.
i
,:-a- ,~ t
.
e
x
p
{
‑
k
o
t
}
(
k
a‑k,
)
""‑r' ‑
0
‑
'
)~ k
a‑k,
‑
‑"r' ‑
0
‑
'
)

(k'D.

2

7

A句

D
.

e
5m

今4

1

n
u
n
u

4

ぜ
︑

ー
羽
:

1
+
1
‑

XJ(t)=~τ exp{-k , t} +卜ームム:Te
x
p
{
‑
k
o
t
}

(
k
o̲k.)2

c'

"

~

1

図 4‑2 3
‑コンパートメントモデルで,
/
)の各項の推移の関係
第 3コンパートメントの薬物量 XJ(t)の推移と X J(

t
)の推移
図 4・1,4・2より, n‑コンパートメントモテeルにおける第 nコンパートメント X,, (
は,第 1項のパラメータ k
eの指数関数と,この関数とは形状が異なる指数関数を是し合わ
せることによって,ラグタイムが表現されていると考えられる.

3
. E
r
l
a
n
g 分布
3
.
1
. E
r
l
a
n
g分 布
E
r
l
a
n
g分布はランダムに発生する事象があるとき,連続 n回発生するまでの時間 fの分
布を表す. E
r
l
a
n
g分布は,ガンマ分布においてパラメータ kを正の整数に限定した分布で
ある. E
r
l
a
n
g分布の確率密度関数は
n‑1
λ
n・t

λ

(
t
)= P(T=n
)=一一一:
‑
;
‑
e
x
p
(
一λt
)

(
n‑1)!

t>0 n>0 λ>0

であり,累積分布関数は

「 ギ(
λt
)
k
/
1
(
/
)
=
1 主
τ
州一々)

同)=

で与えられる.平均 E(T)および分散 V(T)は

E作

f
, σ
(

印
y作
T

である. E
r
l
a
n
g分布のパラメ一夕 nと確率密度関数の閲係を調ベる .λ=1とし , nを 1
から 1
0まで変化させたときの λ(
t
)を図 5に示す.

‑6
1‑

64.
[beta]
λ;1

2

4

6

8

10

12

14

16

1
8

2日

図 5 λ=1のもとでの Er
1ang分布の確率密度関数

図 5より . nが増えると,平均が大きくなることから Er
1ang分布の形状が異なり,確率密
度が最大になるまでの時間は長くなると考察できる.この関係は,直列コンパートメント

n
(
t
)の関係においても伺えた. Er
1ang分布の確
モデルにおけるコンパートメント数 nとX
率密度関数は,ラグタイムが生じる現象に通じていると考えられる.

3
.
2
. 直列コンパートメントモデルと E
r
l
a
n
g分 布
ここでは. n‑コンパートメントモデルにおける第 n コンパートメントの薬物量の挙動と

Er
1ang分布の関係を調べる.初期条件を X1(
O
)=D
l
'Xj(O)=Dj=0(
i=2,
…,
n
)とし,直

n
(
t
)
列コンパートメントモデ、ルの第 nコンパートメントの関数 X

( k

γ 1 4 4 f kγ‑
, k!‑1 ,
̲
.

X,, (
t
)=I
ー 」 ー ID,
e
x
p
{
‑
k
e
t
}一)
Jー 」 ー ID,
ー ム ーt
,
‑I e
xp{‑kA (
n三 2
)

L
k
a k
ej

t

efT71KG‑kcj ( j l
)
!

の第 2項に着目する.第 2項は,パラメータ k
1ang分布の確率密度関数
m の Er

,
̲
,

ーこι:
‑
‑
f‑lexp{‑knt} (j=1
,
2
・,.
n‑1)

(
j‑
1
)
!

と係数
ιn‑j‑l

,(j=1,
2 n‑1)

一 一 旦 ー で ヲD

川

(
k
a‑k
)
"
‑
' '
e

,

の一次結合で表現されている.さらに X
n
(
t
)の第 1項を見ると,それは,パラメータ kの

,

( k ,
'
1‑1

指数分布の確率密度関数と係数|ー • a ー I D,
の積である.指数分布の確率密度関数は,

ka‑ke)

ι

nL

nb

65.

Erlang分布のパラメータ nを 1とした特殊ケースである.よって .Xn( t )は.Erlang分 布の確率密度関数の一次結合で表されることがわかる. 4 . まとめ 薬物動態解析でよく用いられているモデルに,コンパートメントモデ、ルがある.特に. 1 ‑コンパートメントモデルと 2 ‑コンパートメントモデルが多用されている.コンパートメン ト数を多くすると,末端コンパートメントにラグタイムが生じると考えるのは自然である. 本稿では,コンパートメント数とラグタイムが表現される仕組みに着目した.まず.n個の コンパートメントをー列に並べた直列コンパートメントモデルを考え,時刻 tにおける第 n パ コンパートメントの薬物量 X t )を定式化した.次に,末端コンパートメントである X n ( t ) の推移とコンパートメント数の関係を検討した.その結果,コンパートメント数を増やす と. X n ( t )がピークに達するまでの時間は,遅延することを確認した.吸収速度定数と消失 速度定数の比が一定の場合,薬物量のピークの値は変化せず,そこに達するまでの時間に が異なることが示唆された.また,第 nコンパートメントの薬物量の挙動と Erlang分布の t )は. Erlang分布の確率密度関数の一次結合で表現で 関連性を検討した.その結果. X"( きることを確認した. 著者らは薬物動態解析よりもむしろ P KlPD解析のほうに興味をもっている.とくに,薬 物濃度と薬効発現のラグタイムを合理的に説明することに関心がある.本稿の検討から, 直列コンパートメントモデルにおける末端コンパートメントの動きに注目し,それを薬効 につなげることが考えられた.このリンク関数としては例えばシグモイド Emaxモデ、ルが 利用できるであろう. 参考文献 1 ) 高田寛治;薬物動態学,じほう ( 2 0 0 2 ) 2 0 0 6 ) 2 ) 丹後俊郎,上坂浩之;臨床試験ノ、ンドブック,朝倉書底 ( D a n i e lM. Jo n k e r , ThomasK e r b u s c ha n dMatsO .Ka r l s s o n ;I m p l e m e n t a t i o no f 3 ) R a d o j k aM . S a v i c, at r a n s i tcompa 口m entmodelf o rd e s c r i b i n gd r u ga b s o r p t i o ni np h a r m a c o k i n e t i cs t u d i e s .J o u r n a l o f P h a r m a c o k i n e t i c sa n dPharmacodynamics34, 7 I1 ‑ 7 2 6( 2 0 0 7 ) 4 ) JHing,1 1P e r e z ‑ R u i x o,KS t u y c k e n s, AS o t o ‑ M a t o s,LL o p e z ‑ L a z a r oa n dPZ a n n i k o s ; M e c h a n i s m ‑ b a s e dp h a r m a c o k i n e t i c / p h a r m a c o d戸l a m i cm e t a ‑ a n a l y s i so f t r a b e c t e d i n( E T ‑ 7 4 3, Y o n d e l i s )i n d u c e dn e u 甘o p e n i ai n d u c e dn e u t r o p e n i a .C l i n i c a lP h a r m a c o k i n e t i c s,1 3 0 ‑ 1 4 3 ‑ 63 ‑

66.

SASによる S p e a r m a nの順位相関係数の p値の計算 ' " ' ‑ ' p値計算方法選択のための検討 0畑 山 知 慶 矢 田 真 城 秋 谷 一 平 林 行 和 株式会社 ACRONET 開発本部 データサイエンス部 AComparisonofComputationMethodsf o rp ‑ v a l u eofSpea 口n a n ' sRankC o r r e l a t i o n TomoyoshiHatayama S h i n j o uYada I p p e iA k iy a Y u k i k a z uH a y a s h i D a t aS c i e n c e sD e p a r t m e n t, C l i n i c a lDevelopmentD i v i s i o n , ACRONETC o r p o r a t i o n 要旨 S p e a r r n a nの順位相関係数の p値の計算を行う場合, SASではし、くつかの計算方法が利用可能である.本稿で はそれぞれの計算方法の特徴をモンテカルロシミュレーションを用いて紹介する. キーワード:S p e a r r n a nの順位相関係数, FREQプロシージャ, CORRプロシージャ,モンテカルロ法 1.はじめに 正規性の仮定できないデータの相関を求める場合, Spearmanの順位相関係数がしばしば用いられる. SASを用し、て S p e a r r n a nの順位相関係数を計算する場合, CORRプロシージャと FREQプロシージャの 2 つのプロシージャが利用可能である.どちらのプロシージャを用いても S p e a r r n a nの順位相関係数の点推定値 の計算方法は同一であり,結果は一致する. 一方, S p e a r r n a nの順位相関係数の正確な p値の計算は,サンプル数の増加とともに許算量も増大し,一般 的な PCを用いて現実的な時間で正確な p値を計算するのは困難となる.そのため,計算が比較的容易な近 似計算方法が研究されてきた [ 1 ] . 正確な方法及び代替手法として, SASではV.8以降,表 1 ・1 に示すいくつ かの近似的な計算方法が利用可能となった. 表1 ‑ 1 Spearmanの順位相関係数の計算方法とそれに対応する SASプロシージャ 計算法 P r o c 巴d u r e 方法 I 正確な方法 F r e q 方法 2 モンテカルロ法による p値の計算 F r e q 方法 3 BrownandB巴n巴d c t t i( 19 7 7 )に基づく方法 F r e q 方法 4 t分布へ近似して計算 C o π ‑ 64

67.

プログラム 1 ‑ 1 S p e a r m a nの順位相関係数を算出するための S A Sプログラム /*方法 h/ p r∞ f r e qd a t a = くS A Sデータセット名); E X A C TS C O R R ;t a b l e s 変数 1*変数 2 ; r u n ; /*方法 2 * / p r∞ f r e qd a t a = くS A Sデータセット名); E X A C TS C O R R/ M CN =くモンテカルロ試行回数) S E E D = く乱数のシード); t a b l e s 変数 1*変数 2 ; r u n ; /*方法 3 / p r∞ f r e qd a t aニ くS A Sデータセット名); T E S TS C O R R ; t a b l e s 変数 1*変数 2 ; r u n ; /*方法 4 * / p r∞∞ r rd a t a =くS A Sデータセット名) S P E A R M A N; v a r 変数 1 変数 2 ;r u n ; S p e a r m a nの順位相関係数の p値を計算する場合,最も望ましい計算方法は並べ替え検定に基づいて p値を 計算する「正確な方法」であるが,この方法では p値算出の計算量はサンプル数が増大するに従って急激に 増加する. p e a r m a nの順位相関係数の p値の 本稿では,サンプル数が大きい場合において,様々な条件を仮定して, S 近似的な計算を行う方法の比較を行った. 2章では S p e a r m a nの順位相関係数と表 1 ‑ 1に示した p値の計算方法を紹介し, 3章でこれらの計算方法を モンテカルロシミュレーションで比較する.最後に 4章で全体のまとめを述べる. 以降,表記の煩雑を防ぐため r 正確な方法 J を方法 lと表記し r モンテカルロ法による p値の計算 J を B r o w na n dB e n e d e t t iに基づく方法」を方法 3, rt分布へ近似して計算」する方法を方法 4とそれぞ 方法 2, r れ表記することとする. 2 .Spearmanの順位相関係数と代表的な p値の計算方法 本章では, S p e a r m a nの順位相関係数 L 表 1 ‑ 1に示した p値の計算方法の概略を説明する. まず, S p e a r m a nの順位相関係数について概略を説明すると,よく知られているように以下のようになる. x , > ; ) ,( X YJ…,( x , ど)が取られたとする.データ X と Yにそれぞれ昇順に順 対応のある n組のデータ ( 2, 1 位をつける x ) '…, x,を順位データに変換したものを R)'…, R",九 一, Y ,を順位データに変換したものを s ) '…, s ,とする.もともと X と Y は対応するデータであった.順位に変換したものを X と Y の対応に当て はめると (RI' SI~ (R2 , S2~ … , (R"SJ となる.この順位データを用いて以下の ( 2 . 1 )式のように相関を計算した p c a r m a nの順位相関係数と呼ぶ [ 4 ] . ものを S RU PO

68.

RtD[SRS4 工 ] ( 2 . 1 ) 2.1方法 1 (正確な方法)について 並べ替え検定に基づく正確な p値(ある特定の値よりも統計量が大きくなる確率)は,統計量がある特定 の値よりも大きくなる回数を数え上げることで得られる.正確な p値の計算の簡単な例を以下に示す.説明 の簡略化のためにタイデータは考えない. 表 2ーIに示した X,Y,Z,3人の数学と体育の成績に相闘があるか, Spearmanの順位相関係数を用いて調 べる.順位は評価の良い順から lとする. 韮亙卑塾 R = O R > O 帰無仮説: 対立仮説: 表2 ‑ 1 数学と体育の成績 数学の成績(順位) 体育の成績(順位) X さん A ( 1 ) C ( 3 ) Y さん B ( 2 ) A ( 1 ) Z さん C ( 3 ) B ( 2 ) *成績は A, B, C評価で Aが良いとする このときの数学と体育の成績の Spearmanの順位相関係数は( 2 . 1 )式に代入して計算することによって, = R ・ 0 . 5と計算される. 次に,この計算された R=‑0.5の p値を求めるために,全ての順位組み合わせについて R を計算する.順位 ‑ 2に示した. データ化した成績の全ての組み合わせと,各組み合わせにおいて計算された R の値を表 2 このとき,考えられる全ての組み合わせは 3!x3!=36通りとなる.一般的にタイデータが無い場合は,考え られる組み合わせば p!xq!となる. ‑ 2から ‑ 0 . 5 より大きい値の R が観測される確率を数え上げ 全ての組み合わせを考慮することにより,表 2 で計算することができ,その確率は, 18/36=0.5となる. ‑ 66 ‑

69.

表2 ‑ 2 S p e a r m a nの相関係数の p値の計算 E膏由成績 数学の成績 2 2 2 2 2 2 3 3 3 3 3 3 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 2 2 2 2 2 2 3 3 3 3 3 3 1 3 3 3 3 3 3 2 2 3 3 1 2 2 3 3 2 2 3 3 2 2 2 2 2 2 2 2 2 2 2 2 2 3 2 2 3 3 1 1 1 1 2 2 3 3 1 2 2 3 3 I R 3 2 3 3 2 2 2 3 1 0 . 5 0 . 5 ‑0. 5 ‑05 1 3 2 3 3 0 . 5 05 0 . 5 2 2 2 3 3 2 3 3 2 2 2 3 1 3 2 3 ‑05 05 ‑05 1 1 05 ‑0. 5 ‑05 05 3 2 2 2 3 1 3 2 3 3 ‑0. 5 0 . 5 0 . 5 0 . 5 ‑05 2 2 2 3 1 1 3 2 3 3 1 1 2 2 05 ‑0. 5 ‑0. 5 0 . 5 05 I 1 この様に正確な p値の計算は,全ての順位の組み合わせを考慮することで行われる.さらに,順位組み合 わせの数はサンプノレ数の増大とともに飛躍的に増大するため,サンプル数が大きい場合にはこの方法を利用 できない場合も多い. 2 . 2 方法 2 (モンテカルロ法)について ここでは,方法 2を用いて p値を計算した場合の計算過程のイメージを説明する. 全順位組み合わせが T通り存在するとする モンテカルロ法の試行回数を S固と指定すると, s通りの順 位組み合わせを全 T通りからランダムに抽出し,その S個の順位組み合わせについてそれぞれ Rの計算を行 う.得られた S値の R の計算値を用いて方法 lと同様に p値を計算する.これが方法 2による p値の計算で ある. この場合,全ての順位組み合わせを考慮した p値(正確な p値)を S個の p値から推定することになる 2 . 1節の例に対し,方法 2を用いて計算するとする.試行回数 Sを 1 7回と指定した場合,全 36通りの組み 合わせの中からランダムに 1 7個の組み合わせを選び(表 2 ‑ 3網掛け行),それぞれの R の計算を行う.得ら 7個の Rの計算値から方法!と同様に p値を計算する. れた 1 i 円 p o

70.

表2 ‑ 3 モンテカルロ法を用いた場合の実行イメージ(網掛けの行のみ計算する) 政干の成 2 2 2 2 2 2 3 3 3 3 3 3 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 2 . 3 方法 3 3 3 3 3 3 3 2 2 2 2 2 2 3 3 3 3 3 3 1 1 2 2 3 3 R 2 3 z 2 3 3 1 2 2 3 3 z 2 2 3 3 1 2 2 2 2 2 2 3 3 z E 2 2 2 2 2 2 2 3 3 3 3 0 . 5 05 2 ‑0. 5 ‑0. 5 3 2 3 ‑0. 5 3 2 2 3 E 3 3 3 3 3 3 1 1 官の成績 。 5 0 . 5 3 2 2 2 3 3 1 2 2 3 3 3 1 2 2 3 3 3 3 2 z 3 ? 3 ‑0. 5 3 2 3 2 3 2 3 05 ‑0. 5 ‑05 0 . 5 ‑ 1 i 2 ‑05 3 2 3 ‑0. 5 05 2 0 . 5 ‑05 1 05 3 2 3 2 2 05 ‑0. 5 ‑0. 5 司自吉 0 . 5 0 . 5 t (BrownandB e n e d i t t iに基づく方法)について BrownandB e n e d i t t iは二元分割表によって Spearmanの順位相関係数を定義し,それによって Spearmanの順 2 ] . 位相関係数の漸近標準誤差(ASE)を導出した [ 二元分割表に得られた観測値の度数を集計し,集計された度数を元に ASEを計算する. i, j)セルの度数を a i j J 度数の合計を N ,列の合計を r ;=LaijJ 行の合計を C; = LQijとする.この 分割表の ( とき,順位相関係数 R は以下のように表される. 12LLQijR(i)C(j) ( 2 . 2 ) J c す HJ N ¥ . ・ Ill1﹄︐ノ す? N /'11111¥ R= ただし , R ( i ) =デ九+立主 ,c ( j )=吹CI+fL‑Z r : : " 2 2 ' '" 7 ; J 22 ( 2 . 2 )式の R に対して , ASEI 土以下のように定義される. 2 古(拝。川叫), ‑N(wv 而)'} ASE = ただし, 6 8 ( 2 . 3 )

71.

v =I:~>ijR(i)c(j) J w= 古~(N' ‑ ~r/( J N' 一平~) り 十 やる[(N'-~r:)吋N' 下)門,] v '=IIaijv~/N , w '=IIaijw~/N J J この ASEを用いて R を標準化すると , R は以下のように漸近的に標準正規分布に従う. R・= .~_ ASE ~N(O, 1 ' ) ( 2. 4 ) R 'が標準正規分布に従うことを利用して, p値を求めるのが,方法 3(BrownandB e n e d i t t iに基づく方法)で ある. 2.4方法 4 (t分布へ近似して計算する方法)について Rを S p e a r m a nの順位相関係数の点推定値とし ,nをサンプル数とする nが十分に大きいとき,以下の ( 2 . 5 ) 式は自由度 n ‑ 2の t分布に漸近的に従うことが知られている. ( 2 . 5 ) 巨 ( 2 . 5 )式の t統計量を用いれば,通常の t検定と同様の手順で p値を求めることができる ( Rの中心極限性). 3 . シミュレーションによる近似計算の性能比較 本章では,方法 l を基準として,方法 2~ 方法 4 の p 値の計算精度,実行時間を比較するために,カテゴ リー数や相関の値を変えて 6種類のデータを乱数によって発生させ,それらのデータを用いて p値の計算シ ミュレーションを行った.作成した 6 種類のデータをそれぞれ図 3-I~ 図 3-6 に示した. 図3 ‑ 1 は,カテゴリー数 6X6で相関係数 R が約 0 . 5 となるように 1 , 000, 000個のデータを乱数により発生 させた時の出現割合である.同僚に図 3 ‑ 2のデータは相関係数 R が約 0 . 5でカテゴリー数 4 x9のデータであ る.図 3 ‑ 3と図 3‑4は相関係数 Rが約一 0 . 3でカテゴリー数が 6x 6 . 4x9のデータである.同織に図 3 ‑ 5と図 ρb ヨ ハ

72.

3 ‑ 6においては Rを約 0 . 8としてデータを作成している. また,用いる検定仮説は 変数1 r 帰無仮説:R =OJ, r 対立仮説 :R 剖 J とする. " 2 塁塁1 図3 ‑ 2 R キ0 . 5 カテゴリー数 4x9 図3 ‑ 1 R 王 寺0 . 5 カテゴリー数 6x6 変 数1 " 2 重量1 図3 ‑ 4 R 与一O .3 カテゴリー数 4x9 図3 ‑ 3 R 今 一O .3 カテゴリー数 6x6 変 数1 t 変 数1 図3 ‑ 6 R キ0 . 8 カテゴリー数 4x9 図3 ‑ 5 R 王 寺0 . 8 カテゴリー数 6x6 上記に示したカテゴリー数及び相関をシミュレーションの条件とし,サンプル数を変えて Speannanの順位 相関係数の p 値の計算を行う.図 3・7 には,方法 I~ 方法 4 で、サンプル数を変えて p 値の計算を行った場合の 推移図を示す.ここで,方法 2では試行回数を 1 , 000, 0 0 0固とした. { 直の計算をそれぞれ 1 0 0回ずつ繰り返し,その 横軸がサンプル数,縦執が p値である.各サンプル数で Pl 平均をとった. U ハ ワ a

73.

p l i i D 一一一一一ー方法 1 ーー一一一一方法 2 ‑ー一一一 方法 3 一一一一一ーー方法4 一一一一一一方法 1 一一一一一ー方法2 一 一 一 ・ 方 法3 一 一 一 一 一 方 活4 a O . 1 0 1 5 2 0 2 5 3 0 3 5 1 0 4 0 サンプJレ 数 R約 0 . 5,カテゴリ一致 6x6 1 5 2 0 2 5 3 0 サンプル数 R約 0 . 5,カテゴリ 数 4x9 3 5 4 0 p値 O . 一 一 一 ー 方 法1 一 一 一 一 方 ま2 ‑一一一‑・方法 3 一 一 一 一 一 方 法4 一一一一一一方活 1 一一一一一ー方志2 ‑ーーーー‑方法 3 一一ー一一ーー方法4 、 目 1 0 1 5 2 0 2 5 3 0 サンプJ レ 数 R約‑ 0,3,力子ゴリ 数 6x6 3 5 1 0 4 0 1 5 2 0 2 5 3 0 3 5 4 0 サンプJレ 数 R約 0 . 3,カテゴリ 数 : 4x9 p f 直 p値 一一一一一一方法 1 一 一 一 一 方 法2 ‑‑̲...方法 3 一 一 一 ー 方 法4 一 一 ー 一 方 法1 ‑一一一一一方法 2 ‑ー一一ー‑方ま 3 一一一一方法4 。 口 に 1 0 1 5 2 0 2 5 3 0 3 5 1 0 4 0 サンプJレ 数 R :約 0 . 8,力子ゴリ 数 : 6x6 1 5 2 0 2 5 3 0 3 5 4 0 サンプJ レ 数 R約 0 . 8,カテゴリー数 4x9 図3 ‑ 7 シミュレーションによる p値の比較 サンプル数が少ない箇所では方法 Iによる p値に対して,方法 3,方法 4による p値の差が大きいが,方 直は,方法 lによる p1 i 直に非常によく近似している.また,サンプル数が大きくなるにつれて, 法 2による P1 方法 2以外でも方法!との差は小さくなることがわかる. しかし,方法 3についてはサンプル数が増大しで 5を過ぎるあたりからは も,方法 lによる値への漸近が遅いこともわかる.方法 2,方法 4はサンプル数が 1 両者の p値の差は無く,精度においてだけ言えばどちらの方法を用いても大差はない. ウS ーよ

74.
[beta]
また,データの相関係数の値によらず,同様の傾向を示すことがわかった.ここまでの検討で,それぞれ
の計算方法の p値の計算精度はカテゴリー数や相関の値にはそれほど依存せず,サンプル数に強く依存する
ことがわかった.
・lには図 3
‑
7を作成した際の各計算方法で
次に,計算方法ごとの実行時間についても比較する.以下,表 3

のサンプルサイズごとの実行時間を記す.

実行に用いた PCのスペックは以下の通りである.

OS:WindowsXP 物理メモリ :208 CPU:I
n
旬1
C
o
r
e2Dω2.130

表3
‑
1 実行時間比較単位:秒
川一同一山一山

26
27
28
2
5
1
0
.
8
8
1
7
.
3
9 1
3
4
.
0
9
7
.
6
9
3
.
4
2
3
.
5
9
3.72
3
.
4
1
0
.
0
3
0
.
0
3
0
.
0
4
0
.
0
3
0
.
0
1
0
.
0
1
0
.
0
1
0
.
0
1

今回の検討では方法 lはサンプル数 30で実行すると,物理メモリが飽和し,計算が終わる見込みが無くな
った.このように,サンプル数が大きい状況では方法 Iで p値を計算するのは一般的な PCでは難しい.
次に,方法 2の試行回数について検討する.方法 2による pi
{
直は方法 lによる p値のモンテカルロ推定値
こ正規分布に従う.そのため,方法 2の試行回数の適切な試行回数の決
であることから,その p値 は 漸 近 的 l
定には,方法 2による p値の信頼区間の区間幅を評価基準として用いることができる.
,
000回
, 1
0
0,
000回. 1
,
000,
000
試行回数を変化させたときの p値の計算の精度を検討するために,試行回数 1
回での「モンテカルロ推定値としての p値 の 99%
信頼区間の区間幅 J を図 3
‑
8に図示する.

9
9
¥
信頼区間の区間幅

、
^
'
‑
I、

9
9
¥
信頼区間の区間幅

一一時ー一ー鼠行回散
1
.
0∞
回
0
0
.Q
(
阻
回
一一一ー一一一民行回融 1
一一一一一一一鼠行回融1.0
0
0
.
0∞
回

0
.
0s
‑
j/
.
、
、

¥
,
.
‑
‑
、

、
、¥
r司
、
.
/
、
、
.
、
ν
、
.
、
'
¥
.
;
へ
".
v

回
ー一ー一一一民行回世1.0∞
一ー一一一一一鼠行回世ー l
(
目
。
∞
回
一一一一一一一民行回融 1
.
0
0
0
.
0
∞
回

¥へf
.
.
.
.
.
.
.
̲
,
̲

'
‑
̲
.
ぺ
V¥d¥/
ヘ
げ
、

,
‑

ー

•

~ ~、-

0
.
0

。 ー一一一ーー 一一‑‑ーー一ー一一
ι

1
0

2
0
2
5
3
0
サンプJ
レ
数
R約0
.
5,力テゴリ 数 6x6

3
5

一一‑ー 一一
一
ー一 一
ー
一 一ー
一一ー
ι

一 一 一 一 三
一 一 戸

1
5

。
。

4
0

1
0

ι

1
5

ー一一‑ー

2
0
2
5
3
0
サンプル数
R約0
.
5,カテゴリー数 4x9

図3
‑
8 モンテカルロ推定値としての p値の 9
9百信頼区間の区間幅

3
5

4
0

円
4

ウt

75.

通常,検定では p値が 0 . 0 5を下回るか否かなど,小数点第 2位までを基準として議論されることが多く, 信頼区間の幅が 0 . 0 0 5よりも小さい値であれば,検定を行う上での影響は モンテカルロ法による p値の 99% 小さいと考えられる.この条件を満たすのは,比較した試行回数で、は 1 , 000, 000回であった. 4 . まとめ 本稿では, SASで用いることのできる S p e a n n a nの順位相関係数の p値の近似的な計算による精度と実行時 間をモンテカルロシミュレーションを用いて比較した. 比較に用いたデータにおいては,データに関わらず,近似的な計算方法の p1 ,直の計算精度は同様の傾向を 示した.傾向としては,方法 2ではサンプル数に依存せず,常に計算精度が高く,方法 2以外ではサンプル 数に計算精度が強く依存し,サンプル数が大きくなるほど,計算精度は高くなった.方法 3についてはサン プル数が大きい場合でも正確な p値に対する近似の精度が高くないことがわかった. 一般的に,サンプル数が大きくなると標準誤差は小さくなり, Rの絶対値が小さな場合でも p値は小さく なることが知られている. p値が小さい状況においても,方法 3による p値は方法 1,方法 2,方法 4 による p値とは異なる値を示した .p値がノj、さい場合には方法 3による p値と方法 lによる P1 1 直の差が検定の結果に 対して大きな影響を与えると考えられる. また,実用性の観点から計算にかかる実行時間についても比較を行った.方法 lはサンプル数によっては 実用的で、はなく,方法 3と方法 4は計算にかかる時間は非常に短かった.方法 2は他の近似的な計算方法と 比べるとやや実行時間は長いが実行可能であった. p値の計算の精度と実行時間の両方を考慮すると,サンプル数が大きく,実行時間の制約もある場合には, 方法 4を用い,実行時間に制約が無い場合は,方法 2を用いることが適当だと考えられる. 参考文献 川 浜田知久馬 ( 2 0 0 1 ) . SASV . 8における正確な推測とシミュレーションによる近似法. 第 20回 日 本 SASユーザー会および研究発表会論文集. [ 2 ] B r o w n ,M .B .a n dB e n e d e t t i,J . K .( 1 9 7 7 ) . S a m p l i n gB e h a v i o ro fT e s t sf o rC o r r e l a t i o ni nTwo‑WayC o n t i n g e n c y l a l i s l i c a lA s s o c i a l i o n7 2,309‑315. T a b l e s .JournalollheAmericanS 2 0 0 7 ) . ノンパラメトリックス.森北出版. [ 3 ] E .L.レーマン ( [ 4 ] 柳川尭 ( 1 9 8 2 ) . ノンパラメトリック法.培風館 υ マa ︑ 円

76.

ある種の状況における κ係数の挙動について 0 丸尾和司中西豊支菅波秀規 興和株式会社 臨床解析部 Ab e h a v i o ro f t h ek a p p ac o e f f i c i e n ti nsomec o n d i t i o n . K且z u s h iMaruo/Y u s h iN a k a n i s h i/H i d e k iSuganami , KOWACO恥1P ANY , LTD C l i n i c a lD a t aS c i e n c eDept 要旨 カテゴリカルデータの信頼性を評価するための指標として, κ係数が一般によく用いられる.本稿では, ある種の状況における κ係数と有効性の解析結果の信頼性との関係をシミュレーションに基づき検討する. キーワード:FREQプロシジャ,信頼性, κ係数,カイ二乗検定 1.はじめに 臨床データは,血圧,臨床検査値のような測定値として,あるいは診断,患者の重傷度,改善度のように, あらかじめ定められたいくつかのカテゴリに従った評価者の評価・判定として取られる.これらの評価指標 について取られたデータの信頼性が高いとは,精度が高く誤差が小さいこと,測定・評価を繰り返すときの 一致性・再現性が高いことをいう (SKETCH研究会, 2 0 0 5 ) . ICHの「臨床試験の一般指針( E 8 ) J ,および「臨 床試験のための統計的原則 ( E 9 ) J においても,臨床試験で用いる評価指標について,信頼性の高いことが確 認されていなければならないと明記されており,臨床試験において評価指標の信頼性を確保することは重要 である. 信頼性を評価するための指標は多く存在するが,本稿ではカテゴリカルデータの信頼性を評価する際に一 般的に用いられる κ 係数に焦点をあて,ある種の状況における κ 係数の信頼性評価指標としての性能と, κ 係数と解析結果の信頼性の関係を検討する. 2節では κ 係数について簡単に説明する. 3節である種の状 況における κ 係数の性能を評価するための数値検討を行い, 4節で κ 係数と解析結果の信頼性との関係、を シミュレーションに基づき検討する. 5節で考察とまとめを述べる 2 . κ係 数 測定結果を主とする連続的データに対して,カテゴリカルデータは評価・判定の結果である場合が多く, 客観的な測定に対して主観的な要素を含む場合も多い.この特徴から,異なる評価者の評価が一致する程度, あるいは同じ評価者が繰り返し行う評価が一致する程度が問題となる.前者についての信頼性を評価者間信 7 4‑

77.
[beta]
頼性といい,後者についての信頼性を評価者内信頼性という.このようなカテゴリカルデータの信頼性の評
価基準として κ係数が一般に用いられる.
として,評価者間信頼性を考え. 2評価者の信頼性を評価する際のデータ構造を表 lに与える.まず,
伊J

o
. 期待一致率九(偶然に一致する割合)を以下のように計算する.
観測一致率 P

え

ヱ

ヱ

1 njk, ξ =

nj~k

Pj‑P‑k

j~k

これらの一致率より κ係数は

p^‑p^

K =ー
ム
一
一
ー

(
1
)

と計算される.すなわち,

κ係数は通常の観測一致率から,偶然に一致する割合である期待一致率を差し引

I‑Pe

いたうえで検討する指標である.
上記の κ係数は単純 κ係数と呼ばれ,完全に判定の一致したデータのみをとり扱っているが,評価者間で
判定が l段階ずれることと. 3段階ずれることは恭離の程度が違うとして,恭離の程度に重みをつけて評価

P
'
0
' P
eを
することもある.これを重みつき κ係数といい,表 Iの各セルについて重み円kをおき .九

i
ε
エ

ε
エ

ト
ξ= む
む川
w
4
ν
う
η
内
j
y

ト
ξ =む円
w
4
ν
y
う
j川

としたうえでで、 κ係数を計算する.重みとしては一般に一次重み

, [j‑k[
"jk ‑ .

(
2
)

[c‑l[

あるいは二次重み

w. =1‑[
j‑k[
2

(
3
)

JK│c 1
1
2

が用いられる.因みに,単純 κ 係数の重みは

[
1, j=k

w,,̲ =~

'
^

(
4
)

1
0
, jC
I
'k

であり,単純 κ係数壬一次重みつき κ係数豆二次重みつき κ係数となる.
評価者が 3名以上(1名)の場合については, tC2個の表 lのようなクロス表ができるが,各クロス表について
P
o
.P
eを計算し,それらをクロス表聞で平均をとってP", }うとした上で,

κ係数を算出する.

次に κ係数の推測の問題を記述する.多評価者の重みつき κ係数の漸近分散は

土
何
{
杓
d
杓
心
ι
仏
(
j
,
I
ν
t
l
i
い

y
αr
(
K
)=.!叶=F斗l

μ
r
凡
山2
い
l

(
5
)

n
(
1一R
)
4

と推定される.ここに .ji
/
(1=1
.,
‑
・1
)は,対象 i(戸 1
,.・・ , n) を評価者 l が判定した際の判定カテゴリ (l~
c
)であり,

1戸
一

2
(
1一戸)
一
一
ー
エ
,
(
I
J
t
(
tム
1
)

d
(
j
i
l,I
2,
.
.
.
,I
t
)= (
ι工
j
i
/'
}
;
m
)
t‑1
): w(
Jim
向 i / '

J

ー

w

である.また . w(
jjf,
Im)は評価者 lと m のクロス表で対象 iが存在するセルの重みで、あり,

円

Fhu

i

78.
[beta]
表1.データ構造
評価者 2

n
l
l

nl
2

2

n21

n22

.
.
.

j

n
j
l

nj
}
.

.

2

評価者 l

C

nci

nc2

言
十

n・
1

n.2

P・1

P・
2

周辺割合

k

"

C

言
十

周辺割合

nlk

"

nlc

nl・

Pト

n2
k

"

n2c

n2・

P2・

n
j
k

"

n
j
c

n
j・

P
i
'

.

.
.
.

nck
n.k

.

"

ncc

nc

"

n.c

n

Pc.

. P'C

P.k

(
j
)ニ
エ P k(l) Wjk

W/

k=1

であり ,pl
f
.l)は評価者 lが判定 kを下す周辺割合である (Schouten,1982;SKETCH研究会, 2005). これより,
κ係数の 100(1‑a)
パーセント信頼区間が

ト

戸 高,K + Zα 戸 高l

z
α 12

(
6
)

12

で推定できる.ここに , zal2は標準正規分布の上側 100臼 /2パーセント点である.

同E
Qプロシジャ

d
a
t
ad
a
t
;
i
n
p
u
td
ld
2w
;
c
a
r
d
s
;

d
1市 d
2

3

31

5

12
2
2

3
1 合計

0凹凹凹 47
65
04
4
000 9叩判

367

r
u
n
;
p
r
o
cf
r
e
qd
a
t
a
=
d
a
t
;
/
a
g
r
e
e
;①
t
a
b
l
ed
l吋 2
w
e
i
g
h
tw
;
r
u
n
.

3293
71
41
2

2

234
310
322
335

831
451

18
36
25
7
1
68
47
8
2

221
4

z 2881 4578

トト

ン
ン

トセセ

111

z
4tt

122
2 13

ン一一

︐
︐

量一白白

出直パ行列

d

唖

1 1 10

3I
0I
2I
5I
7
.
8
8I 1
2
.
2
0I 1
7
.
0
7
I 0田 I 4
I 0田 I 2
臥5
7I 7
1
.
4
3I
1
.1
1I 5
5
.
5
6I
I 0 I1

∞

合計

1
4
3
4
.
1
5

1
8
4
3田

9
4
1
21
.9
5 1
凹凹

d
1事 d
2の統計量
対梓性白樟定②

統計量 (
S
)
自盛置

P
r>S

0
.
8
6
6
7
3

0回3
5

カッパ腕酎量

酷計量

壇覇近揖準思量⑤

器カツ帽時③

日 7
幻
付きカッー像世 @ O制 5
7

0
.
1
1
0
1
0
.
0
9
4
6

揖 本 サ イ ズ =4
1

図 1
:FREQプロシジャのプログラムと出力

9
5 恒組EIIII@
0
.
3
5
曲
0
.
4
田3

0
.
7師
0
.
8
3
1
1

nb
ウ
t

79.

SASにおける、 κ係数の推定プログラムと解析結果の例を提示する(図 1 ) . FREQプロシジャの a g r e eオプ ションを指定することにより κ係数の推定が可能である(①).結果については,まず,クロス表の対称性に関 , する検定 (Bowkκ1948)の結果が出力される(②).因みに,カテゴリ数が 2の場合には McNemar検定 (McNemar 1 9 4 7 )の結果が出力されるが意味としては同じである .κ 係数については,単純 κ係数(③,式 ( 1 ),( 4 ) )と重み 2 ) カテゴリ数が 3以上の場合のみ),およびこれらの漸近標準誤差(⑤,式 ( 5 ) )と 95パーセ つき κ係数(④,式( ント信頼区間(⑥,式( 6 ) )が出力される. SASのデフォルトでは単純 κ係数と l次重みつき κ係数が出力され るが,二次重みつき κ係数については a g r 町(wt=f c )と指定することで出力される. 3評価者以上についての κ係数については,米国 SAS社にてマクロが公開されている ( h t ω: l l s U D D o r t . s a s . c o m l k b / 2 5 1 0 0 6 . h t m1 ) . 3 . κ係数の構造評価のための数値検討 ここでは 2値の判定について,判定の 2評価者間信頼性を考える. 2値の判定にも様々あるが,本稿では, イベントの有無を考える ( 0:イベント無し 1 イベントあり). 2評価者の判定データ (X , ] X ) 2 を,二変量正 規分布に従う確率変数ベクトル (Z,] Z2) ~ BVN(0, 0,1 ,1 , ρ)を基盤にし,ある闇値 sについて, 。 。 図:判定が一致 図 2:判定データの構造 XO.6~ 実際に観測されるクロス表 図 3:クロス表の例(割合) ノξ ラメータ :ρ=0. 4 , So二 1 ,S]=ー 1 ,p=O. 4 円 門 i i

80.

表 2:So, ρ別の特異度 。 So 2 。 ρ 0. 4 0 . 8 0 . 2 5 0 0 . 3 1 5 0 . 3 9 8 0 . 7 0 8 0 . 7 3 6 0 . 7 8 0 0 . 9 5 5 0 . 9 5 7 ρ=0 s O二 O ρ=0 s Oニ 1 κ 1 .0 κ 1 .0 0 . 8 0 . 8 . o6 . o6 0 . 4 0 . 4 0 . 2 0 . 2 0 . 0 0 . 0 .0 o2 0.4 0.6 0.8 1 . o0 . 0 . 0 0 . 2 0 . 4 p p ρ=0.4 s OニO ρ=0 s O = 2 κ 1 .0 κ 1 .0 0 . 8 0 . 8 O .6 .'~ーーー・・・・・・ -ι ・ . ・ ' ̲ 0 . 6 . . . ' . " 0.4 ". 0 . 2 , ・ 同 ー ーー . . . . ̲・ . . 0.2 , 崎 、 0 . 0 0 . 0 0 . 4 . o6 0.8 1 .0 h ・ . ‑ 、 ' . 6 0 . 8 1 .0 . 4 0 0 . 0 0 . 2 0 . 8 1 . 6 0 .0 . 2 0 . 4 0 0 . 0 0 p p s 1 一:‑2 ・ ・ ・ :‑ 1ー ‑: 0 図 4:κ 係数の検討 ‑78 ‑

81.

ρ=0.4 5 0 = 2 ρ=0.4 5 0 = 1 κ κ 1 . 0 1 .0 O .8 0 . 8 O .6 O .6 0 . 4 0 . 4 0 . 2 0 . 2 0 . 0 0 . 0 .2 0 . 4 O .6 0 . 8 1 .0 0 . 0 O 。 。0.2 0.4 O.6 O.8 1.0 p p ρ=0.85 0二 1 ρ=0.8 5 0 = 0 1 .0 κ κ 1 . 0 0 . 8 O .8 0 . 6 . ー ・4詰可:.:: . .: . :. : .. . : . . 晶 、 晶 、 . 0 . 6 0 . 4 0 . 4 0 . 2 0 . 2 。 。 。 。O.2 0.4 O.6 O.8 1.0 . 4 O .6 O .8 1 . 0 0 . 0 O .2 0 0 . 0 p p ρ=0.85 0 = 2 κ 1 .0 三‑;によ込│ 0815 s 1 一 :‑2 ・ ・ :‑1 ・・ : 0 0 . 4 0 . 2 0 . 0 「 . 4 O .6 O .8 1 0 . 0 0 . 2 0 . 0 p 図 5: κ 係数の検討(続き) ‑ 79

82.
[beta]
1
0
. Z
.5
.S

X =仁 司
j

11
.

,
L

.>S

(
i=12
)

とする(2
)
. また,真の状態 (Oor1)を既知とし,真の状態が 0の場合に両評価者ともに 0と判定する確率
を特異度 (F
とし,真の状態が lの場合に両評価者ともに!と判定する確率を感度(F
T
P
)とするとこれらは
T
N)
以下の式で表される:

F
T
N(
S
o
'ρ)=φ2(
S
o,
S
o
;0,0,1
,
1
,
ρ),
F
T
P
(
s
pρ)=φ 2
(
‑
S
I,
‑
S
I
;0,0,1
,1
,
ρ
)
.
ここに, φ2(
・
,
・
;0,
0,1
,
1
,ρ)は
, (Z1. Z2)の同時累積分布関数である.つまり ,Soは特異度に ,SIは感度に,
ρ は感度・特異度の両方に関連するパラメータであり,

l
i
m
s
o→∞ F
T
N(
s
o
'ρ)1
,l
i
m
s
l
‑
‑
><
<
>F
T
P
(
s
pρ)=1
となる.さらに,各状態の存在比率を{真に 0である被験者数}:{真に lである被験者数}=(l‑p):p とする.
上記の仮定のもとで,

κ係数を規定する因子は ρ ,s
o,S
" pである.

例として, ρ=0.
4
, so=l,sl=‑I,p=O.
4の場合のクロス表(割合のみ)は図 3のようになり,このときの
κ係数は 0
.
5
7
2 となる.サンプルサイズは κ係数のパラっきに関係するが,本稿では,

κ係数の点推定値の

みを検討する.また, s
o,ρ別の特異度は表 2のようになる.感度については Sjの符合が変わるのみである.
4
, 0
.
8,so=O,1
,2,Sj=‑2,ーし 0,p =0 ~ 1で変化させた場合の κ係数の挙動
ここでは, ρ=0,0.
)
. Soが大きく(特異度が高く), Sjが小さく(感度が高く),
を検討した(図 4,図 5

ρ が高い場合に κ係数は高く

pが 0に近いあるいは Iに近い
なることが確認できる.また,真の状態の存在比率が極端に偏っている場合 (

場合)は κ係数が低くなる傾向にあった.

4
. シミュレーション
4
.1
. シミュレーション 1(イベント判定の信頼性)
4
.1
.
1
. シミュレーションデザイン l

ここでは,イベント判定の κ係数の値が薬剤の有効性の解析結果とどのように関係するかを検討する.イ
ベントの発生を抑制する薬剤についてのプラセボ対象の並行群問比較試験を考える.真の状態は, #{イベン
トなし}:#{イベントあり }=l‑p:p,#{プラセボ群}:#{実薬群 }=I:1であり,薬剤の効果として,カイ二
乗検定(連続補正なし)の結果の P値が 0
.
0
5となるようなクロス表が得られるような状態であるとする(実際に
直が 0
.
0
5に最も近くなるようなクロス表となる).たとえば,サン
はクロス表の各セルは整数となるため, pf
4としたときのクロス表は表 3のようになる (
p値 :0
.
0
4
5
)
. このとき,イベント判
プルサイズ n=500,p=O.

定を二評価者で行うとする.判定データは二変量正規乱数に基づき(前節参照)生成し,シミュレーション条件
は表 4のように与える.条件毎に 50,
000回のシミュレーションを行い,各シミュレーションにおいて,二評
価者の κ係数を算出し,各評価者の判定毎にカイ二乗検定を行う.結果として得られた 2個の P値の差の SE
と κ係数の平均値との関係を評価することにより,イベント判定の κ係数と,解析結果の信頼性との関連性
を検討する. pf
直の差の SEは,個々の評価者の判定に基づく解析結果のパラつきを評価するための指標であ
5パーセント信頼区間は近似的に [‑0.8,0
.
8
]と
り,たとえば,この値が 0.4の場合, 2評価者の P値の差の 9

なる.

80

83.

表 3 . シミュレーションにおけるクロス表(例) イベント イベント なし あり 1 3 9 I I I 250 250 プラセボ群 実薬群 1 6 1 8 9 言 十 300 200 計 表 4 . シミュレーション条件 l パラメータ 値 n 1 0 0, 500 p 0 . 0 5, 0 . 2 7 5,0 . 5 ρ 0 ,0. 4 ,0 . 8 So 0,0, 4 .0 . 8,1 .2,1 .6, 2 2,‑1.6,一1.2,‑0.8,‑0. 4 ,0 SI 4 . 1 . 2 . シミュレーション結果 l まず, κ係数, P値の差の SE,nとの関係を検討する(図 6).κ 係数が低くなるにつれ,信頼性は低くなっ たが ,n =1 0 0のとき,結果がぱらついており, κ係数と信頼性との関連をクリアに検討するために ,n= 500 についてのみ検討した .n= 500についてのシミュレーション結果(図 7 )より,今回のシミュレーション条件 の下では,結果の信頼性に寄与する因子は,ほぽ κ係数のみであり, ρ も若干の寄与が認められた. κ係 数 4 が lより小さくなるにつれ急激に P値の差の SEは大きくなり, κ係数が 0.4を下回ると P値の差の SEが 0. を超え,解析結果の信頼性が非常に低くなることが示唆された. p値の差の S E 0 . 5 0 . 4 0 . 3 0 . 2 0 . 1 0 . 0 。 。 0 . 2 0 . 4 0 . 6 O .B K n XXX 1 0 0 000500 図 6 . シミュレーション lの結果(n毎のプロット) ‑8 1‑ 1 .0

84.

表 5 . シミュレーション条件 2 f 直 パラメータ n 500 p 0 . 0 5, 0 . 2 P 2 0 . 2,0. 4 ρ 0, 0, 4 .0 . 8 So 0,0, 4 .0 . 8,1 .2 ,1 .6,2 2,‑1.6,一1.2,‑0.8,‑0. 4 ,0 SI 4ユ シ ミ ュ レ ー シ ョ ン 2(特殊な状況) 4ユ1. シミュレーションデザイン 2 ここでは,治験への被験者の組み入れ判定 (0:組み入れ可, !組み入れ不可の 2値判定)について二評価 者で中央判定を行った場合の κ係数の値が,薬剤l の有効性の解析結果とどのよう関係するかを検討する.実 施医療機関でスクリーニングされた被験者について中央判定で組み入れ不可の症例を除外するとする.真の 状態として, #{組み入れ可}:#{組み入れ不可}=l‑p:p,組み入れ可の症例について実薬群とプラセボ群 2 ' #{薬剤群}:#{プラセボ群 }=l:1とし,薬剤の とあわせて#{イベントなし}:#{イベントあり}= !‑P2:P 効果として,カイ二乗検定(連続補正なし)の結果の P値が 0 . 0 5となるようなクロス表が得られるような状態 であるとする.組み入れ不可の症例については誤って組み入れられた場合には必ずイベントが発生するとす る.このとき,二評価者で組み入れ判定を行い,それぞれの判定結果について,組み入れ不可と判定された 症例を除いて解析する.シミュレーション条件は表 5のように与える.本シミュレーションにおいて,組み 入れ可の症例を両評価者ともに組み入れ可と判定する確率を特異度,組み入れ不可の症例を両評価者ともに p f 直の差の S E 0 . 5 0 . 4 0 . 3 0 . 2 0 . 1 0 . 0 。 。 0 . 2 0 . 6 0 . 4 O .B κ ρ xxxO .0 0 00 0 . 4 /j.. d . . d .O .B 図 7 . シミュレーション lの結果 ( ρ 毎のプロット) 82 ‑ 1 .0

85.

# 0 . 6 偽 白川可酌守 崎町一伊 担割押+ 叫内陸帯 OH 動領 0 . 4 0 . 2 と曙 必 吋 地吋官官 E4 。 。 l 厳 唱 幽 明 W+ 0 陣持 0 . 4 1 .0 0 . 8 κ s O XXX 0 . 0 0 0 00 . 4 f J .f J .f J .0 . 8 ロロロ1.2 官官官1.6 +++ 2.0 図 8 .シミュレーション 2の結果(So毎 ) ρ毎のプロ ノト p値の差の SE 0 . 1 0 O . O B O . O B : ? g t 筆 戦 0 . 0 6 0 . 0 4 0 . 0 2 p毎のプロット p { 直の墨の SE 0 . 1 0 0 . 0 6 : ? 若 君 挙 戦 0 . 0 4 0 . 0 2 0 . 0 0 0 . 0 0 O .0 O .2 O .4 O .6 1 .0 O .B K O .0 O .2 O .4 O .6 ρ x xx O .0 000 O .4 f J .f J .f J .O .B p xxx O .0 5 000 O .2 0 p,毎のプロット p { 直の差O)SE 0.10~ー O . O B 0 . 0 6 : ! 芝 学 接 戦 0 . 0 4 0 . 0 2 0 . 0 0 O .0 O .2 O .4 O .B K O .6 O .B 1 .0 K p 2 XXX O .2 000 O .4 図 9 . シミュレーション 2の結果 ( S o= 2) ‑8 3 1 .0

86.

組み入れ不可と判定する確率を感度と再定義すると, 3節 , 4 . 1節での定義と同様に, Soは特異度に, S Iは感 度に関連するパラメータとなる.また,組み入れ不可の症例の都合は,小さめに設定した (p= 0 . 0 5, 0 . 2).条 000回のシミュレーションを行い,各シミュレーションにおいて,二評価の κ係数を算出し,各評 件毎に 50, 価者の判定ごとにカイ二乗検定を行う.結果として得られた 2個の p値の差の SEと κ係数の平均値との関 係を評価することによって,組み入れ判定の κ係数と解析結果の信頼性との関連性を検討する. ユ 4 2 . シミュレーション結果 2 まず, κ係数, P値の差の SE,特異度(s o )の関係を検討する(図 8)と,本シミュレーション条件の下では, P値の差の SEに対して,特異度の影響が非常に大きかった.さらに特別な場合として,特異度が高い状況に zの影響が若干認められたが,本シミュレーショ 限定して検討した(図的結果, P値の差の SEの変動には p ン条件の下では, κ係数の高低が解析結果の信頼性に与える影響は低かった. 5 . 考察とまとめ 本稿では, κ係数の性質と, κ係数に基づく信頼性評価と解析結果の信頼性との関連性を評価した. 3節 では,様々に状況において κ係数の性質を検討したが,カテゴリ毎の被験者の存在割合が非常に偏っている 場合には, κ係数が低くなりがちになるため,信頼性評価指標として選択する際は注意すべきであることが 示唆された . 4 . 1節では解析結果に直接影響するイベント判定における κ係数と解析結果の信頼性の関連性を .4以下になると解析結果の信頼性が非常に低くなることがわかった.また,特別な 検討したが, κ係数が 0 場合として,組み入れ時の信頼性と解析結果の信頼性を検討した結果,今回のシミュレーション条件の下で は , κ係数と解析結果の信頼性との関連性は低かった.なお,真に組み入れ不可の症例の割合が低く,組み 入れ可の症例については容易に組み入れ可と判定できる(特異度が高しつが,真に組み入れ不可の症例を弾くこ とは困難(感度が低し、)という今回のシミュレーション条件のような状況は,十分に生起しうると考えられる. 組み入れ判定の信頼性が低いことは倫理的に問題があるが,本稿におけるシミュレーション 2は , κ係数で 信頼性を評価するには適さない状況も存在することの一つの例を提示している.信頼性評価指標の選択は, 生起しうる状況を十分に吟味した上で行う必要があろう. 参考文献 ・ • Bowker , A .H . B o w k e r ' st e s tf o rs 戸n r n e廿y .J o u r n a lo f t h eA m e r i c a nS t a t i s t i c a lA s s o c i a t i o n ,43, 572・ 574,1 9 4 8 . 楠 正 監 修 (SKETCH研究会統計分科会).臨床データの妥当性と信頼性,サイエンテイスト社, 2005. • ,Q. Note on t h es a r n p l i n g eπuroft h ed i f f e r e n c e between c o r r e l a t e dP r o p o r t i o n so rp e r c e n t a g e s . McNernar 9 4 7 . P s y c h o m e t r i k a,12,153‑157,1 • S c h o u t e n,H .J .A . Measuringp a i r w i s ei n t e r o b s e r v e ra g r e e r n e n t whena l ls u b j e c t sa r ejudged byt h es a r n e t a t i s t i c aN e e r l a n d i c a,36, 4 5 ‑ 6 1,1 9 8 2 . o b s e r v e r s .S 8 4‑

87.

マーケティング・調査

88.

計量的にみた寄席興行の時代変遷 坂部裕美子 (財)統計情報研究開発センター ηleL o n g ‑ t e r mChangeo ft h eV a r i e t yT h e a t r eShow仕omaS t a t i s t i c a lV i e w p o i n t YumikoS a k a b e S t a t i s t i c a lI n f o r m a t i o nI n s t i t u t ef o rC o n s u l t i n gandA n a l y s i s 要旨 落語の寄席定席への出演者の頻度集計を 1 9 8 5年・ 2005年 の 2時点について行ったが、顔ぶれに大きな 変化は見られなかった。しかし、内容を詳細に見ていくと、大きな世代交代の波が迫っていることも感 じさせた。 キーワード:落語、伝統芸、興行、世代交代 寄席興行の集計 o . 過去の集計と残った問題 筆者は 2 0 0 5年の SASユーザー会で fSASを用いた寄席定席奥行の現状分析」という発表を行った。これ は、「顔付け(毎回の寄席の出演者一覧) Jデータから 2 0 0 4年 1年間の寄席定席興行への出演頻度を出演者 ごとに集計し、頻度の高い者と低い者の属性の違い(抜擢昇進しているか否か、正月初席に出演しているか 否かなど)を検出しようとするもので、関係者が直感的に掴んでいた事実に、実際のデータから統計的な裏 付けを得られるという効果があった。 しかしこれは単年度データを用いた集計だ、ったので、長期的な視野から寄席興行の傾向を調べてみたらど 9 8 5年と 2 0 0 5年の興行を集計し、 うなるのか、という疑問が残った。そこで、その後入手できたデータから 1 その結果を比較したのが今回の分析である。 集計に際しては、集計対象は落語協会興行分のみ、前座は出演者としてカウントしない、交替出演は交替 人数に応じた「重み」をつける、など、ルールは前回同様とした。ただし、今回は初席興行は計算から除外 した。また、文中敬称はすべて略して表記した。 ‑8 7

89.

1 . 寄席にとっての 1 9 8 5年 この年は、協会員構成に大きな動きがあった。 l月に、落語芸術協会から桂文朝・桂文生・桂南喬のベテ ラン真打 3名が落語協会へ移籍したのである。これは人的コネクションを何よりも重視する落語界において は特筆すべき出来事で、協会問の異動はこの後 20年発生しなし、。この 3人は香盤上も特別待遇で迎え入れら れることになる。 昇進関係では 9月に三木助・志ん輔・かん平・才賀・扇遊・時蔵・小ゑん・正朝の 8名の新真打が誕生し た。ただし、その後かん平は病を発し、三木助は自らの命を絶ってしまったので、現在の寄席でその高座を 見ることはできなし、。 また、夏場に上方落語の霧乃五郎を招いての怪談噺の企画があり、東西交流が定席でも行われていたこと が分かる。 2. 寄席にとっての 2005年 この年の落語界最大の話題は、 3月の林家こぶ平の正蔵襲名である。前回の分析で触れたとおり、 「タイ ガー&ドラゴン」というドラマをきっかけに若年層への落語の認知が急速に深まった時期でもあり、この襲 名は各方面(税務署も含む)から大きな注目を集めることとなった。正確な数値データは把握できないが、 各演芸場での襲名披露奥行は、話題性のみに留まらない意欲的な仕掛け(久しぶりに上方落語の桂三枝・桂 春団治・笑福亭鶴瓶が交互出演で定席の高座に上がるなど)も相まって記録的な大入り満員を続け、定席で の披露目の後には落語界初の「全国襲名披露ツアー」も敢行された。さらに 9月には、金也・園十郎・丈二・ すい平・白酒の 5人の新真打が誕生している。 これらの若手の台頭の影で、長年の「寄席の顔J2 人が世を去った。柳家小せん・桂文朝の両名である。 それぞれ前年 2004年の集計では出演回数第 l位と第 8位につけていた大ベテランであり、「寄席の世代交代 J が意識され始めた年とも言える。 0日開通しで出 また、 6月にはラジオで絶大な人気を誇る小沢昭ーが親友の柳家小三治の招きで末広亭に 1 演し、この芝居も連日満員札止めの大入りとなった。 3 . 集計結果の比較 2年次分の集計結果を比較する前に、 1つ前提条件の大きな違いについて述べておく。 1985 年当時の池袋演芸場は、客の入りがあまりよくないことで有名で、昼席は 10 日のうち 2~5 日しか開 けていなかった(恐らく週末のみの営業と恩われる)。また、現在のような落語芸術協会との交替制は敷か れておらず、さらに月末の「特選会 J (定席としての興行でない貸館公演)も行われていなかった。つまり、 現在の鈴本演芸場と同様に、落語協会が l年中興行を打っていたのである。 集計に際しては、これらの池袋の興行に対し特段の処理は行わず、他の奥行と同様に出演回数やトリ回数 を計上した。つまり、 1 9 8 5年は 2005年より総興行数・出演者延べ総数が多かったことになる。(ちなみに 「定席出演回数の全出演者合計」は 1 9 8 5年が 3 0 3 5、2005年は 2425である。) それを踏まえた上で、登場回数上位の顔ぶれを眺めてみようと思う。結果は次ページ表 1の通りである。 前回の分析でも確認できた傾向なのだが、色物が相対的に上位に来るのは今も昔も変わらなし、。なお、この 表中、 8 5年の第 9位「ー楽 J (紙切り)はその後師匠である第 7位の「正楽」の名を継いで、おり、 0 5年の第 l位と同一人物である。また、 8 5年の第 8位「仙三郎・仙之助 J (太神楽)の鏡味仙三郎は、相方の仙之助 没後は自らの弟子・息子と社中を組んで、活動しており、 0 5年の第 5位と事実上同じ組織である。 8 8

90.

この 2組のみならず、双方のランキング上位を順に見ていくと、登場回数上位者の顔ぶれは、集計時点に 2 0年の隔たりがあるとは思えないほとー似通っていることに気づく。なんと両年の上位 5 0人中 1 9人が同一人 物なのである。この「顔付けの固定化」について、詳細に見ていこうと思う。 表 1 出演頻度上位 1 0位 1 9 8 5年 2 0 0 5年 ゆきえ・はなこ 7 9 正楽 5 1I 2 ひろし・順子 7 5 . 5 さん喬 4 7 3 つi ま女 6 2 . 3 市馬 4 6 . 4 4 小せん 6 1 . 2 権太楼 4 6 5 志ん馬 5 9 . 4 鏡味仙三郎社中 4 4 6 圏菊 5 6 . 8 世津子 41 .5 5 6 . 3 一朝 4 0 7 正楽 8 仙三郎・仙之助 5 6 遊平か!まり 4 0 9 一楽 5 4 アサダ二世 3 9 1 0 歌奴 5 4 和楽・小楽・和助・小花 3 9 集計結果の分析 1 . トリ回数 トリ(寄席の最後の出番)を取った者についての集計を今回も行ってみた。 表2 トリについての集計 1 9 8 5 2 0 0 5 トリを取った人数 4 9 7 6 その中でのトリ回数平均値 4 . 1 2 . 2 8 トリ回数 0 . 8 0 . 5 8 トリ回数+中入り回数 O .6 8 0 . 7 1 総出演回数との相関 1 9 8 5年の方が、 「年間 I度でもトリを取った人数Jが 2 0 0 5年より少なく、またトリ経験者間での回数平 0 0 5年より多い。この頃の方が、 均も 2 トリを取る落語家の偏りが大きかったことが窺える。 0 0 5年は 2 0 0 4年データを用いた前回報告 また、前回同様に総出演回数とトリ回数の相関も調べてみた。 2 同様に「トリ+中入り(中入り休憩の直前の出番) Jの方が「トリ J だけより総出演回数との相関が高いの ‑89 ‑

91.

だが、意外なことに 1985年データでは「トリ+中入り」より「トリ」だけの方が総出演回数との相関が高か った。 この結果から推測されるのは、この 20年の聞に落語家たちの聞に「広く浅く J トリを取る機会が行き渡る ようになったこと、そして、「中入り」の地位が相対的に上がったことである。 トリは l公演に l人しか置けないが、中入りも重要なポジションであるということにすれば、「し、い扱い J にしたい人を l公演に 2人入れられることになる。さらに、長時間のんびりと寄席で過ごす、とし、う生活の しづらくなった昨今、中入りで良い噺が聞ければお客の退場の踏ん切りになる、というような寄席側の意向 が働いていることも考えられる。 2. 掛け持ち 寄席の番組においては、同一期間に開催される複数の定席に出演者として名を連ね、 lつ自の出番を終え た後、次の寄席へ移動してさらに出番をこなす「掛け持ち J を引き受けている者が時折見受けられる。これ は「人気者」の証とも言えるのだが、 1985年データの月 3回 xl2ヶ月分 36期間のうち、それぞれが「掛け持 ち」で寄席に入った回数を調べてみた。 表 3 掛け持ち ∞ 参考 2 4年 回数 回数 小せん 2 8 29 さん喬 2 6 志ん馬 28 権太楼 2 6 小せん 27 圃蔵 1 2 ゆきえ・はなこ 3 1 ひろし・ 1原子 園菊 27 文朝 1 2 つi ま女 26 敬之介 1 1 仙三郎・仙之助 25 金馬 1 1 一楽 23 喬太郎 1 0 権太楼 23 馬風 9 金馬 22 志ん輔 8 ゆきえ・はなこの掛け持ち回数は実に 3 1回。先に挙げた「偏り Jを象徴する結果とも言えるが、確かにそ 9回も顔付けに登場できるはずがない。しかし、逆に考えると、こんなに寄席に出 のくらいしなければ年間 7 ていては他の仕事が入る隙がない。つまり、この掛け持ち回数上位の人たちは皆「寄席で食えていた」とい うことになるのではないか。 ちなみに「寄席の顔 J がまだ健在だった 2004年の掛け持ち回数は、上位 3人のみが 20回台で、第 9位以 下は l桁台になっている。 ‑ 90

92.

3 . 顔付けにおける新旧のシェア いくら顔付けが固定的とは言え、 2 0年は梱当に長い期間である。この聞にヲ l 退した人もいれば、 2 0年前に はまだ入門前 前座修行中だ、ったが、その後めきめきと頭角を現し、現在は寄席の常連になっている人もい 0 0 4年掛け持ち回数第 8位の人気者・柳家喬太郎は 1 9 8 9年の入門である)。 る(例えば 2 どちらにも名前のある者と片方にしか名前のない者の構成比を調べてみた。 圏1 2 0年間の出演者の変化 1 9 8 5年 2 0 0 5年 こちらだけ 3 3 .1 % こちらだけ 43.1% 無論、この間の改名・真打昇進に伴う襲名等は考慮しである。 f 2 0 0 5年に苦手席の顔付けにあった名前のう ち5 6.9%は 2 0年前にも出ていた」とも、 f l 9 8 5年に寄席で見られた人の 3分の 2は 、 2 0年後もまだ寄席に出 ていた」とも読める。 総公演数の減っている 2 0 0 5年の方が「新顔 j の占める率が高いというのも、世代交代の進展を示す一端と 恩われる。 個人の動向 ここまでは全体の動きを見てきたが、個々の出演者の動向についても実際に何名か追ってみたいと思う。 1 柳家さん喬 出演回数 1 9 8 5年 柳家権太楼 出演回数 1 9 8 5年 44回 → 2 0 0 5年 4 7回 5 3 . 1 4回 → 2 0 0 5年 4 6回 今回集計してみて、最も驚いたのが現在の寄席の二大巨頭と言えるこの 2人の集計結果である。総公演数 の減少や個人の待遇の向上 ( 2人とも 2 0 0 1年から協会理事を務めている)など、 2 0年の聞には彼らを取り巻 く環境に様々な変化があったはずなのに、寄席出演回数がほとんど、変わっていない。しかも、かなりの回数 0年間保っていることになる。「大いなるマンネリズム」というような言葉だけでは語れない何かが 上位を 2 あるのだろう。 2 古今亭志ん輔 出演回数 1 9 8 5年 8 . 7 5回 → 2 0 0 5年 3 4 . 2回 入船亭扇遊 出演回数 1 9 8 5年 8 . 5回 → 2 0 0 5年 2 7 . 5回 8 5年に真打昇進した 2人で、 8 5年の数値には二つ目として上がった分も含まれている。まさに 8 5年 の 昇 9 1‑

93.

進以降どんどん実力をつけ、寄席を担う存在に成長した例と言える。ちなみに志ん輸は二つ目の頃から昇進 後までしばらく N H Kの「おかあさんといっしょ」に出演していたことでも有名である。 3 古今亭園菊 出演回数 1 9 8 5年 5 6 . 8 3回 → 2005年 29回 三遊亭金馬 出演回数 1 9 8 5年 44. 45回 → 2005年 1 9 . 3 3回 この辺りは加齢の影響かと恩われる。 2人とも 1 9 2 0年代終わりの生まれで、現役落語家でも最高齢のグ、ル ープに属する。同世代の柳家さん助も 1985年の 3 7固から 2005年は l固になってしまった。 4 柳家小三治 出演回数 1 9 8 5年 34. 49回 → 2005年 7回 小三治自身は元気に高座をこなし続けており、話術には定評があって固定ファンも多いが、寄席出演回数 は 20年の聞に激減した。これは数ある落語家の中でも非常に珍しい例なのだが、敢えて言うならば「偉くな りすぎた」というところだろうか。何しろ寄席にはトリか中入りでしか上がらないのである。が、彼がこう したある意味「孤高の存在」になってしまった理由の Iっとして、 8 5年当時のもう一方の古典落語の雄・古 今亭志ん朝の早すぎる死を挙げる声もある。 5 林家木久蔵出演回数 1 9 8 5年 9 . 2 7回 → 2005年 6回 いわゆる「テレビタレント J化している落語家は、概して寄席への出演が少ない。また、出る時期も正月・ G W・お盆などの客の入りが見込める時期に限られることが多い。 8 5年はいろいろな時期の寄席に出ていた が 、 05年は正月・ G Wと正蔵襲名の興行にしか出ていない彼のパターンは典型的である。ちなみに春風亭小 0固と 2桁になったが前年は 8回 、 1985年 朝の出演回数も、 2005年は正蔵襲名による定席連続出演があり 1 は7 . 2 3固とその人気・実力の嘗j に多くはない。 ただし、「テレビタレント」と評される部分を持っていても、古い寄席の時代を経験してきた一世代上の落 3 . 1 4回、古今亭志、 語家たちは、寄席にもある程度定期的に出演していた。 85年の柳家小さんの登場回数は 2 ん朝の登場回数は 1 5 . 1 7回である。 今後の分析 今固までは「年間総出演回数Jだけを手がかりに集計を行ってきたが、寄席の番組への出演は「出る J r 出 ない」以上に、出る順番、昼の部か夜の部か、どの演芸場に出るか、 実は大きな意味がある。これらを加味した集計を現在計画中である。 ‑9 2 トリが誰の時に出ているかーなどにも

94.

全国学生調査に基づく実演芸術鑑賞行動の規定要因の分析 有馬昌宏 兵庫県立大学大学院応用情報科学研究科 AnA n a l y s i so fThe a t e r ‑ G o i n gS t u d e n t s: Wha tF a c t o r sMakeS t u d e n t sGot oS e eP e r f o 口n ingA巾? M a s a h i r oArima G r a d u a t eF a c u l t yo fA p p l i e dI nf o r m a t i c s, U n i v e r s i t yofHyogo 要旨 1 9 9 1年から 2002年までに 3回にわたって実施してきた全国の学生を調査対象とする芸術と文化に対 する活動と意識に関する質問紙調査の結果に基づき、 7分野の実演芸術のライブ鑑賞と映画鑑賞に焦点 を絞り、これらの活動を惹起する要因(個人的属性と社会的属性)について、ロジットモデ、ルを適用し てその要因を探るとともに、約 1 0年間の聞に要因に変化があったかどうかについても検言すする。 キーワード: 2項目帰分析、ロジットモデル、 JMP、アンケート調査 1.はじめに 高度経済成長を達成した上で、人口高齢化、高学歴化、高度情報化といった社会構造の変化を迎えている 我が国では、国民の要求は精神的に充実した生活を送る方向へと向かつてきており、文化・芸術に対する関 心も量的増大と質的多様化を見せはじめてきている。しかし、このような動向に比して、我が国の文化・芸 術に関する統計情報の整備は、近年になって漸く着手されはじめた段階であり、残念ながら需要、供給、お よびこの需給を結び付ける劇場・ホールやメディアなどに関する統計を含めて、全体を体系的に捉えるまで には至っていない。さらに、この分野・領域の実態を明らかにする代表的な統計調査は、実演芸術の鑑賞活 動の現状把握に限定してみても、表 1に要約して示すように、標本数が十分に確保されている調査では実演 芸術の分野・ジャンルが包括的で、詳細な分析がで、きず、反対に実演芸術の分野・ジャンルが詳細な調査では 地域や性や年齢や学歴などによる鑑賞構造の違いを明らかにするには標本数が不十分であるといった問題が 生じている。 このような状況のもと、本研究では、芸術・文化の需要サイドの実態と構造を分析するための統計情報の 収集と整備を目的として、全国の高等教育機関に在籍する学生を対象に、 1 9 8 5年度からほぼ 5年毎に実演芸 術、映画、視覚芸術(美術)の鑑賞活動に加えて、書籍・雑誌の購読状況や学校でのクラブ活動や稽古事を 含めた主体的芸術活動状況の経験と現状を把握するために実施されてきた 4回の質問紙調査(r現代青年の芸 術意識と芸術活動調査」、以降、本稿では「学生調査」と略記)を通じて蓄積されてきたミクロ統計データ(個 票データ)に基づき、我が国の将来の芸術の需要動向を大きく左右すると考えられる若年層、特に大学生に 焦点を当てた芸術・文化の需要活動に関する構造とその変化に関する時系列的分析を試みる。 ‑9 3

95.
[beta]
2
. 研究の背景と問題意識
芸術・文化の需要サイドの実態と構造を明らかにするための統計データの蓄積は、表 1に示すように歴史
が浅く、しかも詳細な分析を行うに必要な純分類による鑑賞・活動実態の把握は行われていない。しかも、
ノンパラメトリック分析やランダム効用理論に基づく消費者の行動選択に関する統計解析手法の発展、なら
びに統計解析のためのコンピュータのハードウェアおよびソフトウェアの進歩により、単なる集計統計量に
基づく分析ではなく、ミクロ統計データに基づく分析が主流になりつつあると同時に、政策の立案・評価に
直結する重要な研究結果も生まれつつある。このような時代背景のもと、ミクロ統計データに基づく芸術・
文化の需要サイドの分析の重要性を逸早く認識した松田芳郎・永山貞則らの研究グループにより、三善晃を
研究代表者とする科学研究費補助金による研究の一環として、全国の大学生 1
0
570人と勤労青年 2
507 
対象とする「現代青年の芸術意識と芸術活動調査 Jが 1
9
8
6年に実施され、爾来、表 2に示すように、ほぽ 5
年ごとに学生を対象とする調査が実施され、ミクロ統計データの蓄積と蓄積されたデータに基づく研究が続
けられ、成果の発表が行われてきている(三善(
1
9
8
8
)、永山 (
1
9
9
2
)、杉江 (
1
9
9
9
)、有馬他 (
2
0
0
0
)、周防 (
2
0
0
4
)
)。
ところで、我が国では地域や社会階層間の格差の拡大が社会問題のーっとして注目されているが、

B
o
u
r
d
i巴u
(
1
9
7
9
)が指摘し、片岡 (
2
0
0
7
)が実証研究で確認しているように、芸術・文化の享受活動は、経済的状
況の他に家族の学歴や職業、さらには稽古事や鑑賞活動の経験など、いわゆる文化資本と呼ばれる要因と深
く関係していることが知られている。この点については、 R
u
s
k
i
n
(1
9
0
5
)の固有価値論や Sen(
19
9
2
)の潜在能力
アプローチとも関連して、芸術・文化を享受する主体としての個人の能力に影響を及ぼす家庭や学校や地域
の影響をし、かに計量的分析に組み込んで実証していくかが大きな課題となっている。
社会生活基本調査は、このような課題に応えるための国民の芸術・文化関連活動実態に関するデータを提
供してくれる、 5  1度実施される大規模標本の周期調査である。社会生活基本調査の活動種目別の行動
者率(過去 1年に当該の活動を行った者の比率)を用いて、永山 (
1
9
9
8
)は公表されている集計表を活用し、勝
浦(
2
0
0
6
a、2
0
0
6
b
)は 80%抽出の秘匿処理済ミクロ統計データを活用して、「学歴が高くなるにつれて実演芸術
(演芸・演劇・舞踊鑑賞、クラシック音楽鑑賞など)の行動者率は高くなる」ことを示している。
また、有馬 (
2
0
0
7
)は、社会生活基本調査の結果の中で最も紹かくプレイクダウンされた集計表の一つである
「男女,教育,ふだんの就業状態,卒業者の年齢,趣味・娯楽の種類別行動者数(行動者率 )
J に注目し、
種目別行動者率=定数+加齢効果十時代効果+世代効果+教育効果+就業効果+誤差項
とし、う線形モデルを考えて、年齢階級、調査年、出生年、教育階級、就業状態についてダミー変数を設けて
重回帰分析を適用することにより、 1
9
9
1 年から 2
0
0
1年までの 3時点、の集計表を用いて、教育効果と就業効
果も考慮に入れたコーホート分
 1 芸術・文化の需要に関する既存調査
関査実施主体
調査名



"の品査1"1.主
調査対象
s

析を試みている。ここで、コー

文化庁







再部
の工化に 余暇活動に





 凶民
社会生活



基本調査
世鎗調査



調
 関する調査
1996 1


年以

1
9
5
7

6



と降 1987
1
9
9
9
9
3
9
2

手と 1977
2003

総総理務



7



総内理閣


3
i

]

2怜]

301






政逗
国民生活
時間調査
1960
以降
5


1
0
1
'
"

圃 20皐
全
直20歳 都
全
国 10歳
国
歳
の
以
世
上
帯
の 全
1
5
5
万
歳
市
人
以
に
以
居
上
上
住
男
の
の
女以
上の国民
世帯員) 以上の男女 以上の男女
000
3,
1
2,
約 17,
000
世
帯
3,
000
2
.
0
0
0
600
2,
094
*1200,
000人
1
.509
2.
43
1
7,
718
ャ
ンFレ
)
3(7ジ
7
3
3
聾 璽 の 分4シ
醐
ゴ16シ
ャ
ンfレ
)
'



8

ン1レ

6
ャンル
()
4)彦
容榔・樗踏・パレエ等 9V'‑¥'ン

L
、、
()
0(1ジ
,ンル}
.
γ 大権,ri
'
U
告
6ジ
ャンル
6
)ク
ラ
シ yク
汗
1
3ジ
ャンル
7
);
1
:
ヒ ユ 7‑g
‑
.
:
!
i
l
.
2
1
0ジ
,ンル
、
"
t
長中のりは、対応する二区南芸術分野の泊三九平iH
J
の痕'flIT削
のf
i  刈丘 0
'
し
て
し
もζ 」 を 不 tJ
(
全
1
0

。 。
。 。
。
。
。
。
。 。
t

4

4

‑ 94

ホート分析における加齢効果と
は、世代や時代とは無関係に人
間の生理的な特性やライフステ
ージと関係して変化していく年
齢(加齢)による効果、時代効
果とは、年齢や世代とは無関係
にその時点・時代での特性を反
映して社会全体を同じ方向に変
化させていく効果、世代効果と

96.
[beta]
2

4回の学生調査の実施年度とサンプル構造

第 1回 調 査 (
1
9
8
5年度}
第 2回調査(19
9
1年度)
第 3因調査(19
96
年度)
吋 4回調査 (
2
0
0
2
年皮}
有効回収
有効回収
有効回収
抽出串
抽出串
抽出串
有効回収
抽出畢
母集団
母集団
母集団
母集団
サンプル
サンプル
(%)
(%)
サンプノレ
サンプル
(拡)
(
'
Y
o
)
1
2
8,3
0.405 2,368,
1
,7
3
4
.冊。
7,8
7
9
0.454 2,
052.338
992
8,980
設大学
0.379 2.499.147
3,678
0
.
1
4
7
3
7
7,1
0
7
0
.
3
8
4
4
9
7,569
1
,0
3
2
0.207
4
6
3,948
立短期大学
1
,4
4
9
7
3
3
0.158
2
6
7,086
。
0.000
。
1
9,816
1
8
0
0
.
9
0
8
2
1,608
0.000
80
0.370
21.336
形高等専門学校
579,2
7
4
1
,2
4
2
0
.
2
1
4
834.713
1
,1
5
5
0.138
7
9
9,5
5
1
1
8
5
0
.
0
2
3
7
6
5,558
4
1
0
.
0
0
5
館専修学校
98,650
8
7
s
I
I 大学院
0
.
0
8
8
1
6
4
.
3
5
0
83
0
.
0
5
1
223.512
0
.
0
2
0
4
4
4
6
0.324 2.010,7
6,3
0.316 2.136.180
5.386
0.252 2,085,1
0
.
0
8
7
性男子
1
,6
66.991
5
.
4
0
4
1
5
2
0
,8
0
4
1
0.484 1
4
.
3
7
5
1
,0
23.470
4
,9
4
9
.4
9
2
.3
7
1
0.293 1
,6
8
2,269
4,4
1
4
0.262 1
.
6
91
.519
s
I
I 女子
1
,9
5
4
0.116
,1
5
5,315
3,3
8
7
0
.
5
4
1 1
0.293 1
879,5
3
0
4,7
5
7
,0
4
5,3
4
5
2
.
5
7
3
0.246 1
,1
4
4
.
7
8
1
。.
190
専文芸系学部
2.170
9
7
0
.
4
9
3 1
4,5
0.436 1
7
8
5,3
0
4
3
,8
7
5
,
054,629
,1
5
7,923
5,4
9
7
0
.
4
7
5 1
,1
2
8,3
6
5
攻社会系学部
,3
02
0.115
1
0
.
2
2
1
2
,
0
9
2
分理工系学部
498,968
1
,1
0
1
8
5
7,863
,0
76.724
1
,2
80
0.119
889.537
0.244 1
1
6
2
0.018
1
7
9,2
2
6
6
6
4
0.370
309.838
5
4
8
0.177
3
7
2,262
。 1
7
8
664
506.089
0.025
野保健系学部
1
2
9
北海道・東北
206,5
6
4
0.479
269.809
7
9
2
0
.
2
9
4
3
1
4,556
0
.
1
1
4
989
992
0.315
3
2
4,816
3
7
1
0.392 l
3,4
4
5
地関車
1
.402,891
5,4
9
6
.
420,887
,5
6
9,385
3,3
9
7
0.216 1
,5
7
9,0
2
1
0.242 1
0
.
0
6
8
1
.066
境問信越北陸・東海
7
6,9
1
5
0.424
4
5
7,024
1
.747
0
.
3
8
2
5
2
8,3
3
6
3
2
6
1
,3
62
0.258
5
2
3,758
0
.
1
3
4
7
0
4
0.316
~II 近世
5
5
3,6
8
5
1
,7
5
1
652.747
1
.
7
2
4
0
.
2
6
4
7
4
7,803
2,1
9
7
0
.
2
9
4
7
5
7,073
1
.
1
2
4
0.148
0.593
2
2
7,008
1
,1
9
2
中国・四国
1
7
2
.
7
4
3
1
,0
2
5
0.525
2
6
6
.
1
8
1
7
6
1
0
.
2
8
6
2
6
,
17
8
1
1
7
8
0
.
0
6
8
0.407
3
0
9,666
1
.
8
6
7
九州・沖縄
2
4
1,3
9
8
983
0.603
370.580
1
.
3
5
2
0.365
372.227
0.087
324
2,690,4
6
1
0.393 3.503.086
1
0
.
7
7
0
0.307 3.818.449
1
0,0
6
1
1
0
.
5
7
0
0
.
2
6
3 3,776,639
3,7
全体
6
7
0.100
E
主1
) 母集団の揖造は,第 1因調査では文部省!昭和 59
年度李蚕蚕示扇蚕7
て 豆回調査では l平成 3年度版字校基本調査 J ,第 3回調査では I平 成 8年度版学校孟'*
調査 J ,第 4回調査では「平成 14
年度版学校基本調査 J から計軍
注2
) 第 1因調査では,調査対象から高等専門学校および大学院の学生は除かれている.
注3
) 第 l回調査と第 4回調査の専攻分野s
I
Iには,専修学技のその他の分額が障外されている
注4
) 第 1回調査の地犠伊J
では,東海地壌は関東地塘に吉まれている
注 目 第 3回調査と第 4回調査の地履別では,高等専門学校の人数出除外されている
注6) 第 4回調査の設立形態別の大学と大学院と短期大学には,専攻科と別科の宇生ならびに聴講生、選科生、研究生等と通信用j
の学生が吉まれていない
注7
) 設立形態別.性別,専攻分野別,地塘月I
1の有効回収サンプ Fレには分額出不明のサンプノレは除外されているため,合計しても全悼の有効回収サンプル教には 致 L
f
品、

表 3 コーホート分析による各種効果のパラメータの推定結果
ランツク

皐一一一一

沼 田‑
1
9
8
61
9
7
71
9
8
1年
内7
21
9
1
61
9
6
11
9
1
19
6
21
9
6
6年
出 I1
判 !
9
5
11
9
6
1年

n
:I~~~-l蜘年

0
8
4
0
5
0
8
0
2
1
6
3
9
E
値
定値
0
7
0
2
9 0
4
268
3田
‑
1
2
66.
5
5
2
7 .
1
4
35
8
2
7
5 <45
4
4
4
1
81
2
82
62 ‑<>田

0
8
2
5
0
0
8
0
6
6
1
5
.
9
3
t
恒

権定置

30
5
8
1 1
2
5

0
8
1
5
7
on24
8
5
5
推定値

。羽田

0
6
7
6
5
1
5
1
3

t
櫨

権定値

3
3
9
1
0
1 2
7
7

同

t
憧

1
1
0
0
8
4
1 5
.
5
9

回 目
5
5
55
1
7
5
1
1
12
1
5
.
. 4
6
3
2
7
4
9
l
l
14732
4
4
B
7
0
2
5
0
0
1
8
5
7
I
11
Z
1
9
8
2
0
7
12
5
2147
9
5
1
7
12
3
目 ‑ 14
3
田‑<>田
1
7
7
5
1
5
12
.
5
9
" 1‑
7
2
6
4
6
1 ‑2.46" 13
0
5
5
4
106
5
司

司

0
.
9
30
9
1
3
9
2
4
.
3
5
権 宜f
置

0
8
3
7
8

t
'
直

5
3
4
2
3
1 2田
4
3
8
1
7
8
4
8
9
8
E
8
1
i
l
1 ‑0
0
‑
2
8
4
9
B
I
05
3
9
‑01
7
8
8
1‑
0
0
3

I1同 7
‑
1
9
5
1年
1
11
9
4
2
‑
1
9
4
6年

合

トI1
9
3
7
‑
1
9
4
1年

1
9
3
2
‑
1
9四 年
1
9
2
7ー1
田 1
年
1
9
2
2
‑
1
9
2
6年
一一斗l
l
i
主
鋼I 1
9
9
1年
査1
1
9
9
6年
年1

忽
)
1
)1
年

信時節階級

は、生まれ育った時代環境を反映して世代に固有の特徴に起因する効果である。一般に、加齢効果が優勢で
あれば、個人は変化しでも社会全体としての変化は人口ピラミッドの形状に影響を受けるだけで大きな変化
は生まれず、世代効果が優勢であれば、個人は変化しないが古い世代から新しい世代への移行に伴って社会
は大きく変化し、時代効果が優勢であれば劇的に変化するが逆方向への揺り戻しの可能性もあって変化は流
動的であることが指摘されている(中村 (2000))。
コーホート分析の結果を示す表 3から、演芸・演劇・舞踊鑑賞、クラシック音楽鑑賞、ポピュラー音楽・

n
ヨ

rD

97.

歌謡曲鑑賞、映画鑑賞のいずれにも顕著な教育効果、すなわち学歴が高くなればなるほど劇場・ホールへ足 を運ばなくてはならない実演芸術ならびに映画の鑑賞行動者率は高くなるという現象が確認できる。この教 育効果に関連して、最高学歴の高等教育機関(大学、短期大学、高等専門学校、専修学校)卒業者の中にも 実演芸術および映画を鑑賞する国民もいれば、鑑賞しない国民も存在しており、この鑑賞活動の有無を規定 する要因は何かという疑問が生じる。我が国の高等教育機関への進学率は戦後を通じて一貫して上昇を続け ており、これらの高等教育機関に在籍する学生と卒業生の実演芸術および映画の鑑賞活動の実態と鑑賞活動 を規定する要因を探ることは、将来の我が国の実演芸術への需要を予測するに際して有用と考えられる。 3 . 学生調査に基づく実演芸術の需要構造の分析 文化資本と呼ばれる要因は殊に個人のプライパシーにかかわるものであり、個人情報保護意識の高まりに 関連して調査環境が厳しくなってきている近年では、一般の国民を対象とする質問紙調査で、文化資本にか かわる要因を標本の偏りを生じさせることなく調査することは殆ど不可能であると言ってもよい状況にある。 また、芸術・文化に関連する諸活動について、実演芸術、映画、美術、書籍・雑誌、主体的芸術活動、稽古 事などでジャンル別に多岐にわたる詳細な鑑賞・活動経験に関する調査を質問紙法で行うと回答に時間がか かり、極端に低い回収率となることが予想される。このような認識のもと、大標本を確保しながら限られた 費用で調査を実施するために、大学教員のネットワークを活用して、全国の大学の地域と専門分野別の分布 を考慮しながら有意選定で標本抽出を行うことにして過去 4回の学生調査が実施されてきた。 学生調査では、芸術・文化の需要構造の実態把握に焦点を当てており、調査票の質問は、大別すると、実 演芸術 7分野 5 6ジャンルのライブでの鑑賞経験(過去通算と過去 1年)と実演芸術 7分野のメディアによる 鑑賞経験(過去 1年)を問う質問群、映画鑑賞と美術などの視覚芸術鑑賞の経験と鑑賞場所を問う質問群、 鑑賞行動に影響を与える要因に関する質問群、および鑑賞行動と何らかの関連を持つと考えられる事項につ いて問う質問群とから構成されている。鑑賞行動に影響を与える要因に関する質問群は、①生活時間に関わ る項目(所属学部、学年、課外活動、アルバイト状況など)、②経済状況に関する項目(家族からの仕送り・ 小遣い、アルバイトおよび奨学金からの所得、居住形態、芸術・余暇活動関連機器保有状況など)、③地域に 関する項目(出生地域、生育地域、現住地域、大学所在地域など)、④文化資本または文化的環境に関わる項 目(家族構成と家族の学歴・職業・年齢、稽古事歴、主体的芸術活動歴、購読新聞、書籍・雑誌の購読状況 と購読ジャンルなど)、の 4つに分類することができる。 本研究では、実演芸術の需要構造の実態把握と構造の時系列変化に焦点を絞り、質問項目がほとんど共通 である第 2回調査から第 4因調査までのミクロ統計データを利用して、ロジットモデルを適用して実演芸術 を鑑賞するかしなし、かを規定する要因の把握を試みた。分析における被説明変数は、①実演芸術 7分野につ いての過去を通算した鑑賞経験の有無、②実演芸術 7分野と映画についての過去 1年に限定した鑑賞経験の 有無、である。説明変数は、性別(男子を基準)、所属学部(社会系学部を基準)、学年(過去 1年に限定し た鑑賞経験の有無の場合のみ、 1年生を基準)、居住場所(関東地方を基準)、通学形態(自宅通学を基準)、 文化会系ならびに体育会系の課外活動の有無(過去 1年に限定した鑑賞経験の有無の場合のみ)、父親の職業 と学歴(専門・技術職を除く被雇用者および高校卒を基準)、母親の職業と学歴(専門・技術職を除く被雇用 者および高校卒を基準)を用いた。表 4には第 1回調査から第 4回調査までの実演芸術の年間鑑賞経験率の 推移を、表 5と表 6にはロジットモテ、ルを適用した 2項回帰分析の結果を要約して示している。 (1)過去を通算した実演芸術の鑑賞経験の有無 モテ、ルの説明力は、表中の尤度比 χ2ならびに McFaddcnの擬似決定係数の値で確認することができるが、 ρhu Qd

98.
[beta]
表 4 学生の実演芸術の年間鑑賞経験率の推移
第 1回 調 査
全体
男子

第 2回 調 査
第 3回 調 査
第 4因 調 査
子全体
男子女子 全体
男子女そ 全体
弟子女子

云統演劇

5.3
2
.
4
。.
6
3
.
0
0
.
4
0.2
11
.7
4
.
9
1
.1
0
.
2
l日
0.8
5
.
0
0
.
7
1
.4
0.2
8.2
1
.5
0.9
0.3
5
.
3

2
.
1 9.7 4.0 2
.
1 6.2 5.6 2.5 8.4
1
.1 4
.2 3
.5 3.2 1
.2 2.3 1
.4 4.9
0.3 1
.
6 0.4 0.8 0.9 0.5 1
.1 0
.3
0.9 5.9 1
.8 0
.8 3.0 2.0 0.6 3.3
1 0.4 0
.
2 0
0.2 0.8 0.3 。.
.
1 0.3
4
. 現そ代の他歌舞の伝伎統 演 劇
0.2 0
5
.
.
1 0.3
0
.
1 0.4 0.2 0
.
1 0.3 0.3 0.2 0.4
.5 7
7.6 1
7
.
5 11
.0 1
6
.
7 1
0
.
8 8.7 1
2
.
7
境 E
碩1l'
1
8.6 5.2 1
2
.
3
3
.
1
5
.
6
3
.
4 8
7
.
4
.
1 5.5 4
.i 6.3
ピュ
6
. 演ポ劇
7
ラー演車j
1
.5
1
.3
1
.8
0
.
7 1
1
.0 0
.8 1
.6
.3
.3 1
1
.1 1
.5
0.4 0
.
1 0
.
8
0
.
1 0.5 日 l 0
.
1 0.2 0
.
1 0
.
1 O
.1
日 新現派
代 ・ 新 国 庫l
4
0.6 0
.
7 。.
.8 0.5 1
的小劇場
0.9 3.0 1
.3 0
.7 1
9
.
.9 0
.1
0.8 0.6 1
.2
0.3 1
1
0
.外国劇団
.
7 0.3 1
.5 0.4 0.6
.5 0
.3 0
1
0
.
0 日.5 11
.6
3.5 7.0 4.8 3.3 6.5 4
11.ア 7 チ ュ ア 演 劇
.
3 3.6 4.9
.
0
0
.
4 1
2.2 1
.
9 0.5 1
.4 3
1
2
. 児童庫l
.1 0
.5
1
.1 0
.7 1
.4
3.7 l日 5
.
7
O
.日 2
.2 0
.6 1
.1 1
1
.9 0
.8 2.9
.9
1
3
そ
形
のB
他J
の現代演劇
0.4 0.2 0.7
1
4 人
0
.
1 0
.
4 0
.
1 0.2 0
.
1 0.2
.
1 。l 0
オ ベ 7等
3
.
1 1
5
.
4 9.0 3.7 1
5
.
2 1
0
.
7 4.8 1
6
.
1
4.7 し6 8.0
.3 0
.6 2.0 3.0 0.8 4.9
0.4 2.9 1
1
5
オ
ベ
人
ラ
ラ
の
(
(
外
日
創
本
来
作
)オ
0.5 1
ベ
1
.2 0
.4 2.2 1
1
6
.オ
.6
.6 0
.5 2.6
日l 0
0.8 0
.
3 1
.4
.
4 0
ベラ
.0 0
.4 1
.5 0
.
1 0.6 1
1
7
. 日本
.6
1
1
.8 4
.7 1
9
.
5
1
8 ミュージカノレ(日本)
1
.9 1
0
.
1 5
.
7 2
.日 9.9
.1 1
0
.
0 6.5 2
1
.
自
0
.
7 3.3 1
.9 0
.9 3.2 1
1
9 ミュージカノレ(外来)
.2 日目
1
.5
0
.
6 0
.
4 O
.1 0
.
1
1
.3 0
.8 0.6 0.2 0.9
2
0
. 干レのビ俄ュの
ー
.
1 0
0
.
1 。 l 0.2 0
.
1 0.2 0
.
1 0
.
1 0
.
オベラ等
21
.
1
罵踊・書面・パレエ
6.6 2.8 1
1
.9 6
.2 2.4 1
1
.9
0
.
8 I.8 3.4 1
1
.3 0
.5 2
.
2 1
.1 0
.6 1
.9
1
.0 0
.
4 1
1
.9 0
.9 2.8
.7
日
本
俗
舞
・
民
族
族
.j
舞
舞
E統
踊
踊
芸
{
{
外
日
程
本
来
2
2
1
.0 0
.
7 1
.3 0
.
5 0
.
4 0.8 0
.
6 0.3 O
s
'
:
#
>
.踊
ß':~"'~(ß
;j;:)
.自
.自
2
3
.民
1
.4 O
1
.9
0
.
8 0.3 1
0.3 1
2
4
.民俗・民族踊{外来)
.5 日目
1
.1 0
.3 1
.4
.9
5.5 1
.0 1
0
.
4 1
.5 0
.
4 3
.4 0
.3 2.7 1
.7 0
2
5
. パレエ(日本)
.
1 1
.3 3.0
1
.4 0
.2 3.0 1
2
6 パレエ{外来)
1
.2 。。
.4 0
.3 2日
2.3
2.0 。
3
.
3 1
2
7 モダンダンス{日本)
ー
自
.2 0
.3 2
.
7 0.3 1
1
.6 0
.
3 0
.7 2.3
.3
2日 モ ダ ン ダ ン ス ( 外 来 )
0.3 0
.
1 0
.
1 0
.
7 0.2 0
.
4 0
.
5 0.2 0.7
0.9 0
.2
.
5 1
1
.3 0
.
7 2
1
.2 0
.7 1
1
.0 0
.7
.
1
.7 1
.4
舞
そ
踏
踏
の
偵
・
・パ
パ
の
舞
フ
フ
踊
ォ
ォ
ー
ー
・舞
77踏
ン
ン
ス
等
ス(
(日本)
2
9
0
.
5 0.3 0.9 0.9 0.3 1
.6 0.3 0.9
外来)
3
0
.舞
.5 0
0.5 0.2 0.8 0.2 0
.
1 0
.
4 0.2 。 l 0.3 0.2 ー
31
.
。l 0
.3
1
7
.
1 1
タフシク音楽
0
.
4 26.4 1
6
.
1 8.9 24.8 2
3
.
1 1
3
.
3 3
2
.1
0自 2
2
.
1 I
.
l 4.6 1
1
6
.
3 1
0
.
6 6.8 4.0 1
0
.
3 1
0
.
4 5.4 1
5
.
0
3
2 オ ケストララ{(外日本来)
2
.
5 1
.2 4
.
日
3
3
. オーケスト
.1 5
.7 4.6 1
7.2
.3 3.2 1
9.7 3
.
4 1
6
.
5 3
.
0 1
.3 5
.
1 1
3
4
. ピアノリサイタル(日本)
.4 3.0 1
.4 5
.0 7
.
日
1
2
.
0
1
.5 0
.
5 3
.7 0
.5 3
.
0 1
3
5
. ピアノリサイタル(外来)
.
2 3.3 0.6 5.8
3
6
. 弦楽器リサイタル(日本)
5.7 3
4 2
.
9 1
.
3 自.
.
7 4
.
7 2.7 1
.5 3
.9 4.8 2.3 7
.1
3
7
. 弦楽器リサイタル(外来)
.
5 2
1
.2 0
.
4 2.2 1
.4 0
.
1 0.8 3.3
.
4 2
5.6 3
.
2 8.3 2.0 0.9 3.6 2
.
1 0.7 3
.自 4
.
1
3
8
. 室内楽(日本・外来)
1
.4 6
.5
4.8 3
.
0 6
.
8 3.6 2.0 5.8 3
1
.3 5
.
1
3
9
. 管楽器(日本・外来)
.3 5.5 3.0 7.7
4
0
. 声楽リサイタノレ(日本)
5.6 2.2 9
.
4 1
.5 0
.6 2
.6 0
.6 2.7 4.5 1
.5 7
.2
.
7 1
0
.
4 0.2 0.6 0
.
4 0
.
1 0.7 1
.0 0
.3 1
4
1 声楽リサイタノレ(外来)
.7
11
.9 7
.
4 1
6
.
9 4
.日 3
.
0 7
.
7 2
.
2 3
.
5 5.3 6.8 3.6 9.8
4
2
. 合唱(日本)
。l 1
0.6 0
.
4 0.9 0.6 0.2 1
.7 噂
.1 0
.3
4
3 合唱(外来)
.日
.
6 1
.0 2
.
1 3
.日
2
.
0 1
.4 2
.2 O
1
.0 0
.6 1
.5 3
1
.8
4
4
. 邦その
楽術 の
.6 0.3 0.2 0.5 0.5 0.3 0.7 0.8 0.3 1
4
5
.
クラシーク音楽
1
.8
1
.0 2
.3
ハピュフー音楽
27.4 22.7 34.0 24.5 1
9
.
6 30.3 24.2 20.3 2
7
.7
0.6 0.5 0.6 0
.
4 0
.
1 0.8 0.7 0.2 1
.2 0.1 0.3
.3 0
日本・外来)
46 シャン(ソ日ン本{)
5
.日 6日 4
.
7 2
.
4 2
.
1 2.3 3.8
4
7
. ジャズ
.
2 2.6 2.9 2
.
3 3.6 3
1
.7
ジャズ(外来)
1
.5 2
.
1
21
.2 21
.4 21
.0 1
0
.
7 9.6 1
2
.
3 8.7 日.
4 9.2 9.5 1
0
.
3 8.7
4
8
. ロック(日本)
4
.
7 5.2 3.9 3
.
9 5
4
9 ロック(外来)
.
1 2.5 2.6 3.4 1
.9
2
.
3 1
.8 2
.9 1
.4
1
.0
1
.7
5
0
. ニューミュージック・フォーク(日本
0
.
5 0
.
3 0
.
7 0.2 0
.
1 0.3
51.ニューミュージック・フォーク{外来
ニューミュージック(日本)
21
.4 1
7
.1 26.0 1
1
.4 8
.2 1
5
.自
.6 1
ニューミュージック(外来)
1
.0 0
.6
フォーク(日本・外来)
4
.
0 4
.
8 0.9 0.8 1
.0
.1 3
11
.1 6
5
2 ポップス(日本)
.9 1
6
.
2 1
3
.
3 9.3 1
7
.1
1
.7 1
.0 2
.2
1
.0
5
3 ポップス{外来)
1
.3
.
4 1
9.2 8.5 9
.
9 3
.
2 2
.
4 0.9 0.7 0.3 1
.
4 4
.
4 0.7 0
5
4
.歌謡曲・演歌
.1
.
5 0
.
2 0.2 0.2 0
0
.
4 0
.
3 0
.
1 0
.
1 0
.0
.
1 0.6 0.2 1
5
5 民その
謡他 の
.
2 0.9 0.7 1
.6 0.5 0.6 0.9 1
ポピュラー音楽
1
.9
1
.5 2
5
6
.2 0
.0 0.8
大衆芸館
6
.
7 5.3 8.5 7.6 5.0 1
0
.
3 8.8 6.0 11
.3
4.2 4
.
1 2.6 2.0 3.5 3.2 2.3 3.9 5.5 3.6 7.3
.
2 4
5
7
. 落浪語曲・・講漫談
才
.
0
.
1 0
.
1 0
.
1 日l 日l 0
.
1 0
5日
.
1 0.2 日 l 0.3 0
.1
.
1 O
日目
5
9
.芸能ショー
6.6 2
.
4 11
.2 0
.
9 0.8 1
.1 l日
2.9 0.9 0.7 1
.1
0.8 0.6 0
.
9 0
.
5 0.5 0.6 0.3 0.2 0
.
4 0.3 0.4 0.3
6
0
. 大衆演軍j
5.0 4
.
1 2
.
8 2
6
1 サーカス
.1 6
.1 3.7 2.6 2.0 3.4 3.2 2.5 3.9
0.9 0
.
9 0.5 0.5 0.5 0
.
9 0
.
5 0
.
4 0.5 0.6 0.4 0.7
術他 の 大 衆 芸 曲
6
2 奇その
6
3
0.3 0.2 0
.
4 0.2 0.2 0.2 0.2 。 l 0.2 0.2 0.2 0.2
ヂ のf
問
.
4 0.6 0.5 0.8 0.6 0.6 0.5 0.3 0.2 0.5
3.2 1
.2 5
.
4 0.6 0.5 0.8 0.6 0.6 0.5 0.3 0.2 0.5
6
4
. 干の附
3.2 1
.2 5
全ジャンル
67.8 55.5 81
.3 4
6.7 35.9 61
4.8 32.2 59.6 47.3 35.2 58.3
.7 4
耳語耳持持 5
.370 4.905 持再非再評 5.945 4.269 宮 453 4.958 4.278 3.724 1
有効サンプノレ数
.7
68 1
.9
49
注1
) 第 1因 調 査 で は 7分 野 4
7ジャンノレ(分野としての「その他 Jと 各 分 野 で の 「 そ の 他 j を含む) .第記lEl調査から第 4園 調 蚕
4ジャンノレ(分野としての「その他 1 と 各 分 野 で の f
そ の 他 j を含む)を調査しており,
は該当するジャンノレが
で は 自 分 野6
1
. 能文楽
・狂ロ

2
.
3
. 歌舞伎

2.6
0.7
1
1
.5

.
9
2.3 2
0
.
5 1
.0
3
.
3 20.5

なし、か集計値が計算されていないことを,空欄は日本と外来を区別していないことを示す。
注2
) 表中の単位は%である。

97 ‑

99.
[beta]
表 5

第 2回
(
1
9
9
1
)

i
品去華子雨算した実演芸術の鑑賓経験の有無に対する ロジットモデルの宇佐宗結果

縄踊ー舞踊・パレエ
現代 f
i
l
:U
日
駐
オベラ等
クラシック ff~
irピュ 7-ff~
大衆芸能
3
0
9
8
.
7
3
2
6
5
0
.
2
2
2
2
6
3.
47
3
1
7
9
.
3
6
3
0
0
6
.
2
9
3
0
7
2
.
8
7
2
3
2
.
8
5 •••
1
41
.9
8 •••
4
2
4
.
9
6・
5
3
0
.
6
5・
・
・
6
6
3
.
1
5
1
1
3.
47
0
.
0
3
6
0
.
0
9
1
。1
2
8
0
.
0
6
6
0
.
0
1
8
0
.
0
2
3
4
.
6
'
叩
4
.
6
9
0
4
.
6
9
0
4
.
6
9
。
690
4,
4
.
6
9
0
雛定.̲
p
l
J
(
p値
p僅
縫定値
筆
後定値
p値
推定値
p値
推定値
p値
権定値
篠宮値
.
0
曲,.... 0815 <
'
0
0
0
1•••
・
'
0
0
0
1
'
0
0
0
1
.
0
0
0
1.
<0
0
0
1
.
5
4
7 <
0
.
2
2
1 <
0
.
3
4
0 〈叩0"" 0
0489 <
0
.
3
1
4 ,
0
.
2
1
2 <
.
0
0
0 •••
0
0
0
1.
.
. 0
曲 1.
‑ 0.
.
0
.
0
0
0
0
.
2
1
3 <
179 0
0
.
2
4
2 く.
0159 0
0
.
0
3
1 0.
45
9
0
.
1
2
9 0
.
0
0
2
.
1
6
0 。∞o•••
.
0
0
9.
.
0
0
2 •••
同
.
0
2
8 ••
.
0
0
6
0同 l 0
。.
.
1
4
9 0
1
3
2 0
0
.
0
9
2 0
0
.
1
3
1 0曲 7... 0
0
.
0
4
9 0
.
1
4
3
.
2
4
3
0
.
1
3
2 0
.
0
5
7•
.
0
8
6•
17
6 0
0
.
0
7
9 0
‑
0.
.
0
9
3・
0
.
1
4
0 0
.
2
6
7
0
.
0
5
4 0
.
5
6
0
.
4
4
7
‑0.
0
5
2 0
.
6
2
6
‑0.
1
6
1 0
‑0.
1
5
4 0
.
0
0
0
1寧
. ‑0.155 。帥5
.
0
7
8•
.
0剖 .
‑0.
1
9
5 0加 1•••
I0 0
‑
{
)
.
0
6
1 0
‑
0
.
1
0
2 0
O
.1
.
2
7
5
0
.
5
5
7 <
0
.
0
3
7 0.
49
5
.
. ‑
.
0
6
8•
0
.
1阻 0制)0 .
‑
0
.
0
3
8 0
.
0
9
8 0
.
1
5
9
0
.
2
9
9 (0曲 l
0.
2
1
2 。曲2̲. 0
‑0.
1
0
0 0
0
.
0
5
0 0
.
3
4
5
.
4
8
2
.
0
0
0.
.
. 0
.
0
1
3 •• ‑0.
0曲 3 0
‑
0師 5 0
.
8
7
7
.
9
4
8
.
1
1
7
0
.
0
7
4 0
.
0
6
6
0
.
1
5
4 0
.
0
0
6 0
‑0.
1
2
3 0
0
2
4 0564
.
0
0
1・ ‑
.
0
6
7•
0
.
0
2
3 0
0
.
1
9
1 0回 0." ‑
‑
0
.
0
9
4 0
.
6
5
2
0
.
1
8
5 0
<
>
.
0
4
0 0
.
5
2
5
0
.
0
2
2 0675
0
.
0
9
5 0
.
0
5
9
.
0
3
0 •• ‑
0
.
1
3
0 0
0
.
0
1
1 0
.
8
2
7
0
.
0
4
2 0
0
.
1
5
4 0
.
0
1
7"
‑<>回2 0
.
4
7
0
0
.
0
6
2 0
.
2
3
6
0
.
0
8
2 0.
.
9
7
2
11
3
<
.
0
0
0
1
.
.
・
・
.
0
0
3・
.
0
8
1•
.
0
2
5 ••
0
.
1
6
5
0
.
0
9
7 0
0
.
0
4
2 0
.
2
4
9
0
.
0
7
0 0
0
.
0
7
4 0
0
.
0
4
3 0
.
2
0
3
0
.
0
6
5 0
.
0
4
4
.
6
7
3
0
.
0‑
1
3 0.
0
.
0
2
6 0
0
.
0
1
3 0
.
8
2
2
0
.
0
3
2 0
.
6
0
4
‑0.
0
5
5 0
.
3
9
9
‑0.
0
3
9 0
.
5
0
7
‑0.
0
6
5 0
.
2
4
8
45
7
.
0
0
6.
・
.
0
4
2 ••
.
0
8
2•
.
0日6 •
15
0 0
.
6
7
6
0.
0
.
0
2
4 0
0
.
0
8
8 0
0
.
1
2
2 0
0
.
0
6
0 0
.
2
4
4
0
.
1
2
2 0
0
8
5 0
.
0
1
8 ‑ ‑0.
.
0
7
3•
日1
0
8 0
0
.
0
9
4 0
.
1
7
2
0
.
0
3日 0
.
5
4
6
‑0.
0
1
5 0
.
8
0
6
.
1
1
6
0
.
1
0
2 0
.
1
7
4
‑
0
.
1
1
6 0
0
.
0
0
2 0
.
9
7
4
0
.
0
0
0
.
.
.
0
.
0
2
4
•• ‑
0
.
0
5
1
•
←0
.
0
8
2 0.
0.
47
8
0
.
2
3
0
0
.
0
1
0 0
.
9
3
1
0
.
0
1
4 0
48
2
.
2
0
4
0
.
3
0
5
.
9
0
9
。1
6
' 0
.
0
8
3・
.
0
3
5.
. 0
0
.
1
0
5 0
0
.
1
2
3 0
0
.
0
0
6 0
.
9
2
4
.
1
3
0
0
.
1
5
6 0
.
0
2
5 0
.
7
0
4
0
.
0
0
6 0
0
.
0
5
9 0
.
3
4
8
.
9
2
5
.
0
5
3•
.
0
0
6
'
.
' 0
0
.
0
3
3 0
.
6
7
6
0
.
0
9
3 0
.
1
7
8
0
.
0
2
8 0
0
.
0
5
0 0
.
5
4
2
0
.
1
9
1 0
.
9
6
7
.
7
1
2
‑0.
1
3
6 0
.
0
0
3 0
‑
O
.l
.
0
8
1•
.
0
5
0.
. 0
(
泊
0
.
1
0
8 0
.
0
3
7 0
0
.
2目
。 0
.
6
9
3
0
.
1
1
2 0
.
2
7
3
0
.
3
6
2
‑0.
2
3
5 0.015.' ‑
‑0.
1
6
2 0
.
2
5
2
.
0
0
0
.
0
6
3•
.
0
2
0 ••
. 0
.
0
9
0•
0
.
0
8
2 0046 .
.
0
7
7 0
0
.
1
5
4 0
0
.
0
0
0 0
.
9
9
5
0
.
0
6
9 0
0
.
0
8
5 0
0
.
0
5
0 0
.
1
6
1
.
5
7
9
0
.
0
3
8 0
‑
0
.
0
0
7 0
0
.
0
3
5 0
0
.
0
4
1 0.
43
2
.
5
3
1
0
.
1
1
0 0
.
1
0
5
0
.
0
3
8 0
.
4
8
0
0
.
0
2
4 0
.
6
4
2
.
8
9
4
0
.
0
0
4
'
.
.
0
.
1
6
8
0
.
0
6
9
0
.
2
1
1
0
.
0
9
8
0
.
0
8
9 0
.
1
6
5
0
.
3
2
2
0
.
0
1
0 0
.
8
7
7
0
.
1
0
2 0
0
.
0
7
9 0
.
2
1
1
.
1
1
7
0
0
1・
n
1.
.
. 0
叩 1・
.
0
。師6 0
.
0
7
5・
.
0
0
0
1・
0
.
1
8
9 く0
0
.
0
7
2 0
0
.
2
2
4 <
0
.
2
3
5 〈凹0
.
1
6
7 <
‑0.
0
1
8 0
.
6
5
5
.
1
0
7
.
1
6
8
.
7
2
9
0
.
0
8
7 0
0
.
0
1
9 0
‑
0.
0
5
8 0
.
3
6
8
‑0.
0
9
5 0
.
1
9
6
‑0.
0
6
1 0
.
2
6
6
‑0.
0
5
6 0
‑0.
0
4
7 0
.
3
7
9
.
3
0
6
.
5
1
2
‑
0
.
0
4
6 0
0
.
0
4
9 0
.
0
0
7'
" 0
0
.
0
3
2 0
.
3
0
5
.
3
0
1
0.
13
7 0
.
0
4
7 0
.
3
1
0
0
.
0
0
9 0
‑0.
0
0
3 0
.
9
5
2
.
8
3
3
.
0
0
5 •••
.
0
2
8・
。出6 0
・
.
0
0
2 ・" 0
0
.
2
1
2 。+冊1
140 0
0
.
2
1
5 0
.
1
8
0 0
0
.
0
2
0 0
0
.
0
5
3 0
.
3
7
7
.
2
8
6
0.
.
7
4
8
伝 筑 波 臨j

11:大対数尤度 (X‑1)
尤 度 比 χ2;
食
McF,
l
d
d
e
n
O
フ鍾胆 R2;
襲
サンプル数

ーー‑

f
全知 l 女子

2
5
9
4
.
1
4
4
5
3
.
1
5 •••
0
.
0
8
0
4,
690

H

問

文芸系
所皿
理工系
学腕
保健某
九州ー神蝿
中国ー四盟
居地生
域 近着色

目

同

国

申

山

由

匝 甲~国東専自帽宅営北門届外業

H

ー
‑
後
I
通
t
樺
術
中
学植
陣
;
t

制

父娘
1
f
t集 自 廃 業
その地
専門控術職
母 規 自営業
1
&集 自 由 業
その他
中学卒
父盟
高 専.
j
a
大卒
学E
大学・院事
中学亭
母血
高専・短大卒
学歴
大学・院本

向

H

H

目

..踊・舞踏ーパレエ
ボピ ::::.7-tr;~
大衆芸能
現代I)(IfI
オへラ写
クラシ ノ:ク青海
3
8
7
4
.
2
3
4
5
1
9
.
7
6
4
0
5
4
.
7
8
3
4
叩 1
8
4
3
6
4
.
8
0
4
5
9
9
.
7
7
4
6
5
7
.
3
2
4
11
.9
4・
n
9
3
3
.
7
2 .~
4
8
6
.
3
6・
・
73023 .
.
.
.
.
3
2
6
.
1
0・
.
.
8
0
8
.
3
0 ・"
2
2
6
.
6
9
0
.
0
5
1
0
.
0
5
1
。0
83
0
.
1
2
1
0
.
0
8
5
0
.
0
3
4
0
.
0
2
4
6,
889
6
.
8
8
9
6
.
8
8
9
6
.
8
8
9
6
.
8
8
9
6
.
8
8
9
6
.
8
8
9
p僅
p鑑
。臨
推定鑑
後定置
推定値
推定値
pl~
推定値
p値
p値
,1
直
錐定値
推定値
.
0
0
0
1
.
0
0
0
1.
.
0
0
0
1.
.
0
0
0
1.
・
・
・
・ 0
.
0
0
0
1.
.
.
0
0
0
1
.
.
.
.
. 0
0
.
3
6
9 <
0
.
4
6
3 ι0001•••
0
.
5
9
3 <
0
.
8
1
5 <
.
6
0
5 <
0
.
3
3
1 <
.
3
0
2 <
.
0
0
2.
.
0
0
0
1•••
・
.
0
0
0
1.
.
0
.
0
1
6 ••
・
田l
(0
0
0
1・
0
.
1
0
5 0
0
.
1
5
2 <
0
.
1
8
0 <
0.
16
2 <
.
0
0
0
1
"・ 0
0
.
1
6
5 ,
0
.
1
4
9 <
.
0
7
5 0
.
0
0
0.
.
.
. 0.
.
0
0
4.
・ ‑
.
0
1
0・
.
0
0
4.
.
.
. 0.
.
0
0
1・
0
.
1
7
6 0
10
4 0
0
.
1
3
3 0
17
5 0
0
.
0
0
8 0
.
0
0
0
1
'
"
・
0
.
1
6
3 <
0
.
1
1
8 0
.
8
4
3
.
0
0
2 •••
.
0
0
5 •••
.
0
0
1 •••
.
0
0
1.
.
.
0
0
7・
・ 0
.
0
1
6.
.
0
.
1
9
1 0
0.
19
0 0
0
.
1
6
2 0
.
1
7
8 0
0
.
1
9
0 0
0
.
0
6
3 0
0
.
1
3
5 0
.
2
6
1
.
0
0
0
1̲
. ー0
.
0
0
0
1••• ‑0.
・ ‑
.
0
0
0
1.
.
・ ‑
.
0
1
6.
. ‑0.
0
.
3
8
7 く 0001.'
0
.
2
3
1 <
.
1
9
0 <
0
.
1
6
5 0
.
0
0
0'
.
' ‑0.
1
2
2 0
1
8
5 <
0
4
6 0
.
2
9
5
.
0
0
0̲
. ‑0.
.
0
0
0
1.
・ 0
・ ‑
.
0
田町
0
9
1•
(0
0
0
1.
.
・ 。0
‑
0.
2
9
7 く 0001'.
,
1
7
0 0
2
0
9 0
0
.
1
0
1 0,
0
.
1
9
9 ,
‑0.
2
4
8 <
.
1
0
4
77 0
日0
0
1
.
'
・ ‑0.
.
0
1
2.
. 0
(0
0
0
1・ ‑0.
.
0
2
9.
. ‑0.
.
0
0
0
1・ ‑
1
7
7 〈
0
.
1
5
8 <
.
0
0
0
1
‑
0.
1
0
4 0
.
0
8
3 0
2
9
9 ,
1
9
5 <
0
.
0
1
5 0
.
6
8
2
0
回
l
.
0日4 ・
,
(
0
0
0
1
・
.
0
0
0
1
‑
0
.
3
4
9 <
‑
0
.
1
2
7
(0
日0
1
'
" 0
.
1
2
1 0曲 l
‑
0
.
15
3 0副知"・
0
.
2
0
3
‑
0
.
10
8 0
‑
01
9
9 ,
.
0
1
1 •• ‑0035 0.
.田 7.'. ‑0.
.
0
0
0
1.
.
.
. 0
.
0
4
7 ••
‑
0
.
2
3
6 <
‑0.
1
5
7 。冊 1.‑ ‑0.
1
3
7 0
.
0
4
8 0
.
2
9
1
44
5
0
.
1
2
0 O
0
8
8 0
1
‑
{
l0
85 。田3 ••• ‑0.
。田 1 0
0
.
0
2
7 0
.
3
0
7
‑0.
1
4
4 〈叩 0
0
2
8 0
.
3
7
0
.
6
6
8
0
.
0
1
2 0
‑0.
0
2
9 0
.
2
6
6
.
9
7
5
.
0
0
1.
・
.
0
0
2・
0
.
1
3
1 0曲 7
0
.
1
6
4 0
0
.
0
5
8 0
.
2
1
1
0
.
1
6
3 0
0
.
0
5
6 0
.
2
3
6
0
.
0
2
5 0
0
.
0
1
7 0
.
7
0
5
.
5
8
5
.
0
4
3 ••
.
0
1
2 ••
0
.
0
7
6 0
.
1
2
6
‑
0
.
0
3
2 0
0
.
0
3
7 0
.
4
7
9
.
4
4
8
0
.
1
0
9 0
0
.
0
3
9 0
.
4
0
7
0
.1
l4 0
0
.
0
2
5 0
.
5
8
0
.
0
2
4 ••
0
.
0
9
0 0
.
1
3
0
.
3
5
5
0
.
0
5
7 0
‑
0
.
0
5
2 0
0
.
0
5
2 0
.
3
3
4
0
.
1
4
3 0
0
.
0
2
7 0
.
6
4
1
.
9
8
1
‑0.
0
0
1 0
.
3
4
6
.
0
田町
.
0
4
1 ••
1
田 1・
ー
0
.
6
7
3 〈田0
.
5
1
7
0
.
5
4
0 <0
0
.
0
7
5 0
.
3
1
7
0
.
1
8
3 0
0
.
0
5
8 0
0
.
3
4
2 0
.
3
9
2
0
.
0
9
2 0
.
1
6
2
‑
0
.
0
3
6 0
0
.
0
7
5 0
0
.
0
3
5 0.
47
0
.
4
9
3
‑0.
0
2
1 0
.
7
2
1
。0
0
1 0
.
9
8
6
‑0.
0
3
6 0.
47
4
0
.
0
6
1 0
.
2
0
3
0
.
0
1
1 0
0
.
0
8
6 0
.
2
1
1
‑
0
.
01
l 0
.
8
6
5
0
.
0
4
3 0
.
5
5
7
‑
0
.
0
2
9 0
.
6
5
2
0
.
0
6
9 0
.
8
6
1
‑0.
0
4
5 0.
.
2
6
6
46
3
.
0曲 1
.
" 0
.
0
0
1.
・
0
.
3
5日 <
.
0
2
1 ••
5
.
0
6
0 0
.
4
5
1
0
.
2
9
4 0
0
.
2
9
0 0
0
.
0
7
8 0
.
3
4
1
0
.
1
8
5 0
0
.
0
1
8 0日1
.
0
0
0
.
0
1
1.
. 0
.
0
2
9 ••
0
.
0
8
6 0
.
0
4
1 0
.
1
6
8
0
.
0
7
0 0
0
.
0
2
2 0
.
5
3
9
0
.
0
1
5 0
.
6
3
0
0
.
0
0
2 0
‑0.
0
2
3 0.
42
3
.
9
3
9
.
0
7
2•
0
.
1
0
2 0
0
.
0
8
9 0
.
0
8
6
0
.
0
7
7 0
.
0
0
0 ・" 0
.
0
3
2.
. 0
.
1
6
3
0
.
2
1
9 0
.
0
8
9 0
.
0
8
9
0
.
1
0
9 0
.
0
1
4 0
.
7
7
5
0凪 9 0
‑
{
l
日
目 I 。1
0
.
0
5
8 0
.
2
9
8
0
.
0
3
2 0
.
5
3
0
.
2
0
4
0
.
0
5
5 0
.
3
6
6
‑0.
0
8
2 0
.
1
0
1
0
.
0
2
5 。ι15
1
9
.
0
0
1.
.
.
.
. 0
.
0
0
6.
.
. 0
. 0
15
3
0
.
0
7
8 0024 .
・
・
.
0
0
6・
0
.
0
3
7 0
.
2
5
0
0
.
0
5
1 0.
.
1
2
7 0
.
0
5
1 0
.
0
9
1 0
.
1
0
7
0
.
0
8
6 0
42
6
‑
0
.
0
1
0 0
0
.
0
6
0 0
.
3日9
‑
0
.
0
4
7 0
.
8
4
9
0
.
0
0
3 0
.
9
6
9
0
.
0
4
8 0.
‑0.
0
7
2 0
.
1
9
7
‑0.
0
3
5 0
.
5
1
8
.
3
8
4
.
0
2
2 ••
.
0
9
2•
.
0
5
1•
0同 O 0
0
.
0
8
5 0
0
.
0
3
4 0
.
3
1
8
‑
0
.
0
2
3 0
‑
0.
0
6
5 0
.
0
5
1
0
.
0
7
7 0
0
.
0
2
0 0
.
5
5
8
.
4
8
5
.
0
0
3・
s・
.
0
0
6.
.
・
0
.
1
3
8 0
0
.
0
0
6 0
.
8
9
6
0
.
0
8
0 0
0
.
0
8
5 0
‑
0
.
0
1
3 0
.
0
8
2
.
0
9
2
0
.
0
1
2 0
.
1
9
3
.
1
7
1
‑0.
1
1
8 0
伝統演劇

第 3回
(
1
9
9
6
)

燥 大 対 数 尤 度 (X‑I)
尤度比, 2乗
McF,
¥
d
d
c
n
の鐙但 R2
乗
サンプル数
ー‑同司ー

性別 k子
文芸芸系
所属
理工系
学部
保健系

山

H

H

H

H

九州・沖縄
中国・四国
居住
近後
地犠
I
j
!f
重且ー中陣
東北・北海道
通 学 自宅外通学
専門控鱗植
自営費
父皿貧
圃
自由業

その也
専門控術職
信ま鎖 8営 業
植 業 自由業
その他
中学卒
父盟
高専・短大事
学歴
大学院卒
中学卒
母規
高専・短大卒
学E
大学・院事

第 4回
(
2
0
0
2
)

u
.

H

由

同

H

H

山

由

市

H

H

司

舞踊・轟踏・パレエ
クラ・ンァク青舟
ボピ3. 7-{干 ~i
穴 東 云i
I
を
1
8
4
7
.
3
3
1
6
01
.
78
1
1
5
8
.
1
1
2
0
0
6
.
1
5
1
9
8
3.
45
3
31
.60 ・
432.
44
4
2
4
.
6
6
1
2
3
.
9
1
8
9
.
0
5
0
.
0
8
2
0
.
1
1
9
0108
0
.
0
3
0
0
.
0
2
2
2
.
9
6
4
2田 4
2
.
9
6
4
2
.
9
6
4
2
.
9
6
4
ゐ
'
1
[
推定値
鑑定値
権定値
推定値
量
1
1
直
推定値
p値
推定量
p値
推定値
値
1̲
. 0478 <
1
.
.
. 0.
.
0
0
0
1
.
"
凹I
.
0
0
0
1・
・
.
0
.
0
0
0
1.
性 別 女子
回 1
'
" 0
'
0
0
.
3
6
5 〈佃0
49
1 〈叩0
0
.
7
5
3 <
0
.
2
7
6 (
0
.
3
0
9 (
.
5
8
9 (
.
0
3
0 ••
回 1'‑ 0
.
. 0
'
0
0
0
1•••
0
.
2
6
8 (0
文芸系
0
.
1
1
8 0
0
.
1
5
6 0凹 2
.
1
8
7 0001 .
.
2
5
0 <
0
.
1
0
0 0
0
.
0
4
7 0
.
0
4
0
.
3
4
2
所属
.
0
0
0.
.
. 0
理工系
‑
{
)
.
1
7
5 0
0
.
3
4
6 0
.
5
5
7
0
.
0
3
8 0
.
0
6
0
.
0
5
6 0
.
7
0
5
0
.
1
0
3 0
.
3
7
5
0
.
0
3
3 0
.
7
3
2
0
.
0
9
2 0
.
3
1
6
学腕
保健系
0
.
1
1
4 0
.
2
7
2
0
.
1
2
3 0249
0
.
2
3
2 0
.
0
2
1
‑Q.
O
I
5 0
.
8
9
3
‑
{
)
.
0
0
7 0
。1
2
6 0
.
9
4
7
.
1
9
5
0
.
1
4
2 0
.
1
6
0
'
0
0
0
1・
.
0
0
0
1・
.
0
0
3 •••
.
0
1
0 •••
. ‑
九州・沖縄
0
.
2
3
2 0
0
.
3
4
3 <
0
.
3
3
0 (
0
.
1
4
6 0
.
0
7
1
‑
{
)
.
1
9
2 0
0
.
0
4
6 0
0
.
0
1
1 0
.
8
7
7
.
5
1
3
.
0
1
5 ••
.
0
1
0 •••
0
.
2
9
7 0
‑
0
.
2&
0 0
0
.
0
8
3 0
‑
0
.
0
7
0 0
ー0
.
0
8
7 0
中国四国
.
4
4
7
.
5
9
3
‑
0
.
1
8
1 0
.
0
7
6
0
.
0
6
3 0
.
5
1
3
.
3
6
4
居住
.
0
0
6.
.
. 0
近費量
0
.
1
5
6 0
.
0
0
9 0
.
8
7
6
0
.
0
3
7 0
0
.
0
5
5 0
.
3
8
1
.
5
0
4
0
.
0
6
3
0
.
2
7
4
0
.
0
8
9
0
.
0
9
3
0
.
0
9
4
0
.
0
7
9
地織
0
.
0
0
5 0
.
9
3
2
0
.
0
3
0 0
.
6
3
4
0
.
0
4
9 0.
0
.
1
1
4 0
‑
0
.
1
2
0 0
41
1
.
0
8
2
0
.
0
3
4 0
.
5
9
2
0
.
1
0
8 0
.
0
6
4
.
0
3
8
.
0
2
0 ••
.
0
1
0 •••
0
0
1•••
0
.
1
7
8 0
.
0
0
1"
. 0
0
.
0
4
3 0
.
5
5
3
0
.
1
8
1 0
0
.
2
4
1 0
。0
29 0
0
.
0
0
6 0
.
3
7
9 く0
.
6
7
5
.
9
2
5
.
0
0
0
1
.
' 0
旦
東
専
甲
自
主
北
信
門
営
主
圏
ー・業
筏
北
霊
海
術
中
堂
道
聞
職
0
.
2
8
2 (
.
0
5
5 。.
1
9
7
‑
0
.
1
3
0 0
.
0
0
2 ・" 0
.0
S
4 0
.
1
6
4
0
.
0
0
0 0
.
8
9
5
0
.
0
4
3 0
0
.
0
4
9 0
.
2
2
0
.
2
7
5
.
0
1
0 ••• ‑
.
0
0
7 ・" 0169 0
0
.
0
1
6 0
0
.
1
7
1 0
.
7
9
6
0
.
1
1
3 0
.
0
8
5
0
.
0
4
7 0.
47
5
0
.
1
0
2 0
0
.
1
0
3 0
.
0
8
9
.
0
9
0
‑
0
.
0
1
9 0
0
.
0日9 0
.
7
9
9
.
9
0
2
0054 0.
.
1
8
1
0
.
0
1
0 0
‑
<
>
1凹 0
0046 0
.
5
2
5
.
8
7
8
0
.
0
6
3 0
.
3
5
3
父盟
45
8
暗 策 自由業
.
5
5
0
0
.
0
5
5 0
0
.
0
4
3 0
.
6
2
7
0
.
0
2
2 0
.
8
1
0
0
.
1
8
1 0
.
0
6
1
‑
{
)
.
0
3
5 0
.
7
0
5
0
.
0
2
8 0
0
.
0
4
1 0
.
6
2
8
.
7
4
2
.
0
3
6 •• ‑
その他
0
.
2
5
9 0
0
.
2
2
5 0
.
0
6
4
0014 。事 1
3
‑
0
.
0
3
1 0825
-{).~51
‑
0
.
0
8
5 0.
0
.
0
4
4
46
7
0
.
0
0
3 0
.
9
7
7
.
0
2
6.
. 0
専門 ‑
t
支術暗
0
.
1
5
4 0
0
.
0
3
8 0
‑
{
)
.
1
l4 0
.
0
9
4
0
.
0
3
8 0
0
.
0
1
2 0
.
8
4
7
.
0
6
0 0
.
3
6
9
.
5
6
5
0
.
0
3
9 0
.
5
7
8
.
5
4
6
信ま観 自営業
0
.
0
1
5 0
.
8
8
9
0
.
1
1
7 0
.
2
5
1
0
.
1
2
9 0
0
.
0
8
7 0.
‑
{
)
.
0
8
2 0.
‑
0
.
0
5
1 0
.
8
7
6
.
2
0
5
43
3
43
0
.
5
9
5
0
.
0
1
5 0
.
0
6
0•
職 業 自由幾
0
.
2
4
1 0
0
.
0
7
6 0
.
5
5
8
0
.
2
5
6 0045
0
.
0
8
2 0
.
5
5
1
0
.
0
3
3 0
.
9
9
2
0
.
1
1
9 0
.
3
7
4
.
7
8
2
‑
{
I
.O
O
I 0
‑ ‑
その他
<
>
0
0
.
0
3
7 0.
47
5
0
.
0
4
6 0
.
3
5
2
0
.
1
7
0 。曲 1.
伍
‑
0
.
0
1
7 0715
0
.
2
3
1
0
.
0
1
3 0807
0
.
0
0
9 0
.
8
5
2
0
.
0
9
5 0.
42
7
‑0036 0
‑
0.
13
3 0
中学卒
.
7
3
2
.
2
3
0
。1
2
. 0287
‑0239 0
.
0
2
5
0
.
0
3
9 0
.
6
9
1
0
.
0
3
6 。 726
父劉
.
2
2
3
高専短大卒
0
.
0
9
9 0
0
.
1
1
6 0138
0
.
0
8
5 0
.
2
6
θ
0
.
0
3
5 0
.
6
7
9
‑
{
]
.
0
5日 0.
‑
{
I.
1
7
6 0
.
0
2
7
0
.
0
1
3 0
43
7
.
8
6
5
学歴
.
0
0
2.
・
大学.~$
0
.
1
6
2 0
0018 0
.
7
1
3
0
.
1
1
9 0015
0
.
0
9
3 0
.
0
8
6
0
.
0
0
5 0
.
9
2
3
0
.
0
0
1 0
‑0.
0
2
4 0
.
6
0
5
.
9
7
5
.
0
0
7•
中学率
0
.
3
2
4 0
0
.
0
0
5 0
.
9
6
4
‑
0
.
1
2
0 0
.
3
2
1
0
.
0
6
5 0616
‑
{
I.1H 0
.
2
0
7
0
.
0
9
8 0
。3
0
2 0
.
0
0
7
.
3
6
9
母観
.
0
0
7.
.
0
0
0・
・ 0
・
.
0
0
9.
.
0
.
1
3
7 0
0
.
0
5
8 0
高専・短大卒
.
1
1
6 0
.
0
2
5
.
2
5
5
0
.
1
4
8 0
0
.
0
3
8 0.
<
1
0
.
0
2
8 0
.
56
0
.
2
0
2 0
42
9
学歴
1•••
.
0
0
1・
大学・院卒
0
.
:
:
1
1 0
0
.
0
6
9 0268
0
.
1
2
1 0
.
0
4
6
0
.
1
4
9 0
.
0
2
5
0
.
:
:
:
6
2 〈叩 0
0
.
0
6
2 0286
0
.
0
0
8 0
.
8
9
4
注)表明のH ・己 1%
有垂水<10,・・4
ま5%有意水槽、判ま 10%有 意 永 畑 で 有Z
重であることを示す.
{云筑(jÎ{ ~J

X‑I)
最大対敏文:置 (

尤 度 比 χ2'
食
McFadden
の媛阻 R2
乗
サンプル数

1
7
4
0
.
8
4
2
8
3
.
2
0
0
.
0
7
5
'
.
9
臼

現~(Ji(lI!J

同

オベフ捗

1
8
2
6
.
0
5
2
8
0
.
2
1.
・
0
.
0
7
1
2
.
9
6
4

H

山

H

H

喝事

一

H

H

9
8‑

100.
[beta]
P

‑111

一一‑ー‑ー一il‑‑I

明一日一山一叩一一岨沼山一刻山法一山一市町山一山川町山一出向一法滞川町一ほ
一‑n一︒一一一‑ー一

uZZ2‑?EO‑‑泊‑一o‑に00‑ooo'io‑o‑0000‑0000‑000一ODe‑000‑00
・
寸

ゾ一一一一一一佐︒一000一00000‑40000‑00040014014000‑ao

い一大一一一一一一日一四畑却一即加印刷川一山一川閉山剛一岨叩山畑一朗畑町一即問問一陥抑制一MM

ヴ一

挽ザ一川一川一川一mp一叫一州制服一制脚加剛加一則一川加問川一川閉山川一日刊剛一知却制一刷刷畑一四側

︑‑ZI‑‑‑ 414it‑‑+Ill111+‑TIll‑TIll‑‑4IIlli‑‑14sli‑‑Tll

R4一一一一一値一刊一叩問川一捌訓旧国間一仙一四叫剛山一則叩叩M一同山間一山剛剛一M湖同一山川
二二一定一M古引山一叫叫叩叫叫一川一叩叩引引一引制日付一引引刊一引日制一muu一制川

1
{
一
↓
↓
↓
↓
寸
寸1111
斗 1↓││寸│寸│寸斗

‑
d
γ十
↑ Ill1 Ill1111l
﹁llfLI‑‑jiι1111 llir‑‑
じhll

司 IMF‑m 一 山 一 恭 一 沼 市 町 山 間 山 一 山 一 問 団 一 叩 吋 忠 一 沼 市 町 一 紘 一 畑 山
‑7‑2l

町叩叩一一一二・一
"ω

一mm一向

J一万一一一一一一︒一︒心︒一040ovo‑49000一010AU一ooc一000一000一oA1

下
い
レ
ト
一一
乙九一二二里口一目指制一制初
η 幻幻一位一η 刊 持 旦 沼 n m n 一 同 日 立 m u u 同 一 回 随 時 一 初 日
U4r一一一一一一山一nm附一同MMm閃昭一同一MM回初一閃に口白一例M的一Mmm町一mw山初一口町
Jリ

P

ロ一一一日一一一ー一二仲町一

内二二一週一諸問一川流川川一哨一明川芯一岬叫閣制宮山一川羽司

ι

れ一山一山市一胤一 一 刷 一 肌 忠 一 M m 刷 剛 畑 一 川 一 川 m M M 一 m m m 器 官 一 定 加 古 川 剛 一 剛 M
一ノ﹂川一剛一日一引一ut‑‑u一川町山一山山山川山一山一配配配引一回目山引一引UE一山山山一
山刊一刊町

監桝宜計計引軒糾引訂訂羽前川

いい

いい

μ μ μ

叩山一二二一定叩一川山叩一山川山山山一山一沼山叩一山叩叩山一山叩山市川山一山叩叩一山叩

いとドいいドおいいいい竹いい

ぃドふれ

P一 川 一 蜘 加 川 一 酬 畑 川 剛 叩 一 山 一 日 印 刷 川 一 四 山 川 醐 一 川 町 山 一 邸 調 即 一 肌 剛 剛 一 世

4Ef

写一山一日一四一服一
二一一山花一︒一

﹂一一一一E2000一4040444Goo‑aGOo‑Goo‑600‑GOo‑00

市川44一一一一瞳一端一mm町一川町制叩刊日一川一叫四回描一羽田叩畑一四川市一山叫四一出掛間一盟問

0018
くα
)01
0
1.‑

035

〈
∞

。

ミ 醐 i向

。

0001

<0001'027 ••

証一︒一心内VAv‑JUJu‑044404AU一4442440一AuoAGOG‑00

否一山一山一選﹂判官出一出山市一山間山川誠叩山山一沼山一山忠一山山明一は

一︑︑一一一一一一山川臨m一山町出血叫一間一四叩醐日一四出掛同一副問哨一湖聞聞一山川揃一印刷

叫一MEm‑4若‑脚回目一間四剛川崎一叫一間四朗剛一価四郎山一皿脂畑一明間臨一蜘剛剛一酬間

th‑‑

一一一級一四一山川川一叩印刷川四一四一明刷川副一郎川出剛一川川間一配四四一同mm一酬明

二 ‑m‑m‑o‑6‑‑︿‑00000000‑o‑OOOF‑oGoo‑000‑goo‑︽仁︿‑仁o

一什一一一一一催︒一oon‑‑040ovo‑o‑n000一0400000一Goa‑Goo‑04

E川市一川一周一唯一剛一剛四刷一剛刷四畑町一山一則即網開一訓川町制一川蛸川一印刷訓一刷剛剛一酬剛
一み‑万一辺一o‑6‑一仁一仁00‑ooDOG‑o‑oGoo‑oGoo‑ooo‑ooo‑o(︿‑tL0

一間一川一間一明一一剛一肌刷一川一旧制肌刷出一畑一醐価指蜘一醐畑町四一皿踊周一服沼崎一肌剛蜘一四期

2: 三 一 登 山 山 山 一 山 山 山 山 間 岡 山 川 叩 市 川 町 叩 一 山 町 悶 却 問 釦 間 叫
ん

区一祁一刀一o‑6一一仁一︿00‑oo'joo‑o‑800︿一0000一000一Goo‑︿''ー一00

いいいい

μ
μ

いいい

ι

いいド

いい

いい

ドド

μ μ μι

耐一一一一一一回一mm川一川四日間叫一附一川川川町一川町四山一回刷出一川間町一問問削一旧制
同F一一一一回一a一仏anL‑aaaoa‑o‑aoaoFOOoa‑oaa‑oao‑GOO‑oα

ぃ

brfμ

一 一間一位一︒一

ドい

i'一川一四一四一川一値一剛一馴刷川一湖周一四四川一服一日間四剛一期間肌m一明mm一回制問一馴剛剛一馴刷

三一一一一値同一羽山間一日間四国巡回一団国間四一蹴団山国一町四四一山師団一国崎捌一問問

町一四一一一一朗一川一一剛一剛四四一脚印刷剛四一m一配醐剛蜘一間鵬刷町一一蹴回訓一町即朋一明隅醐一官一

↑

↑

一一描一州一四叩削一畑山市川旧一刷一間叩出品一川団拙問一市川四一同印印一川町四一四叩
一一一一一一航一o一000‑444JUG‑o一00000000000000000一oo

z
‑
‑

r刷 一 世 間 一 四 万 五 剛 古 川 町 一 刷 四 郎 町 鵬 首 一 朗 川 捌 蜘 一 四 悶 欄 間 一 隅 制 問 一 剛 山 畑 一 川 担 問 一 刷 出

一一一一一叱一︒一00044444460000000000一Goo‑000一ハ喝

0<
3
号

・

〈
∞01
〈
∞ 01...

0006 .
.
.

001
)
9 .‑

0
.
9
6
4

服組出叫四一師四日間一間同調一叩四期‑Mm一川

・

0003'"

四一明沼山一川棚畑山側一回一山川町山一印刷町制一一4Mm一間印刷一山川削一剛山一

0
.
0
1
9

・
0
6
:
;
:
0
.
0
3
2
0
.
0
1
3

互一一一一一曙一叩一捌mm‑m刷出別冊一間一mm四阿一四羽田印一隅臨叩一閉山知一四日叩一四四

0
<
.

0

・
"

川四四一作醐一日山川間町一日泊四一日山印一'出

∞
く01'"

面一回一ωmu一日白川辺司‑mu一ロロ何刊一Hげ凹田一∞目時一町田川一日凶ロ‑mw日

g

頑‑汚 ‑ s ‑ u ‑ 6 ‑ ‑ L ︿ 0 0 ‑ o o a ︿ o ‑ a 一 0 0 0 ︿ ‑ o o o c 一 0 0 0 ‑ 0 0 0 ‑ ︿ ︿ 仁 ‑ d U 0
卜 rill
ート f11﹁llL十 卜 ト 下i
2
EZ
二 E Lトll Ill1十j lll

ω一 刊 一 町 一 周 五 一 剛 一 則 問 畑 一 剛 山 刷 珂 町 一 山 一 刷 出 叩 四 一 即 却 肺 四 一 加 即 叩 一 間 国 別 一 樹 刷 間 一 剛 山

,
(0
001‑‑

台丑旦主旦o一﹂ママ00一︿0000一︒一0000一0000一000一000‑00070

芸羽一

・
・

‑
ι
‑
‑

0010 .‑

目一醐瑚山一市町町山崎一間一間剛m辺町四団間一団山町一明叩川一醐附剛一出川一

剛一蹴州市一剛山叫叫閉山一期間mm一同師期間一山町叩一叩刷出一刊mm一削川一

間一山附叩‑M叩叫州引一的一四日加虫一印刷叫則一瑚叩羽一醐晴間一剛山師一川叩一

M一MJn2一ω目印日的一山一UM訓尚一目立日制一的同国一目的ω‑MM刊一一目的一

剛一刷出仙一刷出川畑剛一川一泊四郎町一制剛町市一則mm一⁝umm一印刷附一肌剛一

刷一山山肌一山川町間町一日一剛山山川一臨川町四一山間同一日即日一州町間一川町一

‑‑‑m‑

肌一肌醐M一間肥川況町一川一叫刊問調一羽目畑山一mmm一間醐同一日閣制一叩市一

・‑ニ

‑

‑を

副一山細川一問問山山町一剛一同制剛山一国閉山問一間別問一川町川一附山間一山町一
o‑anぃ o ‑ a o o o o ‑ o ‑ B G o o ‑ a a a ‑ ‑ o o o ‑ a か o ‑ o o o ‑ か か 一 ・

て o ﹂ o o G o o ‑ o 一 o o o c ‑ 0 0 0 4 8 0 0 ‑ G o o ‑ 0 0 0 一 O 〆‑ E

一⁝川川一山附刷即四一阻一州出訓加一山内細目則一酬明日一刷用M一川山仙一川剛一位

二一

つ︒︒一00000一︒一OGoo‑0000一000一000一Don‑00一明

可割引削岩間割引州判制叫叫割引叫州製

zmm一間四附叩鵬首一日目別問芯四朗開一mm山百山印一mm脚一剛間百叫

一⁝加山一剖醐鵬削叫一間一山町田町一山間抽出一山山間一畑山聞一川町湘一Mm一昨

二 0 0 一 0 0 0 4 0 一 o 一 O A U D O ‑ 0 0 0 0 一 0 0 0 一 0 0 0 一 o o l o ‑ ‑民

二問問一叫削削問問一同一四四即町一問刷間四一出剛山一則刷附一間町四一則酬一同

二叩叩一明市瑚加盟国一出叫用制一四四日日一山川市一川町町一回問川一町山一"一

本‑$‑‑‑%
‑‑a‑a‑
一一縄国ゆ禽監傷事一大呈大呈?一山
一罰系五件但骨
t 削一恒実業一任案業一手岨一事岨一一割剖一叫

一一罰

一切一一世一明一日四一掃臨時一m一一四曙一明暗一特一

u
u一四一叫

一mZ一訓団組厩償基室四営商の一円営自の一学専主学専一宇宇一化主M

J 同岡有件同阿国首宵同出場同医存臣杯ほ古いい校出拐

‑9
9

・
I
I

OOSQ

=恥一元一三司副劃﹂科副叫門司当剖↓判ー国

I

o
.7
!R

田一‑郷f‑a一・‑率一本‑‑
︑
﹁
一
一一則一空間一敏一一一一唱団削指一一岬一岬一出一昨県一‑畢長
一=引‑iH‑Aa‑‑一一一師自dM一一同一H‑田F‑u‑ξ一系系
一=四一﹂一清一削=一一系系系一iIJU4一外4集金庫一吃曾提案抱一事ゆ一卒吻♂一丸一会会
=‑H一覧‑M一巧一一主芸工一州国後旭市北一宅一門蛍aの一四営鹿の一学専学一学専‑zvEF引一化育
一=叩‑a‑h一九一一一文理保一九州守近怒宙飛一白‑E守自白一専88そ一@吉岡大一命官同大一目叫od‑‑文体

,

~又ヲ写
I
8
6
6
.
0
7

,

映
,
.

世主同一一一一一描一山一mm開一川問問問叩一明一市出mm一岡山蜘日一則町川一川町四一同崎町一四鵬

一割一回一山一同一服一

P 剛一肌刷棚一馴M剛剛山Em山川一帥一川削mmT川町同一山間眼前恥盟問削

ぽ芋士土品川日行い村竹いH
μ 判ハ行村れ竹

ι

44一鍋一同一M一o‑et‑‑'ー一︿00'L04i'io一o‑00000000‑Goo‑Gog‑'ιく一00

喜二二司制割引剖封訓割引割引叫剖叫矧叫引
一 ‑J‑ 一喚‑

n
o 一 =・
4m一
却‑
K
1A 一杭一兆一組一ヴ
一一一比一

4

・
"
神5
3.
4
:1

!

pE
く0
001

0.
109
2.819
p値
10.5031ぇ 0
0
0
1

i 権~i[ 1

MO

~12.76

大軒両主

初 制 ハ レ ヱ l タ7
'
/
:
1ク
ヨf
:!
k I .::1:'.;>ラー..l> ,

!被定僅

I
(
J0
2
1
I
:
:
:
.
8
1
9
1権定値,
"値

豪両
1
2
9
6
.
7
8
1
5
4
.
6
7
00
ち
i
6
:
:
:
.
8
1
9

..・:1
6
.
9
1

735.96 r
1307.24 1
!5~.1 村
12641 "
'
1
523.14 .
.
"
6
3
.
7
1
1
0.079 I
0.161 I
0021
I
2.819 r
2.819 I
~.f;19
l推定値,
,
酒
量
,推定値,
,値 l権定値,
"値

・
・
一 一 … … … ・ …一一一一・,…"

ー 哲

起w‑一一一一‑肱‑o‑600‑4JUAυoavT
ヰ0400‑0000‑400‑600‑coo‑04

i
i
i
罰;
i

・I

目
一一一ー』
信託嗣"'
現代間
l媛 大 対 数 尤 皮 (x‑I
)I
558.08 I
89051
l
尤度比, 2果
I
10702"'
1
12
.
7
:
:
ぬ,"媛似R2果 I
0.0811!
0.060
IMcFddd
1
φン プ ル 数
I
2
.
8
1¥
J
I
2
.
1
1
1
9
,‑ーーーーーーーー
l権"値,
"値
l雄定値,
,鑑
I性 別 1
女子
I05!81<uool 1008310.239

第 4回
(
2
0
0
2
)

3
7
4
9
.
6
3
3
9
0
.
8
3

第 3回
(
19
9
6
)

一‑一叫一世一山一れ

第 2回
(
1
9
9
1
)

101.

過去を通産した鑑賞経験では、こられの検定統計量の値は低ぐ、モデ、ルの説明力は高いとは言えない。しか し、分野別では、第 2回調査から第 4回調査までを通じて、舞踊・舞踏・バレエ、クラシック音楽、オペラ 等、伝統演劇の分野で尤度比 χ2ならびに McFaddenの擬似決定係数の値が相対的に高く、大衆芸能とポピュ ラー音楽の 2分野では尤度比 χ2ならびに McFaddenの疑似決定係数の値は低いという傾向が存在する。この ことは、過去を通算した鑑賞活動の有無に関しては、小学校から高校までの学校などを通じた団体鑑賞活動 の4 の影響なども考慮しなければならないが、舞踊・舞踏・バレエ、クラシック音楽、オペラ等、伝統演劇l 分野では、ポピュラー音楽と大衆芸能の 2分野と比較してモデルに組み込んだ要因に説明力があり、成育地 域の違いや文化資本が鑑賞活動の有無に及ぼす影響の存在が示唆されていると言えよう。 モデルに組み込んだ要因の個別の影響を見ると、性別は「女子」の係数が全ての調査回の全ての分野でプ ラスで 1 %有意水準で有意となっており、女子が男子と比較して実演芸術を鑑賞した経験を有する傾向の高 さが明確に現れている。 所属学部については、過去を通算した鑑賞経験を説明する要因として妥当かどうかという問題があるが、 本研究では、高校までの鑑賞経験が大学の学部選択に影響を及ぼした可能性があることと大学入学後の鑑賞 経験に影響を及ぼすことを考慮して説明変数に加えている。全ての調査回を通じて、ポピュラー音楽と大衆 芸能の 2分野を除き、「文芸系」の係数が「社会系 Jの学部を基準とすると符号はプラスで 5 %有意水準で有 9 1年)では、「文芸系」に加えて「理工系」がポピュラー音楽と大衆芸 意となっている。また、第 2回調査(19 能を除く 4分野で係数の符号はプラスで 5 %有意水準で有意、第 3回調査( 1 9 9 6年)では、ポピュラー音楽を 除く 5分野で「文芸系」に加えて「理工系」と「保健系Jの学部でも係数の符号はプラスで 5 %有意水準で 有意となっているが、第 4回調査( 2 0 0 2年)では、伝統演劇で「理工系」の学部の係数の符号がプラスで 1 % 有意水準で有意になっているだけである。 通学形態については、所属学部と同様に過去を通算した鑑賞経験を説明する要因としての妥当性に問題が 指摘されるかもしれないが、本研究では、高校までの非都市部居住の代理変数としてモデルに組み込んでい る。したがって、想定される係数の符号条件はマイナスであるが、第 2回調査の現代演劇と舞踊・舞踏・バ レエ、ポピュラー音楽、大衆芸能では 10%有意水準で係数の符合はプラスとなっている。これは、大学入学 後に行った鑑賞活動が影響を及ぼしているのではないかと考えられる。 文化資本に関連する父親と母親の学歴については、「高校卒 Jを比較の基準としており、符号条件は、クラ シック音楽、舞踊・舞踏・バレエ、オペラ等のハイカルチャーとハイカルチャーの一部を含む伝統演劇!なら びに現代演劇l では「大学・院卒」および「高専・短大卒」の係数はプラス、サブカルチャーのポピュラー音 楽と大衆芸能では「大学・院卒」および「高専・短大卒」の係数はマイナスであると考えられる。 10%有意 水準で有意となった係数については、第 3回調査の大衆芸能の父親の「大学・院卒」を除いて、この符号条 件は満たされている。また、父親と母親の職業は、学歴ならびに世帯所得と相関が高いと考えられる変数で ある。「専門・技術職を除く被雇用者」を基準としており、符号条件は、父親の「専門・技術職」と「自由業」 ならびに母親の「専門・技術職」と「自由業」と無職を含む「その他Jで、学歴の「大学・院卒」および「高 専・短大卒」と同じ条件を示すものと考えられる。推定の結果、 10%有意水準で有意となった係数について は、伝統演劇の第 4回調査の母親の「専門・技術職」、クラシック音楽の第 2回調査の父親の「自由業」と母 親の「自由業」、ポピュラー音楽の第 3回調査の母親の「自由業Jを除いて、符号条件は満たされている。 (2)過去 1年の実演芸術の鑑賞経験の有無 過去を通算した実演芸術の鑑賞経験の有無を説明するモデ、ルの説明変数に、学年と課外活動状況を追加し て、ロジットモデ ルで過去 1年の実演芸術の鑑賞経験の有無に寄与する要因の分析を行った。過去を通算し ‑1 0 0‑

102.

た実演芸術の鑑賞経験の有無を説明するモデ、ルと比較して、尤度比 χ2ならびに McFaddenの擬似決定係数の 値は大きく、モデルの説明力は高くなっている。 過去を通算した実演芸術の鑑賞経験の有無を説明するモテ ルに追加して組み込んだ説明要因の係数の符号 」 、 13年 j、 14年以上」のいずれもがプラス、課外活動 条件については、 11年 j を基準とする学年は 12年 については、「文化会系」がプラス、「体育会系 j がマイナスであると考えられる。表 6に示した係数の推定 結果では、第 2回調査と第 3回調査では、映画を含めた全ての実演芸術分野で学年の 12年 」 、 13年 j、 14 年以上」の係数は全てプラスであり、第 3回調査では全ての係数が、第 2回調査でも殆どの係数が 5 %有意 水準で有意となっている。加えて、学年が進行するにつれて係数は大きくなっており、学年が上になるほど 実演芸術の年間鑑賞経験率が高まることが示されている。しかし、この傾向は 2002年の第 4回調査では見ら 」 、 13年 」 、 14年以上」の係数がプラスで 5 %有意水準で有意となっ れなくなり、ポピュラー音楽で 12年 ているだけである。 また、課外活動については、全ての調査回において、映画は「体育会系 J の係数がプラスで 5 % 有意水準 で有意、「映画」以外の実演芸術の 7分野は、「文化会系 j の係数がプラスであるのに対して「体育会系 J の 係数はマイナスであるという傾向が示されている。また、第 4回調査の伝統演劇とオペラ等と舞踊・舞踏・ バレエを除き、 7分野の「文化会系」の係数の符号は 5 %有意水準で有意となっている。これは、芸術・文 化活動の選好者の「文化会系」の課外活動選択の結果であると解釈することもできるが、「体育会系 Jの課外 活動での時間的拘束などが実演芸術の鑑賞活動を制限している可能性を示唆していると考えるもできょう。 4. おわりに 近年、公的セクターでは、行財政改革およびその一環としての市町村合併の推進や指定管理者制度への対 応などで公立の芸術・文化施設を取り巻く環境は厳しさを増し、合併後の自治体内に複数館が存在するよう になった公立の芸術・文化施設の統廃合の問題に加えて、公立の芸術・文化施設の存立意義と管理・運営のあ り方が「福祉をとるか芸術をとるか」や「財政破綻か文化支援かJ といった惹句のもとに各地で問われるよ うになり、芸術・文化活動への助成金や補助金も根本的な見直しを迫られるようになってきている。民間セク ターにおいても、劇場・ホールや楽・劇団などの芸術・文化の創造者の団体は、国民や住民の噌好の多様化 や固定客の高齢化の流れの中でいかに新規の観客・来場者を獲得していくかが課題となっており、アーツ・ マネジメントへの関心が高まっている。 9 9 1年から 2002年にかけて実施された学生調査のミ このような時代背景も考慮、に入れて、本研究では、 1 クロ統計データを用いて、実演芸術および映画の鑑賞活動の有無を規定する要因について、ロジットモデル を適用して分析を行った。しかし、本研究 i こは、鑑賞経験率の集計や 2項回帰分析におけるパラメータの推 定に際して、各個票データの母集団復元乗率に基づく重み付けの調整が必要であるにもかかわらず、このよ うな調整は行っていないという欠陥が存在する。地域と学部と性別による学年別学生数のトリプルクロス表 を作成し、各個票データの復元乗率を推計した上で、この復元乗率を用いて鑑賞経験率を再集計したり、ロ ジットモデルを適用することが必要になるが、残念ながらこの目的のために必要な学校基本調査のデータが 保存されておらず、何らかの代替的な方法で復元乗率を推定しなければならない。また、この集計やパラメ ータ推定上の問題のために、鑑賞経験率や推定された係数の時系列変化の分析も意味を持たないことになる。 このような大きな統計処理上の課題が残つてはいるものの、本研究のようにミクロ統計データを用いた分 析は、政策立案やアーツマーケティングを展開していく上での基礎資料を提供するものとして、今後、大い に活用されるべきであると考える。 ‑1 0 1

103.

謝辞 本研究に当たって、文部科学省科学研究費特別研究促進費 ( 1)(研究代表者:平成 13~14 年度:若松美黄、 平成 1 5年度:周防節雄、研究課題番号 13800007)による補助を受けている。なお、第 1回から第 4回までの 調査を行うにあたっては、調査票の配布、学生への説明、回収に至るまで、多くの高等教育機関の関係者の 方々から多大な協力を頂いている。また、第 1回から第 4固までの調査で調査対象となった学生の皆様には 多岐にわたる詳細な調査の回答に協力頂いた。ここに記して感謝いたします。 参考文献 有馬昌宏・杉江淑子・古賀広志, 2000, r 学生の実演芸術需要活動とその地域間変動」松田芳郎・垂水共之・ 3 8 4 . 地域社会経済の構造』日本評論社, 359・ 近藤健文編著『講座ミクロ統計分析第 3巻 有馬昌宏, 2002, r 文化経済学における実証研究の動向と課題」日本文化経済学会『文化経済学』第 3巻第 1 号 , 1 1・1 6 . 有馬昌宏, 2006,r 消費実態から見た芸術・文化の需要構造」日本文化経済学会『文化経済学』第 5巻第 1号 , 4 9 ‑ 6 0 . 片岡栄美, 2007,r 芸術文化消費と象徴資本の社会学ーブノレデ ュ一理論からみた日本文化の構造と特徴 」日 本文化経済学会『文化経済学』第 6巻第 1号 , 1 3 ‑ 2 5 . 勝浦正樹, 2006a, r 文化芸術活動への参加の 2項目帰モデソレによる実証分析」日本文化経済学会『文化経済 学会<日本>年次大会予稿集 2006~ , 1 6 ‑ 1 9 . 勝浦正樹, 2006b, r 文化・芸術の実証研究への統計分析の応用可能性」日本文化経済学会『文化経済学』第 7 ‑ 2 5 . 5巻第 1号 , 1 周防節雄(編), 2004, ~芸術・文化政策立案のための統計指標の開発と体系化に関する研究~ (平成 1 3年 度 平成 1 5年度科学研究費補助金(特別研究促進費 ( 1))研究成果報告書). 0年度科 杉江淑子(編), 1999,~実演芸術の需要の実態と構造に関する統計情報の収集と時系列分析~ (平成 1 学研究費補助金(特定領域研究 A)公募研究成果報告書). 中村隆, 2000,r 質問項目のコウホート分析 多項ロジット・コウホートモデルー J~統計数理』第 48 巻第 1 号 , 9 3 ‑ 1 1 9 . 永山貞則(編), 1992,~わが国文化・芸術情報の体系化と統計調査方法の研究~ (平成 3年度科学研究費補助金 (総合研究 (A)研究課題番号 02305009) 研究成果報告書). Ir 文化経済学と実証分析」池上惇・植木浩・福原義春編『文化経済学』有斐閣, 1998年. 永山貞員J 日本芸能実演家団体協議会編, 2007 ,~芸能活動の構造変化ーこの 10 年の光と影 1 丸善株式会社出版事業部. 三善晃(編), 1988,~わが国の芸術活動の動向予測に関する基礎研究~ (昭和 62年度科学研究費補助金(特定 研究 (1)研究課題番号 62124014) 研究成果報告書(総論編・資料編)). B o u r d i e u,P .,1979, LaD i s t i n c t i o n ,Ed.Minuit (石井洋二郎訳, 1990,藤原書庖『ディスタンクシオン・ 1 1 ) . Grcene, W.H.,2003, E c o n o m e t r i cAna~阿久 5th E d i t i o n,P r e n t i c eH a l l . ,J .,1 9 0 5, MuneraP u / v e r i s :S i xE s s a y sont h eE / e m e n t s01Po/ i t i c a /Economy , Everyman'sL i b r a r y (木村正身 Ruskin 訳 , 1958 ,関書院『ムネラ・プ/レウェリス一政治経済要義論~) . Scn, A.K.,1 992, I n e q l l a l i l yReexam 初e d , H a r v a r dU n i v c r s i t yP r e s s (池本幸生・野口裕生・佐藤仁訳, 1999,岩波書 庖『不平等の再検討ー潜在能力と自由~). ‑1 0 2

104.

普及理論の医薬品マーケティングへの応用 武藤猛 ITBPO株 式 会 社 主 席 研 究 員 A p p l i c a t i o no fD i f f u s i o nTheoryt oPharmaceuticalMarketing T a k e s h iM此 0 S e n i o rF e l l o w、 ITBPOI n c . 要旨 普及理論の代表的な数理モデ、ルで、ある Bassモデルを、医薬品の製品ライフサイク ル予測に適用した。まず、カラーテレビの普及率データを用いて、 Bassモデルの精度 を検証した。その結果、普及初期のデータだけを用いて、製品ライフサイクルのマイ ルストーンが精度良く予測できることがわかった。次に、 Bassモデ、ルを医薬品に適用 した。最初に、医薬品の月別売上高のデータに Bassモデ、ルを適用した。その結果、 ほとんどの製品で製品ライフサイクルのマイルストーンや総売上高を精度良く予測 可能なことが分かつた。さらに、薬価改訂の影響を考慮する方法を提案した。最後に、 このような製品ライフサイクルの分析結果を医薬品マーケティングに応用する方法 について提案した。 キーワード: 普及理論、 Bassモデル、製品ライフサイクル、医薬品マーケティング、売上高予測 はじめに 消費者に有用なイノベーション(製品やサービス)を速やかに普及させることは、マー ケティングの重要な目的である。イノベーションの普及がどのようなメカニズムで、行われ るかについては、古く Rogersの普及理論が有名である(1) Rogersはアメリカにおける農 0 機具の普及を観察することで普及理論の基礎を固め、その後、 Rogersを含む多数の研究者 が消費財を主な対象に理論を発展させた。現在では普及理論は、マーケティングの古典理 論といってよいほどである。普及理論の数理モデ、ルについては、 Bassを始めとする研究者 が様々なモデルを提案し (2)(3)、現在に至るまで改良や応用が続けられている ω。 医療用医薬品(以下、単に医薬品と呼ぶ)は典型的なイノベーションであり、普及理論 の対象となり得る。実際、 1950年代には普及理論の立場から、医師のコミュニティにおけ る医薬品の普及メカニズ、ムが研究され、基本的には医薬品も消費財と変わらないメカニズ ムで普及することが明らかにされている ω。新薬は、まずオピニオンリーダーが採用し、 次にその影響を受けた医師の問で普及していくというメカニズムは、現在では、製薬企業 一1 0 3一

105.

のマーケテ.イング活動の基本となっている。しかしながら、医薬品への普及理論の適用は、 採用者カテゴリーなど概念的な内容が多く、数理モデルによる取扱いは行われていない(的。 本論文では、普及理論の代表的な数理モデ、ルで、ある Bassモテツレを用いて、医薬品の普及(売 上高推移)に対して、普及の初期段階で製品ライフサイクルの予測が可能かどうかを検証する ことを目的としている。具体的には、製品ライフサイクル全体に渡る総売上高(ライフサイク ル価値)の予測、および製品ライフサイクルのマイルストーン(最大普及率や累積普及率の変 曲点の時期)の予測である。また、この予測結果を、営業・マーケテイング活動へのタイムリ ーな反映に活用することの可能性についても検討する。 1 . Bassモデルとその予測精度 , ( )普及モデルの進展と Bassモデル Rogersは普及理論の基本的な枠組みを構築した(1)。イノベーションは、革新的採用者、初期 少数採用者、初期多数採用者、後期多数採用者、および伝統主義者の順に普及するという採用 ogers自身は定性的な研究が主で、数 者カテゴリーのモデ、ルはあまりに有名である。しかし R ogers 以後、多数の研究者が数理モデ、ルの開発を行った。 理モデルの開発は行わなかった。 R その中でも、 Bassモデル包)は、普及の内部構造がモテ苧ルに反映されていること、およびパラメ ータの数が少ないのにモデルの予測精度が高いこと、などの理由で、現在に至るまで広く使わ れている (4)。 Bassモテ守ルは次のように表される: f ( t )=d F ( t ) /d t=[ p+qF(t)t‑F( の ] ここで、f( t ) は時点 tでの普及率、 F ( t ) は時点 tでの累積普及率、 p、qはパラメータで、各々 革新係数、模倣係数と呼ばれ、普及メカニズ、ムを表している。初期条件 F(O)=Oで積分すると、 累積普及曲線(し、わゆる S字曲線)が得られる: 1 ~-(p+q)1 F ( t )= ・ ," . . 1 . . , , ¥ , l+(q/p)e‑lP+q)1 ν なお、変数を普及率でなく、売上高(または販売数量)とする場合には、 F ( t )の式にパラメー タ m を掛ければよい。パラメータ m は、ライフサイクルの全売上高(または全数量)、つまり ( ο を 1回微分および 2回微分することにより、製品ラ ライフサイクル価値を意味している。 F l (初期多数者採用開始時期)、 T合(最大普及率 イフサイクルの重要なマイルストーンである T 時期)、および T2 (後期多数者採用終了時期)が求められる ωω。 ( 2 )カラーテレビの普及率に対する B a s sモデルの適用結果と予測精度 Bassモテ手ルの精度を確認するために、 1966年から 41年間のカラーテレピの普及率の推移 を分析する(データは、内閣府消費者動向調査による)。予測精度を確認することが目的であ るので、全データを使用するケースを基準として、使用データを少しずつ減らし、最も少ない 1種類の計算を行った。直 データでは 2年目までのデータを使用する、とし、う方法で、合計 1 接の予測結果はパラメータ pおよび qで示されるが、実用上はライフサイクルのマイルストー l、T官、および T 2の方が分かり易い。結果を図表 1および図表 2に示す。 ンT 1 0 4‑

106.
[beta]
図表 1カラーテレビ、の普及率への Bassモ子、ルの適用
カラーテレビの昔車率分析 8ass曲線の晶てはめ(使用データの範囲白遭い)
1
.0

0
.
9

o
ar

‑ ‑②薗館 B 1
9年までのデータ使用

ι
"
.‑‑
‑
ー

一一一一

ー+ー③曲線 C 1
3年までのデータ使用
ー~@:曲線 D 9
年までのデータ使用

07

一ーー⑤曲線 E 8年までのデ

タ使用

一一一⑥曲線 .
.
7年までのデータ使用
0
.
6

.
.

ー

⑦曲線 G 6年までのデータ使用

一一‑@:曲線 H.5年までのデータ使用

吋 0
.
5

•

ー+ー@曲線1
:
4年までのデータ使用
ー←ー⑩曲線Ll年までのデタ使用

0
.
4

0
.
2
0
.
1

。
。
1
0

1
5

羽

3
0

田

4
0

35

1
9
6
6
年からの年億

図表 2カラーテレビ、の普及率分析に対する B
assモ
テ
、jレの精度比較
あてはめ薗組白檀蹟

担車まで
自由度 由
し
繰
回
り
数返

F櫨

p檀

R2

自由度
田豊済
みR2

パラ;<.,.:空機愈青島
M

ム

;
l ;~

p
'二人P叫
り
:
l〆

Y
移h 川
れ

〆

ぇ事曜&ライフサィ ?
J
,
!予溝鈍

イ
,[
r
, 1
"
;
1
:命
j

①曲線A 主データ使用

42

1
4

1
3
7
3
0
7
.
0

②曲線8:19
年までのデータ使用

20

1
0

343192

00000

0
.
9
9
9
7

09997

0
.
0
1
7
5

0
.
6
6
0
7

3
.
4
1

5
.
3
6

7
.
3
0

③曲線c:tJ年までのデータ使用

1
4

1
3

.
4
1
5田 8

00000

O
.
9
99
t
1

0
.
9
9
9
6

00174

0
.
6
6
2
4

3.
42

5
.
3
6

7
.
2
9

④歯線0:9年までのデータ使用

1
0

日

1
3
3
1
5
.
1

0
.
9
9
9
6

00162

0
.
6
8
2
5

.
47
3

536

7
.
2
4

9

8

2
9
3
7
4
.
4

。
。
α羽

09997

⑤歯線E 8年までのデータ使用

0
.
9
9
9
9

0
.
9
9
9
8

0
.
0
1
5
3

06984

3
.
5
1

5
.
3
5

7
.
2
0
717

,

0
.
0
0
0
0

0
.
0
0
0
0

0
.
9
9
9
9 0
.
9
9
9
8

0
.
0
1
7
5

0
.
6
6
0
7

3
.
4
1

5
.
3
6

7
.
3
0

⑥曲線F:7年までのデータ使用

8

7

2
1
7
6
0
.
7

00000

0
.
9
9
9
9 09998

0
.
0
1
4
9

0
.
7
0
6
8

352

5
.
3
5

年までのデータ使用
⑦曲線G 6

7

3

4
{
)
455

0
.
0
0
0
0

09993

00144

0
.
7
1
6
9

354

5
.
3
4

714

⑧曲線H:5
年までのデータ便用

6

6

09993

0
.
9
9
8
9

00145

0
.
7
1
4
0

3
.
5
4

535

7
.
1
5

⑨曲線1
:
4年までのデータ使用

5

8

。
。
α羽
。α羽
2
2
6
3
.
1 。

0
.
9
9
9
5

09993

09989

0
.
0
1
2
7

0
.
7
7
5
1

3
.
5
5

522

6
.
8
9

⑩曲線1
:
3年までのデータ使用

4

5

24940

00004

0
.
9
9
9
6

0
.
9
9
9
2

0
.
0
0
9
8

0
.
9
2
3
1

3
.
4
6

4
.
8
8

6
.
2
9

⑪曲線u隼までのデータ使用

3

4

1
7
6
.
2

00532

09972 0
.
9
9
1
5

0
.
0
0
9
9

0
.
9
1田

3
.
4
8

4
.
9
1

,

2
2
6
3
.
1

計算ケース⑮ (
3年までのデータ使用)および⑪ (
2年までのデータ使用)を除き、全期間
のデータを精度良く再現している。パラメータ pおよび qは、計算ケース⑪を除き、すべて統
計的に有意で、あった(有意水準 0
.
0
5
)0 T
l
=
3.4年なので、 S字曲線の最初の変曲点である初期
多数者採用開始時期付近までのデータがあれば、ライフサイクル全体の予測が可能で、あること
を示唆している。これはライフサイクル初期で、全期間の予測が可能で、あることを意味しており、
実用上重要な結果である。

(
3
)B
a
s
sモデルの収束について
Bassモデルのパラメータは非線形回帰分析で求められる。このため、初期値が適切でない
と収束しないことがある。経験的には、 p=O.Ol、q
=O.lを設定すると収束する場合が多い。ま
た、変数に売上高を用いる場合に必要なパラメータ m は、売上高の最大値を超える適当な数
値を与えると良い。「見た目」で S字曲線に似たデータについては、 p<qであり、問題なく収
束する。しかし、「見た目」で S字曲線から外れたデータについては、 p>qと逆転し、またラ

‑1
0
5一

107.

イフサイクルのマイルストーン匹、 T*,および T2もマイナスとなる。これは、革新性のあま 2が 1に非常に りない製品の場合とされている。なお、図表 2の例が示すように、決定係数 R 近い場合でも、パラメータ pおよび qが有意とならない場合がある。 Bassモデルにおいては、 決定係数でモデ、ルの精度を判断することは適切でないようである。 SASの NLINプロシジャーを用いた Bassモテ、ルのプログラムを図表 3に示す。 図表 3B ass モデルの SAS プロク、ラム(売上高を変数とする場合) %macrob a s s ( d a t a s e t , no, prod, s t a r t, mO, pO, q O ) ; l i合l*l ** *‑ 1 *d a t a s e t 入力デーヲのデーヲセット名 門 n o :計算の整理番号 1 *prod 製品名 1 *s t a r t 計算の開始年 1 *mO, pO, qO:パラメータの初期値 p r o cn l i nd a t a = & d a t a s e t . ; p=&pO., q = & q O . ; parmsm=&mO., =year• & s t a r t . ; x x p ( ー( p + q ) model&prod.=m (1'e 合 合x)) 1(1+( q / p )合 e x p ( ー( p + q )合 x )) ; I in.ParameterEstimates=FIT&no.̲&prod.; o d so u t p u tN o d so u t p u tNIin.ANOVA=ANV&no.̲&prod.; run, %mendb a s s ; 2 . Bassモデルの医薬品への適用事例 (')8assモデルを医薬品に適用する上での留意点 Bassモデルを医薬品に適用する場合、データの種類として、①金額デー夕、②数量デー夕、 および普及率デー夕、の 3種類が考えられる。①の金額データは、入手し易いが薬価改定の問 題がある。②の数量データは、薬価改定の問題を避けられるが、入手が困難である。③の普及 モテ、ルの考え方に沿うデータであるが、医療機関の採用率を医薬品の普及率としてよし、かどう かには検討の余地がある(同じ医療機関内の複数医師問で採用の考え方が異なる可能性があ る)。まとめると、金額データを用いて Bassモデ、ルを適用するのが現実的であるが、薬価改定 の影響を別途考察する必要がある。 ( 2 )薬効領域への適用 医薬品におけるイノベーションは、新規作用機序の発見による新しい薬効領域の創出、およ び既存薬効領域における新薬の発見、という 2つのレベルが考えられる。まず、薬効領域にお けるライフサイクル予測の例として、高血圧症治療薬の中の薬効領域 ARB (アンジオテンシ ン 2受容体桔抗薬)を取り上げる。 ARBは、日本では最初の薬剤が 1997年に上市され、急速 に市場規模が拡大した。多くの薬剤の市場参入があり、現在では高血圧症治療薬の中で最大シ ェアを占める薬効領域である。 図表 4は、薬効領域 ARBに対して Bassモデ、ルを適用した結果である。この結果によれば、 急速に成長した ARB領域は、既に普及率のピーク時期 T*を過ぎていて、ライフサイクルの後 期に入っている。今後の市場拡大はあまり期待できず、新規参入はハード、ルが高くなる。一方、 1 0 6

108.
[beta]
ARB のメーカー各社は、マーケティング戦略を成長期から成熟期へと切り替えることが求め
られる。また、薬価改定やジェネリック医薬品の参入を見越した戦略も重要となる。最近、 ARB
と利尿剤の合剤の上市など、 ARBの機能拡張が見られるのも、成熟期に対応した、ライフサ
イクル延長戦略と考えられる。

図表 4薬効領域 (ARB)への Bass
モ
デ
、 jレの適用
ARBの売上高とその推定
25000

,

r
"

T

. ARB売上高(実績)
• ARB累積売上高{実績)
‑Bass
モデル(累積売上高) I
‑Bass
モデル(年別売上高) I

T2

一

20000

m(l‑exp{ 一(p+q)I})
S(I)=
1+(qIp)exp[ー (p+q)I}‑
m = 24166

問醐

(Egv輝吋民戻凪w︐輝吋艇事瞬

[Bassモデル】

p = 0.007087
q = 0.5919

[8
,還草fJLによるライフサイクル待英語算出I

1
!
!.
.
"Tト初期多数者採用鰐始草寺綴(5.2

ず最大普及率時綴(7.4} 桑ゑ部
1
‑‑
‑
‑T2:後期j数者探烏終了時錫{何年}
(いずれ辞/997
年からの年数}

5
以x
l

o

2

J

4

5

6

7

8

9

1
0 1
1 1
2 1
3
1
9
9
7牢必らの年盈

1
4

1
5

1
5

!
7

1
8

1
9

2
0

2
1

2
2

2
3

(3)各種製品のライフサイクル分析
Bass モデルを個別の製品に適用する。 2000 年以降に上市された 6 種類の製品(製品 A~F)

が対象である。各製品の薬効領域は異なる。データは 5
3ヶ月分の月別売上高である。 Bassモ
デ、ルを適用するために、累積売上高を算出した。このことにより、月別売上高でありがちな、
季節変動やキャンベーンの影響がキャンセルされ、予測制度が高まる。

6製品の予測結果のうちの 2製品の結果を示す。図表 5は製品 A はRB) に対する結果であ
る。月別売上高ではかなりの変動が見られるものの、 B
assモデルは累積売上高を精度良く再
現している。この結果から、製品 Aは普及率のピークを過ぎており、マーケテイング戦略の転
換が求められていることが分かる。
図表 6は製品 E(
抗菌剤)に対する結果である。データへのフィッティングは行われている
ものの、製品 A とは異なり、ライフサイクルのマイルストーンは

(
T
2を除き)算出不可能で

ある (p>qであるため)。この理由については、革新性が比較的乏しい製品であることが考え
られる。
図表 7は
、 6種類の製品の予測結果をまとめたものである。前述の製品 Eは
、 p>qとなり、
同時に T
lと Tすがマイナスになっている。 E以外は、ライフサイクルのマイルストーンが正常
に算出されている。これらは、マーケティング戦略の転換時期に関する重要なヒントを与えて
いる。
図表 8のパラメータ m (製品ライフサイクル価値)の予測精度をまとめたものである。製品

107
109.
[beta]
E を除くと、製品ライフサイクル価値が数%以内の誤差で予測可能であることを示している。
この値がライフサイクル初期で、予測できることは、経営戦略上有用と考えられる。

図表 5製品 A(ARB)への B
ass
モデルの適用
製品売上高とその推定(製品同
1
4
0
.
0
0
00国

,

T
1
2
0。由似"

1
∞α".0国

醐醐

醐醐

回同

信吋尿宗治︐健吋凶 EE‑w峰

←

‑売上高(実績)
・累積売上高(実績)

l

40α"似 "

∞

20 .
0
0
0

1
0

20

XI

柑

羽

田

河

田

∞

1

副

"発からの月駐

図表 6製品 E(抗菌剤)への B
assモデルの適用
製品売上高とその推定{製品目

∞α
"

1
5
.
01
2日lO.
O

‑ 売上高(実績)
・ 累積売上高(実績)

∞

1
0以lO.
O

一
一 Bassモデル(累積売上高)

1
(
吋

7
.

民
・

.'

事
ミ

栂

一一

醐 醐

=
<

.
.
.
{

・
曜

一一-.~?

y

←

一

,
色町

敵

1
0
8

ι

一回州

一‑舞

同亮

b
‑
‑︑
﹂
合

ι 珂

ゆ一

全

ピ
O
M4

f主

一色 羽

a
‑

主
2

H

0

E‑o
N
一
‑
22
5
E
z
‑

0

J

E
GO

A

‑
‑‑41
一
一
一
5
一
‑
九
f

1
i・
:

2日lO周3

ι

[Bassモデルによるライフサイクル詩織算出1
T,
:
:
初期多数者I
J
l
I
f
J
.
標始時期 (‑34IV
一一一一一一ず最大普及率跨英語 (‑4IV
T
;
:後期多数者祭殿終了時綴 (26
月}
{いずれも、発売からの月数)
一一一
一 司 p)qと
,なり、またqの穣度も悪いため、
T とγ t
J
f
負となる

叫

∞

6assモデル(年別売上高)

広一一一一一一一一一ー

ぽ

5以lO.
O

I ....

7
0

関

田

11
1
0

110.

図表 7製品ライフサイクル予測に対する Bass モ テ 、 jレの精度比較 製品目種頭 収束まで 自由車 由繰り返 し回数 F値 p値 R2 j 自由置 調整済 ./,^ み回 。 1以t';J;~:得サ手《向H 4 f 手 1 干 潟 吋 後 パ マ 寺 井一 J 端輪 白除 ①製品 A(高血圧症治療薬 (ARB)) 5 3 8 1 8 9 3 7200E‑76 0 . 9 9 9 1 6 09991 1 3 6 . 5 0 0凹 0 0凹 2 00994 23 3 6 4 9 ②製品別高血圧症治療車 (Ca措抗剤)) 5 3 g 3 7 9 1 87田 E‑84 09996 09995 1 7 . 3 7 2 . 1 6 0 0凹 1 4 01476 2 2 3 1 40 ③製品 C(糖尿病治療剤) 5 3 7 . 9 9 9 8 09998 3 6. 16 2 . 1 9 4 1 0 5 9 6 75田 E‑95 0 8 0凹 7 00396 7 34 6 2 @製品 D( 骨粗しよう症治療剤) 5 3 6 . 0 0 E ‑ 8 7 09997 09996 7 5 0 0 6 76 3 . 9 0 6 . 2 7 8 0田 国 0回 日 1 8 3 6 5 5 ⑤製品 E(銑菌剤) 5 3 1 5 5 4 . 5 4 3 1 8 4 74α)E‑51 09910 09905 1 4,7 空 ' . 0 2 4 1 繁 冶 0200 野 町 品 議 議 枝 容 2 6 ⑥製品 F(噛且治療剤} 5 3 8 . 9 9 9 7 605908∞ E‑89 0 40 5 7 。 α)33 09997 4 6 . 9 6 8 . 8 9 3 0 . 0 7 5 0 2 3 図表 8製品ライフサイクル価値の予測とその精度 パラメ-~m の推定値と誤差および信頼限界 製品の種類 製品フイフサイ ' J ) レ儲憧 m (億円} ① 製 品 A(高 血 圧 症 治 療 薬 (ARB)) 棟準誤差比 事 栂準誤差 下剥信頼限 界 上側信頼限 界 t 値 p値 1 . 3 6 5 77 5 . 7 % 1 . 2 1 0 1 . 5 2 1 1 7 . 6 2 日日∞日 ② 製 品 B(高 血 圧 症 治 療 薬 (Ca詰抗剤)) 174 5 3 . 1兎 163 184 3 2 . 5 0 日日日∞ ③ 製 品 C(塘尿病治療剤) 362 1 5 4 . 2有 331 392 2 3 . 9 2 日日日田 ④ 製 品D (骨粗しょう症治療剤) 739 26 3 . 5 % 687 792 2 8 . 3 0 0 . 0 0 0 0 ⑤ 製 品 E(抗菌剤) 148 25 1 6 . 8 % 98 197 5 . 9 7 日 日 000 ⑤ 製 品 F(暗患治療剤) 470 1 7 3 . 7 % 435 504 2 7 . 2 5 0 . 0 0 0 0 ( 4 )長寿医薬品における薬価低減の影響の分析 現在の薬価制度では、革新的な医薬品であっても、薬価低減の影響を免れない。そこで、長 寿医薬品のデータを用いて、薬価低減を伴う医薬品のライフサイクル予測を行った。 図表 9は、ある長寿医薬品の売上高および薬価低減率(上市時の薬価に対する当該年の薬価 の比率)の推移を示している ( 7 ) 0 1 960年の上市後、 3年目には薬価低減が始まり、最終的には 上市時の薬価の約 60%にまで低下している。このような製品のライフサイクル分析を適切に行 うには、売上高を薬価低減率で補正し、上市時の薬価に換算する必要がある。このことは、価 格でなく数量ベースで分析を行うことに対応している。 assモ 薬価補正前および薬価補正後の売上高を求め、それぞれの累積売上高を算出して、 B デ、ルを適用した結果を図表 10に示す。この結果によれば、薬価補正前後のライフサイクルの マイルストーン Tl、Tへ お よ び T2の差は、各々、1.0年、1.3年、および1.7年である。図表 1 0には示していないが、薬価補正前後の製品ライフサイクル価値 m の値は、各々 1, 157億円 , 531億円となり、その差は 374億円(薬価補正後の m に対する比率は 24%) となり、無 と1 視できない大きさである。 以上をまとめると、医薬品のライフサイクル分析における薬価低減の影響は無視できない大 きさである。数量ベースで分析を行えば薬価の影響は除外できるが、価格を用いる場合でも、 薬価低減を考慮、して価格を補正すればマイルストーンや製品ライフサイクル価値を予測する ことが可能である。 ‑1 0 9‑

111.

図表 9長寿医薬品 Vの売上高および薬価低減率の推移 長膏匡葺品の売上高推移と灘価低減車(高血圧症治療薬V J s o 1宏O 巳コ薬価低混率 7 0 4ト売上高{億円)[薬価補正前] 1国 同 回 。 (Egv組問リ﹁ぽ 日相 . . • O回 単 • 躍 30 0 . 4 0 宏0 宏 。O 1 0 向 山 … 同 町 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 0国 0.... 1 掬 019 日 1 9帥 t掬 719岨 19691970197119721973197419751976197719 明 1 97919国 19811982 円 8319倒 198519 同 1 98719 田 図表 1 0長寿医薬品Vにおける薬価低減の影響 長膏医薬品目製品ライフサイヴル分析{高血圧症治療薬V)[藁価補正有帽の比較] 1600 ‑車積売上高(憧円)[車価補正前] 1400 ...車積売上高{憧円)[車値補正也] ‑8assモデル[薬価補正前] 一 8assモデル[叢価補正也] 1200 一一一一守︐一 ト 一 ・ 200 T2 一一一一年一 ト H s i ‑ ‑ F a g a ‑ ‑ z i iz‑‑22 i ! s i ‑ ‑ i i 5i ト 000 (E畢)匝斗原 凹回回 400 0 1960 1969 1974 1979 1984 1989 1994 1999 3 . 普及理論の医薬品マーケティングへの応用について ( 1)医師クラスターと普及理論 イノベーションの普及メカニズムを考慮することにより、医薬品 7 ーケティングの効果を高 めることが可能である。著者は、質的セグメンテーションに基づく医師ターゲティングを提唱 ‑ 110 一

112.

してきたω(9)。質的セグメンテーションで得られた医師クラスターを「先進派」、「追随派 J 、「保 守派」と名付けており、このクラスターを認識して五回活動を行えば、生産性が著しく高まる ことを実証した (9)。各医師クラスターの処方比率は、製品ライフサイクルの時期により異なる。 1に示す。 医師クラスターと製品ライフサイクルとの関係を図表 1 図表 1 1医師クラスターと製品ライフサイクルとの関係 採用時期別 医師クラスター 先進派 lnnovator/ OpinionLeader/ E a r l yAdapter 追随派 Majority/ F o l l o w e r 保守派 LateAdapter/ Laggard ライフサイクル別処方比率 導入期 成長期 成無期 。。 ム ム × クラスターの特徴 表退期 ‑新製品への学術的関心が大(作用機序など) ‑治験を通しての影響力大 ‑学会活動に熱心(論文発表、座長) ‑導入期のディテーリング活動への反応が大 ‑次の新製品への切替が早い × 。。 ‑新製品の安全性、使い易さへの関心が大 ‑医師仲間の影響力が大 ‑業界標準に敏感 ‑熱心なM R活動{量)に反応し易い ‑ブランドロイヤルティが高い ム ム 。。 ‑新製品への関心I 立大きくない ‑従来の処方方針へのこだわり大 ‑処方の中心は、成熟期以降の薬剤 ‑然心なM R活動(量)に比較的反応し易い ‑ブランドロイヤルティが高い (2)普及理論の医薬品マーケテイングへの応用および課題について 普及理論は、採用者カテゴリーのような概念的なレベルを超えて、数理的な分析を行うこと により、マーケティング戦略を一層効果的にすることができると考えられる。いくつかの応用 や課題を述べる。 ①先発品の特許切れの影響(主としてジェネリック医薬品)を分析すること 日本でも今後、ジェネリック医薬品の本格的な普及が予想される。先発品のライフサイクル がジェネリック医薬品の参入でどのような影響を受けるかを分析することは、実用上も興味あ る課題である。 ②ジェネリック医薬品そのものに対する製品ライフサイクル予測の可能性を検討すること ジェネリック医薬品はイノベーションとは考えられないが、その製品ライフサイクルがどの ような特徴を持っているか、また B assモテ守ルなど、どのような数理モデルが適用できるかは 興味ある課題である。 ③製品ライフサイクル予測をより的確に医薬品マーケティングに活かすこと 製品ライフサイクル予測とターゲティングとの関係をより深く理解して、医薬品マーケティ ングに活かすことは実用上重要である。従来の五回活動以外に、インターネットやコールセン ターが重要なコミュニケーションチャネルとなっているので、普及メカニズムを理解してマー ケティング戦略を立案することにより、その有効性が高まると考えられる。 EA 唱 1よ 1よ

113.

4 .結論と今後の課題 ( 1)結論 ①古典的なマーケティング理論である普及理論は、統計解析ソフトウエアが身近になっ た現在、その有用性を見直す価値がある。 ② Bassモデ、ルを適用すると、製品ライフサイクルの初期データから、ライフサイクル全 体を予測できる。特に有用な予測は次の 2点である: 1 ) 製品ライフサイクルのマイルストーン(最大普及率や累積普及率の変曲点) 2 ) 製品ライフサイクル全体に渡る総売上高(ライフサイクル価値) ③月次売上データを用いて、製品ライフサイクル分析を行うことで、的確なマーケテイ ング戦略の立案に役立つことが期待される。 ④医薬品特有の薬価改訂を考慮して製品ライフサイクル予測を行った: 1 ) 上市からの薬価比率を補正した金額を用いて、予測を行うことができる 2 ) もし可能であれば、数量データを用いることが望ましい 3) 薬価改訂を考慮すると、製品ライフサイクルのマイルストーンが l 年 ~2 年延びる ( 2 )今後の課題 ①先発品の特許切れの影響(主としてジェネリック医薬品)を分析すること。 ②ジェネリック医薬品そのものに対する製品ライフサイクル予測の可能性を検討すること。 ③製品ライフサイクル予測をより的確に医薬品マーケテイングに活かすこと。 参考文献 (1)エベレット・ Rogers (三藤利夫訳) :イノベーションの普及、開泳社 ( 2 0 0 7 ) [Everett M . Rogers: Diffusion of Innovations Fifth Edition,Free Press,2003 の翻訳] ( 2 )Frank M .B a s s : A New Product Growth for Model Consumer Durables,Management Science, Vol.15, No.5, pp.215‑227 ( ] a n 1 9 6 9 ) .B a s s : NewProduct DiffusionModels i n ( 3 )Vijay Mahajan,EitanMuller,& FrankM Marketing: AReviewandDirections forResearch,]ournal ofMarketing, Vo.54, No.1, pp.1‑26 ( Jan 1 9 9 0 ) ( 4 )酒井博章:普及モデ、ルによる顧客細分化の実証、オイコノミカ、第 4 2巻・第 l号 ・ pp.1‑13 ( 2 0 0 5 ) E .Katz、 H .Menzel:The Diffusion of an Innovation Among Physicians, ( 5 )].Coleman, Sociom巴t r y, Vol .2 0,No4, p p . ( D巴c 1 9 5 7 ) ( 6 )佐賀国一:医薬品マーケティング、日本能率協会マネジメントセンター ( 1 9 9 3 ) ( 7 )長 寿 商 品 の 軌 跡 い 2、ディテールマン ( 1 9 8 8年 1 0月 、 1 9 8 9年 6月) ( 8 )武藤 猛:効果的な顧客ターゲティングのための一手法、 SAS Forum ( 2 0 0 5年 7月) ( 9 )武 藤 猛:新しい医師ターゲテイング法、 Monthly ミクス ‑1 1 2‑ (2005 年 8 月号 ~9 月号)

114.

「ふ!II!!l二話会?王子ふ子一一一ソぷ斗..ふ一 川円川‑‑山一一川九. SAS98 1Server 環境における マーケテインク、分析システムの開発事例 (財)流通経済研究所専務理事加藤弘貴 (株)タクミインフォメーションテクノロジー代表取締役佐藤耕一 Thesystemdevelopmentcasef o r m a r k e t i n gd a t aa n a l y s i si nSAS98 1 s e r v e renvironment H i r o t a k aKato/Managingd i r e c t o r,TheD i s t r i b u t i o nEconomics I n s t i t u t eo fJapan K o i c h iSato/P r e s i d e n t, Takumi‑I n f o r m a t i o nTechnology ん い 一 一 一 一古 川町一一一一一一一……… 11 iSA ユーザー総会ア均デミ 7ノテクノロジー晶ソリューションセッション 7 要旨: SAS98 1Server 環境で稼動するマーケティング、分析システムの開発 事例を紹介します。本マーケティング分析システムの機能は、大容量 子、ータウェアハウスから分析用データマートを構築する ETL 機能、 ユーザーがweb環境を利用してデータマートから分析対象データを 作成するデータ抽出機能、分析対象データをSASAMOを利用して マーケティング分析を行う分析機能の 3つの基本機能で構成されてい ます。 キーワード:マーケティング分析、 SAS98 1Server qJ 1ム ーム

115.

げ ‑ 一 ー ゥ1 同お平硲潟鈴涜1 1 …は誌なl1li問一一向ヤウI 財団法人流通経済研究所の概要 設立 所轄 1966年 10月 経済産業省 事業内容 O 庖頭研究開発事業 業態別ディマンドチェーン開発共同研究機構 (DCD:DemandChainDevelopment) を組織し、実験庖における消費者購買行動データを共有して、製配販協働で庖頭起 点のマーチャンダイジング (MD)の革新を考える共同研究プロジェクトの運営。 0 流通開発事業 流通・マーケティン分野における行政政策、民間企業の戦略立案のための各種調 査・データ分析・提言の実施。テーマ別研究会の企画・運営。 0人材開発事業(流通ビジネススクール) 公開講座(体系的なプログラムに基づいた、各流通専門領域に関する研修)および 委託研修の企画・運営 2 鴻 目 指 命 予 探 訪 窓 訪. . 芯才一問問町村附一問主的「 業態別デ、イマンド チェーン開発共同研究機構 (DCD)の体制 E 3 1 1 4

116.
[beta]
I
a
.
4
t
4
Q
j
拾 が み ら ん ー ん ル ム 一 一 一 一 一 一 一I
DCD実験庖の収集データ
•

POSデータ
日別庖舗別単品別販売実績デー夕、日別庖舗別客数データ

. スキャンパネルデータ
ーパネル 1
0別レシート別単品別販売実績デー夕、世帯属性詳細データ
レシートデータ
レシート別単品別販売実績データ
. カード会員購買データ
ーカード会員 1
0別レシート別単品別デー夕、世帯属性データ
コーザルデータ
‑庖舗別単品別販促データ(エンド&チラシ)、庖舗別単品別棚割デー

タ

4

r
認立主磁湾宗務民災沈窃党ロ内吋問問吋問附内向付附向付目
マーケテイングデータ分析システムの構成

一
… 式

・
‑
・
・
・
・
0
"
'
‑
.
,
白
"
・
̲
,
.
.
ケ
同
.
.
.
.
‑
I~~-~.-~鴫・ー

a

ム

同......

!
‑
;
:
‑̲
'

1
I-::'::':;:~
.で
̲
‑
‑
‑
ロ‑
r.~""
山

一
ナ

ム

ス

ι
一一

cur‑‑jJ

54111114li‑‑J
cd‑ 一
一
円
叩

A

シ

FJF

‑d

‑1
1
5

内i_~';::-笠".̲.,戸

1.
1.

白

一
一 一
一
即

ν

117.

… 判 以 … 開 即 時 一 … … 一 … …E ドぷ広広溢ヲ,.彰あ芯弘三こぶ宗之γ DCD実験庖データを分析する基本メニュー 実験庖データの特徴をマーケティング活動に最大隈生かすため、期間別、庖舗別、商品別、 顧客別の各次元で柔軟に集計分析するツールを実装し、ブランド購買実態を多角的に評 価できる基本メニューを構築。今後、共同研究成果に基づき、分析メニューを順次拡充する。 《データ分析基本メニュー》 販売実績を多角的 に分析する ブランドを評価する ※売価施策、競合等 ‑売上 ABC分析 │商品開の販売実績を表示します ・売上トレンド分析 │期間別の販売実績を表示します i i .購買者属性分析 漏 扇 面 玩 扇 語 示 瓦 量 子1 ・売価分析 1適切な売価設定、値引き効果を分析します ‑ ‑ ‑ 思 ‑ ・試用率・反復率分析 i ブランドの試用、反復状況を分析します │ブランド聞の競合状況を分析します 1商品聞の関連づけを明らかにします │販促提案の仮説抽出上寸・関連購買分析 i ! i i 6 … 一 一 一 叫 ん 一 …m 「弘二議二言語‑山完日お二三二7J55fw‑ システム構成 ハードウェア・ソフトウェア構成 7 1 1 6

118.

l f …ーザ一院ふ叫んムんーんじ i シ一一一一…一一丸一 システム構成 システム構成は、 S A S8 1S e r v e r環境を中心に構築し、ローディング対象のデータ 容量と分析機能の要件に即した、最適なハードウェア構成とソフトウェア構成を考 慮した。 E T L 機能では、データベースに S O LS e r v e rを利用してデータの信頼性を確保し、 データのローディング機能には、 S A SD I Sを中心!こ目次、週次、月次のパッチ処理を 組み込む方式を採用した。 S A D環境にてサーバーをグルーピングし、 外部よりログインするユーザーの認証は、 M A SM e t a d a t aS e r v e rを配置し、ログイン時のユーザー認証、 認証サーバーとして S データウェアハウス、分析用データマート、ユーザーデー夕、分析結果データのセ キュリティ設定をメタデータを利用して確保した。 データ分析機能は、インターネット環境を基本とし、 S A SAMO、w e bブラウザを利用 したカスタム分析環境の提供を実現した。 8 た!I主将苓郡波探努言以ぷ,.ぷぷ芯吋.一一一一一向‑ データ口ーテ、イング E D I Server:外部転送機能により、 E D IS e r v e r lこデータソースを転送。 E T LS e r v e r:データソースを S O LS e r v e r1 こローディングし、 S A SD I Sにより D W Hを構築。 D W HS e r v e r:S A SD I Sにより分析用 D M Tを構築。 w e b環境よりユーザーデータ転送。 画 一 一 E D IServer 9 ‑ 117

119.

1 1 1 そそ字会ァ抗日守d.TSM&& シヨンセッション ム 一 二1 1 1 一 データローデ、ィング E DIS e r v e r !こ転送され集められた日次、週次、月次の D G Dデータを S Q LS e r v e r !こ ローディングする。ローディング時にデータのクレンジングを実施し、データウェ アハウス構築用のオリジナルデータとしてデータベースを構成した。 S A SD I Sおよびパッチ処理により、 S Q LS e r v e rからデータを取得し、データウェア T LS e r v e r環境にて行う。さらに、 S A SD I Sおよびパッチ処 ハウスのローディングを E H WS e r v e r !こ構築する。 理により分析用データマートを D D G Dデータの他に、ユーザーが独自に作成・保持しているデータ(ユーザーデー e b環境から D W HS e r v e r !こアップロードすることを可能とした。 タ)を w 構築管理するデータウェアハウス、分析用データマ‑1‑‑.ユーザーデータは、 S A S データセットの形式で保存、管理する。 1 0 … 一 ‑ 一 … 神 間 川 ‑ ぷ ぽ 手 法 手 双 山 ご 山 口 お おF向 付 … … 糊I e データ検索圃結合機能(分析用データマート構築) 次のデータ操作により分析用データマートを構築する ・D G Dデータの検索、抽出 ・D G Dデータ(検索、抽出)とマスタデータを結合。 .D G Dデータ(検索、抽出)とユーザーデータやユーザーマスタを結合。 0 0 1 1 ‑1 1 8‑

120.

i ム ー二ふ院がふーん以Wi&a … & 山 村 川 川 か い 一 一 一 一E データ検索・結合機能(分析用データマート構築) ユーザークライントより w e bB r o w s e rを使用して、インターネット環境から分析用 データの検索・抽出、 D C Dデータとマスタデータとの結合、さらに D C D データとユー ザーデータの結合などのデータ操作のリクエストを行う。リクエストに従った形式 の分析データを S A Sプログラムにより D W HS e r v e rI こ構築する。 構築した分析データは、全て S A Sデータセットの形式で一定期間保存される。 1 2 f mtI!手二i 詰許宗誘活民認なた匁す竹村内…吋一向同町一一一 データ分析機能 (SASAMO) S A SA M Oを利用したデータ分析機能では、次の機能を提供します。 •G M S / S M業態、 C V S業態、 D G S業態の P O Sデー夕、レシートデー夕、スキャンパネル/力一 ド会員購買データのマーケティング分析機能 U s e rC l i e 凶│ 回 ち1 1csvJ~1 ? " 7 ? J 13 ‑1 1 9‑ E

121.

l ユーザー総会ア古デミア/テクノル&ソリーョンセ シヨン SAS E Y データ分析機能 (SASAMO) S A SA M Oを利用して、ユーザーに分析環境を握供する。インターネット環境を経由 して、認証サーバーである M E T AS e r v e r fこログインし、ユーザー認証を実施し、分析 用データサーバーである D W HS e r v e rf こて A M Oの機能を利用してデータ分析を実施する。 S A SA M Oでのデータ分析機能は、 D C D実験庫、ユーザ畳録のマーケティングデータ分 析機能を提供している。分析結果は、分析機能ごとの集計表、グラフの出力を基本 に、分析結果や分析データのダウンロードも可能である。 定型分析については、 S A SS t o r e dP r o c e s sを利用して、パッチ処理およびインタラ クティブ処理に対応している。 14 お 均 一 一 … 問 問 一 … 一 一 叩I 市 主 主 溢 な 辺 I ! 広J I •• テ、ータ分析機能 (web) w e bB r o w s e rを利用したデータの分析機能は、次の機能を提供します。 .G M S / S M業態、 C V S業態、 D G S業態の P O Sデー夕、レシートデー夕、スキャンパネル/力一 ド会員購買データのマーケティング分析機能 iUserClient I 匝面 ~ 匝記 1 5 1 2 0一

122.

[ミ!lIII!B品会ァ叫ん長二五二二元1 $ 一川一一一 I データ分析機能 (web) w e bB r o w s e rを利用して、ユーザーに分析環境を提供する。インターネット環境を 経由して、認証サーバーである M E T AS e r v e r fこログインし、ユーザー認証を実施し、 分析用データサーバーである D W HS e r v e r fこて A M Oでのカスタムタスクと同等の機能を サポートする。 w e bB r o w s e rで、のデータ分析機能は、分析機能ごとの集計表、グラフの出力を基本 に、分析結果や分析データのダウンロードも可能である。 16 ‑1 2 1

123.

POSデータを用いた消費者の ブランドスイッチ行動予測モデル構築法の提案 坂巻英一 坂巻総合研究所 Ap r o p o s a lo fc o n s u m e r s 'b r a n ds w i t c h i n gb e h a v i o u rm o d e l w i t ht h eu s eo fPOSd a t a S a k a m a k i Y o s h i k a z u, 要旨 POSシステムには膨大な顧客の購買履歴が時系列的に記録されており,このデータを分析し顧客 の購買行動パターンを把握することは,小売業界がマーケティング戦略を立案する上で非常に有効 である。 本稿では多項ロジットモデ ルを用いた消費者のブランドスイッチ行動予測モデル構築法,並びに, ブランド問のスイッチ確率を市場レベルで把握することを可能にするブランドスイッチマトリク OSデータを分析に使用する際の SASを用いたデータセ スの作成法を提案する。併せて,実際の P 去を解説するとともに,本研究における提案モデルに適用することで,消費者のブランド ット構築 f スイッチ行動を把握する上で本研究における提案モデルが有効であることを実証する. キーワード ブランドスイッチ バラエティシーキング 多項ロジットモデル マーケットシェア POSデータ 1先行研究紹介 1 . 1 フランドスイッチとは 市場には様々な商品が出回っており,一つ一つの商品にはブ、ランド、と呼ばれる呼称がつけられている. 消費者の購買行動は P OSデータ上で見た場合,ブランドの購買履歴と言い換えることもできるさらに, 個々の消費者は大きく分けて特定のブランドを買い続ける消費者と,購買機会毎に様々なブランドに買い 替える消費者にグ ループ分けすることがで きる. 一般に,消費者がブランドを選択する際,より高い効用を得るためにブ、ランド、をスイッチする行動をバラエ ティシーキング行動と呼び,日本語では多様性追求型行動と訳されている.バラエティシーキング、とは,より 自己の効用を高めることの出来るブランドを追求する行動,未知のブ、ランド、に対する関心を追及する行動を 指している.このような行動を積極的に行う消費者は,前回購買したブ、ランド、とは異なったブ、ランド、を次回の こ,こうした行動を取らない消費者は同じブランドを購買し続け 購買機会に選択する可能性が高く,また逆 i ‑1 2 2

124.

るイ頃向があることが知られている. 今後,前者の購買形態をバラエティシーキング ( v a r i c t y ‑ s c e k i n g ),後者を惰性的選択行動 ( i n e r t i a )と呼び 区別する. 1 .2 ブランドスイッチに関する古典的研究 C . A l i s t e ra n dP e s s i m i c r( l9 8 2 ),Givon( l9 8 4 ), 消費者のブランドスイッチ行動に関する研究は M L a t t i n( l9 8 7 )らまで遡る。彼らは消費者のブ ランドスイッチ行動のうち,特にバラエティシーキング、に焦点を P 当てた研究を行っている。彼らは共通してバラエティシーキング行動を,あるブランドの購買が次回の購買 機会においてそのブランドの購買確率を減少させることと定義しており,バラエティシーキング 行動をブ ラン P ト、レベルで捉えている. このうち, L a t t i n and M c . A l i s t er (1 9 8 5 )は,消費者は自己のニーズを満たすためにブ、ランドを選択するが 多くの場合,このニーズを単一ブランドで満たすことはなく,複数ブランドをスイッチしながら満たしてゆくと しづ仮定のもとで,ブ ランド、スイッチを説明している.また,ブランドスイッチに関する研究の中で,ハイ a p i l( l9 9 0 )が挙げられる. K a p i l (1 9 9 0 )は,消費者 ブリットモデルを用いた代表的なモデルとして, K のブランド選択には直近のスイッチ時点より後の選択行動が影響することを仮定しブランドスイ ッチモデルを構築し研究を行っている. 1 .3RANDOLPH,e t .a l .( 1 9 9 8 )のモデル POSデータを活用した初期のブランドスイッチモデルとしては, Randolph,R u s s e l landS r i n i v a s a n ( 19 9 8 )が挙げられる。彼らは,ランダム効用理論に基づき, POSデータを基にした消費者の選択行 動予測モデソレに関する研究を行っている. この研究に於いて,彼らはモデルの中で消費者及びブランド、の異質性を同時に考慮することで, 購買機会 tにおける消費者 kのブランド iに対する確率的誤差変数を含む効用値を 工 九 = Ujk + ν{I o g ( x 'i / )一νp Iog(p九 )+Z'ik ( 1 ) により定式化している. ここで :ブランド(i=1 ム • . . , f ) k :消費者( k =I ム…,幻 I 購買機会(t=1 み.刀 U i k :消費者 kがブランド iに対して持つ固有選好度 xrtf: 購買機会 Iにおけるブランド rに対する価格以外のマーケティング変数 め : 購 買 機 会 Iにおけるブランド iに対する価格変数 zgzk: 購買機会 Iにおける消費者 kのブランド iに対する確率的誤差変数 l o g ( x ' i/)に対するパラメータ V{ : Vp o g ' j )I :l ( p こ対するパラメータ である. ここで,確率的誤差変数 z hがブランド,消費者,購買機会に関して独立に第一種極値分布に従 1 2 3

125.

う仮定をおき,多項ロジットモデルを用いたブランド選択確率の予測モデルを構築している.即ち, 第一種極値分布におけるパラメータを μ とした場合,誤差変数が閣値 Z oよりも小さくなる確率 P r ( z ' i k壬Z o )を , P r ( z ' i k三z o )=e xp[‑exp( 一戸。)] ( 2 ) Jを により与える時,消費者 kが購買機会 tにブランド iを選択する確率 p い 工 β'/IOg(X'il)‑slog(p'i) e x p l u p '放 = L 「 I p I = i L 」「 エexpluい工 β'/log(x',/)‑slog(p',) ( 3 ) I p により定式化している.ただし,第一種極値分において μ を分布におけるパラメータした時 , U'ik= μJih sF f JVb s p = f J V pである. 2本研究における提案モデル 2 . 1Randolphe t . ,a l . ( 1 9 9 8 ) モデルにおける問題点 . l( 1 9 9 8 )のモデルは消費者 kのブランド iに対する選好度 U i J cをモデルパラメータとし R a n d o l p he t,a da t a )に対してパラメータ U i kを推定 て推定しているが,この手法ではモデル構築用データ ( i n ‑ s a m p l e‑ することは可能である反面,検証用データ ( o u t‑ oιsample‑ da t a )に対しモデルを適用し,消費者の選択 行動予測等を行うことが困難であると恩われる。こうしたモデルの特性を考慮した場合,消費者の ブランドに対する選好度 U i kが未知の場合においても,選択行動予測を行える汎用性のあるモデルを 構築することが,実務的には必要となろう.近年.POSデータの中には,ポイントカードを活用し, 各商品を購買した消費者の個人属性を把握できるものも多く存在する。 t .a . l( 19 9 8 )を基礎とし,ポイントカード等に記録されている個人属 本研究においては R a n d o l p h,e 性データを活用することにより,モデルに汎用性を持たせ,検証用データ ( o u t ‑ o ι s a m p l e‑ d a t a )に対 してもモデルの適用を可能とし,消費者の選択行動予測にモデ.ルを活用できるようモテ、ルの改善提 案を行う。 バラエティシーキングに関する先行研究を概観すると. POSデータを活用して消費者のバラエテ イシーキング行動を記述するモデルについての研究は,まだ殆ど行われていないのが現状である。 そこで,本研究においては更に,前回購買機会までの消費者 kにおけるブランド rの連続購買回数 を 2次関数の形でモデ、ルの中に取り込むことにより. POSデータを用いて消費者のパラエティシー キング行動を把握するモデルの構築を行うことを併せて試みる。 2 . 2本研究に於ける提案モデル及び比較対象モデル 今,購買機会 tにおける消費者 kのブランド iに対する確率的効用値 Y放を V ' i k= V ' j k+e/jk ( 4 ) により定式化する.ここで,九は誤差を含まない確定的効用値, 1 2 4‑ E r z kは確率的誤差変数である.

126.

〔本研究に於ける握案モデル〕 確定的効用値九を V1ik = U1ik ( 5 ) +βdiscountX11i +βconllnue ただい ι β5 k‑ 町一 iZlk +βIge̲iZ2k により定式化する.以下,この形で確定的効用値が記述されることを仮定したモデ、ルを本研究に於 ける提案モデルと呼ぶことにする。 〔比較対象モデル〕 l kを 確定的効用値 v Vtik =βOik +βd4scotm/12+β 印 刷 間 /+β nIInue l X '以 e 2XI2i 印 ( 6 ) により定式化する.以下,この形で確定的効用値が記述されることを仮定したモデルを先行研究モ デルと呼ぶことにする。 ここで, Zlk Z2k 消費者 kの性別(男性!,女性 0のダミーデータ) ・消費者 kの年齢 , s 田 ブ ラ ン ド Hこ対する性別変数 ( Z l k )のパラメータ sage̲i ブランド if こ対する年齢変数(Z2 k )のパラメータ X t } i 購買機会 Iにおけるブランド Iに対する値引率 X F 2 1 k :購買機会 Iにおける前回購買機会までのブランド iの連続購買回数 sO;k ・消費者 kのブランド iに対する固有選好度 sd , 広 叩m t :XIJ iに対する推定パラメータ s c o n t i n u e2 :X l 2 i kの 2次項に対する推定パラメータ s c o n t i n l l e1 :X l 2 i kの l次項に対する推定パラメータ である. このように確定的効用を仮定した後,消費者 kが購買機会 Iにおいて特定のブランド 2を選択する確率を 比二字「一一一 e x p ( v ' ; t ) ( 7 ) ) , により定式化する.ここで定式化された p l kを基に I 1 I 1 I 1 L= Y p';k ; ( 8 ) なる尤度関数を設定する.パラメータ推定には最尤推定法を使用し, ( 8 ) 式が最大になるようなノミ ラメータを推定する. 1 2 5一

127.

2 . 3 ブランドスイッチマトリクスの算出 ここで,消費者のブランドスイッチ行動を把握するために,ブランドスイッチマトリクスを定式 化する。 を基に,九を消費者 kが取り得る購買機会の最大値とした時,ブランド iに関するマーケット prik シェア MS , を 誌 p'., MS ,=とμ斗 ー ‑ 詑 a ( 9 ) により定義する.また,マーケットレベルにおけるスイッチ確率を, 2 Z P 2pt iI i k 此 ( 10 ) 及ぴ ) ikpljlct ‑ l ( 主 主 〆 エ により定式化する.更に,ブランドスイッチをマーケットレベルで捉える際に,ブランド zのマー ケットシェアが与えられた基での条件付スイッチ確率を考えた場合,今回プランド zを購買した消 費者が次回ブランド jにスイッチする確率を, J! r , . ー ‑ ー 一 ‑ Y= MS i , K T L L P 'げ此 エ p' K 九 ( 1 2 ) 抹 により定式化する.ただし ,j = iの場合, 今回ブランド iを購入した消費者が次回もブランド iを反 復購入する確率を表している。 3 モデルの実データへの適用 こ本研究におけ ここで,本研究における提案モデルの妥当性を検証するために,先行研究モデ、ル並ひ1 る提案モデルに対し,実データを適用しモデルの妥当性に付いて検証を行う.検証用データとしては,都 内の日用雑貨量販庖における POSデータに記録された顧客の購買履歴データを使用した. 3 . 1 検証用データ概要 先ず検証に利用したデータの概要を説明する. 一1 2 6

128.

[データ収集日並びにデータ数〕 2 0 0 3年 4月 l日から 2 0 0 3年 9月 3 0日までの日用雑貨量販庖における顧客の購買履歴データ(期間 9 5 7, 5 2 0商品) 内購買商品数= [分析対象データの抽出〕 分析対象としては,多くの消費者が日常品として購入しやすい,台所用洗剤を取り上げた.更に,期間中 5回以上この庖舗を使用した経験のある顧客の購買履歴データ 2 , 5 2 4件を分析対象として取り上げた. に1 (本稿は本研究における提案モデルの妥当性を検証することが主たる目的である.パラメータ推定に際し, コンピュータへの負荷を軽減するために,検証に使用するデータの件数を制服している.) [モデル内で使用した変数と対象ブランド〕 A .ブランド属性 1.当該ブランドの値引率 2 . 当該ブランドに関する前回購買機会までの連続購買回数 B .個人属性 1.年齢 2 性別(男性の場合 1 ,女性の場合 Oのダミー変数を使用) c.分析対象ブランド 分析対象ブランドとしては, P OSデータに購買履歴のある台所用洗剤のうち,購買頻度が最も高 かったもの上位 4ブランド,及びこれら 4ブランド以外のブランドを一纏めにしたその他ブランド 5 つのブ、ランドを分析対象として使用するこどどした。 なお,本研究で使用した P OSデータの一部を最終稿の付録に添付した.ただし,価格に付いては,その OSデータからだけでは,同時陳列されているその他ブランドを含め 日たまたま Iつも売れなかった場合, P た 5つのブランド それぞれの価格を同時に把握することがデータの性質上非常に難しし、ことが判明した.そ こで,本研究では分析で使用されてしも 5つのブランド、それぞれに付いて当該購買機会の前後 7日間にお ける P OSデータ上における同一庖舗内庖頭販売価格の平均値を算出することにより,それぞれの販売時 点における販売価格を算出し分析に使用した.仮に,前後 7 日間(都合 1 5 日間)一度もそのブランドの購 買履歴が記録されていなかった場合(J'.!Dち, 1 5日間一度もそのブランドが購買データとして記録されていな かった場合),その庖舗に関しては当該ブランドが庖頭に陳列されていなかったものと仮定して,分析を実 施した. OSデータそのものにデータの入力ミス等があることが考えられるため,それぞれのブランドに付 更に, P いて販売単価のパーセンタイルを算出し.9 9パーセンタイルを販売価格の上限値に設定して分析を実施し た.この際, 9 9パーセンタイル以上の単価が入力されてしも場合,単価を 9 9パーセンタイルの価格に置き 換えて分析を実施した.参考までに,対象期間内に於けるこの庖舗での各ブランドの購入回数,および分 析対象となった顧客の個人属性に関する基礎統計量を表 1 .表 2に示す. 1 2 7‑

129.

5 2 3 1 8 4 1 5 6 1 4 0 1 5 2 1 2 5 2 4 ブランドA ブランドB ブランドC ブランドD 平均年齢 1 5 2 . 8 8歳 2 0 . 7 2 % 4 . 0 7 % 3 . 5 9 % 3 . 3 5 % 3 7 . 6 0 % 1 0 0 . 0 0 % 女性 男性 計 2 , 0 9 6 4 2 8 2, 5 2 4 表 2 顧客の個人属性に関する基礎統計量 表 1ブランド毎購買回数 顧客の個人属性に関する基礎統計量から,この量販底を利用する顧客層の大半が女性であり,平均年 齢もかなり高いことから,年配の主婦層が,リピート顧客として多く利用していることが予測される. 3 . 2 パラメータの推定 検証用データを基に,先行研究モデル並びに本研究における提案モテ.ルに対するパラメータ推定を最 尤推定法により実施した. パラメータの推定に際し, SAS/ORに搭載されている NLPプロシージャを利用し ている. 3 . 3パラメータ推定結果 先行研究モデル及び本研究における提案モデルを用いたパラメータの推定結果は表 3及 び 表 4の通り である. 変数名 t値 パフメータ推定値 p値 l J DISCOUNT 5 . 2 9 2 8 . 0 0 0 1 21 .2903 0 l J CONTINUE2 ‑ 0 . 0 0 6 4 ‑ 1 9 . 1 6 4 8 0 . 0 0 0 1 事本本 l J CONTINUE 1 0. 4019 . 0 0 0 1 1 9 . 2 6 6 3 0 判事 事事事 BscxA ー 1 .2671 ‑ 3 . 4612 0.0010 本 本 本 8. , xB 1 . 20 3 1 2 . 8 3 9 1 8目 ,C ‑ 0 . 1 1 0 9 ‑ 0. 4012 0 . 6 5 7 2 BSeI 0 1 .9974 . 0 0 0 1 4 . 0 9 8 2 0 本本本 BsexE 1 . 2033 4 . 2 1 4 3 0 . 0 0 0 1 事事本 Bagc̲A 0 . 5 8 7 9 8 7 . 8 7 2 1 0 . 0 0 0 1 本事本 Bage̲B 0 . 6 4 2 9 . 0 0 0 1 5 6 . 9 3 1 4 0 判事 Bage̲C 0 . 6 2 1 8 . 0 0 0 1 61 .2827 0 事事事 Bagc̲D 0 . 5 3 5 5 3 8 . 8 7 4 1 0 . 0 0 0 1 事事本 0 . 5 0 1 8 . 0 0 0 1 96. 4657 0 事事本 Bagc̲E 0 . 0 0 9 2 本本本 表 3 本研究に於ける提案モデルによるパラメータ推定結果 t値 変数名 パフメータ推定値 l Jmscou町 5. 4319 l J CONT lNUE 1 ‑ 0 . 0 0 5 9 ー l J CONTINUE 1 0 . 3 6 2 3 2 3 . 9 5 6 1 1 2 8‑ p値 . 0 0 0 1 25.0994 0 **本 . 0 0 0 1 1 7 . 9 2 3 6 0 本本本 0 . 0 0 0 1 本本事

130.

s O l 0 . 7 2 4 3 s 0 2 ‑ 0 . 8 4 4 5 s 0 3 1 .2844 F F 田 ‑ 7 . 7 9 1 9 刷 3 . 9 6 4 1 K L . s O i k ただし,紙面スペースの都合上, βoa=i ニ」ーとして分析結果を表示している。 K 表 4 先行研究モデルによるパラメータ推定結果 なお,パラメータ推定に当たり,モデルのオーバーフィッティングや推定されたパラメータの安定性に関 する検証を行う必要上,先行研究モデル,本研究における提案モデル双方について,通常であれば,デ r し,片方のデータセッl‑(i n ‑ s a m p l e‑ da t a )を用いてパラメータ推 ータセットをランダムサンプリング、等により分害J o u t ‑ o ι s a m p l e‑ da t a )に適用することで,モデルの妥当性に関する検証を行う, 定を行い,残りのデータセット ( としりたクロスバリデーションを行う必要がある.しかしながら,先行研究モデルにおいて,ブランドに対する 選好度を個々の消費者毎にモデ ルパラメータの形で推定する必要上,データセットを分割してしまうと,ブ ランドに対する個々の消費者の固有選好度 U i kを推定することがで、きなくなり,モテ、ルの検証が困難になるこ n ‑ s a m p l e‑ da t a,o u t ‑ o ι s a m p l e ‑ d a t aの分割を行わずに,モデ とが考えられる.そこで,本研究においては, i ル構築用データに対し,構築されたモデルを適用することで,モデルの妥当性に関する検証を行うことにし た. またモデルによっては尤度関数の形状が多峰性となり,最尤推定法を用いてパラメータ推定を行う場合, L o c a lMinimum)に落ちる可能性があることが知られている.そこで,本研究ではパラメータ推 極所最適解 ( 定に際し,パラメータの初期値を乱数的に発生させパラメータ推定を実施する作業を 200回繰り返した.そ の結果得られた推定値の組み合わせのうち, A IC統計量を最小化するパラメータの組合せをそれぞれのモ デ、ルに対するパラメータの最適解と見なすことにした. 更に,先行研究モデ、ル及び本研究における提案モデル双方にイ寸し、て,対数尤度, A IC適合度,予測の 的中率を算出した結果を表 5に示す. 本研究における 提案モデル 先行研究モデル . 37 ‑ 2 3 21 対数尤度 ‑ 2 4 1 3 . 8 2 AIC統計量 4 8 5 3 . 6 4 5 9 7 8 . 7 4 計算時間 5分 2時間 30分 予測の的中率 61 .96% 63.05% [ 注 1 1予測の的中率に関しては, 5つのブランドのうち最も選択確率の高いブランドと実際 に消費者が当該購買機会に選択したブランドが一致した場合,予測が的中したとみなし検 証を実施した。 表 5 対数尤度・ A IC統計量=予測的中率比較表 ‑1 2 9一

131.

この推定結果から,モデ、ル内で非常に多くのパラメータを用いていることから対数尤度に関しては先行研 究モデ、ルの方が本研究における提案モデルよりも当てはまりがよい反面, AIC 統計量に関しては,本研究 における提案モデルのほうが先行研究モデ、ルよりも遥かに優れたモデルの当てはまりを示していることがわ かる。モデ、ルによる予測の的中率についてみてみても,本研究における提案モデ、ルの方が先行研究モデ、 ルよりも優れた予測力を有することを検証結果が示しており,消費者の個人属性を考慮した汎用性のある モデルが,実際の消費者の選択行動をよく反映している結果であると考えられる。また,パラメータの推定 時間に関しても,先行研究モデルでは非常に多くのパラメータを推定しなければならず,パラメータ推定に / 3 0程度の時間 長い時間を要していた反面,本研究に於ける提案モデ、ルでは,先行研究モデ、ルの僅か 1 でパラメータ推定が終了しており,非常に効率的なパラメータ推定がなされているとし、うことができる。 3 . 4消費者のバラエティシーキング傾向について 次に消費者のバラエティシーキング、傾向について分析を行った結果を示す.( 7 )式 , ( 8 )式より推定された パラメータを基に連続購買回数と効用値の関係をグラフ化したものが図 1である.この結果を見ると,連続 購買回数が 3 0回程度で効用値のピークを迎えており,このデータから判断する限りにおいては,消費者が 台所洗剤を購買する際,惰性的選択行動をとる傾向が強く,日頃購入しているブランドと同ーのブランドを 惰性的に選択購買する傾向が強し、ことが分かる. 連続賂買機会数と効用の関係 q4 3525 n v 軍 「 5 ・ 園田 ‑ . 園田 • ・ i 3 F 。r 。 0 . 5 ‑ . 同ー・ ̲ . . 一 ー . ー 4 . 5 4 3 . 5 1 0 20 30 40 50 60 連続購買回数 図 1 連続購買機会数と効用の関係 3 . 5ブランドスイッチマトリクスの算出 次に, ( 9 )式から ( 1 2 )式を基に,台所洗剤のブランド A からブランド Eの聞におけるブランドスイ ッチ確率マトリクスを作成することを試みた.本研究における提案モデ、ル及び先行研究モテ ルより算 出されたブ ランドスイッチマトリクス,及び実際に消費者により行われたブ ランドスイッチマトリクスは,表 6の 通りである. 1 3 0一

132.

A B C D E A B C 53.33% 11 .96% 15.63% 5.76% 7.24% 3.81% 40. 22% 6.25% 3.60% 3.83% 13.02% 4.89% 16.67% 3.60% 2.75% D 1 .43% 4.35% 9.38% 46.76% 3.33% E 41% 2 8. 38.59% 52.08% 40.29% 82.86% 実 療のブランドスイッチマトリ フ ス C D B E 8.13% 6.98% 36% 6.13% 3 5. B 21 .66% 7.26% 31% 41 .98% 7. 9.44% 13.88% 6.92% 44.29% C 8.56% 7.63% 18.09% 42.18% D 4 9% 4.98% 5. 4.95% 71 .56% E 本研再における提寒 モ' TJ レより算 出されたフランドスイッチマトリクス A A 39. 47% 21 .83% 23.18% 19.66% 12.37% A B C D E A 37.18% 24.26% 26.08% 26.10% 15.10% 7.16% 8. 26% 9. 53% 1 3. 45% 9.61% 5.13% 7.98% 43% 39. 39.17% 42.31% 4 2 . 5 4 % 1 70.36% B C D E 1 8. 4 2% 8.89% 8.32% 4. 43% 8.62% 9.27% 1 3. 43% 4.98% t 来型モァルより算出され とフランドスイッチマトリクス 表 6 算出されたブランドスイッチマトリクス さらに,本研究における提案モデル,先行研究モデノレの双方から算出されたブランド スイッチマトリクスの いずれが,実際のスイッチマトリクスにより近し、かを検定することを試みた. 検定に際しては, 1 :行要素(会=1, 2, . . . , 1 ) j :列要素(戸 l ム. . , . 1 ) k :モデルタイプ ( k =I ;実際のスイッチマトリクス, ;本研究における提案モデルより算出されたスイッチマトリクス, k=2 k=3 ;先行研究モデルより算出されたスイッチマトリクス) とし,マトリクスの各要素を P'ijkとした時, Hij!2 ニ p'ij!‑P'ij2 ( 1 3 ) =p'ij!‑P'ij3 ( 14 ) の値,及び, Hij!3 の値を算出し,統計量 Hij12J Hijl3それぞれの平均値が 0 であるか否かを検定することにより,本研究におけ る提案モデル,先行研究モデルの双方から算出されたプ、ランドスイッチマトリクスと実際のブランドスイッチ マトリクスの聞に差があるか否かを, S t u d e n tの t検定,符号検定,符号付順位検定の 3つの手法により検定 する方法で行った。 更に,統計量 ‑1 3 1

133.

Hij23 =P'ij2‑P'ij3 ( 15 ) を用いることにより,本研究における提案モデ.ル,先行研究モデ、ルの双方から算出されたブ、ランドスイッチ マトリクスの聞に差があるか否かを検定することも併せて行った。 この結果を表 7に示す。 際のブランドスイッチマトリヲスと本研 1 実;障のブラン Fスイッチマトリヲスと先行 する提案モデルより算出された 1 研究モデルより揮出されたブランドス に於 I 1 イツチマトリヲスとの差 ラン Fスイッチマトリヲスとの差 表 7 ブランドスイッチマトリクス聞の差の検定結果 検定結果を見る限り,本研究における提案モデル,先行研究モテツレいずれのモテ、ルから算出されたブ、 ランド、スイッチマトリクスについても,実際のブ、ランド、スイッチマトリクスとの聞に統計的に有意な差が存在しな いことが確かめられ,本研究に於ける提案モデル,先行研究モデルのいずれについても,実際の消費者の ブ ランド、スイッチ行動を予il!!Jする上で有効で、あることが示された。 更に,本研究に於ける提案モデルと先行研究モデルの双方から算出されたブ ランド・スイッチマトリクスを 比較した場合,双方のマトリクスの間にも統計的に有意な差は存在しなし、ことが示され,これら 2つのモデ ルの予測精度に有意な差は存在しないことが確認できた。 4結 論 本研究では,近年小売業界を中心に広がりを見せている POSシステムに焦点を当て,このシステムに蓄 積された顧客の購買履歴データを用いて,消費者選択行動,とりわけバラエティ・シーキング と呼ばれる行 動を把握するためのモデ、ル構築法に関する提案を行った。併せて,構築されたモテ ルを基にしたブ、ランド スイッチマトリクス算出法を提案するとともに,本研究における提案モデルの有効性について,量販点にお ける顧客の購買履歴データに本研究における提案モデル,先行研究モデ、ルの双方を適用することで、モデ ルの有効性に関する検証を行った. その結果,本研究に於ける提案モデル,先行研究モデ、ルの双方から算出されたプ、ランドスイッチマトリク スは,共に,実際の消費者のプ、ランドスイッチマトリクスと統計的に有意な差は存在しないことが裏付けられ た。また,本研究に於ける提案モデル,先行研究モデルの双方から算出されたブ、ランド、スイッチマトリクス聞 にも統計的に有意な差は存在しないことが裏付けられた。 本研究においては,先行研究モデ ルに対し,モテ ル内で、扱われるブランド、に対する消費者固有の選好 度について汎用性を持たせ,検証用データ ( o u t ‑ o ι s a m p l e‑ da t a )に対しでも,モデ、ルを適用できるよう にすることが目的の一つで、あったが,ブランドスイッチマトリクスを用いた検定を実施した結果, モデ、ルの有効性が示されたことから,モテ、ルに汎用性を持たせた本研究に於ける提案モデルは,プ ランドに対する固有選好度が知られていない消費者のブランドスイッチ行動を予測する上でも,極め て有効な手法になりえると考えられる。 1よ ワ 山 d 円

134.

また,パラメータの推定結果に付いてみると,先行研究モデ、ルて、はブ、ランド、に対する固有選好度がモデ ル内における推定パラメータとして扱われているため,モテ、ル内で、扱うブ、ランド数,ユニークな消費者数が 増加するに従い,推定すべきパラメータ数が急激に増加し,パラメータ推定に要する時間の増加,コンビュ ータリソースへ与える負荷の増加等が問題となるが,こうした観点からも本研究における提案モデ、ルは有効 であると言えよう。 次に,パラメータの推定結果について考察を加える。まず,モテ、ルの適合度についてであるが,パラメー タ数が非常に多いこともあり,対数尤度に関しては先行研究モデルの方が優位性が高かったが, AIC 統 計 量を比較した場合,本研究に於ける提案モデルの方が優位性が高いことが確認された。 また,パラメータ推定値を見ると,性別に関してはブランド Aとブランド Cのパラメータ符号がマイナスにな っており,これら 2 つのブランドに関しては比較的女性向であり男性にはあまり好まれていないであろうこと が推測される.一方,年齢の効果に付いてみてみると全てのブランドに対してほぼ同じような重みが推定さ に対する効用にそれ程大きな差異が存在しない れており,台所洗剤の選択に当たっては,年齢問で洗剤l であろうことが推測される.このように,推定された個人属性に対するノ句メータの大きさや符号からもど、のよ うな消費者層にどのようなブランドが好まれるかを予測することができることもわかる。 最後に本研究の今後の展望について言及する.本研究では, POS データから得られた時系列要素を含 んだデータを基に,多項ロジットモデ.ルを用いた消費者行動予測モデルを提案し,モデ、ルから算出された ブ、ランド、選択確率を基にブ、ランド・スイッチマトリクスをマーケットレベルで算出することを試みた.本研究では, 新たな消費者行動予測モデルを提案することが主たる目的であったため,実証研究で使用した実データ はそれほと。多くはなかったが,実際には 1 0万件単位の購買履歴データを使用することが可能であり,コン ピュータリソースが許す限り多くのデータを使用することで,より安定した消費者行動の予測を行うことがで き,マーケティング、戦略を立案する上でも有効な手段となると期待で3きる. また,消費者のブランドに対する効用を記述するに当たり,本研究ではブランドの連続購買回数,値引率 等 , ~艮られた変数のみをモテ、ル内で考慮、したが,長期間に渡るデータを使用すれば,この他にも季節変動 要因等の要素を加え合わせたモテ、ルを構築することが可能になると期待できる。 POSシステムには,膨大な消費者の購買履歴が記録された宝の山である。このデータを分析することで消 費者の購買行動をタイムリーに把握し,同時に消費者のブ、ランドスイッチのパターンも把握できれば,自社 ブ ランドユーザの圏い込み戦略,或いは,他社ブランドへの流出防止戦略を構築する際に大いに役立つと 期待できる.本研究における提案モデ、ルが SAS システムを導入している企業のマーケティング、担当者,当 該分野における研究者の方々がマーケティング 戦略を立案する上で、の一助になれば幸いである。 以上 ‑1 3 3‑

135.

参考文献 1 .Givon, M.,V紅白t yS e e k i n gThroughB r a n dS w i t c h i n g ", M a r k e t i n gS c i e n c e , 3, No , l . 1984,1 ‑ 2 2 . 2 .K a p i l,B ., ModelingI n e r t i aa n dV a r i e t y ‑ S e e k i n gT e n d e n c i e sI nBrandC h o i c eB e h a v i o r " ,Marketing , 9, No.3, Summer ,1990, 2 6 3 ‑ 2 7 8 . S c i e n c e 3 .L a t t i n,J .M.andM c . A l i s t e r ,UsingaV a r i e t y ‑ S e e k i n gModelt oI d e n t i f シS u b s t i t u t eandComplementary R e l a t i o n s h i p sAmongCompetingP r o d u c t s ",Joumal01M a r k e t i n gR e s e a r c h,2 2 ( A u g u s t ),1 9 8 5, 3 3 0 ‑ 3 3 9 . J .M.,AModelofB a l a n c e dC h o i c eB e h a v i o r ", M a r k e t i n gS c i e n c e, 6, N o . l,1 9 8 7, 4 8 ‑ 6 5 . 4 .L a t t i n, ,L .andP e s s i m i e r ,E ., V a r i 巴t y ‑ S e e k i n g :AnI n t e r d i s c i p l i n a r yReview" ,Joumal01Consumer 5 .M c A l i s t e r 9,1 9 8 2, 3 1 1 ‑ 3 2 2 . R e s e a r c h, 6 .R a n d o l p h, E .8 . ,R u s s e l l,G .1 .andS r i n i v a s a , nv . , AR e l a t i o n s h i pBetweenMarketS h a r eE l a s t i c i t i e sa n d , J o u r n a l01M a r k e t i n gR e s e a r τh, 35, F e b u r u a r y ,1998, 9 9 ‑ 1 1 3 . BrandS w i t c h i n gP r o b a b i l i t i e s " ‑1 3 4

136.

付録 1 一般に, P OSデータには顧客が行った大量の購買履歴が記録されており,データを処理するに当たっては, 高速処理が可能な分析ツールが必要となる。 S ASシステムは大容量データを高速処理する上で優れたパフォー OSデータを処理する上で大変有効なツールである。 マンスを有しており, P OSデータの一例を図 2に示す。 I行目が各項目に対するラベル, 2行目が SASデータセッ 本稿で使用した P トで使用した変数名である。 般に, P OSデータは顧客の購買履歴に基づき,時系列的に縦持ちのデータとし て記録されている。 図 2P OSデータの一例(データセット名 =POS̲DATA) 一般に,統計モデルを用いて POSデータを解析するためには,立て持ちのデータセットを横持ちデータセ ットに変換する必要がある。 OSデータを横展開した例 図 3P d 円 1よ Fhu

137.

付録2 また縦持ちの POSデータを横に展開し,分析に使用するデータセットを作成した際に使用した SASプログ ラムを以下に示す。 1 ・横持ちデータセット作成のために使用した SASプログラム町 p r o cs o r td a t a=POS̲DATA; bylDDATE; r u n ; /*期間中購買回数が 1 5回以上の顧客を抽出町 p r o cf r e qd a t a=POS ーDATAn o p r i n t; o c o ln o p c tout =POS̲DATA̲15(k田p= c o u n tlD) ; t a b l elD/norown r u n ; d a t a merge POS DATA; POS̲DATA( i n = in l )POS̲DATA̲15( i n = i n2wher e = ( COUNf> = 1 5 ) ) ; D; byI i f in2= I ; r u n ; ・連続購買回数を変数 ITEM *に格納町 1 d a t a POS̲DATA(drop ‑ ‑ ‑ C OUN T ) ; s e t POS DATA: byID; / *Dataステップ内で byステートメントを使用することで, byで指定された変数毎に以 下の処理を実行することが可能となる。 り i ff i r st . l D =1t h e ndo: = O ;ITEM̲B=O;lTEM̲C= O ;ITEM̲D=O;ITEM̲E=O; lTEM̲A e n d ; e l s ed o ; i fl T EMCODE "ITEM̲A"t h e nITEM̲A+I; e l s eITEM̲A =O; e l s eITEM̲B=O; iflTEMCODE="ITEM B"t h e nITEM B+1; iflTEMCODE="ITEM̲C"t h e nlTEM̲C+1; e l s eITEM̲C=O; iflTEMCODE="ITEM̲D"t h e nITEM̲D+I; e l s eITEM̲D=O; i f汀 EMCODE="ITEM̲E"t h e nlTEM̲E+1; e l s eπ ' EM̲E =O; t ; ou中u e n d ; 竺 r u n: ‑1 3 6

138.

統計解析・教育

139.

ジニ係数の計算とロレンツ曲線を描く SASプログラム 周防節雄 兵庫県立大学・神戸学園都市学術情報館 C a l c u l a t i n gt h eG i n iC o e f f i c i e n tandDrawingt h eLorenzCurvebySAS S e t s u oSuoh I n f o r m a t i o nSystemsC e n t r e, t h eU n i v e r s i t yofHyogo 要旨 ジニ係数を計算し、かっ、ロレンツ曲線を描く SASプログラムを作成する過程を、 SAS初心者向け ) 買を追って解説する。プログラムはマクロ化しであり、データセットと SAS変数を指定するだけ に手1 で{吏えるようにしている。 キーワード:ジニ係数 ロレンツ曲線データハンドリング SASマクロ言語 アルゴリズムの図式化 1. はじめに SASは統計解析ソフトとして 3 0年ほど前に開発されて以来、進化を続け、現在で、は大規模なデータベース システムを構築できるまでに発展してきた。ただ、現在でも SASの大多数のユーザーは、できあがった SAS データセットを豊富なプロシジ ャに適用して簡単に計算結果を得て分析作業をしていると恩われる。簡単に 信頼できる計算結果が出るのが SASの最大の利点の一つであるが、 SASのプロシジャにない計算は、ユーザ ーが自分でプログラムを組む必要があるのは言うまでもない。この場合、 SASのいわゆるデータハンドリン ク守機能を使って、データステップとプロックステップを組み合わせて SASのプログラムを作成することにな る。この SASのデータハンドリング機能は、 SASのデータセットを加工して行われるために、通常のプログ ラミング言語によるプログラム作成とはかなり趣を異にしており、 SASの初心者が戸惑う場合が多い。その 一つに、異なるオブザベーション問の値を相互に使って計算するのがストレートにはできないことがある。 近年、ミクロ統計データを使用して分析をする機会が多くなってきている。本論文では、個票データから ジニ係数を計算し、かつ、ロレンツ曲線を描く SASプログラムを取り上げて、筆者が独自に工夫した図式を 利用して、 SASでプログラミングをするということはどういうことなのかを示す。特に SASの初心者を念 頭に置いて、そのプログラミングの過程、言い換えると、 SASデータセットの作成過程をわかりやすく図解 する。更に、マクロ言語を使ってそのプログラムを再編成し、ユーザーが簡単に利用できるようにした。デ ータ件数が多い場合、個粟データをひとまず階級別に集計した後にジニ係数を計算することもできる。この 場合、個票データから直接計算した場合と若干の誤差が生じるが、その誤差は無視できる程度である。本論 文では個票データから計算する議論に絞っている。 ‑1 3 9‑

140.

2. ジニ係数とロレンツ曲線 2 . 1 ジニ係数の計算方法 ジニ係数は格差の指標として、特に所得分布の不平等を表す場合に広く利用されている。ジニ係数は数学 的には以下に示すようにして求めることができる(森村英典他 [ 1 9 8 4 J) 。 之I x ; ‑ x j l 平 均 差 ̲ 1.;=1 一 一 一 L X ; ジニ係数=一一一一一 平均差 平均値=~ー n n 平 均 値 x2 データ件数が少ない場合は、同ーのオブザベーションに Xl .X 2…Xn を並べて、上記の式をそのまま使え ば 、 SAS プログラム(付録 1)で簡単に計算ができる。しかしこのプログラムでは、データ件数が数万、数十 万に及ぶ場合は実行不可能となる。 2 . 2 口レンツ曲線を利用するジニ係数の計算手順 データ Xl .X 2…Xnが SASのデータセットのオブザベーション lから n までにある場合に、上記の式を使ってジニ係数を直接計算に行くのは、大 容量のデータの場合、計算処理時間、場合によっては記憶容量の制限から 現実的でない。 その代わりにロレンツ曲線を利用して幾何的に計算する方法がある。議 論を簡単にするために 4人の場合の所得 ( 1 5万円、 25万円、 40万円、 D 80万円)のジニ係数を考える。この場合のロレンツ曲線は図 1となる。 まず、データを所得の低い人から順に並べた後、横軸に人数、縦軸に累 積所得を取ってプロットする。プロットした点を結んでできる線は、所得 日口 が完全均等配分されていると、対角線と一致し、不平等の場合は、えぐれ 0 . 2 5 図1 050 号7 5 ロレンツ曲線 たカーブを描くロレンツ曲線となる。不平等の尺度は、対角線とロレンツ曲線 . 5となり、 で圏まれた弓形の面積で示される。縦軸と横軌を 1に標準化した場合、右下の正三角形の面積は 0 それに対する弓形の面積の割合がジニ係数となる。 ASプログラムを作成する。直感 本論文ではこの方法で、ジニ係数を計算し、かつ、ロレンツ曲線を描く S 的に理解しやすくするために、まず E x c e lで計算する場合の手順①を表 1に示す。 x c e lによるジニ係数計算手順 表1 E 1 4 0‑ ∞ 1

141.

① 便 宜 上 、 所 得 0万円を加える。(実際のデータでは人数はもっと多数になるので計算結果に影響 しない。) ②昇順に並べた各人の所得の累積を逐次計算する。 ③ロレンツ曲線を描く際は、横軸、縦軸の最大値が 1になるように標準化するので、各累積所得を 最終の累積所得で割り算をする。横軸に r 1‑:‑人数」ずつ、縦軸に標準化した累積所得をプトッ 卜した後、線で結べば、図 1のロレンツ曲線が儲ける。 ④図 I の A~D の台形 (A も上辺が 0 の台形とみなす)の面積を求めるために、上底の値をセット する。 ⑤ A~D の台形の面積を求める。 ⑥台形全部の面積を合計して、累積台形面積を求める。 . 5 )から累積台形面積を引き算して弓形の面積を求める。 ⑦対角線で、切った正三角形(面積 0 ③ ジ ニ 係 数 は 正 三 角 形 を 1としたときの弓形の割合だから、弓形の面積を 2倍する。 2 . 3 ジニ係数を計算する S A Sプログラムの作成過程 前掲の表 1を基にジニ係数を計算する S A Sプログラムを作成し、末尾の付録に載せた。 S A Sでプログラミ ングを行う場合は、 S A Sデータセットの加工をしていくので、他のプログラミング、言語でプログラム作成の A Sデータセットの変形作業手順を図式化しておく方がわかりや 際によく使われるフローチャートよりは、 S すく、便利である。 ジニ係数の計算過程が理解できるように、付録 2iこ載せたマクロ化する前の通常の S A Sプログラムを使っ て 、 S A Sプログラムの作成過程を説明する。このプログラムでは、各 d a t aステップや p r o cステップで作成 された S A Sデータセットが見えるように、 p r o cp r i n tをそれぞれの後ろに付けているが、データ件数が膨大 r o cpn日tはない方がよい。 O U T P U T画面に出力する時聞がかかるし、記憶容量が制限オーバ な時は、この p ーになり、計算が終了しないことにもなりかねないからである。 U T P U T画面である。同図には、先の表 lの r E x c e lによるジニ係 図 3はそのプログラムを実行した結果の O r o cpnntの t i t l e文に対応させて見れば、 数計算手順」のどの手順に対応するかも表示している。また、 p 各d a t aステップや p r o cステップで作成された S A Sデータセットが見える。これを図式化したものが、図 4 である。この図から、データセットがどのように加工されていったかの軌跡を見ることができる。この図は L o r e r 立 α E精 A Sプ 先の表 lとよく似てし、る。つまり、表 1を見ながら S ログラムを書いていけばいいことになる。 ロレンツ曲線(図 2)を描く際には、ジニ係数を計算した A Sデータセットを利用し、 p r o cg p l o tで O D S 際の副産物の S C O u t p u tD e l i v e r ys y s t e m ) を使って描いている。 I n c o m e 1 .0 0 . 9 0 . 8 0 . 7 0 . 6 0 . 5 0 . 4 0 . 3 0 . 2 0 . 1 0 . 0 D白 白. 2 0 . 4 0 . 6 口a 1 . 口 図 2 完成したロレンツ曲線 1 4 1

142.

3 . O U T P U Tのタイミングと R E T A I Nの効果 付 録 2のプログラム・リストに、プログラム作成上のポイントになる点を、 「解説 1~ 解説 6 J として表 示しているが、初心者のユーザーにはわかりにくい「解説 3J について、少し詳細に述べる。表 1と図 4で 斜めの下向き矢印が 4つ並んで、いる箇所の処理である。 data trapezium; keep shorter standard̲cumm̲income; rename standard̲cumm̲income=longer; s e t ; retain shorter 0 ; output; l l T l ̲income; I * T olet "Ionger" to be "shorter" for next o b s . * 1 shorterニstandard̲cul r u n . この dataステップでは、ロレンツ曲線が描く弓形の下にある台形の面積を次の dataステップで計算する 準備として、各台形の上底と下底を各オブザベーションにべアで揃える作業をしている。ここで f s e t J して いるデータセットの各オブザベーションには既に下底の長さがあり、上底として「直前のオブザベーション の下底」の値を持ってくればよい。先にも述べたが、 SASでは異なるオブザベーションの問のデータのやり とりに工夫が必要である。ここでは f retainJ を使って、直前のオブザベーションの値を引き継ぐようにし ている。問題は、この dataステップで、昌三三之ととから foutputJ するタイミングである。通常、 SASでは output文がなくてもデータセットに保存に行ってくれる。ところが、 dataステップのどこか lカ所でも output 文を使うと、その時しか、データセットに保存に行かなくなる。これは SAS言語の規則にある。つまり、こ の例では、 fshorter=standard̲cumm̲income;J の直後では通常の自動的な outputは実行されない。そうだと すれば、通常はこの命令文は無意味となるところであるが、実際には、変数 shorterが f retainJ で宣言さ れているので、ここで設定された shorterの値は直後のオブザベーションに引き継がれることになる。直後 のオブザベーションの処理に行った時の最初の実行命令文は outputなので、そこで、首尾良く上底と下底が 揃うオブザベーションができることになる。たったふたつの命令 foutput;shorter=standard̲cumm̲income;J しか実行文のない dataステップだが、その背景にはこれだけの SASの知識が必要となる。この f o u t p u tのタ e t a i nの効果 Jは、初心者には理解しにくい点であるが、これが分かれば S ASのプログラミング イミングと r レベルは確実に上達する。 4. 実戦用マクロプログラム 前節までの解説で使用したプログラムは、変数名やデータセット名が固定されているので、各ユーザーが 分析したい SASデータセットにはそのままでは利用できない。実戦用のプログラムとして、ジニ係数の計算 対象となる f S A S変数名 J と f S A Sデータセット名」をプログラム冒頭でマクロ言語で指定するだけで簡単に 使えるプログラムを付録 3に載せている。太字部分が付録 2のプログラムと異なる箇所である。 参考文献 森村英典他編 『統計・ O R活用事典』東京書籍、 1 9 8 4年 。 1 4 2

143.

o 0 1 5 1 5 2 5 4 0 ω 8 0 8 0 1 6 0 ata=star 1 a 玩 面 cu岡 Income l o n g e r shorter totaI ̲ n o 0 . 0 0 0 0 0 0 . 0 9 3 7 5 0 . 2 5 0 0 0 0 . 5 0 0 0 0 1 .0 0 0 0 0 0 . 0 0 0 0 0 0 . 0 0 0 0 0 0 . 0 9 3 7 5 0 . 2 5o 0 . 5 0o 4 4 4 4 4 I ncome 0 . 0 0 0 0 0 0 0 9 3 0 7 0 5 0 . 2 5 0 0 0 0 . 5 1 .0 ∞ ∞ ∞ ∞ under bow 0 . 0 0 0 . 2 5 0 . 5 0 0 . 7 0 5 0 0 0 0 4 9 2 9 7 O .0 9 3 7 5 0 . 1 8 7 5 0 0 . 0 0 0 . 2 5 0 . 5 0 0 . 7 5 1 .0 0 図 3 OUTPUT 函面の出力 ーーロレンツ曲線作庖 図 4 SASデータセットの作成過程 ‑1 4 3 tota1 under bow bow gini 0.16ω6 0 . 3 2 8 1 3 . 0 0 0 0 0 。 ∞ o∞ 0 0 . 0 1 1 7 2 0 . 0 1 1 7 2 di agona1 N O B S nununununu O B S ∞ ∞ 万 ∞ ∞ ∞ ∞ 目 印 ∞ 00025 tota1n o variable g ; i l 了寸云T雨 gini coeffici亘玩 mmm 1 .0 0 0 0 0 ( 7 )g l而 shorter nunununu‑‑ 1 η i : 認 詰i 只iし.舌J思~~息.. 0 0 . 5 0 ∞ ∞ 0 ∞ 0 longer O500D O B S . . . . .. O .0 0 0 0 0~... . 1 6 0 n u nununu 脚 叩 ︐ . ﹃ standard c u r r m [ncome 0 . 0 5 4 6 9 0 0 . 3 1 4 3 5 8 4 9 4

144.
[beta]
匝E 少数のデータの場合にのみ有効なジニ係数計算プログラム(マクロ言語使用)
首1
e
tn
=
4
:

*
S
p
e
ci
f
yt
h
en
u
m
b
e
ro
fs
a
m
p1
e
:
o
p
ti
o
n
sn
o
c
e
n
t
e
rn
o
d
a
t
en
o
n
u
m
b
e
r
:

d
a
t
ao
ri
g
i
n
a
l
;
叩l
e
&
n
: I
*
gi
nic
o
e
f
fi
ci
e
n
t
=
O
.3
2
8
1
3
*
1
i
n
p
u
ti
n
c
o
m
e
1
‑
i
n
c
c
a
r
d
s
:
1
52
5408
0
r
u
n
;
p
r
o
cp
r
i
n
t
:t
i
t
l
e"
O
r
i
g
i
n
a
lO
a
t
a
"
:r
u
n
:

/
事 Calculateg
i
n
ic
o
e
f
f
i
c
i
e
n
t*
1
d
a
t
ag
in
i:
setoriginal:
!n
)i
n
c
o
m
e1
‑i
n
c
o
m
e
品n
:
a
r
r
a
yx 品
d
oi
=
lt
o品n
:
/
吋 oj
=
lt
o&
n
:i
fi
<
=
jt
h
e
ns
i
g
m
a
+
a
b
s
(
x
!
i
)
‑
x{
j
)
)
: end:*1
d
oj
=
lt
o品n
:s
i
g
m
a
+
a
b
s
(
x
f
i
]
‑
x{
j
]
)
:e
n
d
:
e
n
d
:
1
*mean̲di
f
=(
si
g
m
a
*
2
)1
(
&
n
*
&
n
); 明eandi
f
f
e
r
e
n
c
e:
*
1
meand
i
f
=
s
il
!
l
l
la
l処刑品川*me
a
ndi
f
f
e
r
e
n
c
e
:
=
mean(
O
Fi
n
c
o
m
e1
‑i
n
c
o
m
e
品n
)
: *me
a
nv
a
l
u
e
:
mean
1(mean*2):
g
i
n
i
=
π
l
e
a
n
̲
di
f

;注:下線の 2行は、コメント文に j

iした 2行 と 入 れ 替 え て も 良 い 。 :

r
u
n
:
釦a
l
lO
a
t
a
"
:r
u
n
:
p
r
o
cp
r
i
n
t
:t
i
t
l
e"

I
寸録副

大容量のデータの場合のジニ係数計算プログラム(マクロ言語不使用)

面
王1
己
両 s nocenter nロdatenonumber:
ent
=
O
.3
2
8
1
3
*
1
data 口riginal: 1ホ Sam~le data: gini c口effici
i
r
1
Pu
1
:income‑OO:
~. .

C
e
r
Q
e
:
.
̲‑
‑
15254080

I
I j適宜、差し替える。

‑
> jデータセット名・
I i変数名 income

j

本
/ Ca1cu1ate ginecoefficient ホ
/
proc sort data=ロ
riginal: by income: r
u
n
:
u
n
:
pr口c print: title "(l)original": r
data income(keep=income cumm̲income)
cumm̲income(keep=cumm̲income re円 釧 e=(cumm̲income=tロ
t
a
l i
n
c
ロ
me)):
sel 口riginal end=last:
f瀧葺寸・....・・・ヱ草花Yぢお苧ご守主γ~" :f'伴;混ピモ・・1
i
f ̲n̲=l then d
o
: save̲income=inc聞 e
:
iいるが、初心者には別々に作成する方がわかりや!
i
ncome=O: cumm̲i
ncome=O:
iすいが、大容量のデータを想定して、実行時間を i
C
lut山t i
ncom~: ̲̲ .
j優先させた。
!
円c
ome=save I
円G口m
e
1
end:μAdd 勺円C四ne=O" on tロp of dataset "INCOME" *
cu町n Income+1円C口me:
e
:
output i
n
cロm
ーi
n
cロ
m
e
.
i
f last then output cumm
run:

:
m

pr口c prjnt qata=incom¥
l
:
tjtle
incロ m~"' rUD
proc print data=cumm̲income: title "(3)cumm̲income": r
u
n
:
m
e
:
data standard cumm i
n
cロ
[Icome;
dr口p 干
円C口m
ecu四n Income:
merge I
;
ru円

i
:
解説 2: わかりやすさのために、敢えて 2つ の :
L.~!!!.~ス之之プに分割した。_........................................

pr口c print data=standard̲cumm̲inc聞 e
: ti
t1
e"
(
4
)standard̲cumm̲i
ncome(
1
)"
:r
u
n
:
data standard̲cumm̲inc口m
e
;
keep standard̲cumm̲income:
set:
retain xtロ
t
a
l income:

r
u
n
.

i
f̲n̲=l then xtotal̲income= total̲income:
standard̲cumm̲income=cumm̲incomel近
ロ tal income:

proc print: title "data=standard̲cumm̲income(2)": r
u
n
:

̲1
4
4

145.
[beta]
d
a
t
at
r
a
p
e
z
i
u
m
;
ke~~ s
h
o
r
t
e
rs
t
a
n
d
a
r
d
̲
c
u
m
m
̲
in
c
o
m
e
;r
e
n
a
m
est'!E!9~E.9;9!!.~;.!.~.9~!!l.~:).!?'2fi!:!..:
s
e
t
;
1解 説 3: OUTPU子"おYマ '~':;;'!T,と了五tain芯.弱某,::"1
r
e
t
a
i
ns
h
o
r
t
e
r0
;
;
o
u
t
p
u
t
;
.̲
:注意。初心者には理解しにくい点である。,
s
i
I
6
r
t
e
r
=
s
t
a
n
d
a
r
d
̲
c
u
m
m
̲
in
c
o
m
e
;1
*
T
o1
e
t"
1O
n
g
E
i
"
r
'
‑
'
"
t
O百"今日。f
i
:e
γ"
尚
子
・n
e
'
x
・
:
i'
o
o
玄
.
*
'
7
"
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
r
u
n
;

一

p
r
o
cp
r
i
n
t
;t
i
t
l
e"
(
5
)
t
r
a
p
e
z
i
u
m
"
;r
u
n
;
p
r
o
cqat~sets 1
ibr~ry=work; cgnt~nts d
?
t
a
=
o
r
!g
i~~ 1~u!=no.of_o~s .(ke~ p'=nqbs) n
o
p
ri
n
t
;
r
u円; 1
本 T
oc
o
u
n
tt
h
e
'n
u
m
b
e
ro
fo
b
s
e
r
v
a
ti
o
n
si
nthedataset"
o
ri
gi
n
a1
"
.本 /
γ
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
・
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
p
r
o
cp
rI円td
a
t
a
=
n
o
̲
o
f̲
o
b
s
; ti
t1
e"(6)円。̲
o
f
̲
o
b
s
"
;r
u
n
; ~解説 4
d
a
t
aステップで r
n
o
b
s
+
l
;
J でも計算 i
し思議t.c.Æ,...本書.怠~z.:ニ才"の~~号念品 A主目点p..~古;ゑ.'":....i
d
a
t
ag
in
i
;
k
e
e
ps
h
o
r
t
e
rl
o
n
g
e
rt
q
t
a
l
̲
n
ou
n
d
e
r
̲
b
o
wt
o
t
a
l
̲
u
n
d
e
r
̲
b
o
wb
o
wg
i
n
i
;
m
e
r
g
e t
r
a
p
e
z
i
u
mn
o
̲
o
f
̲
o
b
se
n
d
=
l
a
s
t
;
r
e
t
a
i
nt
o
t
a
ln
o
;
i
f n=
1t
h
e
nt
o
t
a
ln
o
=
n
o
b
s
;
u
n
d
e
r̲
b
o
w
=(
s
h
o
r
t
e
r
+1
o
n
g
e
r
)本 (
l
/
t
o
t
a
l
̲
n
o
)1
2
;
t
o
t
a
l
‑
u
n
d
e
rb
o
w
+
u
n
d
e
rb
o
w
;

r
u
n
;

i
fl
a
s
tt
h
e
nd
o
;b
o
w
=
0
.
5
‑
t
o
t
a
l
̲
u
n
d
e
rb
o
w
;
桝 2
;
g
i
n
i
=
b
o
辛
口u
t
p
u
t
;本 M
a
k
et
h
i
sO
U
T
P
U
Tv
a
li
d
.i
fy
o
uw
a
n
to
n
l
yg
i
n
i
;
e
n
a・
瀧
説
, 5:…・・諺芙若手・ごすお事室了"jjf富あちU千
戸Uヂi
i
"
J
i
:
韮
.
.
.
.

p
r
o
cp
r
i
n
t
;t
i
t
l
e"
(
7
)g
i
n
i
:v
a
r
i
a
b
l
e'
g
i
n
i
'i
st
h
eg
i
n
ic
o
e
f
f
i
c
i
e
n
t
."
;r
u
n
;
/
本 D
r
a
wL
o
r
e
n
t
zC
u
r
v
e本/

d
a
t
al
o
r
e
n
z
;
本k
e
e
ps
t
a
n
d
a
r
d
̲
c
u
m
m
̲
i
n
c
o
m
ed
i
a
g
o
n
a
ln
;
/哨 a
K
ef
l
i
i
sK
E
E
Pv
a
T
i
d, i
ft
h
e
‑
d
a
t
a
s
e
ti
sh
u
g
e
.
*
1
r
e
t
a
i
nt
o
t
a
ln
o
;
r
e
n
a
m
es
t
a
n
d
a
r
dc
u
m
mi
n
c
o
m
e
=
i
n
c
o
m
e
;
m
e
r
g
es
t
a
n
d
a
r
d
̲
c
u
m
m
̲
i
n
c
o
m
en
o
̲
o
f
̲
o
b
s
;

r
u
n
;

i
f n=
1t
h
e
nt
o
t
a
ln
o
=
n
o
b
s
;
に
一l
)
/
t
o
t
a
l
̲
n
o
;
n
=亡
*Todrawadiagonal l
i
n
e*
1
d
i
a
g
o
n
a
l
=
n
;1

j解 説 6
ロレンツ曲線を鎗くときには、
j対角線も必要となる。
lp
r
o
cg
p
l
o
tで
、 o
v
e
r
l
a
yオプションを使って
L..~..i

p
r
o
cp
r
i
n
t
;t
i
t
l
e"
(
8
)l
o
r
e
n
z
"
;r
u
n
;
g
o
p
t
i
o
n
sr
e
s
e
t
=
a
l
lh
t
e
x
t
=
O
.
5
c
mv
s
i
z
e
=
8
c
mh
s
i
z
e
=
8
c
m
;
s
y
m
b
o
li
=
s
p
li
n
ef
=
x
s
w
i
s
sh
e
i
g
h
t
=
l
; 1
*i=joino
rs
p
li
n
e
*
1
a
x
j
s
)l
e
n
g
t
h
=
4
.
Q
c
m !aþe!=(hejg~t=Q.~cm f
=
s
i
m
p
l
e
x
)v
a
l
u
e
=
(
h
e
j
g
ht
=Q
.
3
c
mf
=
s
i
m
p
l
e
x
)o
T
T
s
e
t
=
(
O,O
)
a
x
i
s
2l
e
n
g
t
h
=
4
.
5
c
ml
a
b
e
l
=
(
h
e
i
g
h
t
=
O
.
3
c
mf
=
s
i
m
p
l
e
x
)v
a
l
u
e
=
(
h
e
i
g
h
t
=
O
.
3
c
mf
=
s
i
m
p
l
e
x
)o
f
f
s
e
t
=
(
O
:
O
)
;
istin~ c
l
o
s
e
;
o
d
s1
A
SForum平2008~lorenz. r
t
f
"
;
o
d
sr
t
ff
i
T
e
=
"
C平S
;̲
J
:
l
.o
t L~come*n ̲
di
a
g
9
p
a1
町 1o
v
e
r
l
a
yh
a
x
i
s
=
a
x
i
s
1v
a
x
i
s
=
a
x
i
s
2
;
p
r
o
cg
p
l口t
t
i
t1
e"
L
o
r
e
n
zC
u
r
v
e
"
;
r
u
n
; q~it;
o
d
sr
t
fc
l
o
s
e
;
o
d
s1
i
s
t
i
n
g
;

直面大容量のデータの場合のジニ係数計算プログラム(マクロ言語使用)

*
*デ-~セット名と変数名を指定して下さい.

*
S
A
Sd
a
t
a
s
e
t名,事 1
e
td
a
t
a
s
e
t
=
s
a
l
l
1
J1
e;
:I
l
e
t libname=C :~SAS_Forur蝉2008将ASprogr師事samp I
e
̲
d
a
t
a
s
e
t
:
;首 I
e
tv
a
r
̲
n
a
m
e
弔 問t
h
l
y
:

判 i
b
n
a
m
e

*変数名

*
寧・アウトプット画面に g
i
n
ii
嘉数だけを表示したい場合i
主
、

次の m
田 r
o変B:c
明l
l
l
e
n
tに「本」を指定して下さい.
・計算経過も表示したい場合は半角プランクを指定して下さい。;

首l
e
tc
聞
1
T
1e
n
t
=本
;

9~~l~~~ '29~~nt~~ !Q~~~!~ .
o
n
u
m
b
e
r
;
l
i
b
n
a
m
eg
i
n
i‑
&
1i
b
n副 官 , n
d
a
t
ao
r
i
g
i
n
a
l
:
k
e
e
plív 申 r_~a問;
s
e
fg
i
n
j
.!
d
a
t
a
s
e
t
;
r
e
n
a
m
e&
v
a
r̲
n
a
m
e
=
l
n
c
o
m
e
:
r
u
n
;
/
本 C
a
l
G
u
l
a
t
eR
i
n
ec
o
e
f
f
i
G
i
e
n
t本/
p
r
o
c5
0
r
td
a
t
a
=
o
r
i
g
i
n
a
l
;b
yi
n
G
叩 e
;r
u
n,

‑1
4
5‑

j

i

146.
[beta]
&
c叩 1
1
1
e
nt
.proc print: title "(1)original": &c叩 1
1
1
e
nt
.run:
k
e
e
p
二i
n
c
α
l
l
eC
Uf
1
1
T
lr
n
c叩 l
e
)
data i
nc叩 e(
C
Ul
l
1
1
1
̲i
nco~e (
k
e
ep=
cu
l
l
1
1
1
̲
income rename=(
C
Ul
l
1
1
1
̲i
nc
叩l
e
=
tota1i
n
c
o
m
e
)
):
set originalend=last:
i
f̲
n
̲
=
l then d
o
: save i
n
c聞 e
=
1ncome,
i
n
c何 =
O
: CUl
l
1
1
1i
n
c田 e
=
O
:
cutput i
ncom~:
Incαne=save JnCαne,
e
n
d
:1
牟 A
dd '
'
jn
come=σ. on top o
fdataset "INCOME" *
1

e

m川

0

e

m

Hu

pu

m

内

+
L
eu

Hい

品曹﹄

m 句
cn Hu
' u
mm
肘

川

HM 見M

m nb﹂
o
nt

nH

HMHus‑‑

l+LS

町内 uFtl
m
t
col

run,
&
c田 町 ent,proc print data=income:
title "
(
2
)i
n
c
o
m
e
"
: &c叩 町 e
n
t
.r
u
n
:
&c
田 町e
n
t
.proc p
ri
n
t data=cumm̲in
c
o
m
e
:t
it1
e"
(
3
)c
Ul
l
1
1
1
̲
in
c
o
m
e
"
: &col
l
1
1
1e
n
t
.r
u
n
:
l
1
1
1i
ncome:
data standard C
Ul
n
cO
l
1
I
邑
,
dropi
merge lncome c
u
n
u
n
̲
l
n
c
o
m
e
;
r
u
n
.

n
t
.proc p
ri
n
t data=standard̲cumm̲in
c
o
m
e
: ti
t1
e"
(
4
)standard̲cul
l
1
1
1
̲i
ncome(
1
)勺 &col
l
1
1
1e
n
t
.r
u
n
:
&c田 岡 e
ncome;
data standard c
u川 i
keepstanaard̲cumm̲i
n
c
o
m
e
:
s
e
t
:
r
e
t
ai
n xtota1 i
ncome:

r
u
n,

i
f n=
1 then xtota1I
ncome= tota1 i
n
c
o
m
e
:
両信 r
d̲cul
l
1
1
1
̲
income
己c
u
n
r
n
̲
ln
c
四n
e
/
x
t
o
t
aI
̲i
n
c
o
m
e
:
sta

&
c田 岡 e
n
t
.proc p
ri
n
t
: ti
t1
e"
(
4
)standard̲c叩

i
ncome(
2
)
"
:&
c田 岡 e
n
t
.r
u
n
:

data traDezi
u
m
:
keep shorter standard̲cu
間
i
n
c
o
m
e
: rename standard̲cul
l
1
1
1i
nc
叩l
e
=
1o
n
g
e
r
:
s
e
t
:
retain shorter 0
:
output:
l
1
1
1
̲
in
c
o
m
e
:1
牟T
ol
e
t'
'
Io
n
g
e
r
'
' to be horter" f
o
r next o
b
s
.牟 /
shorter=standard̲cul
r
u
n
;

、

r
i
n
t
: title "(5)tr叩 e
zi
u
m
"
:&
c
o
n
m
e
n
t
.r
u
n
:
&c凹 間 ent.proc p
)b
r,
a
ry
=
wo,
rk
: c9nt
,
ents d~ta=o r j
gi
~~ 1qu~=no~oιo~s !ke~e= nqbs) n
opri
n
t
:
proc qat~sets 1
牟 T
ocount the'number o
f observations i
i
i the dataset original 牟 /
r
u
n
:1
&c田 岡 e
n
t
.proc p
ri
n
t data=no̲of
̲
o
b
s
: ti
t
le"
(
6
)no̲of̲
o
b
s
"
:&
c
o
m
m
e
n
t
.r
u
n
:
data g
i
n
i
;
牟k
eep 号hcrter l
o
n
g
e
r total̲no under̲bow total̲under̲bow bowg
i
n
i
:
keepgini;
merge‑trapezi
um no̲of
̲obs end=1
a
s
t
:
retain t
o
t
a
ln
o
:
百 totaI̲no=nobs:
i
f ̲n̲=l the

=(shorter+1
o
n
g
e
r
)本(1I
t
o
t
aI̲no)1
2:
under̲bow
tota1under b
ow+under D
O
w
;

r
u
n
:

i
f1
ast then d
o
: bow
=
O
.5‑tota1under bow:
boW*2
: ̲
g
i
n
i=
outp
凶;本 M
aket
h
i
s OUTPUT v
a
li
d, i
f you want only g
i
n
i
:
eno,

proc p
r
i
n
t
: title "(7)gini: variable '
g
i
n
i
' i
s the g
i
n
i coefficient."
:r
u
n
:

/
本 DrawLorentz Curve *
1
data l
o
r
e
n
z
:
l
1
1
1
̲income diagonal n
:
keep standard̲cul
retai
ntotaI
̲
n
q
:
rename standard c叩町一 i
ncome=&var̲n四 e
:1
牟i
ncome ̲ &var
̲
n
a
m
e
*
1

>

merge standard̲cu冊 一 I
n
c
叩 en
o of o
b
s
:

r
u
n
.

i
f̲n̲
=
1 then totaI
̲
n
o
=
n
o
b
s
:
n=仁n̲‑l)/total̲no:
d
i
a
g
o
i
i
a
l
'
=
n
:1
牟 T
odraw adiagonal 1i
n
e*
1

&c
田 岡e
nt.procprint
: title "(日)lorenz": &col
l
1
1
1e
n
t
.r
u
n
:
goptions reset=all htext
ニO
.5cm v
si
ze=8叩 h
si
ze=8cm:

: 1
牟 i
=joino
rs
p
li
n
e
ホ
/
s
y
m
b
o
l i=spline f=xswiss height=1
a
xi
s11
e
n
g
t
r
=
4
.~cm 1
abe1
=(
r
ej
grt
=
Q
.~cm '
1
=
si
mp1
e
x
)v
a1
ue=(
h
ei
g
h
t
=
9
.~cm '
1
=
si
mp1
e
x
) 01
'
1
'set=(
9
.9
)
=
O
.3cm f
=
s
i
m
p
l
e
x
) value=(height=0.3cm f=simplex) offset=(O
,0
)
axis2 length=4.5cm label=(height
ods 1i
s
t
i
n
g close:
ods r
t
f
:
Proc g~ 1
o
t
: p1
ot &var̲name町 diagonal*n 1overlay haxis=axis1 vaxis=axis2: title "Lorenz Curve": r
u
n
:q
u
i
t
:
ods r
t
f close:
ods 1i
s
t
i
n
g
:

1
4
6̲

147.

ド!III!!m鳴らんふんかムジョんムジ一一 …一一一一 1 新入生がいだくコンビュータ操作に対する 不安の程度とその内容 安田晃 島根大学医学部医療情報学講座 S e v e r i t yo fworryandc o n t e n t s, t h a tfreshmenconceivetoward computero p e r a t i o n s A k i r aYasuda f Departmento fM e d i c a lI n f o r m a t i c s,Schoolo Medicine,ShimaneU n i v e r s i t y 同一一拾い …aaSi ふ一一川…一一一山内 I 要旨: コンビュータの操作が楽しい,楽しくない,どちらともいえないに 3 分 類した学生集団から医学科では情緒不安定性,外向性,調和性が, 看護学科では情緒不安定性,外向性,誠実性の意識構造が抽出 で、きた. キーワード:B i g F i v e尺度,動機づけ,医療情報学 ‑1 4 7‑

148.

「 認ζ 区 西 万 五 日 % に. ζ Z芯 三 ア ー 一 一 一 一 一 … 一 … 一 一 … 司 はじめに ・情報化の進展に伴い 一学習指導要領改訂による r 1 青報」の必要性 一高等学校に新教科「情報」が創設 一高校生は 2003年度以降の全員履修 .履修済みの学生は ー「情報」履修時は 1 年生が半分以上 ー「情報」と単純なパソコン(以下, P C )操作の区別がない ‑基本的なスキルのばらつきが大 一文書作成,表計算の基礎を知らない(あるいは忘れた)学生も ‑r 情報」を履修したことがない学生より少しはマシか を使う場合は, 一統計解析に PC ・解析方法の簡単な理論 ・データの性質 ・結果の解釈,など履修したことがメリットとならないことも 2 |凱蹴s臼ユ一ザ一総会アカデミ?…十九&~I) ソア川aリJ一 ρ 山…ン べ 日 I 本研究の目的 ‑被験者集団を医学科,看護学科新入生 .各集団の基礎的な情報の取得 ・コンビュータ不安調査 (CAS)からの解析 ・性格を判断するための 8 i g F i v e尺度からの考察 ‑60個の質問からおおよそ 5因子に抽出できることから .コンビュータ操作の嫌悪,好感を示す学生の意識構造 ‑CASからの考察 ‑B i g F i v e尺度からの考察 3 ‑1 4 8

149.

l 1 1 1 ιザー総会問ミμ ふふーんこら斗:ん‑ ィ 土 ぃ 一一一目 調査 ・対象 ー今年度入学の医学科 85名,看護学科 70名(編入生含む) .方法 一前期「情報科学概論 J 1回目に質問紙を配布 ‑質問紙 ・質問 1 高校での「情報 J 受講の有無 ・質問 2 CAS ・質問 3 PC利用に関するイメージ ・質問 4 PCを扱える程度 i g F i v e尺度 ・質問 5 B 4 1 1 ふぶふーんシI 二 平 面J lSASユ ーザー総会 切 れ I 千 解析に用いた質問紙 質問 2 コンビュータについてどのように思っていますか I 1 コンピュータの操作は事しくない。 2 コンピュータの前に座ったとき、品作の手順がはっきりとわかる。 まったくあてはまるから まったくあてはまらない までの 5件法 3 コンピュータを蝿伸するのをできるだけ避けている。 4.コンビュータに対して観しみを暗じている. 5 コンピュータを品作していても特に緊張しない。 6 抽作を央曲するのではなし、かといつも心配になる 7 コンピュータを慣うことをいつも畢しみにしている。 8 自分の操作に対してコンピュータがどんな反応をするか大体わかる 9 コンピュータを檀おうとすると不安な気持になる。 10 コンピュータについて説明してある本を読んで理解できる。 11 コンピュータを使うとき、リラックスして曲作できる。 12 操作したときのコンピュ タの反応をみるのが好きだ。 13 コンピュ タを使うのは暗いである。 14.コンピュ タを{吏うのが怖い。 15̲:::J'ンピュータに対していつも正しい曲作をすることができる。 16.コンピュータの前に厘つでも怖くなし、。 17. 自慣をもってヨンピュータを揖作ずることができる。 18 コ ン ピ ュ ー タ で 勉 強 す る の は 気 分 が い い 。 19 コンピュータの前に座ると怖いような感じがする。 20 コンピュータを操作すると、体が硬くなってしまう. I I I I I I I I I I I I ‑ ‑ ‑ ‑ ‑ f I I ・ 1 4 9‑ 5

150.
[beta]
WEIおおお万戸ヰホマァーャ何十~I
解析に用いた質問紙
.質問 2CASを以下のように略する
8
自分
の操
10
1
5
.
ビ
ュ
作に
1
. 1
2
.
1
7
.
20.
コン
ータ
コン 1
.ピ
1
9
. コン
6
. 7 対し 9
ビ
ュ
自信
の前 3
ュ コン 操作
5 操作 コン てコ コ
タ ビ
ュ した
ータ
ュ
ン ー
コン ピ
コン
を
 ピ
に対 1
6
.も
っ 1
8
.ビ
座つ ビ
ュ 4 コン を失 ピ
ュ J
ュ につ ータ とき
ユ ータ
たと ータ コン ビ
ュ ータ いて を使 のコ 13.
して コン てコ コン ータ を操
ユ 敗す ータ ピ
いつ ピ
き
 を操 ビ
ュ J ビ
ュ の前 作す
ュ ータ るの を使 ータ を使 説明 うとン コン
 ビ
う し
ュ ピ
ュ 14 も正 ータ ピ
 がど お
て き
ュ ータ に座る
コン 操作 作す ータ を操 では つ

ビ
ュ の手 るの に対 作し ない とを んな とす あるリ ータ ータ コン しL の前 ータ で勉 ると と
を操 強す 怖い 体が
慣が をで し
ュ 操作
ータ l
て てい かと いつ 反応 ると 本を フツ の反 を使 ビ
う 硬く
の操 はっ きる 親し ても いつ も楽 をす 不安 読ん クス 応を うの ータ をす 座つ 作す るの ょ
1
) しみ るか な気 で理 し
ま気 な感 なっ
り だけ みを 特
!
こ も1
て みる は嫌 を使 るこ ても るこ l
作は き
楽し とわ 避け 感じ 緊張 配に にし 大体 持に 解で 操作 のが いで うの とが 怖く とが 分が じが てし
く
な か てい てい し
な な てい わか な き でき 好き あ が怖 でき な でき い す ま

 る
,
¥
 る
し1 L
 {

反応
緊張
本f
:
:
J
慎
正し
楽し 手I
怖く
気分 恐怖
楽し 反
の
理
応 不安
よる フツ の好 嫌悪 恐怖 い操
く
な の理 回避 親近 しな 失敗
自信 いい
ない
惑
み
感
解
作
い
理解 クス 感
い 解
6
2
.
コン

ーョンいシ

[山l1li二ザ二総会アカチミア子クノロジ‑&'1

解析に用いた質問紙
B
i
g
F
i
v
e尺度の質問

.τa.

一

一

固
.

,

'園周@臥下の・ n
置 " " ・ の . . ,~ t 8 " に ど れ 〈 ら い . て ' " り 軍 司rIl‑.
f きい.還." の 血 且 "
と但むです
盲時 ."1:
,
"1:ら・ぃ

.畦 f

‑質問 5

円

川

小

一
一I

,.

Zの よ う に 叉 a の U t 1
: を つ " て 〈
. . "1 : , > "
・ τ
て阻・・
岨官ら@い

1反統的

:

I

"良心的な

,..."ぃ

:

I

"齢匝伎のある

,"み込 h "はやい

"轟的喧量の魁い

4 置ーな

"11つ 曹 や す い

, . .."..量哩な

E 周直な

"匝慣な

7凡咽"な

"平捕な

E 祖立した

" d但 カ に と ん だ

ー'ーしやすい

2書 置 置 に , < >

"南極的な

"暗い

"自己中 u 的

"軍大な

"帽臨祖

" , " り 行 !t
.t,せ

,,~膏心計檀い

"桐自力のある

" g量 的 な

...音骨の事い

!s..
e" 吊 し な い

"再開的

;
目

薗畢りっぱい

"かんし平〈もち
"昌也な

,,~情な

日開悼の広い

..週担且的

,,'よくよしな弘

咽世心配世

20 措 . 的 な

"圃."

"とげがある

"層買

22Z~2

^
'‑;('な

" g聞 庄 、 置 な

"事才な

"押昆置な

5岨 平 安 に な ワ キ す い

"人置い

"圃口"

"畠力的な

事事岨和"

"いい掴植な
"圃の回転の重い

"植創的な

"回国しやすい

5早 苗 み ",

"世史的

事

1
5
0

oM L僻7

151.

同芯弓二細説話拐幻す‑ 質問紙 反抗的 飽きっぽい 呑み込みがはやい 憂欝な 地味な 素直な 凡帳面な 独立した 緊張しやすい 積極的な 自己中心的 無節操 好奇心が強い 悲観的な 意思表示しない かんしゃくもち 勤勉な 興味の広い くよくよしない 活動的な とげカtある 軽率な 臨機応変な │神経質な 人嫌い 協力的な 無頓着な 頭の回転の速い 動揺しやすい 社交的 良心的な 計画性のある 美的感覚の鋭い 傷つきゃすい 無愛想な 親切な 不精な 想像力 f : : :とんだ 弱気になる 暗い 寛大な 成り行きまかせ 洞察力のある 気苦労の多い 外向的 怒りっぽい 怠惰な 進歩的 心配性 陽気な 短気 ルーズな 多才な 不安になりやすい 無口な 温和な いい加減な 独創的な 悩みがち │蓋し好き 8 「一一点告示品ふーんふーん;一一一一一ーサ吟 解析方法 ・各質問の基礎集計 各項目聞のクロス集計 ・質問2CAS(20項目)の非計量主成分分析 (CATPCA) ー「コンビュータの操作は楽しくなしリを否定,中庸,肯定に分割 ‑それぞれのステージにおいて,残りのゆ問を C ATPCA ・質問 5 B i g F i v e尺度 6 0項目 ‑CASでのそれぞれのステージから相関行列を計算 ・重みつきなし最小2乗法による因子分析 ・予備回転としてエ力マックス回転 ・因子聞の相関を前提にプロマックス回転 .解析はSAS9,SPSSVer.12 9 ‑1 5 1‑

152.

Y . 一 … 一 ‑一 {ふふら二総会がんらん‑…ふん一一 結果 高校での「情報」受講の有無,科目名 1 年 2年 3年 1 , 2年 2, 3年 受講なし 欠損 合計 4 里 l 情報A 7 1 情 報B 8 情 報C 情報 数学 欠損 合計 1 5 6 1 8 4 3 8 6 5 8 2 6 8 4 1 年 年 2 3 年 1 , 2 年 1 , 2 , 3 年 1 年o r2 年 高校以外の課程で屡修 合 計 医学科 情報A 4 8 情報B 情 報C Ao rB 外 1 3 A旦C以 未記入 合計 7 0 3 9 1 0 7 0 看護学科 1 0 E 南区区言語句怒沼完口広三‑‑一々弓仰向吋付命的吋I 均一間一 結果 ・質問 2の基礎集計(医学科) 近 緊彊しない 避 親 楽しくない 手順の理解 回 失敗 楽しみ 反応の理解 不安感 本による理解 まったくあてはまらない 2 1 0 3 0 1 7 2 5 7 11 2 1 9 1 5 1 1 9 1 53 1 1 2 2 3 1 2 9 12 6 8 2 0 1 5 1 6 2 6 7 1 9 9 1 8 2 1 1 8 2 8 1 2 1 9 1 7 5 1 7 2 2 2 7 1 3 1 0 1 4 1 5 2 5 2 0 4 2 0 2 2 2 2 1 6 4 ロ h呈 8 4 8 4 8 4 8 4 8 4 8 4 8 4 8 4 8 4 8 4 まったくあてはまる a t 。 怖 正しい操作 怖くない 自 信 リ フ ッ ク ス 反応の好感 嫌悪 恐 まったくあてはまる まったくあてはまらない t d 口h圭 置 9 2 5 1 5 2 1 1 4 4 5 1 0 1 91 7 5 1 2 5 1 4 2 8 1 9 1 8 1 72 62 7 8 4 8 4 8 4 8 4 気分いい 恐怖感 硬直 1 4 2 3 3 2 1 5 2 6 4 1 7 1 5 6 1 7 2 1 8 2 4 1 5 7 2 0 2 5 1 8 1 4 5 1 8 1 7 2 1 2 3 1 7 1 4 2 0 2 8 8 4 8 4 8 4 8 4 8 4 8 4 1 1 h 戸 U 1よ ワ 山

153.

市立ヰ誌な実‑初旬抗奴ア‑門戸ヤ吋問門「目 結果 ‑ 質 問 2の基礎集計(看護学科) 楽しくない 手順の理解 回避 毅近 緊張しない 失敗 楽しみ 反応の理解 不安感 本による理解 まったくあてはまらない 4 1 0 2 1 2 6 9 7 5 6 1 2 1 4 1 2 1 7 1 4 1 8 2 1 2 1 2 4 1 3 1 6 1 0 1 8 2 4 1 0 1 1 7 1 2 5 1 3 1 6 8 2 5 2 1 1 5 1 6 9 2 1 4 1 8 2 1 1 5 1 2 6 1 0 2 0 2 2 2 8 1 1 7 2 3 2 0 合計 7 0 7 0 7 0 7 0 7 0 7 0 7 0 1 7 0 7 0 まったくあてはまる 。 7 0 リフックス 反応の好感 嫌悪 恐怖 正しい操作 怖くない 自信 まったくあてはまらない 9 2 1 1 9 1 3 8 2 9 5 8 6 11 3 7 1 1 2 3 1 2 7 2 0 2 1 1 0 1 8 2 0 合計 7 0 7 0 7 0 7 0 まったくあてはまる 」ーー 3 2 2 2 9 1 6 2 1 1 9 1 6 1 0 4 1 8 2 3 墨盟霊 6 3 7 1 4 0 2 4 1 6 1 6 2 1 0 2 4 7 0 7 0 7 0 7 0 気分いい 3 9 1 7 硬直 4 1 0 1 2 1 6 2 8 7 0 7 0 1 2 川 ! 小 ヤ ー 下 一 一 υ山 川 … ー … … E ーャ川台、… S~ユーザー総会アカデミア〆子ヲノロジー晶ソリューンョンセy ション 結果 ・CATPCA(医学科, iコンビュータ操作は楽しくなしリの否定) 正しい操九 、 0 . 8 反応の理解 本による理俗" 0 . 6 手順の理ダ! 恐怖感 ‑ 0 . 8 0 . 4 0 . 8 ‑0. 4 ‑0. 6 ‑0. 8 13 14 qd Fυ 同

154.

!…竺そ手会三カデミ日ヲムジー&山 結果 ・CATPCA(医学科, r コンビュータ操作は楽しくなしリの中庸) 親近 0 . 6 ‑ 0 . 8 1 4 ー1 (臼叶ザー総会アザミア子りむ一一 W . a ! . I ョ ン ι γ い I 結果 ・CATPCA(医学科, r コンビュータ操作は楽しくなしリの肯定) 恐怖 1 ‑ 0 . 8 1 5 1 5 4‑

155.

r ! f . o l ユ ー ザ ー 総 会 ア カ デ ミ ア / テ ウ ノ ロ ジ ー 晶 ソ リ ュ ー シ ョ ン セ ッ シ ョ ン 一 . 一 一 一 一 一 一 一 ぃ 一 一一…一一叫ん S 結果 ・CATPCA(看護学科, r コンビュータ操作は楽しくなしリの否定) リ ラ ッ ウ ス 0 . 8 0 . 6 0 . 4 正しい操作 手順の理解 0 . 6 0 . 8 1 6 ヨ竺三?三年会ァーデミんんムル.ショんふん計十三 一一 一一 一 . 結果 ・CATPCA(看護学科, r コンビュータ操作は楽しくなしリの中庸) . 恐怖感 リ ラ ノ ヴ ス 0 . 6 怖くない ‑ 0 . 8 一1 1 5 5一 1 7

156.
[beta]
「~ユーザー総会ア出アノテヲノ己ジー島ソリユー山セ ;;-;"3 ン

y

小

E

山

結果

・CATPCA(看護学科, r
コンビュータ操作は楽しくなしリの肯定)
0
.
8

怖〈ない

‑0.
6

‑
0
.
8

1
8

…
‑

ZLzur‑‑‑n‑

南お字詰潟浮浪完災お

結果
・質問 5の因子解,医学科「楽しくない」の肯定
刷
出
│ h 蜘
側
地 t
叫} 1
u
は
(
礼
恥
1
L
¥
峨t
I~i~訴は~ ¥ O.~~ 4~1~~Jff~*かせ
。.8!~
腕
4
i
l
(
l
1
1
f
f
能
ド荷│割付い O.~~ 411~肱
~~~~\
lil~富論

~i 臨蛇
ギ話~q)多~\

M樹脂

時限立
。
1 O
話
し
僻
o
。
m I
l
i
捌
0.1~i

。
日
} ~I)'臨 1
。
目
。 I
I
I
!
民
自

i 関Mt~\

O~I

日
閣
制I
t
;

~.11~

OÆ~

1
1
宮
崎

j~ 誕l 唱す[,\

~LI!

日値ii.D~

同c
a h 品m
曲
i
ま
I
I

u

曲
目

~~軽鞍

欄S
u
l
8 日
u
l
M 0
1
日
捕I

協
1
5
c
!
町i,

町
品 島
m
c
l
o
r
4。
o
.
m 自社~~
i
日 Igllt~~~\
O
.
m
l ll~Mnql札1 。
0
舗
1
. i
4
割
引
か
自
o
.
m
l 4嗣
。
o
O
l I~ 翻肱
0
1
.
1
4 111CffD~踊

脚
。 出願な

i
叩

u
l
l
i J
闘t O.~ III!D~
l
n
日
。l 相 I~\
車
蝦
1
U
l
1
1 1
m o
W~t~IDnl臨I 。
l
瞬時
U~i
.
!
O I
U
l
o
i 1il~乱材t\ 。
も
し
判
鵠
l
b
'
。
拙│ I
,
臨1
u
l
1
i 1)
I
荷
な
1
盟
q
t
叫1 111~齢
O~l o
t
制│ 1
自樹脂
0~11
&
醐
自
制
1
齢η
I
t
l
¥ n
日
1 !~IW1 1.1it\
I

制
。 時難
0
.
4
日 自 I~\

加
。d

出
。

O
.
I
D
!
o
.
m

副
。
同
。
O.~!

O.4~

~1!Dti
4
書
官J

O.l~

制
慨
が1
:
J
.
.
t
: O.~O

O.4~

。
.
m 4
1
[
t
i
;
t
i
凶
。 曲
話L
賠
M
J
1 見醜[~r1

O.~I

0
.
1
4
O
A
!
O.~I
川
)
J

1
9

1
5
6‑

157.
[beta]
同 諸 湾 攻 お 浜M ノ ー ♂ι
jジ吉川ッジョシ

ゴ

一
三
‑
一
人
?

片

結果
質問 5の因子解,医学科「楽しくない」の中庸
問
l
担m 細
川
e
!
o
r
l協 除
t
e
m a
a
c
t
町4 地
a
c
t
o
r
l 臨 胞m 初出l 地 r
目 IJlt\~閣議な
M
) l
白
臨f
f
g 曲
。
1
0 目
o
.
m 自画咽駒郡1 O
J
.
O
特
l
l
!
慢
自
E
樹
脂
目
n
担
軽
斡
O
.
J
O
i 4l 間勅m~~ o
o
.
m
m )11~~
o
m
。!~ !
防肱
2
1
1
1
A
t
g
o
.
m J
臨
前
O
.
M
! 1~llf前首都t !
.
0
4
H
2君
o
.
m 4
自
社
制
J
.
o
曲
O
.
!
O
l
l
o
.
m 1
i
l
D
雌
~I~~'llf~\
O
.
!
2
2 4!1~~Jっぽい
0.~2
O
j
i o
目
論
崎県~
O.~~l
O
n
J
O 421~~J行苦悩 。.I~I 曲
l
輔雌
o
.
m
。
.
M
a l 自わぽ~ ¥ o
.
o
日
4 lHII脚~~\
o
m J
4舗
な
.
0
1
4
a 11 多?~
.
m
。
m l
1
4
4 4
。
同1
i
l
l
D
蹴
O
A
5
J 1
o
m ~Il~g
l
l
l
齢
1
&
捌
。1 目話しIf~
m l~lìtOO:伽踊 目
国
。i ælmi勧I:~t: 。
品
。i llln\~Jしゃ(杭 O~I
品
。
j 2!I~h蹴
)
1
鰭
位
0
.
4
!
1 121t碕ID~唱い
。
.
m
0
.
4
1 制酷m~~ 051~
叫
。 lll~的B蜘齢1 O
)
臨時
。
m 相 I~~\
0
.
4
J
I l
.
l
i
&i
l
l
i
蹴
な
o
m
Oj~J
却
。 2
m )1~Wg
O~目
0
.
4
1
0
1 &
I
i
i
乱t 。
I!I~肱
1
l
H
耐
品
。i 2
。
馴
│ 時鵬首由説~\ 訓
S
l
i
j
自
臨m
m
¥ 014~ 0
1自
己
中
│
抽
叫│ l
o
i
1
r
u
f
g
o
m

III!D~
相 I~\

~IIÁ臨t

i
地
階
~1I~[部品

1
4外
向
的
4JI~管t

1鰻齢
相
践
的
1OIá2中ID~

自
社
副
lJIf'rn~

20

市鮮問お京野努認詑均学芸除手F吋 吋...町村市竹内問一E
結果
質問 5の因子解,医学科「楽しくない」の否定
恥
t
叩
判 ~um~~\

a
e
t
o
r
l 地 臨m
.
O
i
!
i 出乱惜
日航悦
。
m 日E
諮
問自:制材~\ O
.
M
l 1&11脚~~\
社E
的
O
.
l
l 自
i
l
R
I
し
や
す
い
O
.
!
&
l 日2
肱
!
4
i
D
I
臨
al{以よVg~\
。
m !
酢
I
l
蜘
な
l
l
l
lili~I~~
o
m l
1411,n示~\ O
.
w 別胡蹴
4
1つ
押
す¥
t o
.
m ~IÁ臨I
~i 副首し~tt\
0
.
4
!
i 叫聴な
自
臨
f
J
6
日
神
経W
g
0
.
4
1
1 自
411;~

。
拙

rol~~Wg

~.,

0

・

ktor~

地

。
m )ll~~

e
t
o
r
lh
r
t
e
m a

m r
e
c
t
o
r
4協

臨

B

l
包m k
t
o
r
l

組
盟
申h
l
:
W
:O
4制憎まかt O~â
.
J
I
O 2
.
O
J
t
t
a !
1
盟
脆
o
m l
l
l
l
齢
O~I
。
m 1
.
O
幽 lmf奇心n~臨1
肱
o
.
m
1
l
i
l
D
。
叫 2
.
0
l
1J
な
o
.
m
4舗
J
I
!
踊t !
o
m )JI~\~幅跳‘
.
0
4
J
a
o
.
m I
l
n
騒
酷
品
。i 111~~IIØ拠1 O.~ô J
1硝t
0
.
4
n
拍
。i
0
.
4
1
i 唱跡的
O.~J
l
l
l
!
慢
自
往
き
っ1
f
t¥ o
o
.
m i
地
撤
0
.
4
J l
m
/
!
i
j
i
t
g 間1
品
。i u
O
.
4J 0
己
中
自
前
1自
o
m l
酷出品 間l 4
o
m
m
t
i
l
l
D
f
性
。
m 41 開票hm~~ 0
.
4
1
l l~lìt臨時E 0
1
&
J
品
。i !
o
m 日
つf
や
す
い
o
m
I
R
I
し
や
す
い
。Al~

o
m 4!1~~Jっli~\
1
l
H
部品
o
m 2
o
m 1
鮒
1
&
。
B
O
l 1
1
l
!
自
慢
o
m 2陸
軍t
。
5
2
1 o
楠肱
l
目
l
J 4
1
1
1
#
6
0
5
1
1 2
臨I
1
1
A
。
叫 l
齢
っ
ぼp
O
A
l
a ~â 自力肱
O
A
2
Si
信
し
や
す
い
2自

ー
‑
"
.
,
.
.
.
,

‘~‘._・

.
.
司1
.
.
.
'
.
.
'.
.

2
1

円

F同U

1よ

i

158.

「 l l ! t l!!!広努諒友克手合ソリ̲̲‑ョシ一一一一…一?………一一一目 結果 ・質問 5の因子解,看護学科「楽しくない」の肯定 臨 t 釧 時 ド S I臨 自 社 制 1 4制 的 1 0 l a 2 判 的 I騒 動 I)I!D~ 日腕 ~O 乱腕 m n ' 乱 。 ( 枯 細部っt~\ 4 1 1 1 訴 1 1自¥ 1 鮒? 凶i出 t 聞 品 臨m 協r~ 出 t m c ! o r 4協 目 l a . t o r l m m 包 目 曲 ~i I~凪~t\ o m IJlb~\蹴 . 1 0 曲 l 能~tí~\ O ! l 4 盤 的 0 曲 1 . Jln~酷 1 幽 ~It~脱 US~ ilR乱~lb\ 0~~4 ~Ui斡 掛W g O.1~~ S 叫1 l 1 1 ; g o . m 日 l l I 幌蜘拠t u m 4 ! l I し 起t M つ~~.れ1 j J 鰍 日 j 臨 o . m 0 1 . 1 1 閣 O.~il 0 M 4 ~i l 酷 l騎 │ 羽 o . m I o 1 . a出 鶴h l : 出 国~~ l~ln離目前 u mi W ト 怠 叫 │ l 4骨J @ I 踊 o o . m 目甜階 . m 判~!~@~~\ O.!O~ H轍雌 。 j醸し仲 O}~~ H 問主IJ~lt\ 阻 l脇 島 n mi 0 1 4 1 jJ l~齢 l I(~(ゆ 0 . 4 i 日臨l:Jg~ u mi O M Ji 4It~臨 0 1 1 1 41 1 m . 4 i l I O A l l ~J 1 ! l i f g 0 I調蹴 o m 4JI~撒 n~~a ~I 抑制 捌 。 0.4!~ 4 隈加ø~ J l1 帯 . ' 1i o mI a m 1411騒乱~b\ 11 ! 観 叫j ~I1'自主~相I Oll~ ~llm附 OJ~J d o m l~I!Wg l A m t ¥ H 傷 信 隆 ea t l自1f; ~n 事事前 u 強 盗 仙 台 M~A M M MM ¥ ^ ! Q l 加 。l r o . m O.~~í 0 . 2 l 1 日 1 日i O.~I 1 刺 O.M~ o . m 幽 。 幽 。 h 、 也 4 日 t 限 立 路 ぎ 協 湾 訪 紋[UJI諒 窃Y 時一一一.内?問吋円E 結果 ・質問 5の因子解,看護学科「楽しくない」の中庸 f h l . r r e m i l駒:純 i 5 I 僻ι t b i 4l u性 a . !1 っ き 材¥ b 包l a l 貼 島町 臨│ ! 4I~LJっぽい 幽1 l 喜 i f 6 協l !貼 d e l ! mm~ 地 . 梅田 f a c t o l 5 自 治 自臨騒な 。 盟 向 的 4外 o m5 1 岳 1 。 0 1 舗 , o m 1 4開 票 力 白 あ る 4駄な Q ! u 5!1~肱 . 0 1 # 盟 . 0 1 I l 1翻な o m1 似 Q ! 8 1 I . O 臨 ぃ。 I~ 好奇~b噴い o . m 担甜肱 1 i 捌 品 目 。l 。 . 5 l il li 幽4 ~llm陥る ( ) 蹴 ~I概却羽l: 必 11n~酷 必 。l に と んE 0 目 神 盛 貫 主 1か 札 ゃ ( も ち 0 . 4 l 1 E僻主 o . m5 5 . 1 誕櫛h 0 . 4 調 盟j 姐肱 1 H韓 極 的 な : 1 針 右 . O 4 l 5 皇制憎まかせ 出! 0 5 . 5 8 5 目 的 a l盟肱 l盟撤 0 . 4 0 1 諸説な o . m 111~jNg O a 4 8 o 。l l o 11 O.~ 0 . 5 l 1 日臨な 強調襲加踊 話 5筒 1 l d 組制i r い ゃ Q 。 即 . 1 目 日脱出血 1 国n O : 0 似 I~f I 荷D I 崎¥ b 0 oし 話l 背 I i ! ( よ ( よ は い 。 拙 8Iì!誼~t: 。l 日 却 。4 I O.~ij 翌 日 右 品開票加踊 却 l n 帳 敵 。 捌 日 多 才 な 0 ) , 4 1 相崎性 世l 4 . 1 4 H I ぬ社主的 l d 組制i r い ゃ0 出 ! 1 間l o 材 い 。 。 . m 報~~っt;t\ l協 力 的 な 0 . 4 l M碍│羽j 5臨 組 411~齢 0 1 日 1 I賊略い 0 . 4 1 0S 0 . 1 4 1 4 1章E 訴 し ら い 出 1翻S 川臥 ~J 1 傾 蓄 合 1 白 自 戸 自 の 的 白 9~ 1 9トr . m t , l 日事才世 日1A~ 0 9 . 4 A 町 ぬ 島 担祖性問踊 1 1書 簡 慢 引1 ¥ 加齢 鞘i 23 ‑1 5 8

159.

戸おヰ議お話万ロロ沈な対完ケザヤザマー同町村.11 結果 ・質問 5の因子解,看護学科「楽しくない」の否定 岡 悩c r l o r 1協 鶴 f a d c r l出 l r e m 包t 叫i 411g~っぽい 。~11 H つ f 材¥ 1 o m 目 制t ! n 0 . & 4 日 m o m ~l I~~ 相 ß~ Q~a~ 。 1 1 ! I 韓 酬 な O l . M ~1~~I:JgQ 1~I~h鵬 Q W d l蹴略¥ 1 On~ m . 1 4 1 目維駄 H 雨5 0 l ¥ n O.l~ 制箔蜘j m 0 5 1 1 jj!!~! 日乱~fき 叩 1 ~~鰻齢 。5i~ o . m ill~し材1\ ll&ffi~ 組 校 前 。 . I i li l ! ( よ ( 刷I o O M l 4 . m 1 1 1 雄 岬 。 日相羽材¥ 1山i ! l 翻 陥 o m !!~っIfl\ 山i 。 5 1 0 ~Im\勧叫んf 0.41~ ~IID~1 1 0 l e 己 中 │ 間 1 叫l 目閥肱 O A l l 目時斡 0 1 1 1 目縦し材¥ 。 l d 相 I~\ ! l 搬 n 4 1 o m ~I!~蹄 f b . i m m 日 目 論 ~~I!時 ~~蹴t ・ , . . . e , O A H ~!ル,-tfg O A U ~111\1\蹴 ・ . e ., , ‑ ‑ 晶 . . ' 司 A 盟 。 ! l n 帳 酷 淵 。 日 現 敏 . , . . Q4~~ u m 地 d l f f i 1 4舗t ~IÅ臨1\ 日航 陸 j j鮪 ~111\1\蹴 fudor~ O.~l O,~l O.~l 0 間 , 目 回 。1 血 。i 酷 I l i ! 4制行持制 0.~1 相I m ¥ 品 。1 l !l~削糊I . 0 l 4 1 拙 。 l j齢蹴 ~I!!O~ 曲乱蹄 I I盟 肱 _J'- "," ~I o,n~ 0 J 1 1 0.~1 ' 2 4 τ ‑一九一一一…‑ 1 1 …‑話会 が …J 一一二二二不ン A 考察(質問調査全体から) 高校における「情報」の理解は十分か? • PC操作はできる,できないの分散が大 ・背景には受講年次,何を教わったかが問題 「情報科学概論」でのスタンスは主に PCによる統計解析 • PC操作のスキル以外に論理面も求めたい 25 ‑1 5 9‑

160.

l.ュふ総会んヂザ/テラムジ~j ユージョンいヨン ー I い 考察(CATPCAから) • PC操作が「楽しくない」の肯定,否定,中庸の分割から .医学科では ‑否定の意味次元は明確 一中庸では反応,楽しみ,親近などが異なる次元に ー肯定の意味次元は複雑 ・楽観主義者に見られる傾向も .看護学科では ー否定の意味次元は明確 一中庸では好感,嫌悪以外の軸の存在 ・楽観性と自尊感情の相互作用 ‑肯定の意味次元は明確 26 [~ユーザー総会伝子 11巧ム九ソリーヨンいョシ… … へ ‑ 叩 川 山 川 市 目 考察(質問 5,BigFive尺度から) .医学科では ‑否定の第 1因子は情緒不安定 一中庸では外向性,調和性 一否定同様,情緒不安定性 ・両極端の意見で同質な因子 .看護学科では ー否定は外向性,調和性 一中庸では情緒不安定性,誠実性 ‑肯定は外向性,誠実性 一否定,肯定では同じような意味次元 .明確な因子が得られていない可能性も 27 1 6 0‑

161.

い た が な 一 九 日 7市 川 町 時 … ‑…四ーがいヨ;中的‑ ISASユーザー総会アカデミア/テヲノロジー&ソリューションセyショシ 結語 「情報」の履修によって 一入学時にスキルを十分つけていない学生もいる ーその逆も ーしかし電子メール,文書作成ソフト,表計算ソフトの操 作の基礎は理解 一統計解析ではスキルを十分発揮できないことも • CATPCAから ー操作の楽しさを感じない学生 ・医学科で、は PCへの好感,嫌悪の境界もつかめない .看護学科で、は PC操作の否定は十分な情報が入って いないことも • B i g F i v e尺度から ‑情緒不安定,外向性,誠実性のような意識構造 2 8 ‑1 6 1

162.

チュートリアル

163.

SASによるコクラン・アミテージ 噂( C o c hr a n ‑ A r m i t a g e )検定 東京理科大学 浜田知久馬 1 話の内容 コクラン・アミテージ検定の数理 コクラン・アミテージ検定の実行 FREQ MUじけE S T L O G I S T I C 正確なコクラン・アミテージ検定 2 ‑1 6 5

164.

対象データ 障 害 x 用量 (mgjkg) 2 3 4 5 5 1 5 3 5 8 5 2 0 0 一 + 生 存 死 6 4 5 5 1 4 6 5 5 9 計 死亡割合 亡 . 4 0 1 0 0 . 6 0 1 0 0 1 0 0 . 5 0 . 5 0 1 0 0 . 9 0 1 0 0 3 2値データの用量相関性の CA 検定 prop 死亡 rallA 盲リロ 0.9 0.8 0.7 0.61 本 0.5 0.4 1 〉 ド ヰ 〈 一一一一一 " 1 一 「 十 十 十 「 2 3 x 4 : 群 4 ‑1 6 6 5

165.

問題の定式化 i i = 1 F 2 F . . . F 5 0 Y j:個体 i の死亡状況を表すベルヌーイ変数 0 :生存 1 :死亡 Xj:個体 の薬剤投与量を表す独立変数 y :8 ( 1, π) E [ y ] = π ,V[y]=π(1‑π) π:母発現割合 5 FREQプロシジャの CA 検定 X = 1 to 5 ; do y=O to 1 ; input w @@;output; end;end; cards; 64 46 55 55 19 proc freq; tables y*x/trend; weight w ; run, 6 ‑1 6 7‑

166.

↓FREQプロシジャの出力 * 表:y x y x(群) (反応) 2 。 合計 3 4 5 5 5 4 2 1 6 0 . 0 0 5 0 . 0 0 5 0 . 0 0 1 0 . 0 0 6 0 . 0 0 4 5 9 6 5 29 4 0 . 0 0 5 0 . 0 0 5 0 . 0 0 9 0 . 0 0 4 0 . 0 0 6 合計 1 0 1 0 1 0 1 0 1 0 50 7 4 F m プロシジャの CA 検定 yどY の統計量 C o c h r a n ‑ A r m i t a g e傾向検定 統計量 ( z ) ‑ 1 . 8 2 3 5 片側 P rくZ 0 . 0 3 4 1 両側 Pr>I z l 0 . 0 6 8 2 サンフルサイズ=50 FREQプロシジャは 1行自の割合の傾向性を 評価するため Zは負になる 1 6 8‑ 8

167.

MUL TrESTフロシジャの CA検定 proc multtest o u t = o u t : class x : test c a ( y ) : : freqw data out:set o u t : 一 一̲ exp̲)/̲se̲: z=(̲value proc p r i n t : r u n : 9 日ULTrE D i s c r e t eV a r i a b l eT a b u l a t i o n s C o u n t NumObs P e r c e n t y 4 1 0 4 0 . 0 0 y 2 6 1 0 6 0 . 0 0 y 3 5 1 0 5 0 . 0 0 y 4 5 1 0 5 0 . 0 0 y 5 9 1 0 9 0 . 0 0 V a r i a b l e p‑Values x 一 o n t r a s t Raw V a r i a b l e C y Trend 0 . 0 7 1 0 MULTTESTは 0, 1, 2, 3, 4の スコアを使用 1 0 1 6 9‑

168.

F R E QとM U L l 丁 目T で微妙に 結果が異なる? FREQ , . . p = O . 0 6 8 2 MUじけEST p = O . 0 7 1 0 11 」 出力データセット ( o u t =オプション) OBS test CA var con 廿a st e x p ̲ se value ̲ y Trend 6 7 (xi ‑ 。 58 raw̲p z . 0 7 1 0 4 9 1 .80517 4 . 9 8 5 6 9 0 ~) Yi = ( 2 : X iY)‑ 玄2 :Yi x4+1x6+1 、Tす‑ ‑ + ¥ 3x 5 + 4 x 9 ‑ 2(4 + 6 + 5 + 5+ 9) 十分統計量 9 1 2 1 7 0‑

169.

4分散 L(Xi‑X)Yi V[ Y i ]==π(1‑π) u n d e r H 。 x y 一 x 一 z x n す ] 一 円 π x nT白川 Z V v Z統計量の分子: 1 3 コクラン・アミテージ検定 Y = エ l p Y エ(x P (1 ‑ P 河 ( ~) X ) Z i X i ‑ 2 ど (Xi‑7)(???Yi仰 の 推 定 値 F‑ エ p ) エ( X i 一 X )p ( X i ー =p L X ) 2 (X i X ) 。 14 ‑1 7 1‑

170.

例題への適用 斗 ιV: 29 p = )~ニム二一一= 0.58 : 4 で1 n 5 0 z=一一 エ(Xi‑ X)Yi 十 ・ l (1‑41(Xi‑D2 , J0.58 (1‑0.58)iO x(1‑3)2 十 } MULTTESTのCA 検定 2;(Xi‑x)Yi = 十 z (;~-:vtl ( 1‑ p (Xi ‑ ~) ぼ= =1.823 1. 8 0 5 1 6 1 7 2‑

171.

↓コクラン・アミテージ検定 議ド • FREQプロシジャ 2項分布に基づいて分散を計算 • MULTTEST プロシジャ 超幾何分布に基づいて分散を計算 川 町EST のZ統計量は J 子 倍 17 … M V L 廿 EST のb i n i a lオプシヨン proc multtest o u t = o u t : class x ; test ca(y/binomial); freq w ; data out:set o u t : z=(̲value 一一一e x p ̲ ) / ̲ s e ̲ ; proc print;run; 1 8 ‑1 7 3

172.

L 廿 E S T のb i n o m i n a lオプション エ(Xi‑Z)Yi p ‑ V a l u e s C o n t r a s tI Raw V a r i a b l eI Trend y I Z= p(l‑p)I( Xi‑ X ) 2 0 . 0 6 8 2 OBS I ̲ t e s t ̲I ̲ v a r ̲I ̲ c o n t r a s t ̲I ̲ v a l u e ̲I ̲ e x p ̲I ̲ s e ̲ CA I y 5 8 6 7 I Trend 問 w̲p Iz I 4 . 9 3 5 5 9I 0 . 0 6 8 2 2 9I 1 . 8 2 3 4 9 ハ ツ 句 ︑ 声 ︑ 戸A3Y d u A 坤・ ANY‑AU 一 4 一 5 一 × Ay u r A U o ︑ 戸o AY A 坤‑ e s 1 9 相関係数 2値データだけど 相関係数を .計算したら J 、 ? ・ 強) X X x X / ' x 2 0 ‑1 7 4‑

173.

ト P c o r r ; v a rx仰 qw; 附 一 、v も ム M 加 唱 裕 一 Pearsonの相関係数, N=50 帰無仮説 Rho=Oに対する Prob>I I r x y x 1.00000 y 。 0.25788 0.0706 .25788 0.0706 1.00000 2 1 P e a r s o nの相関係数と CA 検定 s I(x ~)( Y y ) i‑ i‑ ι s y yJZlixi‑hZ11(Yi‑7)Z r 2;(Xi‑x)(Yi‑ p ) 長(X h l z ‑ J ; ; ‑ i‑ 2項分布の分散 s=701=0258 1 7 5‑

174.

2値データの平方和 . 1 . L(Yi̲y)2=L(Yi̲p)2 1 0の数 i = l 1の数 = =n ( l ‑p) ( 0‑p ) 2+n p(1‑p ) 2 = =n p(1‑p) ( p+(1‑p ) ) 2 3 L相関係数(回帰係数)の検定 b = ; γ ヤ=ゐI [ b ]= S巧 S砂 I Z = i =人 I^2 iσ~ v S 1/-~xx I Svv /n =‑ J ; ‑ ,S I υ ~\I S 砂 ' ¥ . /SxxSvv " =‑J;.r N 事 =‑ J 5 O .0.258 =1.823 24 ‑1 7 6

175.

計量データの単回帰モデル 誤差 ε:等分散の正規分布 ε:N (0, σ) 。 。 y =β +β lX +ε, μ=β +β lX y‑μ r i 叫(‑( 2σ2 ) (J y ) = 1 ‑‑‑r 2 ‑ J21Cσ ノ 1 l 2 5 単回帰モデル y 二 。 β +β lX +ε βl β。 2 6 t t ヴ ヴ 1よ

176.

単回帰モデルの尤度と対数尤度 糊 i=βo+βixi+6: 了 Lぽ 叶 exn(‑iYi一 βoてβ1Xi) ~ì モ=~ 2 σ ‑L L ¥ ) 寸 (Yi‑β。 ‑β1Xi )2 l o gL=‑〉; A τ14σ 対数尤度最大化→残差平方和最小 最尤法=最小二乗法 27 最尤法対数尤度が最大になるように s I を推定 d d1 02 :L :スコア関数 U(β)= U(β)==0となる βを求める d21 02 :L I=‑ d βぞ :観察情報量 V I b ] 二 : 7 みの分散 2 8 ‑1 7 8

177.

l w 回帰分析 ウ : ; ‑ (Y i_:_~fJO"二二1Jí:ξ) ., 2σ2 残差の和は 0 。 Uo( β。)=山 a p o ャ( Yi‑β ‑ βlXi ) ャ = 2 J 2 = 乞‑ 7 σ 一 一 σ‑ X ど i ( Y iー へ ‑β i l=エ与 α ρ σ U1(β ' 1 )=dl T = l ‑e ‑e x( e ) "( X ‑x ) ( e ) i i i ニ エ Iσ2 ニ エ 相関係数は 0 2 9 ι 最尤推定量 l O2 :L二ーす( YiーβoてβlXi) 2 ) 2σ4 】 、 n ‑ , /‑ 1 Ir 八 一 一 八ー‑ Uo(so)二 一説一二 O=>sO二Y‑βlX d1 00"r ^ S U1(β ' 1 )= ーゴ ー =0二字 βl=ー 乙 d s l ~ S ← I ー エ (Xi‑X)(Yi‑y) L(X ̲ X ) 2 i 3 0 ‑1 7 9

178.

• 回帰分析のSASのプログラム例 斗六本のページ数と値段 ズ data book; input page price @ @ ; 1 6 72 7 0 0 4 3 24 3 0 0 3 6 34 9 8 0 4 7 95 5 0 0 5 3 55 9 5 0 6 1 06 3 0 0 6 1 66 7 9 0 4 1 56 8 9 0 6 1 08 7 0 0 1 3 7 21 3 0 0 01 8 6 proc reg graphics; model price=page; 3 1 本のページ数 P R I C E =1 8 6 8 . 4+ 8 . 2 9 1 9P A G E 1 6 0 0 0 N 1 0 R s q 0 . 8 8 6 0 A d j R s q 0 . 8 7 1 7 R tM S E 1 0 0 0 . 7 A I C 1 3 9 . 9 4 1 4 0 0 0 1 2 0 0 0 nHV ハHu ハHu nHV ハHU nHV nHυnku 一Z 止 U ︼ 6 0 0 0 4 0 0 0 2 0 0 0 。 2 0 0 4 0 0 6 0 0 8 0 0 P A G E P l o t +++PRICE*PAGE ‑ ‑PRED*PAGE 1 0 0 0 1 2 0 0 1 4 0 0 値段 ‑‑‑L 9 5 f M P A G E 一一‑U 9 5 M ; P A G E 32 ‑1 8 0

179.

残差=実測値ーモデルによる予測値 2000 + 残 1500 十 差 1000 ロ 500 「 亡3 。」ーー ー ± 一 一 十+ ‑ 5 0 0寸 十 + + ‑1000 一1 5 0 0 一一一一一一一一一一一 + + T T O 200 400 600 800 PAGE 1 0 0 0 1 2 0 0 1 4 0 0 X 残差の和は O.Xと残差の相関係数は O 3 3 情報行列 I と分散共分散行列 V n や む 一 l ogL 一 一 rt ‑ j 4 4 1 l L 手 。 d s o d s o 2 0 g L d1 ; d s o 日 一1 = 1 山 二 s1 d s 1d 2 σ σ2 d 利 引4 ‑ b l = 1 i J ‑ 1 L ‑ ca [ 引ム]v 列 34 ‑1 8 1

180.

三 │ £ £ lvzxi乍 ) 豆 や む 一 回帰係数の分散 } X, I i 2 I ‑ 2 x ‑ 2 L x X ‑+一一 2 2 2 σ σ σ n S x x S x x σ = nS x n X x L 2 2 σ σ S x x S x x 2 ^ 同] = σ 2 ( i + L )門局]=三 S x x 4 S x x+nx σ2 n σ2 i i ‑'T" 3 5 ↓回帰分析(傾きのみ) i Yi‑ Y==β1(Xi‑ X)+ε L ぽ日叫 す l OQ OQ L L ==ーア 】 (Yi ーヲゲ i-Z))~) ) ) 2 ( Xi‑X ( Y i‑Y‑βl 2 σ ム 36 1 8 2‑

181.

回帰分析(傾きのみ) β 1(Xi‑ X ) )2 2σ2 i‑ Y ‑ gL==‑L d l og L ャ(毛 ‑X)( Y i‑Y‑β( 弔‑ X ) ) 明)二つ房一二之J d β 2:(.弔ーがこら ‑ 分‑ エ ( X一吟か 一 β凡 =0 i i A =2 : 向一物一分ーら ‑ 2 : ( . 宅 ー が2 S x x 37 │ 回 帰 分 析 情 報 量I T 門宵γ 一 … d β l dßl~βl d l og L ャ(弓 -X)~-y-β(xi 一馬)) 明)=つ属‑乙 一 向̲ X ) 2 エ ー 1= d ニ 一 向 ‑X)2 S ‑ 2 ;d 二言 内 ] 二 ; 壬 3 8 ‑1 8 3

182.

ロジスティック回帰モテ、ル p:反応割合 一̲ 1 ' .‑ 日 exp俄+メ杭) 1 ~ ̲ 1 . , . l+exp俄 + β円)ノ日 l+exp俄 + β月) ̲I P i = = l+exp貯必 -A~り ‑ ムPi) 川 内 l o g i t( P i )= =l o g 1 = = ¥ '1‑ 3 9 112 1 31 41 51 計 016 1 41 51 51 1 2 1 114 1 61 51 51 91 2 9 尤度 L( I i k e l i h o o d ) =モデルの下でデータ が得られる確率 4 6 L= =P 1x ( l ‑ P l ) 6x P 2x ( 1 ‑ P 2 ) 4X・ .. p=exp(β0+β円) 1+e x p ( β + β円) 。 最尤推定量 :s、 。 s1を動かしてしが最も 大きくなるように推定 刈L E :M a x i m u mL i k e l i h o o dE s t i m a t o F o l ← 1 8 4

183.

L 喝 ぜ x(l一P2)4 尤度 L=pdJ×( 0 1一p ω 1 ) 6 β s o=一 ‑ 0 . 8 0 8 6 , 点 s l=0.3849 9 . 21 E‑15 k 6.EE‑15 3.09E‑15 3.37E‑17 ‑0.400 0 . 6 0 0 bO 41 主尤度と対数尤度 6 4 L= =P 1x ( l ‑P l ) 6xP 2x ( l ‑P 2 ) 4x… l o g L= =4・l o g p l+6・l o g ( 1 ‑P l )+ +6・l o g p 2+4・l o g ( 1 ‑P 2 )+・ p=exp(β0+β円 ) l + e x p ( s o+ β~Xi ) 42 1 8 5‑

184.

対数尤度 β。 =‑0.8086A=0.3849HI す: ‑34.19 ‑36.06 ‑37.93 ‑0.400 0 . 6 0 0 0 . 467 b O bl ∞0.200 ‑12 43 対数尤度の等高線図 b 1 0 . 6 司 ‑‑‑‑、、、¥、、、、、、、、、、 ‑ 、 「、 ー 、 、 ¥ ¥ ¥ ¥ ¥ 、 ¥ 、 ¥ 、 、 、 一、 ¥ごミ: ¥ ¥ ¥ ¥ ¥ ....__--~ 、 、 、 、 、 、 、--~ 、、 0 . 5 ~ 、、、、、、、、、、、、、 ¥ 八 示 ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑、 ¥' ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ‑ ¥ 、 0 . 4 1 -----~β。== ‑ 0 . 8 0 8仇均二0 3S49 ‑ ‑ ‑ ‑ ‑ ‑ 、 、 0 . 3 、 、 、 、 、 、 、 、 、 、 、 ‑ ‑ ‑ ‑ 、 、 、 、 、 、 . . . . . . . . ̲ ̲ ̲ ̲ 、 ‑ ‑ ‑. 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 ‑10 l o g l ‑ ¥ 、、 、 、、 、、 、¥ ¥ ¥ 、 、 、 ‑ ‑ ‑、 ‑ ‑ ‑、、、 0 . 2 ‑12 、 、、 、 ~ ー 一一、 喝 、 、 、 、 、 、 匂 句 、 、 、 、 、 、 ‑ ‑ ‑ ‑0.3 ‑37.649 町 、 、 ‑ .、 、 、 、 ‑0.6 ‑35.966 ‑0. 4 ‑35.124 一一 ‑34.282 44 1 8 6‑

185.

一般化した尤度と対数尤度 際 議 長 p‑= e x p( s o+βlXi) 1一 一 一 1 l+exp偽 + β円)/ ~ 1 +exp 偽 +β~Xi ) • • I • 1 I ドxp偽 + んi) y zI L= 円I I p 1‑Pi)ll‑yvII = I i̲ j ̲L‑‑‑rv‑u .11‑‑z/ J パ ~=fYi ¥ . L Y iJ I T [ l+叫ψ。 + βi X i) ] 2 : 0& logL= 工Yi(β。 +β~Xi) ‑ 1 )] 1+叫ψ。+んi Y jは0 , 1変数 45 ロジスティック回帰 p r o cl o g i s t i cd e s c e n d i n g : m o d e l y=x:freqw : r u n ; 46 1 8 7

186.

LOGISTICの出力 Te s t i n gG l o b a lN u l lH y p o t h e s i s :BET A=O F Pr>ChiSq I Chi‑Square D Test . 3 9 3 3 L ik e l i h o o dR a t i o3 0 . 0 6 5 5 Score 3 . 3 2 5 1 0 . 0 6 8 2 Wald 3 . 1 8 9 8 0 . 0 7 4 1 A n a l y s i so fMaximumL ik e l i h o o dE s t i m a t e s Pr>ChiSq Parameter D F Estimate Standard Wald Chi‑Square E r r o r I n t e r c e p t ‑ 0 . 8 0 8 6 0 . 6 8 7 8 1 . 3 8 2 0 0 . 2 3 9 8 x 0 . 3 8 4 9 0 . 2 1 5 5 3 . 1 8 9 8 0 . 0 7 4 1 4 7 ι 一般化した尤度と対数尤度 1 p=exp 偽+ βlXi)p = . . ‑ / l+exp( 1 x p( + β β円) +e s s o 円) o+ 咽 t ~ xp( s ド o+んJ y i if1 J ¥l‑yi ̲ I T つ n " " " " ( l ‑ p J l L=np/ Y i J ~=~Yi I T [ l+ 叫 伊0+卯 i)] ¥ : L 二 L l o g L=LYi(sO+s )‑Llo&l+叫 1 X i ψ。 +βixJ] 1変数 , Y jは0 4 8 ‑1 8 8‑

187.

スコア関数 ー エ log[l+exp(β。 +β~Xi) ] u β ' 0 )=今 L=LYi-L 州β0+β~XJ o( dso エ =(Yi‑pJ ~~, ~l+exp(β。 +β'1 X i) 残差の和は 0 U1(β ' 1) 二 dlogL=L X i Y i‑L 1Xi 仰 (β0+β~XJ 1+ e x p ( β +β1'Xi ) 。 二 ニ エ (Xi‑X)(Yi‑Pi) LXi(Yi‑P i ) 残差とXの相関係数は 0 49 八 八 β ラ 。β l同 日(s o )=L ( Y i ‑P i ) ~Gβl)= エ弓か'i-pJ 6 .l l E‑15 3.09E‑15 3 . 37E‑17 ‑0.400 0 . 6 0 0 ∞0.200 ‑12 5 0 一1 8 9

188.

情報行列 I = │ ‑ O 成 ‑ O 刈 1 = 1 工 (1‑ 0g 1 P i ) ~X~Pi (1- P i ) 1 ̲d logL‑d21 LI-l_~ン'iPi (1- Pi) xふ(1‑Pi) P i 2 目 。]αiμ] dβ~~β。 J 工 dβ;~βl ‑叩ム] 1 ム ] 推定値の分散は情報行列の逆行列によって与えられる. 5 1 情報量の計算 ) Uo (β'0) 二型笠主 =LYi-L~xp(ßo +s JXi e x p(s o+ β円) d2 10gL dU β。 ) ( o 。。 dβ。 d βd β ーで exp(ßo+β~ Xi) ( 1+e x p ( β。 + β i x J ) ‑ [ e x p ( β。 +βlxjr 1 [+exp(β。 + β I X J ) ] 2 ー 。 e x p ( β + β円) で LI‑‑LPi(1‑Pi) ~[I+exp(β。 +β内 )Y L . . i ーで 5 2 1 9 0‑

189.

情報量の計算 叩~) = 半 号i Y i‑LXi d s ! -'---J'~' ‑'‑‑‑J' ロP 伊 ~ +s!xJ ) 1 +e x p( s o+s ! x i d2 10gL dU!(β~) dβ~~βl d β l 。 。 。 ) y xi e x p ( β + β川 ( 1+ e x p ( β + β川 ) ‑ x i [ e x p ( β + β九 ~勺 [1 + 叫( s o+ん J ] 2 ーで =‑ZXI2r e x p( s o + β円 )ゎ 官ーヤ 一一三 x / "Pi(l‑Pi) I I +exp(β。 +β~Xi)r ‑‑ 5 3 スコア検定 H o :s1=0の勾 i a 2がOか 1JU1=D7)x=9 6.13E‑15 3.06E‑15 0 . 6 ‑120 0 . 0 54 ‑1 9 1‑

190.

スコア統計量 =utr1u l q U I ( t f j l t j = 中 い 1 ] ) ] 1 E ; 4 : 引 3 引 2 J h > エ 》 ぷ ニ J ぷ p ) ] エ む 馬 以 ( 川三 主 忍 記 ( : C Z 口 ; : ; : 己 J ; 口 ; 4 : )主 毛 x 引 i パ ; よ ( ; : : i一 が日 卜 、 j [ 日 ; 下 : Z : : ぺ l J : F : J : ; ] Jコ 1 1 V = 0ι 〕 ん ω 1 0 ∞ 0 J I 0 1 二 ::;V:(j;J: 1 ‑イ 5 5 スコア統計量 11‑IooIll‑IolI 1 0 エp(1‑p) エp(1‑p)工x/p(1‑p)‑(Ixip(1‑p)y エ イ p( 1‑p) ( Ixiy/n ‑p(l‑p) 工(Xi‑X)2 p(l‑p) 5 6 ‑1 9 2‑

191.

↓スコア統計量 e=U1711‑1 C~ (Yi‑P)XJ2 p ( l ‑ ‑p)I( Xi‑‑ X ) 2 =Z2 =3 . 3 2 5 1 57 スコア統計量 ・ 0 . 0 4 1 0 5 = =3 . 3 2 5 U1=~シi ‑p)x 9 i= ι ‑ 1 ~~ ユ ー : ‑ =0 . 0 4 1 0 5 p(l‑p))~(Xi ̲ X ) L logOR==β主 UlIll‑1 0 . 3 6 9 5 二 5 8 ‑1 9 3‑

192.

対数オッズ、比の近似分散 工(X X)2 p(l‑p) 一 i 0 . 5 8・0 . 4 2・1 0 0 二 0 . 0 4 1= 0 . 2 0 2 62 p(l‑p)(n‑l)SD2 分散は S 021こ反比例して小さくなる 分散は n lこ反比例して小さくなる 5 9 ロジスティック回帰の例数設計 β:xが 1単位変化したときの対数オッズ比 β2p ( l‑P)nSD2=( z α + z β y n = ‑ ( Z α + Z s Y β2 P( 1̲p)SD2 ヤα+ZβY ( β' S D)2p(l‑p ) 2 6 0 ‑1 9 4‑

193.

J正確なロジスティック回帰 斗二 proc logistic data=data descending; m o d e ly = x ; ; freq w exact x/outdist=out estimate=both; r u n ; 6 1 正確なロジスティック回帰 C o n d i t i o n a lE x a c tTe s t s E f f e c t│ T e s t │ S t a t i s t i cI p ‑ V a l u e E x a c t M i d x I Score 3 . 2 5 8 6 0 . 0 8 7 8 0 . 0 7 9 8 P r o b a b i l i t y 0 . 0 1 6 0 0 . 0 8 7 8 0 . 0 7 9 8 E x a c tParameterE s t i m a t e s ‑ V a l u e Parameter E s t i m a t e 95%C o n f i d e n c eL im i t sp x ‑ 0 . 3 7 7 0 ‑ 0 . 8 3 7 6 0 . 0 8 7 8 6 2 ‑1 9 5一

194.

回帰係数の十分統計量 S u f f i c i e n tS t a t i s t i c s Parameter I V a l u e I n t e r c e p t 1 2 9 x 1 9 6 x y 合計 。 2 3 4 6 4 5 5 計 ' Z 9 ア J : 1 、 、 〈 岡 互 10 10 10 Z P, 4 5 V 21 ¥ 6 5 5 9 2 s c o r e = 3 . 2 6 1 両周辺和を固定 LXiYi=lx4+2x6+・ ・+5x9=96 6 3 辺和を固定した下での十分統計量 y I X 。 1 1 2 1 3 1 4 1 5 エ 合計 。 10 9 2 … = =33.8 , ‑ . ̲,% 2 。。 2 1 8 10 10 29 XiYi=1 x0+2x1+ ・ +5xl0=116 y 。 エ x 合計 2 3 。。 10 10 9 。。 4 5 J r 2 s c o r e = 3 6 . 2 2 1 10 10 29 XiYi=1 x0+2x0・ + ‑1 9 6‑ +5xl0=117 64

195.

帰無仮説の下での十分統計量の分布 罫 確率 0.07 0.05 0.04 0.03 0.02 0 . 0 0.00 50 60 70 80 90 言 ー . . . , yx i y i : K JO 9 6 1 1 0 120 d ← 6 5 司 民o b 一 一 … 一 一 ‑X2score…の正確な確率関数一 0 . 1 6 0 . 1 4 0 . 1 2 0 . 1 0 0 . 0 8 0 . 0 6 0 . 0 4 111111 I I I o.ool~II!I!I ,I! 1 ,1 ,¥ 。 1 0 20 30 40 S c o r e 6 6 ‑1 9 7

196.

の正確な分布と理論分布の累積分布関数 Fの比較 X2score f s c o r e 10 0 . 9 F0.8 0 . 7 0 . 6 0 . 5 0.4 0 . 3 0 . 2 。 0 . 0 今 q u 4 6 , ? ヲ n o 9 1 0 ーIIe Sαコ f s c o r e 100 正確な p i 直 0 . 9 6 0 . 9 4 0 . 0 8 7 8 0 . 9 2 0 . 9 0 0 . 3s 叫 0 . 8 6 0 . 8 4 0 . 8 2 0 . 3 0 0 . 7 3 76 0. 74 0. 0. 72 70 0. 0 . 6 8 1 2 3 主 一品盟 ‑ 198 5 6

197.

F確なコクラン圃アミテージ検定 p r o cf r e qd a t a = d a t a : t a b l e sy * x / t r e n d : w e i g h tw : e x a c tt r e n d : 6 9 α 一mM一 か 一α 定一応一 hEl‑‑ 検一四一削一院一明一四 向一日一 f ‑ 199 0一0一 0o 頃己ー一 一 e‑ ‑ 一一一 gb 一一一一一 a 一一一一一一 α Z一凶一三恒 川一)一 一定一ぺ一ウ一定一ぺ一ふ 一 一 m一量一検一E R一 検 一E R け一計一近一側一側一確一側一側 α一統一漸一片一両一正片一両 確なコクラン・アミテージ検定 70

198.

干確なコクラン・アミテージ検定 以ぶ procmulttest d a t a二 data o u t p e r m = p e r m ; c l a s sx ; t e s tc a ( y / p e r m u t a t i o n = 5 0 ); f r e qw ; 7 1 確なコクラン・アミテージ検定 D i s c r e t eV a r i a b l eT a b u l a t i o n s V a r i a b l e x1 C o u n t NumObs P e r c e n t y 4 0 . 0 0 114 1 0 y 216 1 0 6 0 . 0 0 y 315 1 0 5 0 . 0 0 y 415 519 1 0 1 0 5 0 . 0 0 9 0 . 0 0 y p‑Values o n t r a s t Raw V a r i a b l e C y Trend 0.0878 72 ‑2 0 0一

199.

まとめコクラン・アミテージ検定 1 ) 0, 1の2値データに対して対比を用いた検定 MUじfTEST で解析 2 )相関係数を F n 倍したものがZ 統計量 CORR で解析 3 )ロジスティック回帰のスコア検定 LOGISTICで解析 73 ↓参考文献 ;ぷ:J;~ A g r e s t i, A .(1990), C a t e g o r i c a /DataAnaケ'S/~ら NewY o r k :JohnWiley&Sons, I n c ,P .(1955), " T e s t sf o rL inearTrend Armitage o n sandFrequencies, " i nPropo代i 8 i o m e t r i c , s 11,375‑386. 7 4 ‑2 0 1

200.

医薬品開発・製造販売

201.

H T M Lアプリケーションを用いた簡易 S A Sツールの開発事例 一臨床試験における症例数設計用ツールの構築一 0舟 尾 暢 男 $ 高 浪 洋 平 寧 噂武田薬品工業株式会社 医薬開発本部 日本開発センタ一統計解析部 S o m ec a s e so fd e v e l o p i n gs i m p l eS A St o o l sw i t hH T M LA p p li c a t i o n ‑C o n s t r u c t i o no ft o o l sf o rs a m p l es i z ec a l c u l a t i o ni nc l i n i c a lt r i a l‑ 市 F u n a oN o b u o * Y o h e iT a k a n a m i * T a k e d aP h a r m a c e u t i c a lC o m p a n y, L t d . SASプログラムを実行するための簡易ツール作成方法を紹介する。 G 印U Iを実装し 町 f 汀 T札 M L / J a v a S c r i p μ tのみで た本ツ一ルはH ある。実装例として症例数設計ツールを紹介する。 キーワード:アプリケーション構築、 HTMLApplication(HTA)、JavaScript、 Jscript、SAS、レポートの自動出力、他のソフトウェアの実行 1.はじめに 臨床試験の統計解析業務では、臨床試験が終わった後、 S A S によりデータ解析を行い、データ解析 結果に関する報告書を作成することが一般的であるが、最近の臨床試験における解析報告書の分量は 少なくなく、個々の臨床試験ごとに S A S プログラムを作成するのは非常に労力を要する。この問題を 解消する方法として、 S A Sプログラムの汎用マクロを作成する方法があり、その先には S A S の汎用マ クロを自動で実行するアプリケーションを開発する方法がある。さらに、 G U I で操作することが出来 るアプリケーションを開発してしまえば、 S A S の知識が無い人でも解析報告書を作成することが出来 るようになり、解析報告書を作成する工数確保が容易になる。 さ て 、 ア プ リ ケ ー シ ョ ン 開 発 言 語 と し て は 、 C件、 Java、 M i c r o s o f t "Y i s u a lB a s i c 'f o r S P . N E T "、 ア プ リ ケ ー シ ョ ン 開 発 環 境 と し て は 、 S A S ' AppDev Applications ( Y B A )、 MicrosoftO A Studio™、 Java E clip旬 、 M i c r o s o f t 'Y i s u a lS t u d i o .などがあるが、これらを用いて開発を行うデメ リットとして、新しい言語を覚える労力がかかり過ぎる、開発費用がかかり過ぎる、場合によっては サーバを立てる必要がある、などの問題がある。 A S を動作させ、 S A S プログラムを実行するため 本稿では、本ツールの入力闘面から W i n d o w s版 S の簡易ツールの作成方法を紹介する。本稿におけるツール作成方法の特徴を以下に挙げる。 ・ ・ 必要とする知識は「ホームページ作成のための HTML言語 J I JavaScript と J s c r i p t の限られ た知識」であり、本稿に出てくる知識だけでアプリケーションを作成することが出来る。 本稿で紹介した方法により作成したツールは、大規模なウェブアプリケーションとは異なり、 JavaScript等で記述された HTMLアプリケーションのみで構成されるため、作成およびメンテナ ンスが容易であることに加えて、 PCS A S のライセンスを除くウェプ、サーバ等の費用を必要としな し 、 。 ‑ 本稿で紹介した方法を適用することで、 SASを実行することも Windows のアプリケーションを実 行することも出来るため、 S A S とその他のアプリケーションを組み合わせてレポートを作成する ことも出来る。 本稿では、アプリケーションの開発例として、症例数設計に関するアプリケーション「例数設計く ん」の作成手順およびその概要を紹介する。 205 ‑

202.

2 .使用するツールの概要 まず、本稿で使用するツールの概要を紹介する。 H T M L HTML とは、ウェブページを記述するための言語である。 H T M L で記述されたファイルを閲覧するに n t e r n e tExplorer などのウェブブラウザを使用する。 は I J a v a S c r i p tと J S c r i p t ] a v a S c r i p t とは、主に H T M L に埋め込んで動作させるスクリプト言語であり、コンパイラを必要と しない手軽さが特徴である。ウェブページの上で「文字を入力 J r ボタンをクリック J r 統計量を算 a v a S c r i p t にはアプリケーションを操作する機能やファイルを 出する計算を実行」などが出来るが、 ] i c r o s o f t 社がこれらの機能を搭載するなどの拡張を 操作する機能が用意されていない。そこで、 M ]avaScriptに加えたものが ] S c r i p t である。本稿ではこの 2つを併用してツールを作成する。 H T M LA p p l i c a t i o n s HTMLApplications ( H T A ) とは、 H T M L ファイル(拡張子 1 .h t m l J )を拡張子 1 .h t a J として保存 h t m l,] a v aS c r i p t などのスクリプト し直したものである。 HTA はウェプページで実行できる機能 ( 言語, C S S など)をサポートしている。また、実行可能ファイル(拡張子 1 .e x e J )と同じようなア プリケーションとして動作させることが出来、ダブルクリックで起動させることが出来る。 R R とは、オープンソースかつフリーの統計解析用ソフトである。関数電卓、数値計算、プログラミ ング、統計解析などの機能がある。特に、グラフィックスの作成が容易に行えることが特徴である。 3 .H T M Lアプリケーションのサンプル集 本節では、 「例数設計くん」を開発するための基礎的なテクニックを紹介する目的で、 HTML アプリ ケーションのサンプルをいくつか紹介する。 ①単純な H T M Lアプリケーション まず、最もシンプルな HTMLアプリケーションの例を挙げる。まず、作成した HTMLアプリケーショ s a m p l e1 .h t a J という名前で適当なフォルダに保存する。この I s a m p l e1 .h t a J をダブルクリッ ンを I Microsoft ( R ) HTML クするか、 「 マ ウ ス を 右 ク リ ッ ク 」 → 「 プ ロ グ ラ ム を 実 行 す る 」 か ら I T M L アプリケーションを実行することが出来る。実行すると、 Applicationh o s t J を選択することで、 H . 1の真ん中に示したようなウインドウが表示される(ツール①とする)。このツール①の I R u n J 図3 ボタンをクリックすると、 W indowsのメモ帳が表示される。 E Z睡,), 4,,1 1 コ 持 1 M 問調司酢建議 s a m p l e 1 . h t a HTMlAp:"o(a n 1KB , づ ょJ 図3 . 1:s a m pI e1 .h ta ‑2 0 6

203.
[beta]
本ツールのプログラムを修正することで、 S
A
Sや他の W
i
n
d
o
w
s アプリケーションを実行するような
ツールを作成することが出来る。このツール①はテキストファイルで構成されており、適当なテキス
トエディタで編集することが出来る。ツール①の中身は以下のとおり。
プログラム 3
.
1 :ツール① r
s
a
m
pI
e1
.htaJ
0
1
: <
h
t
m
l
>
0
2
: :
くt
i
t
l
e
>
S
a
m
p
l
e
く/
t
i
t
l
e
>
e
a
d
>
0
3
: くh
0
4・;く s
c
r
i
p
tt
y
p
e
=
"
t
e
xt
/j
a
v
a
s
c
r
i
p
t
"
>
0
5
: !r
e
s
i
z
e
T
o
(
4
0
0
.3
0
0
)
;
0
6
: f
u
n
c
ti
o
nM
y
R
u
n(
){
J
"
)
0
7
:
M
y
S
h
e1 =n
e
wA
c
ti
v
e
X
O
b
j
e
c
t(
"
W
S
c
ri
p
t
.S
h
e1
0
8
:
M
y
S
h
e1
1
.E
x
e
c'
(n
o
t
e
p
a
d
')
0
9
: : M
y
S
h
e1
[=n
u1
1
1
0
: i
1
1
: !
く/
s
c
ri
p
t
>
1
2
: :
く/
h
e
a
d
>
1
3
: lくb
口d
y
>
!i
n
p
u
tt
y
p
e
=
"
b
u
t
t
o
n
"v
a[
u
e
=
"
R
u
n
"o
n
c[
i
c
k
=
"
M
y
R
u
n(
)"
>
1
4
: く
y
>
1
5
: i<
/
b口d
1
6
: <
/
h
t
m
l
>
以下にプログラムの中身に関する解説を付ける。

01‑16行自:H
T
M
Lアプリケーションは、最初と最後をく htmI>とく /htmI>でくくる。
0
2行目:く t
i
t
l
e
> とく /
t
i
t
l
e
> の問に HTMLアプリケーションのタイトルを入れる。
03‑12行目.く h
e
a
d
> くs
c
r
i
p
t.
.
.>とく /
s
c
r
i
p
t
> く/
h
e
a
d
> の聞に、 ]avascriptや ]
s
c
r
i
p
t の命
令を定義する。
0
5行自・関数 resizeTo(
横の幅,縦の幅)でウインドウの大きさをピクセル単位で指定する。
06‑10行自・関数 MyRunO を実行すると、メモ帳が起動される。
0
7行自 0
8行目でシェルを動作させるための準備をする。
0
8行目:0
7行目で準備した M
y
S
h
e
l
1を使用し、 n
o
t
e
p
a
dを実行する。イメージとしては、コ
マンドプロンプトから, n
o
t
e
p
a
d
' を実行するというイメージである。
もし、 S
A
S プログラムを実行する場合は、 8行目を以下のように書き換えればよい。
0
8
;

M
y
S
h
e
l
l
.E
x
e
c
(
'"C:/Program F
il
e
s
/
S
A
S
/
S
A
S9
.l/sas.exe" ‑sysin
"
C
:
/
t巴m
p
/s
a
m
pI
e1
.sas"ー l
o
g"C:/temp/sample1
.l
o
g
"
‑
p
ri
n
t"
C:
/
t
e
m
p
/
s
a
m
pI
e1
.txt" ‑nospI
a
s
h‑i
c
o
n
');

また、 R プログラムを実行する場合は、 8行目を以下のように書き換えればよい。

08:! M
y
S
h
e
l1
.E
x
e
c
(
'"C:/Program F
il
e
s
/
R
/
R
‑
2
.6
.2
/
b
i
n
/
R
.e
x
e
"
i
‑‑no‑restore ‑
‑
n
o
‑
s
a
v
eく 勺 :
/
t
e
m
p
/
s
a
m
p
l
e
3
.r
"
'
)
;

0
9行目:後処理。
13‑15行目・アプリケーションの見栄え(文字の表示、ボタンやメニューの配置)を定義する。
1
4行目:く i
n
p
u
tt
y
p
e
=
"
b
u
t
t
o
n
".
.
.>でボタンを配置する。 I
v
a
l
u
e
=
"
R
u
n
"
J でボタンのラベ
R
u
n
J とし、 I
o
n
c
li
c
k
=
"
M
y
R
u
n(
)
"J で 、 ボ タ ン を 押 し た と き の 動 作 ( こ の 場 合 は
ルを f
I
M
y
R叩 OJ を実行する)を定義する。

② H
T
M
Lファイルと Javascriptの部分の分離
I
sampleLh
t
a
Jは H
T
M
Lの命令と ]
a
v
a
s
c
r
i
p
tの命令が一緒になったファイルであるが、大規模なア
プリケーションを作成する場合は、 H
TML の命令と ]
a
v
a
s
c
r
i
p
t の命令を分離するのが効率的である。
以下に I
sampleLh
t
a
Jを I
sample2̲Lh
t
a
Jと I
s
a
m
p
l
e
2
̲
2
.j
s
J に分離する例を示す。

‑ 207

204.
[beta]
'
r
:
当
叫

2
1
1
1
'
.I(.~
HThL 内初出
1K日

,~諮問ETFiiu

図3
.
2:s
a叩 I
e
21
.h
旬、 s
a
m
p
l
e
2
̲
2
.j
s

r
s
a
m
p
l
e
2
̲1
.h
t
a
Jの 0
4行目の r
s
r
c
=
H
.
/
s
a
m
p
l
e
2
̲
2
.j
s
H
Jで r
s
a
m
p
l
e
2
̲
2
.j
s
J を呼び出しており、
r
s
a
m
p
l
e
2
̲
2
.j
S
J には、 ]
a
v
a
s
c
r
i
p
tの命令が定義されている。
.
2
.1:s
a
m
pI
e
2
̲1
.h
t
a
プログラム 3
くh
t
m
l
)
0
1
:i
くt
i
t
l巴)
S
a
m
p
l巴
く/
t
i
t
l
e
)
0
2
:I
釘
叫
d
0
3
:iくh巴a
0
4
: i くs
c
r
i
p
tl
a
n
g
u
a
g巴二H
ヘJ
a
v
a
S
c
r
i
p
t
"
s
c
r
i
p
t
)
s
r
c
=
"
.
/
s
a
m
p
l
e
2
̲
2
.j
s
"
)く!
h
e
a
d
)
0
5
:1く/
o
d
y
)
0
6
: b
!inputtype= utton"va1ueニ"Run"
0
7
:く
o
n
c1
i
c
k
=
"
M
y
R
u
n0"
)
0
8
:I
く/
b
o
d
y
)
く/
h
t
m
l
)
0
9
:i

く
:

、

プログラム 3
.
2
.
2:s
a
m
p1
e
2
̲
2
.j
s
01:!resizeToα002
0
0
);
f
u
n
c
ti
o
nM
y
R
u
n0 [
0
2
:i
0
3
:
!M
y
S
h
e
[
[=n
e
wA
c
t
i
v
e
X
O
b
j
e
c
t
(
"
W
S
c
r
i
p
t
.
S
h
e
[
[
"
)
0
4
:iM
y
S
h
e1
1
.E
x
e
c'
(n
o
t
e
p
a
d
')
0
5
:
:M
y
S
h
e1
1=n
uII
0
6
:i
}

③ S
A
Sファイルに文字を追記する H
T
M
Lアプリケーション
S
A
S ファイルにテキストを追記する H
T
M
Lアプリケーション r
s
a
m
p
l
e
3
.h
t
a (ツール③とする) Jを
作成する(図 3
.
3
)。

I
L
̲
‑
IClI
忍

島 ~ItR:-:l~一議盤機
Z 訪 日

7111~<Ð

編集@ 蘇

URj

I

議
霊
堂

VZ
睡 h

6d
讃

川・一一一←議畿管m

7
7
1
J
即時

s
am
p
l
e
3
.
s
a
s

6ASJ
1
J
ケ}
f
:
:
.
"
‑
"
'
A
.1KS

図3
.
3:s
a
m
pI
巴
1
.h
t
a
ツール③のテキストボックスに数値を入力した後、 「実行 J ボタンをクリックすると、実行終了を知
A
S ファイル r
s
a
m
p
l
e
3
.
s
a
s
J にマクロパラメータに関するテキストを
らせるダイアログが表示され、 S
.
3右)。生成された S
A
S プログラム r
s
a
m
p
l
e
3
.s
a
s
J の中身は以下のとおり。
追記する(図 3

一 208

205.
[beta]
プログラム 3
.3
.1:sampI
e
3
.sas
01: 目
! let n = 10
02: i
%I
et k 3

=

ツール③の中身は以下のとおり。
sampI
e
3
.htaJ
プログラム 3.3.2:ツール③ i

〈h
t
m
l〉

くt
itle>Sample</title>
i<head>
iくs
c
r
i
p
ttype="text/javascript">
0
0
)
;
ir
e
s
i
z
e
T
o(
3
0
0,2
I
f
u円c
t
i
o円 MyGetParameter0 {
v
a
rM
y
V
a
r
i
a
b
l
e
O
l, MyVariable02, MyScript, M
y
T
e
x
t;
.M
y
F
o
r
m
.M
y
t
e
x
t
b
o
x
O
l
M
y
V
a
r
i
a
b
l
e
O
l = docume円t
.M
y
F
o
r
m
.Mytextbox02
: M
y
V
a
ri
a
bI
e
0
2 = docume円t
="
"
) {
i i
f(
M
y
V
a
r
i
a
b
l
e
O
l!
="
"&MyVariable02 !
i
M
y
S
c
ri
p
t= newActi
veXObject(
"
S
c
ri
p
ti
円g
.F
il
e
S
y
s
t
e
m
O
b
j
e
c
t
"
);
r
u
e
)
;
!
MyText = M
y
S
c
r
i
p
t
.C
r
e
a
t
e
T
e
x
t
F
il
e
(
"
C
:
/
t
e
m
p
/
s
a
m
p
l
e
5
.s
a
s
", t
i
M
y
T
e
x
t
.WriteLine("
弘l
e
t円 = " + MyVariable01
.value+ " ;
"
)
:
M
y
T
e
x
t
.W
ri
teLi
n
e(
"
弘l
e
tk=" + MyVariableOtvalue+
!
M
y
T
e
x
t
.C
l
o
s
e0;

"つ,

I window.alert("セーブ完了:Vn円 = " + MyVariabIe01
.vaI
u
e+ "
V
n k= "+ M
y
V
a
ri
a
bI
e
0
2
.v
aI
u
e
)

内

︒︒ ︒︒ ︒︒

1ηζqu 必U守FhuC07'oon
咽
ヨ
ハ U 咽lηζqu 必斗 FhuC07'oonudnU41ηζ adau守FhuC07'non
ヨ nU41ηζ a
d 必斗 Fhuco7'
nununununununununut‑‑l 11145?ITita‑‑11 ι
ιqL ι ιqL ι ιqLqL内
﹂
内 dququ内﹂内﹂内﹂内﹂

i

内

!<
/
s
c
ri
pt>
i</head>
:<body>
<form 円ame="MyForm">
<
t
a
b
l
e border=O>
<tr>
<tdw
idth=O><p>n= </p></td>
<tdwidth=100><input 円ame="Mytextbox01
"t
y
p
e
=
"
t
e
x
t
" value="10" style="width:l00%;"></td>
<
/
t
r
>
くt
r>
<
t
d width=O><p>k=</p></td>
くt
dwi
d
t
h
=
l0
0
>くi
n
p
u
tname="Mytextbox02"type="text" value="3" style="width:l00
位。 </td>
</tr>
</table>
<br>
くi
n
p
u
tname="Mygetbutton"type="button" v
a
l
u
e
=
"実行 口n
cIi
ck="MyGetParameter0"
>
</form>
i</body>
iく/html>

ツール③ fsamp1e3.htaJ に出てくる主な命令について解説を付ける。
0618 行目:後に出てくるテキストボックス fMytextboxOlj

fMytextbox02J から値を取得して、
フォルダ fC:/temp/J に SAS ファイル fsample3.sasJ を生成してマクロパラメータを書き込み、書
き込みが終了したらその旨を知らせるダイアログを表示する関数 MyGetParameter() を定義する。
1
1行目:ファイルを開くためのオブ、ジェクト MyScript を定義する。
H
12行目:HC:/temp!samp1e3.sas を聞く。
1314 行目:テキスト「覧 1et n = .J を f
samp1e3.sasJ に書き出すことで、マクロパラメータ

を作成する。
15行目:"C:!temp!samp1e3.sas" を閉じる。
2240行目・ <input name=川 ytextboxO." type="text" .
.
. >でテキストボックスを表示する。見
栄えの関係上、 HTMLの表に関する命令を使用している。
H
42行目:<input name=HMygetbutton type="button" .
.
.>でボタンを配置する。
f
va1ue="実行 "
J
でボタンのラベルを「実行」とし、 ronc1ick=H MyGetParameter ()勺で、ボタンを押したときの
)
J を実行する)を定義する。
動作(この場合は fMyGetParameter (

‑209 ‑

206.

④メニュー選択を実装した H T M Lアプリケーション HTML アプリケーションを複数用意する。ラジオボタンとドロップダウンリストを選択した後、 IOKJ ボタンをクリック(実行)すると、 j j l Jの HTML アプリケーションを起動する Isample4̲1 .hta (ツール④とする) Jを作成する(図 3 . 4 )。 i M J L 竺f アゴ由一守 五 示 i L . ; ; . I 盆 品 幽t温 歯 菌 盤 髭 . : : . 坦i 三l 6メ ニュー① 可 「メニュー② 巴 ~ 泊 s a 叩m 叩 町 叫 p叩 … TMLA o o l i c缶ω t 悶t 2K8 司司喝 ゴ 図 3.4: samplel.hta ツール④の「メニュー①、メニュー②」をいずれか選択し、プルダウンメニューからリンク先を選 択して IOKJ ボタンをクリックすると、別の HTMLアプリケーションが起動される(簡単のため、 HTML アプリケーションの種類は Isample4̲2.批判のみとした)。ツール④の中身は以下のとおり。 プログラム 3.4: ツール④ Isample4̲1 .htaJ ) { else i f( n T y p e= 2 $("MySeI e c t " ) .opti ons[ i ] .text = M y A rr ay2[ iJ $("MySelect勺.options[i].value= MyValue2[iJ 1 11 jfunction GoO { M y S h e l 1 = newActiveXObject(WScri p t .She1 1" ): ; MyShe11 .Run( $("MySe1 e c t " ) .va1 u e .1 .f aI s e ): 飢 jυscript) ,</head) i </html) i <body onLoad="Switch( 1 )" ) ; <table a lign="center" border="O" width="95%") <tr) 団")<input type="radio" name="MyRadio" i d = MyRadio" o n G Iick="Switch( 1 )" checked) <td wi dth="50 メニュー①く/td) 3 6 : <td width="50%")<input type 三 " radio"name="MyRadio" id="MyRadio" o n G Iick="Switch(2)") メニュー②</td) 飢 ̲ 210 ̲

207.
[beta]
3
7
:
く/
t
r
>
r
>
3
8
: : くt
dc
o
l
s
p
a
n
=
"
2
"
)品n
b
s
p
;
<
/
t
d
>
3
9
: i くt
4
0
: iυtr>
4
1
:
<
t
r
>
4
2
:
<
t
d w
i
d
t
h
=
"
5
0
%
"
>
4
3
: i <
s
e
l
e
c
ts
i
z
e
=
"
l
"n
a
m
e
=
"
M
y
S
e
l
e
c
t
"i
d
=
"
M
y
S
e
l
e
c
t
"
)
叩t
i
o
n
>リンク A
<
/
o
p
t
i
o
n
>
4
4
: I <
4
5
:
くo
p
t
i
o
n
>リンク B
<
/
o
p
t
i
o
n
>
s
e
l
e
c
t
>
4
6・ i く/
4
7
: !υtd>
dwi
d
t
h
=
"
5
0
%
"
>
<i
n
p
u
tt
y
p
e
= u
t
t
o
n
"n
a
m
e
=
"
b
t
n
G
o
"v
aI
u
e
=
"0 K "o
n
cI
i
c
k
=
"
G
o0"
>
<
/
t
d
>
4
8
: [ くt
4
9
: [ <
/
t
r
>
5
0
:
<
/
t
a
bI
e
)
5
1
: i<
/
b
o
d
y
>
/
h
t
m
l
>
5
2・ i<

、

ツール④ i
sample4̲1
.h
t
a
J に出てくるし、く主な命令について解説を付ける。

06‑10 行自:メニューを構成する文字列 (
M
yArr
a
y
l、MyArr
a
y
2
) とリンク先のリスト (
M
y
V
a
l
u
e
l、
M
y
V
a
l
u
e
2
) など。
11‑13行目:ラジオボタンやテキストボックスの I
Dを取得するための関数 $
0 を定義する。
14‑25行自:ラジオボタンを選択したときにリストの中身を変更する関数 Switch0 を定義する。
26‑29行目
i
O
K
J ボタンをクリックしたときに、選択されているリンク先の HTMLアプリケーシヨ
ンを起動する関数 GoO を定義する。
35‑52行目.ラジオボタン、テキストボックス、 i
O
K
J ボタンを配置する。
36‑48行自 <
i
n
p
u
t type="radio" .
.
. >でラジオボタンを、
<
s
e
l
e
c
ts
i
z
e
=
"
l
" name="MySelect" .
.
. >でドロップダウンリストを配置する。
48行自:く i
n
p
u
ttype="button" n
a
m
e
=
"
b
t口G
o
".
.
. >で i
O
K
J ボタンを配置する。

4
.症例数設計簡易ツール「伊l
数設計くん」
本節では、簡易ツールの作成例として、臨床試験における症例数を設計するためのツール「例数設

‑
・

垂10
‑
1
,
,1

一一
ny一
ヨ
ω
小
一
点
一
石
川
一
ピ

一
鳳
一
金
一
一
則
一

両面直

im

副
市
量

P
C 内)の適当な場所に「例数設計くん.批判とフ
計くん」を紹介する。まず、ローカルドライブ内 (
ォルダを用意する(本稿では i
f
il
e
s
J フォルダを用意した)。

D
f
i
l
田

例数設計〈んh
泊
HTMl 戸;;~hcat!on

318

図4
.
1:s
a
m
p
l日4
.h
t
a
「例数設計くん.h
t
a
J と i
f
i
l
e
s
J フォルダの構造は以下のようになっている】。

1 なお、本節で出てきたアプリケーションの中身や S
A
Sプログラムは、まとめて末節
てきたプログラム」の節で紹介する。

̲2
1
1̲

r[参考 J r
例数設計くん Jで出

208.

・ ‑ 例数設計くん.hta:本体となる HTMLアプリケーション 1 f i l e s J フォルダ: 1 例数設計くん」を動作させるための部品が入ったフォルダ。 HTML アプ リケーション、 SASプログラム、パナーや背景用の画像などが含まれている。 由アん h t acation‑‑‑‑‑‑‑‑.本体となる HTMLアプリケーション HTMlAppl i ロ ‑‑‑→ f i l e s !?日叫芝山 応扇面~-"I i 白日町 1凶 t 田副t 仁 リ ρ M 日 0 1 . 刷 .り一̲t i ; 白日1̲tt e s t ̲ 0 2 . h t a ~機能別に分けられた HTML アプリケーション 白日1̲t匂吋3 . h t a I i 因。1̲tt e s t ̲ 0 1 . s a si 自: 1 1 : : 4 ぉ;:::ト伊蜘計?検出力を計算するための S A Sプログラム I f : )ban E l f 1 附 j 園出c k g r o u n d 2 . j p gト HTMLのパナーや背景の画像 : i 咽b a c k g r o u n d . j p gJ 図 4.2:設定ファイルが入っている rfilesJ フォルダの中身 t a J をクリックすると、図 4 . 3のようなアプリケーションが起動される 20 1 例数の 「例数設計くん.h 算出 J 1 検出力の算出 J 1 検出力カーブ」のいずれかを選択した後、例数設計等を行いたい検定手法 を選択して I O K J ボタンをクリックする。 込 .. ; J c t . 当 妥 合 I:li&晶画誼直直掴園.園田園園田臨誠滋議議謬.騒 : 例数設計〈ん 例数設計〈ん 構主手;去を沼化てから ( O K ]ポ)1ンをクリッ勿J て下乱、 梅宮手法を選干f もてから : tw ( o K lポ)1ンをクリックして下さい G 骨1 殴の算出 , 「検出力の算出 戸蘇議室ヨ 斗 おi 三j 警~;p 「検出力力」ブ ~と」 ~ ゴI I 図4 .3・「例数設計くん」本体画面 肢を学時閣解析 │ ぷ 図 4.4: r 例数設計くん」メニュー選択例 例数の算出 「例数設計くん.htaJ から「例数の算出」→ 1 2標本 t検定」を選択すると、 1 2標本 t検定・ 例数設計 ( Ol̲ttest̲Ol .h t a ) J が立ち上がる 3 L1や u な ど の 各 パ ラ メ ー タ の 値 を 設 定 し て I O K J ボタンをクリックすると、 12標本 t検定の例数設計を実行します」のダイアログが出た 0 2 3 r 伊l 数設計くん.h t a J のプログラムは I 参考プログラム l J を参照のこと。 r O l ̲ t t e s l ̲ O I . h t a J のプログラムは「参考プログラム 2 J を参照のこと。 ̲ 212 ̲

209.

後、例数の算出プログラム ( p r o cp o w巴r ) が実行され、結果が H T M Lファイルとして表示される。 SASシ ステム T h f' O~ι侃 PfO t:~山" " , γ胴 o‑w司n p! etT~ 幻 101 M e d l l[ ' i H e r e n : e 私 脇 謙 =' l日 0 ‑ = ド 日 L I 時 明 品巴= 10.05 当J L e r話 料 寄 議 袋灘 抗議U ̲ ~ 議 お こJ . 6 :実行結果 図4 図4 .5:2標本 t検定・Ol J 数設計 図4 . 7 :動作の流れ 参考までに、 一E 「X E .s a s Jと I p a r a m e t er .s a s J の中身を紹介する。 プログラム 4 .1:̲ E X E .s a s o p t i o n ss o u r c es o u r c e 2s y m b o l g e n 0 1 :! 首l e t̲ pa t h 1ニ C :平t e m p 平O l l数 設 計 く ん ; 0 2 :i 0 3 : 首l e t̲ p a t h 2=% s y s f u n c ( t r a n w r d ( & ̲ p a t h 1 .半 ./ ) ) 0 4 :i % i n c" . / f il e s / p a r a m e t e r .s a s " 型 , in c" ./ fi I e s / 0 1 ̲ t t e s t ̲ 0 1 .s a s " 0 5 :! ︐.︐︐ r a ︐ . nHvnHvnHvnuu 414lnunu ︐ +l ︐ +1 ‑ ‑ 一 一 一 一 = 1'uv ・ jnuaG a 内 vs nHJU ﹂Hau aJunvw" L+L+L4L み 巴 +LIlo m s a D 一 一 一 一‑ uaa‑ 内︽ auaGaGau ll‑‑ 胃w 百山首山首 w ︐ 42anι ‑‑‑‑‑‑‑ nunununU プログラム 4 . 2:p a r a m e t e r .s a s •••• ̲ 213 ̲ 銅 山 国 制 了 呂町内品吋 通 刈 て .7に示す。まず、 I O l ̲ t t e s t ̲ O l . h t a( 図 4 . 5 ) Jを実行すると、計算結果の出 実行の流れを図 4 力先や検定手法の種類を S A Sのマクロパラメータに格納する S A Sプログラム I ̲ E X E .s a s Jと 、 4 や σなどの各ノ号ラメータの値を S A S のマクロパラメータに格納する S A S プログラム I p a r a m e t e r .s a s J が生成される。その後、 I ̲ E X E . s a s J から例数の算出を行う S A S プログラム I O l ̲ t t e s t ̲ O l . s a s J を実行し、例数の算出を行い、結果を I r巴s u l t .h t m l J に出力する。ちなみ に、本プログラムでは p r o cp o w e r を用いて計算を行ったが、 d a t a ステップで例数設計の公式を 計算しでも、シミュレーションにより例数設計を行っても構わない。

210.
[beta]
検出力の算出
「例数設計くん.htaJ から「検出力の算出」→ i
2標 本 t検定」 を選択すると、
Ol
̲tt巴st̲02.hta) J が立ち上がる 4
0
定・例数設計 (

i
2標 本 t 検

而阿咽 h ・~.

1・ー什・"~尚一…

二j

図4
.
9
:実行結果

図4
.
8
:2標 本 t検定・例数設計

動 作 の 流 れ は 図 4.7 とほぼ同様である。 iOKJ ボタンをクリックすると、 SAS プ ロ グ ラ ム
i
̲
E
X
E
.s
a
s
J と iparam巴t巴r. s
a
s
J が生成される。その後、 i
̲
E
X
E
.s
a
s
J から例数の算出を行う SASプ
ログラム i01̲ttest̲02.sasJ を実行し、例数の算出を行い、結果を i
resu1t
.htmlJ に出力する。

検出力カーブの作成
「例数設計くん.htaJ から「検出力カーブ」→ i
2標本 t検定」を選択すると、 i
2標本 t検定・検
出力カーブ (Ol̲ttest̲03.hta) J が立ち上がる 5
0 検出力カーブを SAS で描いてもよいが、ここでは
SAS とその他のアプリケーションを組み合わせる例として、検出力の計算を SAS で行った後、結果を
CSVファイルに出力し、これを Rに読み込ませて検出力カーブを描くことにする。

竺︒

,,"点、.2!J
ニi

4
0

5
0

l﹂l

"
i
o
a
一
一
一
一
"
ヨ
'
=
"
P
o
一
‑
r
o
‑

@
0

1
L
:
:
:
:
[
o
o
5
一
一
一

目酔岬

︒
︒
︒
︒
︒

仏

e河 1"

∞. 0 h . 0

‑
z

ダ=
po
ーで二1
~Y , ~

︒
︒

t古ら

μL

点ダぬ

︒.!
・寸加

、:品川容ムタ晋授

1
"[OK}柑 ソ を 以 外i詐め
か
私
、
,
叩

• •

︒
︒
‑
a
︒
︒
︒
︒
︒
︒
︒
︒
︒
︒
︒
︒
︒
︒

笠岡三I

︒‑
‑
jilla‑‑Ee
‑'lilia‑‑1‑
4
﹃
︐
旬
︑
︐
・
l
i︐
f
‑
‑同
‑
︐
︒
/
抱一
脳
︐
︐
・
1‑
J
︒γ 叩

正
孟
斗
坦
阻
範
蒜
,
{
,

,え標語車、~掌E宅,.,_:j

3
C
N陣 rgrQy;>

園4
.
1
0
:2標 本 t検定・検出力カーブ

図4
.
1
1:実行結果

図 4
.1
0
) J を実行すると、計算結果の
実行の流れを園 4.12 に示す。まず、 i01̲ttest̲03.hta (
、
出力先や検定手法の種類を SAS のマクロパラメータに格納する SAS プログラム i̲EXE.sasJ と
Aや σ な ど の 各 パ ラ メ ー タ の 値 を SAS の マ ク ロ パ ラ メ ー タ に 格 納 す る SAS プ ロ グ ラ ム
iparam巴t巴r
.sasJ が生成される。その後、
i̲EXE.sasJ から例数の算出を行う SAS プログラム
iOl
̲ttest̲03.sasJ を 実 行 す る と 、 各 例 数 に お け る 検 出 力 の 算 出 を 行 っ た 後 、 結 果 を
401 t
t
e
o
t O~hta のプログラムは「参考プログラム 3J を参照のこと 0
[
> 0
1t
t
8
0
t0
3
.
h
t
aのプログラムは「参考プログラム 4
J を参照のこと。

2
1
4̲

211.

τ 瞥叩 ? ﹂ p a ra m e t e r . s a s 圃⁝酎一 寸 ﹂ 間品問‑ ア﹂ M ‑ 閣判官当 圃 I m y p o w巴 r .c s vJに出力すると同時に、検出力カーブを描くための R プログラム I m y p o w巴 r .R Jを m y p o w 巴 r .R J を実行し、検出力カーブ I m y p o w er .b m p J を出力する。 生成する。最後に I m y p o w e r . c s v 図4 . 1 2:動作の流れ I m y p o w er .R Jと I m y p o w巴 r .c s vJの中身を紹介する。 参考までに、 プログラム 4 .3:m y p o w e r .c s v 0,O .5 6 2 0 1 : ,1 .6 0 7 0 2 : i1 1 ,0 2 ,0 .6 4 9 0 3 : j1 0 4 :! 13.0.687 1 4,0 . 7 2 1 0 5 :! n u d n u d n u d nHU FhJV n u ︐ 1 凋斗 • プログラム 4 .4:m y p o w e r .R e a d .c s v( " C :/ t開 p / 例数設計くん / fi 1 e s / m y p o w e r .c s v ", h e a d = F ) 0 1 : ix く‑ r 0 2 : !b m p ( f il e n a m e = " C : / t e m p / 例数設計くん / fi 1 e s / m y p o w e r .b m p " ) 0 3 : 1p l口t( V 2 V 1, d a t aニx, t y p e二 " b ", x l a b = " Np e rg r口u p ", y l a b二 " p 口w e r " b li n e ( v = 1 7, I t y = 2,c o l = 2 ) 0 4 : ia . 8 0 7 0 3 6 7 1 5 1, l a b e l s = " N = l T, p o s二 2 ,c e x =1 .5, c o1 ニ2 ) 0 5 : it e x t ( 1 7, 0 0 6 : id e v . o f f O 陶 5 .おわりに HTML アプリケーションを使用することで、 GUI を備えたアプリケーションツールを簡単に作成する ことが出来、本ツールを使用することで GUI 上で SAS プログラムを実行してレポートを自動出力す ることが実現出来る。本稿で紹介した方法を適用するメリットとして、ツールの作成およびメンテナ ンスが容易であり、ウェブ、サーバ等を必要としないため開発・保守費用がかからない、作成されたツ ールは SAS を習得していない人にも操作が出来るため、運用コストも抑えられることが挙げられる。 W i n d o w s )パ デメリットとして、多言語に比べて HTML アプリケーションに関する資料が少ない、 OS ( ージョンアップによるプログラムの仕様変更が生じる可能性があることが挙げられる。ただ、メリッ トとデメリットを天秤にかけた場合、メリットの方が大きいと発表者は考える。ちなみに、本稿では 説明を簡単にするため、例数設計用のツールの作成方法を例に挙げたが、臨床試験に関するデータを 解析するためのツールを構築するときも、同様の方法が適用できることを最後に申し添える。 謝辞 胃 D A ‑ ‑ J 1Jnレ AU D・ 0 ︾・ 山 Gn‑ a e し aLA ・ da ρν +し 'ka U a ・1 + し 品切 1 ν ρ n OG u v‑ b ‑‑eo‑‑一 +q Nm J 一a V4APAT‑ 念 書 ua 2on ak a 白 ︐Vbu n ︐ 一 株式会社 ] I E Cの長谷川伸弘さんには、 HTMLの命令と ] a v a全般の内容について、貴重な助言を幾 度となく頂戴した。この場をお借りしてお礼申し上げあげる。 ‑215

212.
[beta]
・
・
・
・
・
・

参考文献
MSDN ライブラリ:Jscript,ActiveXObject の解説
http://msdn2.microsoft.c
o
m
/
.
i
a
‑
j
p
/
l
ibrarv/default
.aspx

とほほの WWW入門
http://www.tohoho‑web.com/www.htm

佐 藤 信 正 (2007) i
JavaScript 完全マスター再入門編」
(メディア・テック出版)
佐 藤 信 正 (2007) iJavaScript+Ajax プログラミング・テクニック」
(メディア・テック出版)
浜田知久馬、安藤英一 (2005) iPOWERプロシジャによる症例数設計」
SAS Forumユーザー会学術総会 2005
舟 尾 暢 男 、 高 浪 洋 平 (2005) íデータ解析環境目~ J (工学社)

【参考】

「例数設計くん」で出てきたプログラム
参考プログラム 1:例数設計くん.h
t
a
(簡単のため 2標本 t検定に関するもののみ選択する仕様とした)
く/
s
c
r
i
p
t)

<
h
t
m
l
>
<
t
i
t
l
e
>例数設計くん・メニュー<l
t
i
t
l
e
>
<head>
<
s
c
r
i
p
tt
y
p
e
=
"
t
e
x
ν
J
a
v
a
s
c
r
i
p
t
"
)
3
0
0
)
;
r
e
s
i
z
e
T0
(
4
5
0,
rr
ay
(
"2標本 t検定");
v
a
rMyArrayl =newA
r司Y(
"2標本 t検定");
v
a
rMyArray2 =newA
r
r
ay
(
"
2標本 t検定");
v
a
rMyArray3 =newA
y
(
"
O
l坑 e
s
t
̲
O
l
"
)
;
v
a
rMyValue1 =newA庁 a
y
(
"
O
l坑 e
s
t0
2
勺
,
v
a
rMyValue2 =newA庁 a
v
a
rMyValue3 =newA庁 a
y
(
"
O
l世 e
s
t
̲
0
3,
勺
v
a
rListNumber=1
;
f
u
n
c
t
i
o
n$
むd
)(
retumd
o
c
u
m
e
n
t
.
g
e
t
E
l
e
m
e
n
t
8
y
l
d
むd
);

</head>
<bodyb
a
c
k
g
r
o
u
nd=
"
f
i
l
e
s
/
b
a
c
k
g
r
o
u
n
d
j
p
g
"o
n
L
o
a
d
=
"
S
w
i
t
c
h
(1
)
"
>
(pa
[
jg
n
=
"center"><imgs
r
c
=
"
f
i
l
e
s
/
l
b
a
n
n
e
r
.
g
i
f
"w
i寸t
h
=
"
1
9
9
""
口"
>
<
/
p
>
b
o
r
d
e
r
くpa
l
i
g
n
= e
n
t
e
r
"
)検定手法を選択してからく b
r
>【
OK】ポ告ンをク小yク
して下さいくI
p
>
くh
r
>
="O"width="9S%">
<
t
a
b
l
ea
l
i
g
n
=
"c
e
n
t
e
r
"b
o
r
d
er
<
t
r
>
<
t
a
b
l
ea
l
i
gn
=
"center"b
o
r
d
e
r
ピ"
0
"w
i
批h
="9S%">

、

〈廿〉

(
t
dw
i
d
t
h
=
"
3
3
%
"a
l
ig
n
=
"center">(inputtype
=
"r
a
d
i
o
"
name="MyRadio"id="MyRadio"
o
n
C
l
i
c
k
=
"
S
w
i
t
c
h
(
l
)
"checked>
例数の算出 <
/
t
d
>
くt
dw
i
d
廿
""
34%"a
l
i
g
r
戸"
c
e
n
t
e
r
"
>
(
i
n
p
u
tt
y
p
e
=
"r
a
d
i
o
"
name="MyRadio'"i
d
=
"
M
y
R
a
d
i
o
"
onClick="Sw
比c
h
(
2
)
"
>検出力の算出<l
t
d
>
くt
dwid廿~"33"" a
l
i
gn
=
"c
e
n
t
e
r
"
>
<
i
n
p
u
tt
y
p
e
=
"r
a
d
i
o
"
n
a
m
e
=
"
'
M
y
R
a
d
i
o
'
"i
d="MyRadio"
o
n
C
l
i
c
k
=
"
S
w
i
t
c
h
(
3
)
"
>
検出力カーブ<
/
t
d
>

l

f
u
n
c
t
i
o
nS
w
i
t
c
h(
n
Type){
istNumber;肘)(
f
o
r(
v
a
r同 ;i<L
){
i
f(nType= 1
$
(
"
M
y
S
e
l
e
c
t
"
)
.
o
p
t
i
o
n
s
[
i
]
̲
t
e
x
t =MyA庁 a
y
l
[
i
];
[i
];
$
(
"
M
y
S
e
l
e
c
t
"
)
.
o
p
t
i
o
n
s
[
i
]
̲
v
a
l
u
e=MyValue1

l

=

e
l
s
e汗 (nType 2
){
$
(
"
M
y
S
e
l
e
c
t
"
)
.
o
p
t
i
o
n
s
[
i
]
̲
t
e
x
t =M
y
A
r
r
a
y
2
[
i
];
$
(
"
M
y
S
e
l
e
c
t
"
)
.
o
p
t
i
o
n
s
[
i
]
̲
v
a
l
u
e=M
y
V
a
l
u
e
2
[
i
];

</廿〉

くt
r
>

s
p
;
<
/
t
d
>
<
t
dc
o
l
s
p
a
n
=
"
3
"
>&nb

<
1
廿〉
){
e
l
s
e汗 (nType= 3
$("M凶
yS副
el
e
目c
t
ピ
仁
口
"
'
勺
)
.
。
0
叩
p
凶t
i
旧
。
o
n
s
[
i
]
.
t
同e坑
x
t=M
y
A
r
γ司ay
訂
3[
i
]
;
$("MySel
厄
e
c
t
"
)。叩p
t
l
o
悶
ns
[
i
司
]
̲
v
a
l
u
e=My
V副
al
u
e
3
[
旧
司
l
]
;

.

f
u
問
nc
t
M
y
S
c
r
i
p
t=newActiveXO
凶
;
I
u
e
c
t
(
"
S
c
r
i
p
t
i
n
g
.
F
円
i
l
i
同
e
S
y
s
t
e
町m
判O
凶
b
u
e
c
t
"
)
;
(
γ
"ヲPath;
MyPath =M
y
S
c
r
i
p
t
.
G
e
t
F
o
l
d
er
ぺtrue);
MyTe
x
t =MyScriptCreateTe
x
t
F
i
l
e
(
".
/
f
i
l
e
s
l
̲
E
X
E
.
s
a
s
MyTex
t
.
W
r
i
t
eL
in
e
(
'
o
p
t
i
o
n
ss
o
u
r
c
es
o
u
r
c
e
2symbolgen;
'
)
;
pa
出 1="+M
yPath+"子);
MyTextWriteLineC%let̲
MyText
.
wr白LineC%let̲path2二見sysfunc(tranwrd(ι̲path1.~.I)) ;");
MyTextWriteL
in
e
(
官i
n
c"
'
/
f
i
l
e
s
/
p
a
r
a
m
e
t
e
r
.
s
a
s
";
'
);
MyTextWriteL
in
e
(
唱i
n
c"j
町l
e
s
/
'+$
(
"
M
y
S
e
l
e
c
t
"
)
.
v
a
l
u
e+'
.
s
a
s
";
'
);
MyTextCloseO;
M
y
S
h
e
l
l =newA
c
t
i
v
e
X
O
b
j
e
c
t
(
"
W
S
c
r
i
p
t
.
S
h
e
l
l
"
)
;
.
I
R
u
n
(
"
.
/
f
i
l
e
s
/
"+$
(
"
M
y
S
e
l
e
c
t
"
)
.
v
a
l
u
e+"
.
h
t
a
",1
.f
a
l
s
e
)
;
MySheI

<
t
r
>
l
ig
n
=
"center"colspan
=
γ'>
<
t
dw
i批h="60%"a
<
s
e
l
e
c
ts
i
z
e
=
"
l
"name
="MySe[ect'"i
d=
"
'
M
y
S
e
l
e
c
t
"
)
<
o
p
t
i
o
n
>
2標本 t検定<
I
o
p
t
i
o
n
>
<
/
s
e
l
e
c
ο
<
/
t
d
>
=
"c
e
n
t
e
r
"
>
<
i
n
p
u
ttype="bu仕on~'
<
t
dw
i
d
t
h
=
"40%"a
l
i
gn
name="btnGo"v
a
l
u
e
=
"0 K"o
n
c
l
i
c
k
=
"
G
o
O
"
>
<
/
t
d
>

<
/
t
r
>
くI
t
a
b
l
e
>
</body>
<!ht
J
判1
>

‑216

213.
[beta]
参考プログラム 2
:0
1
̲
t
t
e
s
t
̲
O
l
.h
t
a

。

I<
f
o門別 name="MyFπn">
<
t
a
b
l
eb
o
r
d
eτ0>
<
t><tdw
i批 h
=Oa
l
i
g
n
=
勺i
g
h
t
"
>L
l
く /td><tdw
i
d
t
h=O>=</td>
<
t
dw
i
批h
=I00>
e
s
i
z
e
T
0
(
3
0
0
.
3
5
0
)
;
く'
n
p凶 name="MytextboxOl"t
y
p
eゴ"
t
e
x
t
"v
a
]
u
e
=
"
1
.
0
"
f
u
n
c
t
i
o
nMyGetPaameter
O(
=
"width:l0閃;">
s
t
y
le
v
a
rM
y
V
a
r
i
a
b
l
e
01
.MyVai
a
b
l
e
0
2
.M
y
V
a
r
i
a
b
l
e
0
3
.
く/
td>
p.
tMyTextMyShell;
M
y
V
a
r
i
a
b
l
e
0
4
.MySci
く/
t
r
>
M
y
V
a
r
i
a
b
l
e
O
l=document.MyFonm.Myte此 boxOl;
>
<
t,
M
y
V
a
r
i
a
b
l
e
0
2=documentMyFonm.Myte此 box02;
く
"
t
dw
i此h=Oa
l
i
g
n
=
"i
g
h
t
"
>
σ <l
t
d
>
<
t
dw
i批 h
=O>=<
l
t
d
>
MyVai
a
b
l
e
0
3=document.MyFonm.Mytextbox03;
<
t
dw
i批 h=100>
くi
n
pL
J
tn
ame="Mytextbox02"t
y
p
e
=
"
t
e
x
t
"v
a
l
u
e
ゴ'1.0
"
M
y
V
a
r
i
a
b
l
e
0
4=documentMyFonm.Mytextbox04;
i
f(
M
y
V
a
r
i
a
b
l
e
O
l
&M
y
V
a
r
i
a
b
l
e
0
2
ニ"
w
i
d
t
h
:
l日開;">
s
t
y
J
e
M
y
S
c
r
i
p
t=newA
c
t
i
v
e
X
O
b
j
e
c
t
(
"
S
c
r
i
p
t
i
n
g
.
F
i
l
e
S
y
s
t
e
m
O
b
j
e
c
t
"
)
;
<
/
t
d
>
叩 e
)
;
MyTe
x
t =M
y
S
c
r
i
p
t
.
C
r
e
a
t
eTe
x
t
F
i
l
e
(
".
/
f
i
J
e
s
/
p
a
r
a
m
e
t
e
r
.
s
a
s
"
.t
<
/
t,
>
.
writeLine("百let̲meandi仔:;:" +MyVariabJe01
.v
a
l
u
e+'
ぺ
"
)
;
MyTe
x
t
<
t
,
>
MyText
.
w
r
i
t
e
L
i
n
e
(
"
百l
e
t̲
s
t
d
d
e
v ="+M
y
V
a
r
i
a
b
J
e
0
2
.
v
a
l
u
e+";
勺
,
くt
dw
i此h=Oa
l
i
g
n
=
"right">α</td>く
t
dw
i此h=O>=く /
t
d
>
MyText
.
w
円
比eLine("%let̲alpha ="+MyVaiable03.value+.;");
<
t
dwidth=100>
MyTe
x
t
W
r
i
t
eL
in
e
(
"
%
l
e
t̲
power ="+M
y
V
a
r
i
a
b
l
e
0
4
.
v
a
l
u
e+.;
"
);
く'
n
p凶 name="Mytextbox03"t
y
p
e
=
"
t
e
x
t
"v
a
l
u
e
=
"
0
.
0
5
"
=
"w
i
d
t
h
:
l00
%
;
"
>
s
t
y
le
MyTextCloseO;
く/
td>
i
検定の例数設計を実行しますっ,
<
/
t,
>
w
i
n
d
o
w
.
a
l
e
r
t
(
"2標本t
M
y
S
h
e
l
l=newActiveXObject("WSci
p
t
S
h
e
l
!
"
)
;
<
t
r
>
.
1
/s
a
s
.
e
x
e
"‑
s
y
s
i
n
M
y
S
h
e
l
l
.
E
x
e
c
(
'
"C
:
/
P
'
o
gamFiles/SAS/SAS9
<
t
dw
i
此h=Oa
l
i
g
n
=
"ight">Power
<
l
t
d
>
<
t
dw
i
d
t
h=O>=<l
t
d
>
"
.
/
f
i
l
e
s
/
ーE
X
E
.
s
a
s
"ーl
o
gー
./
f
i
l
e
s
/
ーEXE
l
.
og"‑
n
o
s
p
l
a
s
h‑
i
c
o
n
'
)
;
<
t
dw
i此h=I00>
くi
n
p
u
tname="Mytextbox04"t
y
p
e
=
"
t
e
x
t
"v
a
]
u
e
=
"
O
.
9
"
ニ"
w
i
d
t
h
:
l日開;">
s
t
y
l
e
</scipV
く/
head>
</td>
くb
odyb
a
c
k
gound
=b
a
c
k
gound2jpg">
<
/
t,
>
くpa
l
i
g
n
=
"center")くf
o
n
tc
o
J
o戸 "
b
l
u
e
"s
i
z
e
ニ"
5">
く/
t
a
b
l
e
>
g
h
t
"
>
<pa
l
i
g
n
=
"i
l
fonV</p
>
<b>2標本 t検定 </b><
仕o
n
'
"v
a
l
u
e
=
"0 K "
(
i
n
p
u
tname="Mygetbutton" type="bu
くpa
J
i
g
n
=
九enter")各パラメー告を設定してからく b,
>
【
OK】ポ告ンをクリックして下さいく/p>
o
n
c
l
i
c
k
ニ"
MyGetParameter
{
)
'
'
)
<
h,
>
く/
fonm>
</body>
</html>

<
h
t
m
l
>

くt民le>2標本t検定・ ~J 数設計</t辻le>
くh
ead>
くs
c
r
i
p
tt
y
p
e
=
九e此 I
j
a
v
a
s
c
r
i
p
t
"
)

,

,

,

,

,

,

,

,

=
,.
.

,
=
山
'
)
(

,

,

,

,

,

,

,

,

。

υ

参考プログラム 3:0
1
̲
t
t
e
s
t
̲
0
2
.h
t
a

I <
廿><tdw
i
d
t
h=O‑
a
l
i
g
n
=r
湖
、t
う
.
2
l</td><tdwidth=Oう=</td>
<
h
t
m
l
>
く
はl
e
>
2標本t
検定・検出力の計算</t比l
e
>
くt
dw
i
d
t
h
=
l
くl
叩 凶 nam
e
="Myte此 boxOl"type "text"value="1ぴ
'
<head>
くs
c
r
i
p
tt
y
p
e
=
"
t
e此 /
j
a
v
a
s
c
r
i
p
(
'
)
s
t
y
l
e
=
"w
i
d
t
h
:
l0郎;">
r
e
s
i
z
e
T0
(
3
0
0
.
4
∞
)
;
<
/
t
d
>
<
/
t,
>
f
u
n
c
t
i
o
nMyGetParameter
{
)(
v
a MyVai
a
b
l
e
O
l
.MyVai
a
b
l
e
0
2
.MyVai
a
b
l
e
0
3
.
く廿>
<
t
d剛 d
t
h=
Oa
l
i
g
n
=
"i
g
h
t
"
>
σ く/
t
d
>
<
t
dw
i
d
t
h司 >=</td>
MyVai
a
b
l
e
0
4
,M
y
V
a
r
i
a
b
l
e
0
5
.MyVai
a
b
l
e
0
6
.
h
=
1
<
t
dw凶t
p
t
.M
y
T
e
x
t
.M
y
S
h
e
l
l;
(
i
n
p凶 name
二"
Mytextbox02"t
y
p
e
=
"
t
e
x
t
"v
a
l
u
e
=
"1
.0"
MySci
a
b
l
e
O
l=documentMyForm.Myte
此b
oxOl;
吐
.
.
>
MyVai
s
t
y
l
e
=
"w
i
d
t
h
:
l00
此b
ox02;
M
y
V
a
r
i
a
b
l
e
0
2=documentMyForm.Myte
<
/
t
d
>
此b
ox03;
M
y
V
a
r
i
a
b
J
e
0
3=document.MyForm.Myte
<
/
t
r
>
a
b
l
e
0
4=documentMyForm.Myte
此b
ox04;
MyVai
<
t>
<
t
dw
i
d
t
h司 a
l
i
g
n
=
"i
g
h
t
"
>
α く/
t
d
>
<
t
dw
i
d
t
h=
O>=</td>
M
y
V
a
r
i
a
b
l
e
0
5=documentMyFom.Mytextbox05;
<
t
dw
i
d
th=1
M
y
V
a
r
i
a
b
l
e
0
6=documentMyFom.Mytextbox06;
くi
n
p
u
tname
="Mytextbox03"type="text"value="0.05"
汗(
MyVai
a
b
l
e
O
l!
="
.
.&M
y
V
a
r
i
a
b
l
e
0
2
出
ー1
00
s
t
y
l
e
=
"
w
i
d
M
y
S
c
r
i
p
t=newA
c
t
i
v
e
X
O
b
j
e
c
t
C
S
c
r
i
p
t
i
n
g
.
F
i
l
e
S
y
s
t
e
m
O
b
j
e
c
t
"
)
;
く/
t
d
>
問 e
)
;
<
/
t,
>
MyText =M
y
S
c
r
i
p
t
C
r
e
a
t
e
T
e
x
t
F
i
l
e
C.
/
f
i
l
e
s
/
p
a
r
a
m
e
t
e
r
.
s
a
s
"
.t
,
w
.iteLineC%let̲meandiff=.+MyVariable01
.
v
a
l
u
e +";
"
)
;
<
t>
<
t
dw
i
d
th=Oa
l
i
g
n
=
日g
h
(
'
>目標 Power
</
t
d
>
MyText
MyTextWriteL
ineC%let̲
s
t
d
d
e
v ="+MyVai
a
b
l
e
0
2
.
v
a
l
u
e +";
"
);
くt
dw
i
d
t
h=
O
>=</td>
MyTextWriteLineC
百l
e
t̲
a
l
p
h
a ="+M
y
V
a
r
i
a
b
l
e
0
3
.
v
a
J
u
e
<
t
dw
i
d
t
h
=
1
MyTextWr
民e
L
in
e
(
"
冶l
e
t̲Power ="+M
y
V
a
r
i
a
b
l
e
0
4
.
v
a
J
u
e +";
"
'
);
(
i
n
p
u
tname="Mytextbox04"t
y
p
e
=
"
t
e
x
t
"v
a
l
u
e
=0
.
8
"
MyTextWr
辻e
L
in
e
(
"
百l
e
t̲
N
m
i
n ="+ M
y
V
a
r
i
a
b
l
e
0
5
.
v
a
l
u
e
キ2+";
"
)
;
i
d
出
・1
日開,勺
s
t
y
l
e
=w
MyTe
x
t.
w
r
i
t
e
L
i
n
e
C
百J
e
t̲Nmax ="+M
y
V
a
r
i
a
b
J
e
0
6
.
v
a
J
u
e
キ2+";
"
)
;
く/
t
d
>
MyTextCloseO;
<
/
t
r
>
くt,
>く
t
dw凶t
h=Oa
l
i
g
n
=
"r
i
g
h
t
"
>
N
<
/
t
d
>
<
t
dw社 作0>=く/
t
d
>
検定の検出力を計算します");
くt
dw泊t
h
=
1
w
i
n
d
o
w
.
a
l
e
r
t
C2標本t
M
y
S
h
e
l
l=newActiveXObjectCWScript
.S
h
e
l
l
"
)
;
(
i
n
p
u
tname="Myte此 box05"t
y
p
e
=
"t
e
x
t
"v
a
l
u
e
=
"
10"
.
E
xe
c
( C:
lProgramFiles/SAS/SAS9
.
1
/s
a
s
.
e
x
e
"‑
s
y
s
i
n
MyShell
s
t
y
l
e
=
"剛 d出 40
唱;">‑
"
.
/
f
i
l
e
s
/EXE
.s
a
s
'ーl
o
g"
.
/
f
i
l
e
s
/
̲
E
X
E
l
.
og"‑
n
o
s
p
l
a
s
h‑
i
c
o
n
'
)
;
(
i
n
p
u
tname="Myte
此b
ox06"t
y
p
e
=
"
t
e
x
t
"v
a
!
u
e
=
"
5ぴ
'
s
t
y
le
="wid
廿
1
:4
0
%
;
"
>
(
/
s
c
r
i
p
t
)
<
/
t
d
>
</head>
<
/
t
r
>
<bodyb
a
c
k
g
r
o
u
nd="backgound2jpg">
く/
t
a
b
l
e
>
くpa
l
i
gn
=
"center")(fontc
o
J
o
r
ニ"
b
J
u
e
"s
i
z
e
=
"
5
"
>
<
pa
l
i
g
n
=
"r
i
g
h
t
"
>
(
i
n
p
u
tname="Mygetbutton" t
y
p
e
=
"
b
u
t
t
o
n
"v
a
!
u
e
ゴ'OK"
<b>2標本 t検定 </b><
lfonVく/p>
くpa
J
i
g
n
=
"c
e
n
t
e
r
"
>各パラメー告を設定してから <
b
r
>【
OK】ポ告ンを
{
)
"
>
onclick="MyGetParameter
く/
p>
クリックして下さいく/p>
くh,
>
く/
fonm>
<
f
o
r
mn
a
m
e
:
:
;
"
M
y
F
o門n">
</body>
=O>
<
t
a
b
l
eb
o
r
d
er
<
/
h
t
m
l
>

〉
∞

二

, ,
,
,

,

,
,

〉
∞

,

,
,

,
,

,

,

〉
∞

=
,.
.
){

,

,

、
社

,

+
"
つ
,

〉
∞

民

〉
∞

凶

,

̲2
1
7

214.
[beta]
参考プログラム 4
:0
1
̲
t
t
e
s
t
̲
0
3
.
h
t
a

、

I <tdw
i
枇h
=Ua
l
i
g
r=
"
r
i
g
h
t
"
>
L
I
くI
td><tdw
i
d
t
h
=U>̲ <
l
td>
<
h
t
r
n
l
>
<
t
dw
i
枇h
=loo>
検定・検出力カーブ<
/
t
i
t
l
e
)
<
t
i
t
l
e
>
2標本t
="Myte此 boxOl
" type="text"v
a
l
u
e
=
"1
.0"
(
i
n
p
u
tname
<head)
s
t
y
l
e
=
"w
i
d
t
h
:1
00
唱
:
"
>
九ext/
j
a
v
a
s
c
r
i
p
t
う
<
s
c
r
i
p
ttype=
r
e
s
i
z
e
T0
(
3
0
0,
40
0
)
;
<
/
t
d
>
<
/
t
r
>
<!‑
(
)I
f
u
n
c
t
i
o
nMyGetParameter
<
t
r
>
ualign="right">σ <
l
t
d
)
<
t
dw
i
d
t
h
=U>=<
l
t
d
>
<
t
dw
i
d
t
h=
v
a
rM
y
V
a
r
i
a
b
l
e
0
1
.M
y
V
a
r
i
a
b
l
e
0
2
.M
y
V
a
r
i
a
b
l
e
0
3
.
<
t
dw池山=
1∞
〉
M
y
V
a
r
i
a
b
l
e
0
4
.M
y
V
a
r
i
a
b
l
e
0
5
.M
y
V
a
r
i
a
b
l
e
0
6
.
(
i
n
p
u
tn
a
m
e
;
:
:
"
M
y
t
e
抗b
ox02"type= t
e
x
(
'v
a
J
u
e
=
"
l
.
0
"
MyScript
.MyTex
t
.M
yShell;
制 改h
:100
社")
s
t
y
l
e
=
"
M
y
V
a
r
i
a
b
l
e
0
1=document.MyFonm.Mytextbox01;
.
M
yForTγ
1
.
M
y
t
e此 box02;
M
y
V
a
r
i
a
b
l
e
0
2=document
<
/
t
d
>
MyVariable03=document,MyFonm.Mytextbox03;
<
/
t
r
>
此b
ox04;
MyVariable04=document,MyFonm.Myte
<
t
r
>
<
t
dw
i
d
t
h
=
Oa
l
i
g
n
=
"r
i
g
h
t
う α</td)
M
y
V
a
r
i
a
b
l
e
0
5=document.MyFonm.Mytextbox05;
M
y
V
a
r
i
a
b
l
e
0
6=document.MyFonm.Mytextbox06;
<
t
dw
i
d
t
h
=
O
>=<
/
t
d
>
汗(
M
y
V
a
r
i
a
b
l
e
0
1!
='
'
, &M
yVariable02,
="
"
)I
<
t
dwidth=loo>
MyScript=newA
c
t
i
v
e
X
O
b
j
e
c
t
(
"
S
c
r
i
p
t
i
n
g
.
F
i
l
e
S
y
s
t
e
m
O
b
j
e
c
t
"
)
;
="Myte抗 box03"type="text"valueピ"
0,05
(
i
n
p
u
tname
枇h
:
1
0
0
唱
;
"
>
s
t
y
l
e
=
"
w
i
t
.CreateTextFile("'/files/parameter,sas
"
.t
r
u
e
)
;
MyText =MyScrip
t
.
W
r
i
t
eLineC
首l
e
t̲meandr
仔
;
:
:"+ M
yVariable01
.v
a
l
u
e +'";
"
);
My
Tex
</td>
My
Tex
t
.
W
r
i
t
eLineC
首[
e
t̲
s
t
d
d
e
v ;
:
:
"+ M
y
V
a
r
i
a
b
l
畑
e
0
2
.
v
a
l
u
e +";
"
);
<
/
t
r
:
ヲ
MyTex
t
.
W
r
i
比
t
e
L
i
問
neC
相l
司
e
叫t
一a
l
p
h
a ="+M
y
V
a
r
i
a
b
l
均
e
0
3
.
v
a
l
u
e +":
"
);
<
t
r
>
tWr
円
『
此
t
e
L
i
n
e
(
"
制l
司
e
叫t P
ower ;
:
:
"+M
y
V
a
r
i
a
b
J
e
0
4
.
v
副
al
u
e +";
"
)
;
MyTe此
x
l
i
g
n
=
"r
i
g
h
t
"
>目標 Power
<
l
t
d
><
t
dwは h=
u
>=</td>
<
t
dw
i批h=Oa
乱
x
t
.
Wr
円
川
I
比
t
eL
i問n
、官
イ
eC
、
,
百l
e
t̲Nmin ;
:.
"+M
y
V
a
r
i
a
b
l
e
0
5
.
v
a
l
u
e
*
2+"
My刊
Te
枇h
=l∞
〉
<
t
dw
i
MyTextWriteLineC
首l
e
t̲Nmax ;
:"+M
y
V
a
r
i
a
b
l
e
0
6
.
v
a
J
u
e
*
2+";
"
);
(
i
n
p
u
tname="'Myte
此b
ox04"type="te此;"v
a
]
u
e
=
"
O
.
8
"
My
Te
x
t
.C
l
o
s
e
(
)
;
s
t
y
l
e
=
"w
i
d
t
h
:
10
0
%
;
"
>
<
/
t
d
>
w
i
n
d
o
w
.
a
l
e
r
t
C2標本t
検定の検出力カーブを描きます");
<
/
t
r
>
MyShell=newActiveXObjectCWScrip
t
.S
h
e
l
l勺
,
<
t
r
>
MyShelLExe
c
(
'
"C:/ProgramFiles/SAS/SAS9
.
1I
s
a
s
.
e
x
e
"‑
s
y
s
i
n
g
n
=
"right">N<
l
td><tdwidth=O>=</td>
<
t
dw
i
d
t
h
=
Oa
l
i
".
/
f
i
l
e
s
/
̲
E
X
E,s
as
"
ーl
o
g"
.
/
f
i
l
e
s
/
̲
E
X
E
l
.
og"‑nosplash‑
i
c
o
n
'
}
.
批れ=
100>
<
t
dw
i
二"
t
e
x
t
"va[ue="10"
(
i
n
p
u
tname="Mytextbox05"type
〉
="w油 h:40%;">‑
s
t
y
!e
<
/
s
c
r
i
p
t)
<
i
n
p
u
tname="Mytextbox06"t
y
p
e
=
"
t
e
x
t
"value="50"
="wi枇h:40
%
;
"
>
s
t
y
le
</head>
くb
odybackground="
b
a
c
l
屯r
ound2jpg")
</td>
n="center"><fontcoJor="blue"s
i
ze
='
γ〉
(pa
J
i
g
<
/
t
r
>
<b>2標本 t検定 </b></lont
></p)
<
/
t
a
b
l
e
>
ピ
, right">
<pa
l
i
g
r
う各パラメ 告を設定してから <br>【OK]ポ告ンを
<pa
l
i
g
n
=
"c
e
n
t
e
r
柱。 n
"v
a
l
ue
=
"0 K "
(
I
n
p
u
tname="Mygetbutton" type="bu
ヲリッヲして下さい </p>
onclick="MyGet
くh
r
>
Parameter
{
)
"
)
="MyFormH
>
<formname
</p
ヲ
<
t
a
b
l
eb
o
r
d
er
=
O>
</lonm)
<
t
r
>
</bo町
〉
</html>
子

つ;

参考プログラム 5:0
1t
t
e
s
t0
1
.s
a
s
e
s
u
l
t
.h
t
m
l
'
o
d
sh
t
m
lf
il
e ='r
&
̲
p
a
t
h
l
"
p
a
t
h二 "

参考プログラム 6:0
1
̲
t
t
e
s
t
̲
0
2
.s
a
s
o
d
sh
t
m
lf
il
e ='r
e
s
u
l
t
.h
t
m
l
'
p
a
t
h ="
&
̲
p
a
t
h
l
"

p
r
o
cp
o
w
e
r
.
t
w
o
s
a
m
p
1e
m
e
a
n
s
=diff
t
e
s
t
m
e
a
n
d
i
f
fニ品 m
e
a
n
d
i
f
f
.
t
d
d
e
v
s
t
d
d
e
v =品 s
a1
p
h
a =品̲
a1
p
h
a
.
o
w
e
r
.
p
o
w
e
r =品 p
n
t
o
t
a
l =
r
u
n

p
r
o
cp
o
w
e
r
t
w
o
s
a
m
p
1e
m
e
a
n
s
=di
f
f
t
e
s
t
e
a
n
d
i
f
f
m
e
a
n
d
i
f
f=品 m
t
d
d
e
v
s
t
d
d
e
v =品 s
a
lp
h
a =品̲
a
l
p
h
a
p
o
w
e
r
nt
o&
̲
N
m
a
xb
y2
n
t
o
t
a
l =品̲Nmi
r
u
n

o
d
sh
t
m
lc
l
o
s
e
;

o
d
sh
t
m
lc
l
o
s
e
;

X"
&
̲
p
a
t
h
l半r
e
s
u
l
t
.h
t
m
l
"

X"
&
̲
pa
t
h
l半r
e
s
u
l
t
.
h
t
m
l
"

218 ̲

215.
[beta]
参考プログラム 7:0
1
̲
t
t
e
s
t
̲
0
3
.s
a
s
1
地[
e
t̲RPGM =&
̲
p
a
廿1
2
/
f
i
[
e
s
/
m
y
p
o
w
e
r
.
R
;
%
[
e
t̲REMF =&
̲
path2/files/mypower.bmp;
則e
t̲RCSV =&
̲
p
ath2/
日l
es/mypower.csv;
ods0叫 p
u
tOutput
二Tmp;
odsl
i
s
t
i
n
gc
l
o
s
e;
p
r
o
cpower;
twosamplemeans
干
t
e
s
t =d
i
f
meand汗f
:
:
:
:& meand汗f
s
t
d
d
e
v =& s
t
d
d
e
v
a
l
p
h
a =ι̲a[pha
power =
n
t
o
t
a
l =ιーNmint
o&̲Nmaxby2;
fUn;

odso
u
l
p
u
tc
[
o
s
e;
odsJ
i
s
t
i
n
g;
f
i
l
e
n
a
m
eRCSV"&̲RCSV";
d
a
t
aMyPower;
s
e
tTmp;
f
i
l
eRCSV;
N
t
o
t
a
[=N
to
t
a
[/2;
p
u
tN
to
t
a
!"
,
"Power;
r
u
n
;

d
a
t
a NULL
s
e
tMyPowerend=̲EOF;
r
e
t
a
i
n̲PFLG0;
i
f((
N
t
o
t
a
[=&̲Nmin/2andPower>
&̲Power)
o
r(
N
t
o
t
a
[=&̲Nmax/2andPower<
&̲Power))thendo;
PFLGニ 2
end;
e
l
s
ei
fPower>
ー
&Powerand̲PFLG=0thendo;
PFLG=1
c
a
[
[symput("̲POWER
ぺcompress(put(Power.best.)));
c
a
[
[s
y
m
p
u
t
(
"
̲
N
T
O
T
"
.
c
o
m
p
r
e
s
s
(
p
u
t
(
N
t
o
t
a
[
.
b
e
s
t
.
)
)
)
end
i
f̲EOFt
h
e
nc
a
l
lsymput("̲FLG".
c
o
m
p
r
e
s
s
(
p
u
t
(
̲
P
F
L
G
.
b
e
s
t
.
)
)
);
ー

run;

o
p
t
l
o
n
snoxwa比 x
s
y
n
c;
f
i
[
e
n
a
m
eRPGM"&̲RPGM";
唱m
acrodrawgraphO:

d
a
t
a̲
n
u
I
J
̲;
日[
eRPGM:
‑read.csv(山.&只CSV川'.head=Fl";
p
u
t"x <
p
u
t m
p
(
f
i
[
e門 ame
=""&̲REMF....)";
p
u
t'
p
[
o
t
(
V
2
‑V
l
.d
a
回=
x
.t
y
pe
="b".x[ab
ニ"Np
e
rgroup",y
l
a
b
=
"
P
o
w
e
r
"
)
';
知f&
ーFLG=1首t
h
e
n首do;
v
=
&̲NTOT.比y=2
.c
o
[
=
2
)
";
p
u
t"
a
b
[
i
n
e
(
.[abe[s= 'N=&NTOT ,pos=2.cexニ1.5
.c
o
[
=
2
)
"
;
p
u
t"
t
e
x
t
(
ι
̲
N
T
O
T
.&̲POWER
%end;
p
u
t'
d
e
v
.
of
f
(
)
';

、

川

山

'
i

run;

<''''&̲RPGM'''''';

x"'C:~Program Files~R~R-2.6.2pat~bin~Rexe' ‑no‑restore‑no‑save
首mend
%drawgraphO;
x"&REMF"

以上

̲ 219 一

216.

l 1 1 1 ユーザー総会子ふ1 〆 子 り かR WJJユージョンセ I シ ョ シ ベ 川 山 ‑ 目 ム 咋 統計解析結果の英訳に対する 効率的な業務モデル確立への取り組み 0東島正竪,竹田虞 株式会社ACRONET 開発本部データサイエンス部 Actionst otheE f f e c t i v eBusinessModelEstablishment f o rtheEnglishT r a n s l a t i o n o ftheS t a t i s t i c a lAnalysisOutput MasatakaH i g a s h i j i m aIMakotoTakeda l i n i c a lDevelopmentD i v i s i o n, DataSciencesDepartment,C ACRONETC o r p o r a t i o n ACROl 桔T スー手二民会?カデミア;子辰巳ふ1 , " 1 & ン lm& 一一 引 要旨: 国際臨床開発が活発になりつつある中,圏内試験結果の 英語化の必要性も高まっている. そこで, M i c r o s o f tE x c e lで作成した統計解析結果に対し, SASを利用した英訳作業効率化への取り組みを紹介する. キーワード:国際臨床開発,英語化,プログラム,英訳対応表 ACRl 別百 ‑220 い I

217.

K‑ ザー除}よ}瓦I J I ジ.. ミ 一一一一シ ¥ 山 川 一 … 川 町 . 発表の流れ 欝背景 事解析結果英訳における懸念事項 撃作業フローの紹介 事まとめ A C l 回 話T 2 !いふザー必?五デミ?デゥ'‑1ジ一九一一一一 μ … 叶 山 一 一 九 川 二I 童量 ①国際臨床開発の活発化 ・圏内試験結果の英語化ニーズの高まり ②医薬英語と臨床開発の両方を熟知した翻訳担当 者の必要性 ・人材確保が困難 ACRONET 3 2 2 1‑

218.

同孟忌お云示孟:ムλムソリ一一ム.寸 マ …川 … I 発表の流れ "i 乙亙互 関巧ミ 事解析結果英訳における懸念事項 憲作業フローの紹介 壊まとめ Aa 回 経T 4 ! l l I I ! ! ! ! ザ ー 諮 問 デ ミ ア テ ゥ ム ム ム ー ム ン ー ッ シ ョ 解析結果英訳における懸念事項 ①全てを英訳すると時聞が掛かる(重複も多) ②適切な英訳? ③同一の日本語に対する英語表現のブレ ④日本語部分が全て英訳できている? 午 Aa 盟、ぽ 3そこで 5 222 ‑

219.

! ム ユ ー ザ ー 語 会1 五 デ ふ 子 ? ノ 一 一 一 一 解析結果英訳における懸念事項 eプログラムにより..• .作業工程を簡素化 ・英訳対象を自動抽出 ・一括操作で英語表現のブレを解消 e英訳対応表により..• .英訳の確認を簡便に 2上記を検討した イι 凶V E I 6 ( 1 1 ユザ一点?よみみん. . 戸二三二 発表の流れ 壊首景 零解析結果英訳における懸念事項 吋午業フローの紹介 eまとめ A ε'RONET 7 2 2 3‑

220.

l S A Sユーザー総会がふゐノ時山内ヨン U シ ム E ρ 作業フローの紹介 ヨ園田弁 E 〉 ‑ ⑤英語版 解析結果 悶悶悶鴎 者 完 封 ( ③ 英 訳i ‑ ‑ 4 c 1 樹 、z 8 J │山一内会?ムアテウノロジー&ソリユーンセツシー 一 作業フローの紹介 ①英訳対象抽出 プログ、フムにより 2byte文字が含まれる セルを抽出 、 r v I m * * " * ] I ι E x c e lシート名:患者背景 項目 性別 統計量 男性 女性 年齢(歳)例数 平均値 B M I 合併症 ACRONET 標準偏差 最小値 中央値 最大値 例数 平均値 標準備差 最小値 中央値 最大値 例数 有(目) 無(弘) 安全性解析対象集団 実薬 ヲフセボ 9 9 9 9 9 9 9 9 9 9 9 9 9 9 . 9 9 9 . 9 9 9 . 9 9 9 . 9 9 9 9 9 9 9 . 9 9 9 . 9 9 9 9 9 9 9 9 9 9 9 . 9 9 9 9 . 9 9 9 9 . 9 9 9 9 . 9 9 9 9 . 9 9 9 . 9 9 9 . 9 9 9 9 . 9 9 9 9 . 9 9 9 . 9 9 9 9 9 9 9( 9 9 .9 ) 9 9( 9 9 . 9 ) 9 9( 9 9 .9 ) 9 9( 9 9 .9 ) 9 一 224

221.

ふ . . …一一 1 ‑内 会 治 三 五 ら み ん111 作業フローの紹介 ①英訳対象抽出 一一I Excelシート名:患者背景 / 宮 l 統計 、 :4 1 安全性解析対象集団 男性 女性 平均値 標準偏差 最小値 中央値 最大値 抽出ー B M I 平均値 標準偏差 最小値 中央値 最大値 ~、 I ~*18~J 有(唱) 無(弘) 9 9 9 9 9 9 9 9 9 9 . 9 9 9 .9 9 9 . 9 9 9 .9 9 9 9 9 9 9 . 9 9 9 . 9 9 9 9 9 9 9 9 9 9 9 . 9 9 9 9 .9 9 9 9 . 9 9 9 9 .9 9 9 9 . 9 9 9 . 9 9 9 . 9 9 9 9 .9 9 9 9 . 9 9 9 .9 9 9 9 9 9 9( 9 9 .9 ) 9 9( 9 9 .9 ) 9 9( 9 9 .9 ) 9 9( 9 9 .9 ) ACRoNEr 1 0 i‑ 二ザ二主会?ザミァI ルロふーんぷら斗 作業フローの紹介 ①英訳対象抽出 英訳対応表 項目 性別 年齢(歳) 合併症 Excelシート名:患者背景 f住別 ~ B M 例数 ど乞" R ONET 男性 1t' !! 9 9 9 9 9 9 9 9 9 9 . 9 9 9 .9 9 9 . 9 9 9 .9 ' " 、 ー 可 ー .' " 司 = 最小値 9 9 9 9 中央値 9 9 . 9 9 9 . 9 9 9 最大値 9 9 9 9 9 9 平均値 9 9 . 9 9 9 9 .9 9 標準偏差 9 9 . 9 9 9 9 . 9 9 最小値 9 9 . 9 9 9 . 9 9 9 . 9 9 9 9 .9 9 9 9 . 9 9 9 . 9 9 9 9 9( 9 9 .9 ) 9 9( 9 9 .9 ) 9( 9 9 .9 ) 9 9( 9 9 .9 ) 9 1 1 ‑2 2 5

222.

「 11 ユージョンセーシ ユーザー総会アカ子ミアテウノ日ジ‑&'1') 小 三 ‑ 作業フローの紹介 ①英訳対象抽出 Excelシート名:有害事象 抽出 l J T ; t ACROl 話T 、 、 , 〆 9 9( 9 9 .9 ) 9 9( 9 9 .9 ) 9 9( 9 9 . 9 ) 9 9( 9 9 . 9 ) 9 9( 9 9 . 9 ) 9 9( 9 9 .9 ) 9 9( 9 9 .9 ) 9 9( 9 9 .9 ) 9 9( 9 9 . 9 ) 9 9( 9 9 .9 ) 9 9( 9 9 .9 ) 9 9( 9 9 .9 ) 9 9( 9 9 . 9 ) vv 両ムザ二ふヲ示ムムムー一二ムシムム 山 、 ~12 E 作業フローの紹介 ①英訳対象抽出 セルの位置情報と共に一覧表を自動生成 Aε~孟F シート名 患者同尽 患者背景 患者背景 患者背景 患者背景 患者背景 患者背景 患者背景 患者背景 患者背景 有害事象 有害事象 有害事象 ~:r 9 0 6 7 2 1 7 2 2 2 3 3 8 9 1 0 1 5 1 6 2 1 12 1 3 14 3 対象文字列 工具固 年齢(歳) 合併症 男性 女性 英訳 例数 平均値 3 例 平 均 数値 3 直1 墾 3 口渇 3 倦怠感 3 1発 熱 2 2 6‑ 1 3

223.

十 点sユーザー総会内デロ子‑ん一一ッシミシ山咋山 川 一一…ー いー… I 作業フローの紹介 ①英訳対象抽出 英訳作業用に重複を削除した一覧表を自動生成 N o . 英訳対象文字列 英訳 項目 2 年齢(歳) 3 合併症 4 男性 5 女性 例数 7 平簡{甫 8 ロ渇 9 倦怠感 1 0 発熱 A C l 幽 、z 1 4 1 . ム三ふ話会九日みんムソ 11 ふんらp J …一一一一ーが 目 川 作業フローの紹介 ②既存英訳ライブラリの適応(プログラム) MedDRA等による変換 N o . 英訳対象文字列 項目 2 年齢(歳) 3 合併症 4 男性 5 女性 6 例数 7 平均値 8 ロ渇 9 倦怠感 1 0 発熱 英訳 口~ 亙‑二二件ι 一 一 i 一 、 iヘ ミ、ふ2 、 一 J 、¥と、ヲミ、や 、 Jぷ ど、 マ ャ E~ に i l ぷ 官民 必CROJVj百 15 一2 27‑

224.

一 [ 凱 ユーザー総会アカテミア円l1liソザユーシヨンセシシヨン S 目 九 作業フローの紹介 ②既存英訳ライブラリの適応(プログラム) MedDRA等による変換 、 z ACROl 16 S~ユーザー総会アザミア子山内ソ 1) ュザョンセツショシ 山 I 作業フローの紹介 ②既存英訳ライブラリの適応(プログラム) 既存の英訳ライブラリを適応 既存の英訳ライブラリ J A P A N E S E 項目 合併症 男性 女性 平均値 . . . A C 1 回 、T f J T E N G L I S H i t e m c o m pI i c a ti o n m a l e f e m a l e m e a n . . . 17 ‑228 ‑

225.

「一一一ザー総会アカデ託子ゥムムー ムーシ…ーン E 門 一 一一ベI二1 作業フローの紹介 ②既存英訳ライブラリの適応(プログラム) 既存の英訳ライブラリを適応 N o . 2 3 4 5 6 LJ 三 τ 寸 τ 9 1 0 A C l 也、百 1 8 内!!ユーザー総会アカヂミア門川凡ソ,zaSi シ ョ シ ー… y 子 L二ψ E 作業フローの紹介 ③英訳 英訳担当者による英訳 N o . 英訳対象文字列 項目 2 年齢(歳) 3 合併症 4 男性 5 女性 6 例数 7 平均{直 8 口渇 9 倦意感 1 0 発熱 英訳 i t e m 機総会為、よ三 compI i c a ti o n male female r川 三 、 、 ♂争予 d 弘 よ 前 仏 、 、 Jれ ム ニ mean Thirst Malaise F e v e r A ι回、百 1 9 ‑229

226.

(~ユーザー総会ア\カデミアテウノロジー&ソリユーシヨンセッシヨン ヶ [ 作業フローの紹介 ③英訳 英訳担当者による英訳 、 ACROlT E T 20 目 j~ユーザー総会アカヂミアテウノザ晶ソリユーシヨンいヨン 作業フローの紹介 ③英訳 セルの位置情報を持つ一覧に英訳を反映 英訳 雇者育憂 塁重責量 一 一 患者背景 患者背景 M a l a i s e Fever ACRl 到百 230 ‑ 2 1

227.

「 … 作業フローの紹介 ③英訳 日本語は同じだけど一部別の表現を使いたい シート名 f T 夢IJ 患者背景 6 患者背景 7 1 患者背景 2 患者背景 7 患者背景 8 患者背景 9 患者背景 10 5 患者背景 1 6 患者背景 1 患者背景 2 1 A C l 盟、主T │有害事象 有害事象 │有害事象 1 2 1 3 1 4 対象文字列 英訳 i t e m 2 年 齢 目(歳) a g e ( y e a r so l d ) 2 項 c o m p l i c a t i o n 2 合併症 m a l e 3 男性 f e m a l e 3 女性 N 3 例数 作l e a n 3 平均値 1M 3 例数 3 平均値 / 作lean シ 内 ' W j 1 数 3 1 t N 日h i r s t 3 倦 口 渇 怠感 Ma~ 3 F e v e r 3 │暑熱 、 、 、 司 , ̲b ζ 22 「..ザ二必ァカデミア/ぷ孟ール二斗ふふ可….勺.市 作業フローの紹介 ③英訳 該当部分を書き換える..• シート名 f T 列 患者用足 6 患者背景 7 1 患者背景 2 患者背景 7 患者背景 8 患患者者背背景 患患賓者費背景 量 A C 1 凶訂 意著昔責 │有害事象 有害事象 有害事象 9 1 0 1 5 1 6 2 1 1 2 1 3 1 4 対象文字列 英訳 員白 i t e m 2 I a g e ( y e a r so l d ) 2 年齢(議) c o m p l i c a t i o n 2 合併症 m a l e 3 男性 f e m a l e 3 女性 N 3 例数 行l e a n 3 平均値 1 1 ¥1 3 例数 同~ ~司、 3 平均値 /"行lean 9 i j 薮 : t s 3 1 t Numberofsubjec 3 五 [ bi r s t . . . . . . . . " . , 喜 口 恵 渇惑 Ma~ 3 3 │発熱 F e v e r 、 、 ‑2 3 1 b 23

228.
[beta]
!11
ユーザー総会アヵデミア/テヤu
.
&
&Uユージョシセッシヨン

…E

戸

作業フローの紹介

④英訳を統計解析結果に反映

プログラムにより反映

A
ι回、百

24

(
叫Sユーザー総会子力デミァテヲノ戸内ソリユサヨンセツ山

…

E

作業フローの紹介

⑤英語版統計解析結果
1
s
a
f
e
t
ya
n
a
l
y
s
i
s populaL:
i
t
e
m
s
e
x

statist, eTã宮内 ~~~Oð "'llrð l!・・・'

m
aI
e

.
̲
.
.
.
.
.
..
,
町laIe

.
.
.
.
.
.
.
.
.
占
的
s
r
o

.
:a
g
e(year~N :
n

9
9
9
9
9
9
9
9
.
9
9
9
.9

999
レイアウトの調整 ~ ~ ~~~;~n.~-ゆ
.
,9
9
.
m
a
x
9
9
(列幅,印刷設定…)爾
N
9
9

9
9
9
9
9
9
9
9
.
9
9
9
.9

9
9
9
9
.
9
9
9
9
9
m
e
a
n
9
9
.
9
9
9
9
.
9
9
s
r
o
9
9
.
9
9
9
9
.
9
9
m
i
n
9
9
.
9
9
9
.
9
m
e
di
a
n
9
9
.9
9
9
9
.9
9
J'圃
・
・
・
.
.
.
l
'
1
t
r
9
9
.
9
9
9
.
9
:c
o
m
p
li
c
a
t
N
u
m
b
e
ro
f ; 9
9
9
9
~-<I制・・・・・・仰 (99. 9
) 9
9(
9
9
.9
)
N(
九
)
9
9(
9
9
.9
) 9
9(
9
9
.9
)
median~

l
.
.
.
.
.
.
.
.
、

Ac
回、z

‑
.
.
.
.
.
.
.
.
.
2
3
2

25

229.

「ムI!lーザー訟会シ五ふらふ 作業フローの紹介 ⑤英語版統計解析結果 完成! f ♀ 、 『、I;a f e t y ‑ a n aI y sIS p o p uI a tI0司 p l a c e b o d r u g ~ τ 市 a T← a g e( y e a r so l d ) ‑N‑ m e a n N 開1 m e a n S T D 一 一 晴 、 、 円Jumbero一 f J , 戸L c o m pI i c a ti 0 subjec主~ 2 1~~~ AωVET¥. ふ 一 一 戸λ ふ..ザ二総会士五反ぶらんふy で ム 9 9 9 9 9 9 .9 9 9 . 9 9 9 9 9 . 9 9 9 弱 9 9 .9 9 9 9 . 9 9 9 9 . 9 9 9 .9 9 9 9 . 9 1宮 9 9( 9 9 .9 ) 9 9( 9 9 .9 ) … 一 ー 9 9 弱 9 9 . 9 9 9 . 9 9 9 9 9 . 9 9 9 弱 9 9 .9 9 9 9 .9 9 9 9 . 9 9 9 .9 9 9 9 .9 ‑弱 9 9( 9 9 .9 ) 9 9( 9 9 . 9 )26 一一山 E 作業フローの紹介 ⑤英語版統計解析結果 "、,¥ 、 , 4 2 J( y s t e mo r g a nc l a s s p r e f e r r e dt e r m ' " G e n e r a ld i s o r d e r sa n da d m i n i s t r a t i o ns i t ec o n d i t i o l s T hi r s t I M a1 ai s e I F e v e r I G a s t r oi n t e s ti n aIdi s o r d e r s I D ia r r h o e a I C o n s ti p a ti o n I D y s p e p si a I V O α m i t i n g I R e s p i r a t o r y, t h o r a c i ca n dm e d i a s t i n a ld i s o r d e r s I R h i n i t i sa l l e r g i c I ¥ J γ 印 E p山 P 附h a r y 卯n g 伊0 1 凶 a r 門y n 昭g ea ld i s c ∞ o m f 向o r 吋t 、 、 』 ← 、 伺 t o t号│ . / 一一一. . . . . L ̲ ACRolT E T p l a c e b o N(覧) d r u g J 、 N(百Y‑‑J 9 9(日}J.日j 9 9( 9 9 . 9 ) 9 9( 9 9 .9 ) 9 9( 9 9 .9 ) 9 9( 9 9 .9 ) 9 9( 9 9 . 9 ) 9 9( 9 9 .9 ) 9 9( 9 9 .9 ) 9 9 ( 9 9 . 9 ) 9 9( 9 9 . 9 ) 9 9( 9 9 . 9 ) 9 9( 9 9 . 9 ) 9 9( 9 9 .9 ) 9 9( 9 99 ) 9 9( 9 9 .9 ) 9 9( 9 9 . 9 ) 9 9( 9 9 .9 ) 9 9( 9 9 .9 ) 9 9 ( 9 9 . 9 ) 9 9( 9 9 . 9 ) 9 9( 9 9 . 9 ) 叩 9 9( ω 9 9 .的 9 ) 9 9( 9 9 .9 ) ) 9 ω 9( ω 9 9 .町 9 9 9( 9 9 .9 ) 世 田 , } J } J .} J ) 27 一2 33 一

230.

l 1 1 1 ユーザー総会?ムミア/テウノロム…ーョンセ シ ョ シ ー γ E 発表の流れ e背景 零解析結果英訳における懸念事項 e作業フローの紹介 事まとめ A C l 副 主T 2 8 │ぬユーザー総会アザミア円ノム一一‑ョムッシ‑ーヶ まとめ ゥヶ ー一一一目 『期待されるメリット』 eプログラムにより… コ英訳作業時間の短縮 コ人為的ミスの軽減 コ再実行・再処理も容易 想英訳対応表により.ー コ作業の振り返りが容易 3逆変換(英語=今日本語)対応も可能 ACROl 官 、 ‑234 ‑ 2 9

231.

「ム副主主仏子I ふんぷ.5M 3 り. . . . . まとめ 『今後の展望』 撃英訳対応表をライブラリとして蓄積 =今さらなる英訳作業時間の減少ヘ 療[依頼者][疾患領域][プロジェクト]単位のライブラリ化 =今依頼者ニーズ、にあった英訳対応 ACROl 枯T 30 円ノ ηJ 口U

232.

製造販売後臨床データ集計に関する支援システムの構築 調査、試験の安全性定期報告から再審査申請まで 0岩 崎 智 昭 ・ 小 柳 寿 雄 ・ 木 村 彰 男 株式会社アームシステックス 医薬情報部 C o n s t r u c t i o no fs u p p o 口s y s t e mconcemingp o s t ‑ m a r k e t i n gc l i n i c a ld a t aa n a l y s i s TomoakiI w a s a k i/H i s a oKoyanagi/AkioKimura M e d i c a landDrugI n f o r m a t i o nDep , . tArmS y s t e xC o ., L t d 要旨 新医療用医薬品の製造販売後における安全性データは定期的に当局に報告する必要がある。安全性報 告 資 料 と 再 審 査 資 料 の 作 成 を 効 率 的 に 行 う こ と を 目 的 に SAS プ ロ グ ラ ム を 用 い た 支 援 シ ス テ ム (STARMACRO‑PV) を作成したので紹介する。 キーワード:安全性定期報告、再審査申請資料、マクロ、 STARMACRO はじめに 新医療用医薬品は製造販売承認申請のために行われた治験データのみでは安全性に関して充分でないこと が想定される。そのため、 6年 「医薬品の製造販売後の調査及び試験の実施の基準に関する省令J (平成 1 1 2月 20日厚生労働省令第 1 7 1号)に従い、 「使用成績調査」、 「特定使用成績調査」あるいは「製造販売 後臨床試験」が要求されている。 安全性を定期的に監視するために、上記の調査、臨床試験の安全性データに関しては当初は半年に l度そ の後は年 l回「安全性定期報告書別紙様式及びその記載方法について J (平成 1 7年 3月 25 日薬食審査発第 0325006 号・薬食安発第 0325001 号、一部改正平成 1 7年 1 1月 2 5日薬食審査発第 1125004号・薬食安発第 1 1 2 5 0 1 1号、一部改正平成 1 8年 3月 1 3日薬食審査発第 0313013号・薬食安発第 0313001号)、 「医薬品未 知・非重篤高J [ 作用定期報告書の記載方法等について J(平成 1 7年 1 1月 2 5日薬食安発第 1125010号)に従い、 当局に報告する必要がある。 また、再審査期間が終了した際には、「新医療用医薬品の再審査申請に際し添付すべき資料について J ( 平 7年 1 0月 27日薬食審査発第 1027004号)に従い、上記の調査、臨床試験のデータをまとめ、再審査申請 成1 をする必要がある。 236

233.
[beta]
「使用成績調査J 、 「特定使用成績調査」あるいは「製造販売後臨床試験」の集計に関しては出力形式が
上記「安全性定期報告書別紙様式及びその記載方法について」及び「新医療用医薬品の再審査申請に際し添
付すべき資料について」にて、特に安全性に関して、別紙様式として定型化されていることから、標準マク
ロを作成し資料作成の効率化を図るシステムを作成している。そのシステムの概要に関して報告する。

安全性定期報告
前述のように安全性定期報告は「安全性定期報告書別紙様式及びその記載方法についてい 「医薬品未知・
非重篤副作用定期報告書の記載方法等について」で様式と記載方法が規定されている。
様式 i
土
原J
紙傑式 l

製造販売後調査等の実施状況の概要

別紙様式 2

使用成績調査における副作用・感染症の発現状況一覧表

別紙様式 2の 2

使用成績調査・特定使用成績調査・製造販売後臨床試験における重篤な有害事象の
発現状況一覧表

別紙様式 3

副作用・感染症症例報告における発現状況一覧表

別紙様式 4

副作用・感染症症例報告の目次

別紙様式

未知・非重篤巨1作用発現症例一覧表

となっている。
このうち別紙傑式 2及び別紙様式 2の 2に関しては集計が必要となるため今回のシステムの対象とした。

表 1 別紙様式 2
別紙様式 2 使用成績調査における副作用・感染症の発現状況一覧表
使用成績言笹
時期

承認時 i
与の 平成 ll'手4 月 1~

t
t
i
l
t

平成 12年4 月 1~

t

平成 1
2
'
1
'
‑
4月 1"

t

T暗 12年 3月31日 ヤ暗 13年3月316 平成 13年 3月316
調 会 施 設 教
調 合 : 組 問 数
副作用等の発現症例敢
副作用等の免現件散
副作用等の発現症例率
副 作 用 の 極 函

畢 染l
i
t
および帯生!i‑'
Ji

5
0
250
1
0
1
5
4.0偶

2
田
1
6
0
200
1
6
0
1
,
4
田
1.150
1
,150
3,7
5
0
1
3
0
<1)
S
O
<
I
>
1
0
40
:
1
1
‑
7
7
<
1
>
5
1
¥
3.48
3.45%
3
.‑
1
8
¥
3.48
<0.07
現
〉
<0.07〉
副作用為的種頑"'1発'Ji位倒{件数 j 中{
)
1
(
0
.
0
7
)
1
(
0
.
0
7
)

お

$+ffi~詔1)-

.
4
i
L
l
1
〈
{
{
P
0
J
0
0
J
7
7
1
)
ム
〉

*HH'
暗
¥
!
I
,
心厳障害
洞性ィ、重脈
本心房掴動

1
(
0
.
1
0
)

習腸障害
悪心
恒躯
‑出血性脂尭
府j
但道系障害
肝硬変
I
脂 肪R
*急性肝費
度膚および直下組曲障害
型疹
多汗症
本直下出血

3
(1
.2
0
)
2
(
0
.
"
0
)
2
(
0
.
8
0
)
1
(
0.
4
0
)
1
(
0
.
4
0
)

臨床桔査
へそグロビン輔少
アラニン・アミノトランス
フ エ ラ ー ゼi
目加
アンススパフエラギラーン醍ゼ増ア加
ミノ トラ

‑237

唱 間 制

300
2850

3.51~

5
端
1
(
0・
詔
07
)
ふ

1
(
0
.
4
0
)

MedDR
Al
J

Z
十

世用成抽調査合
の累計

11
.0)

234.

再審査申請資料 前述のように再審査申請資料は「新医療用医薬品の再審査申請に際し添付すべき資料 J で規定されている。 また、 rr 新医療用医薬品の再審査資料申請に際し添付すべき資料 J の作成の手引き」が日本製薬工業協会 2 ) 特定使 の編集で発行されている。本システムでは添付資料(1)使用成績調査に関する資料、添付資料 ( 用成績調査に関する資料及び製造販売後臨床試験に関する資料のうち以下の帳票の作成を対象とした。 ・症例構成 ・患者背景一覧表 ・副作用の発現頻度 ・患者背景別副作用発現状況一覧表 システムフロー 今回のシステムにおけるフローを図 lに示した。 調査・試験データ 図 1 システムフロー 調査・試験のデータ集積方法は様々であることから、データ変換プログラムを用いてシステムで用いるデ ータを作成し、帳票作成プログラムには汎用性を持たせることとした。今後の展開を考え、帳票作成プログ ラムで処理するデータセット構造は CDISCの SDTMに必要な変数を追加する構造となっている。 帳票作成プログラムでは別紙様式 2 や別紙様式 2-2 のように様式が固定されているものでは ~ledDRA のパー ジョン等のメタデータを設定するだけで作成できるようになっている。その他の帳票においては項目の選択 ‑238 ‑

235.

等は GUIで設定できるようにしており S A Sプログラミングの知識がなくとも帳票を作成することができるよ うになっている。また、一度設定した項目は繰り返して使うことが想定されることから、設定ファイルとし て保存することができ、次回からはその設定ファイルを呼び出すことにより簡単に帳票を作成することがで きる。 また、プログラムの実行日時、入力データ等を保存する形での履歴管理が行えるようになっている。 メニュー構成 帳票作成プログラムのメニュー構成を示す。すべての作業は G U Iを用いて対話的に作業できるようになっ ている。初期メニューは以下のとおりになっている。 |醤訂r~m;:r~'t:tJ:r'l i 旦 麿 置I よ : 臨床データ帳票作成システム STAR l ¥ fACRO‑I)V 定期報告・再審査苅応版 園 民主 デ』タ選択 薬剤x x x 国 データ選択画面を押すと以下のメニューが開く。 ‑239

236.

(子短古川一一……一一 . . 箇瞥 デ』タ選択 五百語前 00 錠 贈男鳴 ; 0 ムロ あいうえお 薬斉J I 名 ; j 薬育I J X X X 調査種目J I 販売後 図 書R 4 / 1 0 調査期間 2 0 0 7 / 0 5 / 0 1 ~ 2 0 1 0 / 0 4 / 3 0 iデ』タ取込 ] 1ClipC主~ ̲ ̲ i ‑ ' *二 上 亡互コ I~'i'Jt)~ 1 この画面であらかじめ変換されたデータを指定しデータを取り込む。現在の初期画面では薬剤 x x xのデー タが取り込まれている。 ' ¥ " 包 囲 │ 塑 │STARMACRO 臨床デー担帳票作成システム STARl\fAむ RO 圃 I~V 定期報告・再審査苅応版 国 薬斉I J x XX ー データ取り込み後、初期メニューに戻り帳票作成を押すと以下のメニューが開く。 240

237.

│ 恥 TARMACRO 山 B閉園 I 薬剤x x x 使用成績調査における副作用・!菩染症の発現状況一覧表 国 g l j S 時間 国 g l j 紙様式4 副作用/慾染症症例報告助ける発現状況一覧表 国 g l j 紙様式 10 重篤な有害事象の発現1 統一覧 〈調査局蛾〉対象症例概要一覧表 国患者背長一覧表 国 患 者 時g l j ; l j 作用問状況一覧表 圃 このメニューで出力したい帳票を選択する。別紙様式 2を押すと以下のメニューが開く。 EE 蓮司・・圃量制樋岡I 出力先 E x c e l 7 r イル名 x c e lファイル名とシート名を指定する。詳細 別紙様式 2では設定することがほとんどないため出力先の E 設定ボタンは MedDRAのパーション等のメタデータを指定するもので、一度指定しておけば変更のない限り設 定の必要はない。 ‑2 4 1‑

238.

… 議 │S 九B i ……… 包国関 I 一 薬剤x x x 霊童 ~IJ紙様式2 使用鵬調査(;:制するE 柵 固 目J I 紙様式3 (調査樹齢対象倒J I 概要ー覧表 固 別 紙 様 式4 副作用滑染症症何J I 報告{二お回発現状況一覧表 固 目J I 紙様式 10 詩情害事象の発現状況一覧 固患者哲果一覧表 固 患 者 哲 果 時1 1 1 明観状況一覧表 園 患者背景一覧表のような設定が必要な帳票を選択すると以下のメニューが開く。 [主扇子‑…一一川…一一…………開閉 I テ.‑タセット変数名 表示項目 巴 巴 出力 E x c e lフ7イル名 匡自 議j 亡互コ巴璽9iA: 1[~';7~t!J~ 1 ‑2 4 2‑

239.

既i こデータセットが読み込まれていることから、左上のデータセット変数名のウインドウにデータセット に含まれる変数名が表示される。データセット変数名から表示したい項目を選択して表示項目欄に移動させ る。表示項目の順番も表示項目右の矢印で入れ替えることができる。データセット変数名をハイライトする ことにより左下のウインドウにその変数の詳細が表示される。 年齢のようにカテゴリと計量値を持つ場合には二つの変数を持つ必要がある。集計の際には種別に従いカ テゴリでは頻度集計が、計量値では要約統計量が算出される。 最後に 今回は、当社が蓄積している「標準マクロ集」の応用として製造販売後臨床データ集計に関する支援シス テムを作成した。本システムで作成した患者背景、安全性に関する帳票は治験における帳票にも応用可能で、 ある。治験においては安全性では重篤以外にも例えば治験薬の処置等のデータが追加されることがあるが、 患者背景で用いた GUI での設定を使用することにより、帳票作成の時間の短縮に寄与できると考えている。 さらに臨床検査、パイタルサインあるいは ECGデータの処理マクロを追加することにより治験における安全 性の帳票は網羅できると考えている。 本システムを応用するためには帳票の標準化は不可避である。また、変換プログラムの効率を上げるため にはデータマネージメントシステムの標準化も必要となってくる。本システムの導入が社内業務の標準化を 進めることの一助になれば幸いである。 ‑243 ‑

240.

参考文献 「医薬品の製造販売後の調査及び試験の実施の基準に関する省令 J (平成 1 6年 1 2月 20日厚生労働省令第 1 7 1号) 「安全性定期報告書別紙様式及びその記載方法について J(平成 1 7年 3月 2 5日薬食審査発第 0325006 号・ 3 2 5 0 0 1 号) 薬食安発第 0 「医薬品未知・非重篤副作用定期報告書の記載方法等について J (平成 1 7年 1 1月 2 5日薬食安第 1125010 号) 「安全性定期報告書別紙様式及びその記載方法について」の一部改正について(平成 1 7年 1 1月 2 5日薬食 審査発第 1 125004号・薬食安発第 1 1 2 5 0 1 1号) 8年 3月 1 3 日薬食 「安全性定期報告書別紙様式及びその記載方法について」の一部改正について(平成 1 審査発第 0313013号・薬食安発第 0 3 1 3 0 0 1号) 7年 1 0 月 27 日薬食審査発第 「新医療用医薬品の再審査申請に際し添付すべき資料について J (平成 1 1 0 2 7 0 0 4号) M S部 会 編 集 日本製薬工業協会医薬品評価委員会 P 料」の作成の手引き 柳津健太郎・常吉 改訂版 8年 6月作成 平成 1 華奈・山本 「新医療用医薬品の再審査申請に際し添付すべき資 医薬出版センタ一発行 A Sプログラムの標準化、 S A SF o r u m 典子、臨床試験における集計解析用 S ユーザー会学術総会 2004論文集、 25‑32 ( 2 0 0 4 ) ‑ 244

241.

SASを用いたデータチェック仕様の検討 西野美沙、今野聡、堺伸也 イーピーエス株式会社臨床情報処理部門 C o n s i d e r a t i o nofd a t ac h e c ks p e c i f i c a t i o nu s i n gSAS MisaN i s h i n o, S a t o s h iKonno, S h i n y aS a k a i 8 i o m e t r i c sD i v i s i o n,EPSC o ., L t d . 要旨 集計・解析上問題となり得るデータを事前に確認することで、データ固定から解析結果提示までの業務 を速やかに遂行することが可能となる。今回、 SASを利用した簡便なデータチェックの仕様を検討した。 キーワード:データチェック、盲検下レヴュー 1.はじめに 臨床試験のデータを解析する際、解析担当者は適切な解析を実施することに加えて、迅速に解析結果 を作成することが求められる。迅速な薬剤の開発、規制当局への報告および臨床成績の公表のため、デ ータ収集後の速やかな解析の実施は重要である。 通常、解析方針は事前に統計解析計画書に記載されており、これは迅速な解析の実施にも大きく貢献 している。しかし、統計解析計画書に沿った解析を実施するための詳細な仕様は、多かれ少なかれデー タの収集後に検討する必要がある。その際たる例としては、予想外のデータの発生や、データ聞に不整 合が生じているようなケース(イレギュラーデータ)への対応である。探索的な部分集団解析を行う場 合の集団の区切りの決定や、注視すべき疾患や薬剤l の特定なども併せて行う必要がある。また、解析計 画の見直しのため実施される盲検下レヴューにも関連するが、欠測値、外れ値の確認も行うべきである。 データ固定以前に予めこのようなデータチェックを実施することにより、データに依存する解析仕様 の詳細を事前に取り決めることができ、キーコード開示から解析結果提示までの業務を滞りなく実施す ることが可能になる。 今回、データチェックを容易に実施するための SASプログラムを作成した。問題となるイレギュラー なデータの確認と併せて、データの分布等を確認し、「盲検下レヴュー」資料としての応用も検討した。 なお、今回利用する SASのパージョンは 8 .2である。 245 一

242.

2 .データチェック実施手順 データチェックの目的は以下のとおりとした。 ・ ・ ・ ・ ・ ‑ イレギュラーデータ(外れ値、欠測値を含む)の確認 部分集団解析のためのサプ.グ、ループの検討 有効桁の確認、 測定値に対する単位の確認 特定の薬剤j 区分および疾患区分の検討 規定されたスケジュール外で測定されたデータの確認 上記を実施する際の資料を、 SASを用いて作成する。 SASの出力を、 ODS機能を用いて整形し、再出 力した結果をそのまま使用することとした。 汎用的でない変数ラベルおよびフォーマットの設定を最小限に止めたため、結果が多少読み辛くなる という点は否めないが、別途以下のような変数名および値の一覧を作成することで、対応することとし た 。 変数名 ラベル f 直 age 年齢 sex 性別 。 ラベル 男性 女性 今回のデータチェックは、症例報告書の記載を忠実に反映した入力データに対して実施することとし た。入力データはテキスト型でデータを保持していることも多く、解析実施の際には、入力データに変 数変換や、解析に必要な変数を追加する等の加工を施した、解析用 SASデータセットを作成する。その 大元である入力データに対するデータチェックを行うことで、解析用 SASデータセットの作成時に発生 するエラーを予見することができ、また、イレギュラーなデータの発生時点が特定されるため、対応を 要する段階が明確になる。 今回は、作為的にイレギュラーなデータを混入させたサンプルデータを作成し、そのデータを用いて 実用前の試用を行った。 3 .データチェックの仕様 まず、外れ値以外のイレギュラーデータの抽出方法を検討した。 入力データの内容から、変数型を自動的に選択し、その変換が施せないデータについては別フィール ドにデータを保持する SASデータセットの作成プログラムを検討し、作成した。例えば、あるフィール ドに格納されているデータの 10%以上が数値に変換できるデータであれば、フィールドの型を BESTフ ‑246 ‑

243.

ォーマットを用いて数値型に変換し、変換できないデータは別フィールドに変換適用前のデータのまま 格納する。この別フィールドに格納されたデータを一覧することにより、イレギュラーなデータを容易 に確認することができる。 次l こ、上記の手順により得られた S ASデータセットから、データチェックの目的を果たす資料の作成 仕様を検討した。要約統計量(パーセント点を含む)または分類別の頻度を確認することにより、外れ 値の確認およびサブPグ、ループの検討は可能であると考えた。外れ値については、値のみならず、そのデ ータをもっ症例が特定できることも望ましいと考え、仕様を検討した。 測定値に対する単位の確認や特定の薬剤区分および疾患区分の検討は、 2変数毎の集計により確認、 検討することとした。 表 I の被験者背景の分布 ( 1変数毎)は、 l変数毎の SASシステムの UNIVARIATEプロシジャまたは FREQプロシジャの出力結果を簡素化し出力した。加えて、当該変数の桁数、極イ直をもっ症例番号とそ の値、欠測値およびイレギュラーなデータをもっ症例とその値を示している。 1変数毎) 表!被験者背景の分布 ( 分類変数と判断された項目 頻度集計 連続変数と判断された項目.要約統計量を表示 連続変数については桁数と極値をもっ症例の情報を表示 欠現lJi直を含むイレギュラーデータについて、症例番号と内容の一覧を表示 C O L4 C O L 5 C O L 6 ∞ C O L7∞L8 3:204・ 2 6 5:3 1 6:2 0 7:2 7 2 8年 6月 1 9白木曜日 1 4 : 1 4 1 頻度 V a r N a m e ∞ L 1 C O L 2 s e x 0:1 0 5 1:9 5 s i t e 1:272:25 ∞L3 ∞ 要約統計量 V a r N a m e a g e 8:2 4 2 8年 6月 1 9白木曜日 1 4 : 1 4 2 標本数 平均値 標準偏差 最小値 5 g も点 25%点 印%点 75%点 95%点 最大値 1 9 9 4 9 . 4 6 7 3 9 . 6 8 3 8 2 3 . 0 3 3 . 0 4 2 . 0 0 5 0 . 0 0 5 6 . 0 0 6 5 . 0 0 7 5 . 0 d u r a 1 9 8 5 .3 2 3 2 2 .0 5 4 2 1 .0 2 .0 4 ∞ 5 . 0 0 7 .0 0 9 .0 0 1 2 . 0 w e i g h t 1 9 7 5 5 . 6 1 2 2 1 0 5 5 ∞ 2 6 .5 3 9 .6 4 8 .7 0 5 5 . 8 0 6 2 ∞ 7 0 . 9 0 8 6 . 7 ‑2 4 7‑

244.

表 l被験者背景の分布 ( 1変数毎) (続き) 初日 8年 6月 1 9日 木 曜 日 有効桁 a g e 1 O ^0 d u r a 1 O ^0 w ei g h t 1 0二 1 99 87 89 9 有効桁 数 度 V a r N四 e 1 4 : 1 4 3 1 0 ‑ 0 ∞ 2 8年 6月 1 9日木曜日14:1 4 4 極値をもっ症例 V a r N a n 官 5%点以下の caseno 値 ω‑ { J7 a g e 95%点以よの caseno 値 。 牛{ } 5 6 5 . 0 2 3 . 0 0 1‑ { J1 2 4 . 0 0 4 ‑ 2 0 6 5 . 0 ω‑20 2 4 . 0 0 1 ト2 0 6 5 . 0 0 6‑ { J5 2 9 . 0 0 5 ‑ 2 6 6 5 . 0 0 6 ‑ 1 9 3 0 . 0 0 7 ‑ 2 4 6 5 . 0 1 ‑ 11 0 31 .0 0 2 ‑1 2 6 6 . 0 0 5 ‑ 2 1 1 .0 3 0 3 ‑ 2 0 6 6 . 0 1 ‑ 15 0 3 2 . 0 0 7 ‑ 1 5 6 7 . 0 ω‑ { J8 3 2 . 0 3 ‑1 2 0 6 9 . 0 { J2 0 5‑ 3 3 . 0 0 1 ‑ 2 7 71 .0 3 3 . 0 { J4 0 1‑ 7 2 . 0 0 2 ‑ { J2 7 5 . 0 0 5 ‑ 2 2 I r r e g u l a r V a r N a m e c a s e n o a g e 0 4 ‑ 1 7 肉容 s 松明 0 4‑ { J5 不明 w e i g h t 0 2 ‑ 2 1 4 7 . 3 { J4 0 4‑ 0 5 ‑ 2 6 ‑248 ‑ ∞ 2 B年 6月 1 9日 木 曜 日 1 4 : 1 4 5

245.

表 2被験者背景の分布 ( 2変数毎) 分類変数 x分類変数(パターン 1 ) ークロス集計 分類変数 x連続変数(パターン 2) ー分類毎の要約統計量を表示 パターン 2については分類毎に連続変数の桁数を表示 2変数のうちどちらか一方にイレギュラーデータが存在する場合、症例番号と内容 の一覧を表示 日 初8年 6月 1 9白木曜日 1 4 : 1 4 分 ' ! 1 J 表 C O L 1 V a r N a m e C O L 2 C O L 3 U*1 。 *U・ 0 1 1 * 1 4 1 。 * 0 :8 5 。 * 1 ・0 。 * 2 :0 。 * 3 :0 1 * 1 1 *2 3 5 1 *3 : 4 1 1 *a ! c hi s a! c un 。 * 0 s m k u n 向 山h i s 時: 0 1 1 0 2 0 * 2 :0 1 *2 3 8 2 8 本 日3 0 1 * 3 2 9 9白木曜日 1 4 : 1 4 2 2 0 0 8年 6月 1 ! r r e g u! a r V a r N a m e c a s e n o 変数 1内容 s n 也 団 岡 崎h i s 0 4 ‑ 0 5 変数 2内 容 不明 ∞ 2 8年 6月 1 9白木曜日 1 4 : 1 4 3 カテゴリー別要約統計量 V a r N a m e c a t e g o r y s e x * a g e 。 * a g e .0 41 .5 4 9 . 1 0 44 8 . 1 8 2 7 1 0 . 1 5 2 0 2 3 . 0 31 l * a g e 9 5 5 0 . 8 7 3 7 8 . 9 8 7 3 3 1 .0 3 6 . 04 5 . 0 5 2 . 0 05 7 . 0 6 6 . 0 7 2 . 0 本w e ig h t s e x 1 C O L 4 標本数平均値標準偏差量小値 5%点 25%点印%点 75%点 95%点最大値 柑 。eight 1 柑eight ∞55.0 臼 o 75.0 1 0 2 5 5 . 5 8 0 4 1 0 . 0 2 9 9 2 6 . 5 3 7 . 35 0 . 0 5 6 . 3 5 6 1 .2 7 0 . 5 81 .5 9 5 5 5 . 6 4 6 3 1 0 . 0 3 2 42 7 . 2 4 2 . 34 7 . 5 5 4 . 9 0 6 2 . 5 7 1 . 8 8 6 . 7 2 0 0 8年 6月 1 9白木曜日 1 4 : 1 4 4 カテゴリ -~IJ 有効桁 V a r N a m e c a t e g o r y 有効桁 度数 s e x * a g e 。 * a g e 1 Q ^0 1 0 4 l * a g e 1 Q ^0 9 5 柑 e i g h t s e x 本 。weight 1 Q ^ ー1 9 1 1 本 w e i g h t 1 0 。 角 1 1 1 0 ぺ1 8 7 1 Q ^0 8 249 一

246.

表 2被験者背景の分布 ( 2変数毎) (続き) I r r e g u l a r V a r N a m e ー内容 c a s e n o 変数 1 s e x * a g e 0 4 ‑ 1 7 柑 e i g h t s e x 0 2 ‑ 2 1 。 2 0 0 8年 6月 1 9白木曜日 1 4 : 1 4 6 変 数 2内 容 4 7 . 3 0 4 ‑ 0 4 0 5 ‑2 6 表 2被験者背景の分布 (2変数毎) 1 士 、 2変数毎に表 Iと同様の集計を行ったものである。 ) の集計については、被験者背景の項目に限らず、その他の集計項目にも応用 上記(表 lおよび表 2 することが可能な汎用的な仕様となっている。 2変数毎の集計プログラムをマクロ化することで、分類別に検討すべき項目について、容易に分布の 確認を行うことが可能である。例えば、各施設において梅床検査値が測定されるような場合、施設問で 単位が異なるということがある。データチェックの際に複数の単位の存在が確認できたならば、解析用 SASデータセットの作成の段階で、単位変換を含めた仕様を検討することができ、その後の解析、集計 も円滑に実施することが可能となる。 また、もう一つの有用性としては、入れ子構造となっている項目聞の整合性の確認が可能で、あること が挙げられる。不整合が生じていることが、データ固定後の集計において初めて発見されるケースも少 なくない。容易にこの不整合を抽出することが可能となれば、随時このデータチェックを行い、対応方 法を臨床担当者と協議することができる。上記の集計結果はその際の有用な資料ともなり得る。 今後の課題として、今回内容が不十分であった、特定の薬剤jおよび疾患区分の検討を可能にする仕様 について検討を行いたい。 4 .盲検下レヴューへの応用 盲検下レヴューは、統計解析計画書の固定を目的として、試験終了からキーコードの開示までの閣に、 盲検下でデータの確認を行うことである。盲検下レヴューを実施することにより、偏った判断を下す可 能性の小さい状況で、解析計画の妥当性や症例およびデータの取り扱いを検討することができるため、 ICH‑E9 r 臨床試験の統計的原則」においても有用で、ある旨が記されている。 今回のデータチェックの仕様を踏まえ、盲検下レヴューへの応用を検討した。 ‑2 5 0一

247.

表 3有効性評価項目の分布 表 lと同様の仕様に加えて、歪度と尖度を表示 2 0 0 8年 6月 1 9日 木 曜 日 1 7 : 3 1 要約統計量 V a r N a m e 標本数 平均値 標準偏差 最小値 5%点 25%点 50%点 75%点 95%点 最大値 e f f c t 1 2 0 0 5 9 . 8 1 0 . 3 9 9 6 3 2 4 2 . 5 5 4 5 9 6 8 7 5 . 5 9 2 2 0 0 8年 6月 1 9日 木 曜 日 1 7・3 1 2 有効桁 V a r N a m e 有効桁 度数 e f f c t 1 1 0 。 向 2 0 0 極値をもっ症伊l 加問 V a r N e f f c t 1 1 9日 木 曜 日 1 7 : 3 1 3 2 0 0 8年 6月 1 5%点以下の c a s e n o 直 { 95%点以よの c a s e n o 値 0 3 ‑ 1 4 3 2 0 7 ‑ ω 7 6 OHJ7 3 4 01ω 7 7 0 4 ‑ 1 0 3 5 0 1 ‑ 13 7 7 < l2 ω‑ 3 7 0 4 ‑ 1 5 7 7 0 8 ‑ 2 1 3 7 0 1 ‑ 1 6 関 0 5‑ < l2 4 1 0 7 ‑ 1 7 8 1 1 ‑ 11 0 4 2 0 2 ‑ 1 8 邸 ω‑ < l8 4 2 0 4 ‑ 2 3 8 4 0 7 ‑ 1 4 4 2 0 6 ‑1 5 8 7 < l6 ω‑ 4 2 0 3 ‑ 0 4 9 2 ∞ 歪度/尖度 2 8年 6月 1 9日 木 曜 日 1 7 : 3 1 4 V a r N a r 問 歪度 尖度 e f f c t 1 0 . 0 1 3 6 4 2 0 . 1 5 0 4 4 表 1と同様のプログラムを用いて有効性評価項目の分布を確認する(表 3 ) 。加えて、 UNIVARIATE プロシジャにより算出される歪度と尖度を併せて出力し、正規分布からの解離を確認する。また、有効 性評価項目の時点毎の分布や、被験者背景因子の分類毎の分布は、表 2と同様のプログラムを用いて容 易に確認することができる。連続変数との関係は、 REGプロシジャによる単回帰分析の結果(表 4 )よ り検討することとした。 2 5 1‑

248.

表 4回帰係数の推定 各単回帰モデルにおけるパラメータの推定値および有意性の検定結果を表示 各モデルの寄与率を表示 ∞ 回帰係数の推定 2 8年 6月 1 9日 木 曜 日 1 3 : 5 1 M od e[ D e p e n d e n tV a ri a b[ eD F E s t i m a t e S t d E r r t V a[ u eP r o b t r ̲ s q u a r e n t e r c e p t1 M O D E L1 e f f c t1 [ 5 8 . 4 1 6 7 3 3 . 8 2 0 2 7 1 5 . 2 9 ∞ <01 0 . 07 7 8 g e M O D E L 1 e f f c t 1 a M O D E L 2e f f c t 1 [ n t e r c e p t 1 M O D E L 2e f f c t 1 w e ig h t 阪 l OE L 3e f f c t 1 [ n t e r c e p t 1 M O D E L 3 e ff c t1 d u r a 0 . 0 2 9 3 3 0 . 0 7 5 8 8 5 7 . 3 9 2 3 7 4 . 1 3 6 3 4 1 3 . 8 8 0 . 0 4 4 5 4 0 . 0 7 3 3 1 ∞ 0 . 3 90 . 6 9 9 5 ∞ . <01 0 . 0 0 1 9 1 9 0 . 6 10 . 5 4 4 2 ∞ <01 。 ∞2822 5 8 . 4 5 3 6 8 2 .0 5 0 9 7 2 8 .5 0 0 . 2 6 3 7 0 0 . 3 5 7 7 3 0 . 7 40 . 4 6 1 9 表 3および表 4を用い、有効性評価項目の分布および他因子との関係を確認することで、盲検下レヴ ューの目的である、解析計画の妥当性の検討が可能となる。 図 lの観察スケジュールの遵守状況は、規定された観察時期から実際の観察日のずれを図示したもの である。許容範囲外で観察を行った症例について、 GPLOTプロシジャの POINTLABELオプションを指 定し症例番号を表示する。データチェックにおいては、規定されたスケジュール外で測定されたデータ の存在を確認するための資料となる。 同様のプログラムを用いて、服薬遵守状況や中止時点での検査の実施状況等を図示することが可能で あり、盲検下レヴューにおいては、プロトコール逸脱症例や問題症例を確認、する際に利用できる。 F同U nL nL

249.
[beta]
図 l スケジュールの遵守状況
横軸:基準日から観察日までの日数、縦軸:各症例に付与した任意の数値
主、症例番号を表示
規定外の時点で観察されている症例 l

•

i

! !I~l

"
"

I

I
S‑
CS

E

1
}
‑1l3

.
"

.
.

2

1

・
. ・
a
h

i...!1悔
.
担

H

""ヨ

IE441E4'a
E
S
42
A
a
a

S

・

4

草

品
戸

"
声
明
A司

』

•

I
I

1
1畠‑‑El

..
畠
,
.
抑

. ‑Z
刑

E

E221a‑19
a
d
a
‑
P

E

..

"

.

3
的‑<,

宜
‑

舵ー鳳隠

凶制

1
&
‑
1
1
1

司

j

・

¥
I
H世

4

・

国
;
P
'.,
;
.
..

1

.
.
.
.
0
1
t
Q

:

・

回

1
; ,.

回~n~

‑

a‑

a a

413ta

'
ι

2

・

,
旬u
・a

; :

~
~

む1
‑
t
Z

.

s
a

I

・ 会

・ ・

t

A

Ii

1

l

皐I ・
‑

~

・ ・ O!:.~
,
ト
羽

: .
.
lN"

!

d

.

..
.
";..Ul
‑司?! 島
! 1U~&
1.
・
.

.
.
.
:

2.a82‑a11

量

.

"
・
(
1
1

1

A

"‑‑"必1

t
1
"
1
2
・
1
• '
"
,
'

品

ー

"

守

一
.

,,‑悶血凧

.

I .
.

f .
.

i・

.

1

2

~

a
竺
・JI
f
r
守1
司
'
"

E . 1 H 2 2
量

喝

2

;
3 1 1量j
1

・
"
a
16412
害 " ・

J

1i~IZ

:
l

&

1

1
1
t
5
・
胡

•

・

I

IB

t

同
量

I
,
1

・1 •

・1

i 叩
・
a
,

島
a

.

!.. I'~!?

羽守1
1
3

i:

叫

u
‑
倒 的 : 回

!

!
:

4

虫

.
. QJ‑.
.

.

•
宜 . .

a

.
H
事

I

事

A

ie14

"

5
. まとめ
SASを利用することにより、集計・解析時に問題となり得るデータを非常に簡単に確認することがで
きた。臨床試験で収集されるデータは多岐にわたるが、汎用的な仕様であるため、様々なデータに対し
て用いることができた。
今後は、データチェックに留まらず、盲検下レヴュー資料としての利用も踏まえて、特定の薬剤およ
び疾患区分に該当するデータの確認や問題症例抽出の仕様について、更なる検討を行し、たい。

[参考文献]
「臨床試験データマネジメント

データ管理の役割と重要性一 J (2004) 辻 井 敦 著

「臨床試験のための統計的原則 J (1998) 厚生省医薬安全局

2
5
3‑

250.

BITAPアルゴリズムによるマッチング 0中村竜児山)・角真理子1) 1 ) 国立保健医療科学院 2 ) 株式会社インクリース研究所 ApproximateT e x tMatchingi nSAS 2 ORyojiNakamura1)2)• MarikoSumi ) 1 )N a t i o n a lI n s t i t u t eo fP u b l i cHealth 2 )INCREASECO, LTD. 要旨 FDAへの有害事象報告には、有害事象名だけでなく使用薬剤名も報告、登録されている。 しかし有害事象名が Me dDRAの PT名で登録されているのに対して薬剤名は用語統一は行 われておらず報告名のままの登録となっている。そのため医薬品のリスク評価等を行うには、こ 名データ (AERS薬剤l データ)のクリーニング、を行う必要がある。本発表では、このデー の薬剤J タクリーニング過程で利用した DATAステップにおけるプログ、ラミング技法等を報告する。 キーワード: DATAステップ、 SQLプロシジャ、 P e r l正規表現、 AERS 1 はじめに SASは SOUND‑LIKE演算子 I = * Jを用意している。これは WHEREステートメントに記述 して、サウンテeツクスアルゴ.リズ ムに基づいて似たスペルの文字列を選択するための演算子で ある。サウンデックスアルゴ.リズムは、文字列をサウンデ ックスコードに変換して発音類似技術 により 2つの文字列の付け合せを行うものである。以下にサウンデ、ックスコードへの変換方法を いくつか挙げる。 ・語頭の IMACJ→ IMCCJ .語頭の ISCHJ→ I SSSJ .全ての IDGJ→ IGGJ ‑全ての INSTJ→ INSSJ ・語尾の I A J、I S Jを削除 ・上記の様な変換を行った後で全ての母音 UAJ、I I J、I U J、I E J、I O J、I Y J )を削除 BITAPアルゴ、リズ ムは文章の中に検索したい文字列(パターン)と全く同じかそれに近い文 字列が存在するかどうかを、パターンと文章中の文字列の一致度(レーベンシュタイン距離)で 表し、一致度が闇値より小さければ採用するとしづ考えである。本報告では、 AERS データに に報告された薬剤名と、辞書名とし、う単一の単語どうしの付け合せに利用してみる。 ‑254

251.
[beta]
2 辞 書 デ ー タ と AERS薬 剤 デ ー タ の 準 備
2
.
1 P
e
r
l正規表現
まずはじめに P
e
r
l正規表現により AERS薬剤データから薬剤名以外の文字列を抽出し
削除する
SASが用意する P
e
r
l関数と CALLルーチンには主に以下のものがある
数値変数 =PRXPARSE(
正規表現)
正規表現を作成しその内容を数値変数(パターン ID)に劃り当てるこのパターン
IDは後に記述する関数や CALLルーチンの引数として使用するこの関数は DATA
ステップの ITERATIONにおいて 1度しか実行されないため最初のオブザベーショ
ンで実行し RET
AlNステートメントで劃り当てた数値変数の値を保持する必要がある
数値変数 =PRXMATCH(
パターン凹または正規表現,対象文字列)
マッチした文字列の開始位置を返す見付からない場合は Oを返す
CALLPRXSUBSTR(<ターン ID,対象文字列,数値変数 1<,数値変数 2>)
マッチした文字列の開始位置を数値変数 1長さを数値変数 2に返す
CALLPRXCHANGE(
パターン ID,置換回数,文字変数 1<,文字変数 2
>
)
文字変数 1内のマッチした文字列を PRXPARSE関数で指定した置換文字列に見
付かった1
)
頂に置換回数(‑
1を指定した場合は全てのマッチした文字列)分だけ置換し文
字変数 2
(指定しない場合は文字変数 1に上書き)に返す先に実行する PRXPARSE
関数で IPRXPARSE(s
/
正規表現/置換文字列f
'
)J
のように最初のデリミタの前に置換
オペレータ 1
s
Jを指定する
正規表現はデリミタ(デフォルトは 1
/J
)で囲みさらに関数内ではタ守ブルクォーテーション(ま
たはシンクeルクォーテーション)で囲むまた正規表現で使用する主なメタ文字は以下の通り
である
メタ文字
記述
使用例
数字

¥
d
¥
d
¥
d
J
:
3
桁の数字
¥d
数字以外の文字や記号
D¥D
J
:レングス 2の任意の文字列
¥D
直前に記述したメタ文字を任意図繰り返 
¥d
+
J
:任意の桁数の数字
+
す
{
n
}
直前に記述したメタ文字を n回繰り返す 
¥d
{
5
}
J・
5桁の数字
I
(J
1
)J

¥
(
¥d
¥)J
・()でくくられた 1桁の数字
¥(

,

¥)

2
.
2 辞書データセットの作成
辞書データには TheN
a
t
i
o
n
a
lDrugCodeD
i
r
e
c
t
o
r
y(以下 NDC)のデータファイノレ 1を使
用する薬剤の製品名は LISTING.TXTにTRADENAMEとしう変数名で物質名は
FORMULA.TXTに INGREDIENT̲NAMEとしう変数名で入力されており両者は
LlSTING̲SEQ̲
NOをキーとして結合することができる
これらのデータを SASに取り込み変数名を d
r
g
(製品名) i
n
g
(物質名)としたさらに製
品名から剤型などの文字列を取り除いた変数を作成し cmn(
慣用語)とした
これを元に付け合せ用の辞書名 (
d
i
c
)と d
r
gの UNIQUEな組み合わせからなる辞書デ
1 NDCテ宇一タファイノレは h
t
t
p
:
/
/
w
w
w
.
f
d
a
.
g
o
v
/
c
d
e
r
/
n
d
c
/
よりダウンロードできる今回は
20081月のデータを使う

戸

hu
phu

ワ
臼

252.

ータセット ( d i c )を作成する。変数 d i cには先の 3変数 drg, i n g, cmnの値の他 i こ1 drg( i n g ) J、 l i n g( d r g ) J品、ったそれぞれの組み合わせで、片方を()で、くくった文字列を格納する。さらに 2単語からなる物質名と慣用語については、その 2単語の倒置形も格納する。 倒置形を作成するために、 2単語からなる物質名、慣用語を抽出しなければならないが、そ れには SCAN関数を WHEREステートメントに記述する。以下物質名を例として示す。 wherescan(ing,2, ' ' )n e 'andscan(ing,3 , ' ' )e q a n di n d e x( in g,"( 勺= 0 SCAN関数はスペース区切りでテキスト中の文字列の要素を取り出す関数であり、 2番目の 要素が欠損値でなく、かつ 3番目の要素が欠損値となればその文字列は 2単語からなる文字 列(要素が 2つしかないもの)とし、うことになる。 2単語を入れ替えるために PRXPARSE関数および CALLPRXCHANGEルーチンの記 述は次のようになる。 i f̲ n ̲= 1t h e nr e t u r n=p r x p a r s e ( " S / ( 平w ++ )平 (w + ) / $ 2$ln r e t a i nr e t u r n 1,i n g ) c a1 1p r x c h a n g e( r e t u r n,‑ 8 Jを指定し、 1 8 PRXPARSE関数内の記述であるが、後で置換を行うため置換オペレータ 1 /検索文字列/置換文字列」となる。検索文字列は正規表現で記されている。 I ( ¥w++ ) Jと 1 ( ¥w+)Jは後に 1つ以上のスペースが続く任意の長さの文字列を 1番目のバッファに、続く 任意の長さの文字列を 2番目のバッファに格納させることを意味する。 n 番目のバッファの内 容は l $ n Jで表されるので、置換文字列の指定 1 $ 2$ l Jは第 2バッファ・第 1バッファの順で、文 字列を出力する、すなわち 2単語の順番を入れ替えることを意味する。 以上の処理により 57186オブ、ザベーションからなる辞書データセットを作成した。また変数 d i cのレングスを数値変数 len̲dに格納した。 2 . 3 AERS薬剤データセットのクリーニング AERS薬剤データは IDRUGyyQq.TXTJとし、うファイル名で、提供されており、今回は 2007 年第 2四半期 (DRUG07Q2.TXT)を使用することとする。このデータには 314173オブザベ ー シ ョ ン 登 録 さ れ て お り 、 「 … 」 と い っ た 意 味 不 明 の 値 や 、 1[COMPOSITION 1 J品、った薬剤名を特定で、きなし、値も登録されているため、これらを取り除き UNSPECIFIED 文字列のバリエーションで、まとめて、 21551オブ、ザベーションとした。 ここで、辞書データセットと付け合せ、全く同じ文字列を切り出した。 1つのセルに複数薬剤名 入力されていると思われるものについては複数オプサeベーション出力した。同じ薬剤l 名として 出力されたオブ、ザベーション数は 10654で、あった。 のこった文字列について正規表現により以下の文字列(主に投与量の記載)を削除した。 データ例 正規表現 s $¥d+MG 瓜1 L$$ s /¥d+MG// s / ¥d+MEQ// s ! ¥d+UNITS// s ! ¥ ( ¥d+ ¥) 1 1 ¥d + / $$ s $ ! 99MGIML 99MG 99MEQ 99UNITS ( 9 9 9 9 ) / 9 9 9 9 / ̲ 256

253.

削除した後の文字列をバリエーションで、まとめ、最終的に AERS薬剤データは 1 4864オブ ザベーションとなった。 3 辞書名とのマッチンゲ 3 . 1 スペルチェックにかけるデータセット スベルチェックは、 AERS薬剤データ名と辞書名を比較し、スペルミス・文字の挿入・文字の 削除を認める度にスコア 1を加算し、トータルスコアが基準値より小さしものを候補辞書名とし て出力する、とし、う手順で行う。その際、以下の条件を設定した。 .AERS薬剤データ名は各セル 1薬剤名のみ入力されている . 2文字以上連続した挿入・削除は考慮しない ‑候補とする辞書名のスコアを 2以下とする 14864オブ、ザベーションとなった AERS薬剤データセットから、上記の条件に適うもののみ を抽出する。まず複数の薬剤名を入力したときのデリミタの可能性のある記号を含むオブザベ ーションを削除し、さらにレングス 3 以下の薬剤名は辞書データセットに登録されていない略 語である可能性があるため、これらも取り除く。さらにレングス 4 1以上はマッチする可能性が低 いので処理を速くするためにこれらも取り除き、オブザベーション数 10105を含むデータセット t e x tを作成した。このデータセットは薬剤名 ( t e x t )とそのレングス ( l e n ̲ t )の 2変数からなる。 辞書データセットは AERS薬剤l データセット t e x tに登録されている薬剤名レングスの最大値 +3までのレングスを持つ 28234オブ、ザベーションを抽出したデータセット d i cを使用する。 3 . 2 スペル分割 二つの文字列のスペルを比較するために、それぞれの文字列を 1 文字ずつばらばらの変 数に分割する。 数 目{子 数 変E 珂︐列 .'O文 σb&L ﹂円﹁︑ 吋 ‑rAVLTLvl 品 ' 却' lu ︑SMaEn'anuH'FnOu 要 rE S ョ ︐ ︒ t ‑ 一 ednunH Au=‑IB‑‑ uyAUAu ed r'JUρu DOループの繰り返し回数は、各薬剤名のレングスであるが、 ARRAYステートメントで配列 を指定するときの要素数は、辞書データセット及び AERS薬剤l データセットに入力されている 薬剤名のうち最も長い文字列のレングスが来る。全オブ会ザベーション中の最大値を得るには MEANSプロ、ンジャや SQLプロシジャを使うことになるが、ここでは後で上記のプログラムの要 素数に代入するために、得られた値をマクロ変数に落とすことになり、 MEANSプロシジャだと、 結果をデータセットに落として、 DATAステップ内の CALLSYMPUTルーチンでマクロ変数 に落とすとしづ 2ステップを要してしまう。 SQLプロシジャでは、下記のように記述することで SELECT文節で指定した変数の値を同時にマクロ変数に落とすことができ、 1ステップで済 む 。 「 s eI e c t; l : 数 名 i n t o マクロ変数名 以上から薬剤l 名をスペル分割するプログラムは以下のように記述される。辞書名は 1文字ず つI d 1, d2,・・・」とし、う変数に、 AERS薬剤名は 1 t 1 ,t 2,・・・」とう変数に格納する。 1 *辞書データ本/ ̲ 257 ̲

254.

p r o cs q ln o p r i n t s e l e c tm a x ( l e n ̲ d )i n t o: m a x ̲ df r o mm y d t .d i c q u i t d a t ad i c ( d r o p = i ) s e tm y d t .d i ce n dニe o f ; a r r a yd (& ma x ̲ d J$ d oi = lt ol e n g t h ( d i c ) d( iJ=s u b s t r( di c , i ,1 ) 巴n d i fe o ft h e nc a lIs y m p u t ( ' o b s ̲ d ',p u tしn , 一b e s t .) ) r u n 1 *A E R S薬剤l データ * 1 p r o cs q ln o p r i n t s eI e c tm a x( 1巴n ̲ t )i n t o: m a x ̲ tf r o mm y d t .t e x t q u i t d a t at e x t ( d r o p = i ) s e tm y d t .t e x te n d = e o f ; a r r a yt ( & m a x ̲ t J $; d oi = lt ol e n g t h ( t e x t ) t( iJ=s u b s t r( t e x t, i ,1 ) 巴n d i fe o ft h巴nc a lIs y m p u t ( ' o b s ̲ t ',p u t ( ̲ n , 一b e s t .) ) r u n それぞれ最後に CALLSYMPUTルーチンによりオブ、ザベーション数をマクロ変数 ( o b s ̲ d とo b st )に落としているが、これは後に SETステートメントの繰り返し回数で使用するためであ る 。 3 . 3 二つのデータセットの横結合 AERS薬剤データの値と全く同じ値を辞書データからヲ l っ張ってくるので、あればマッチマー ジで済むのであるが、近い値となると辞書データの全てのオブザベーションをある基準に基づ、 いてチェックしなければならない。つまり二つのデータセットのオブ、ザベーシヨンの全ての組み 合わせ(デ、カルト積)を求めることになる。デカルト積は SQLプロシジャで結合条件を指定しな いと作成されるが、それら組み合わせの中でどれが最適か、とし、うオブ、サeベーション問の比較 を行わなければならないので、 DATAステップで、行うことを考える o そこでまずはじめに DATA ステップによる二つのデータセットの横結合についておさらいする。 DATAステップで、横結合を行う方法は次の 2つで、ある o 複数の SETステートメント MERGEステートメント 3 . 3 . 1 複数の SETステートメント 複数の SETステートメントを指定した場合、全てのデータセットをオブ、ザベーション番号が 同じものどうしを結合する ( 1対 1マージ)。新しく作成されるデータセットのオブ、ザ、ベーション数 は、入力データセットのうちの最小の数となる。複数の入力データセット内に同じ変数が含まれ る場合は、最後に指定した入力データセットの値となる。 例) ̲ 258

255.

d a t aa l l s e td a t a 1 s e td a t a2 r u n d a t a 2 d a t a 1 a l l I d v a r i d v a r i d v a r y 1 I │1 │1 x 1 I l1 y 1 I │2 x 2 I+ I 2 y2I = 1 2 y 2 I i3 y 3 I 1対 1マージ) 3 . 3 . 2 MERGEステートメント ( MERGEステートメントを使用した横結合には 1対 1マージとマッチマージがある。 1対 1 マージは複数の SETステートメントと同様にオブ?ザベーション番号が同じものどうしを結合し、 複数の入力データセットに同じ変数が存在する場合は最後に指定した入力データセットの値 となるが、出力データセットのオブ、ザベーション数は入力デ ータセットのうちの最大の数となる o 例) d a t aa l l m e r g ed a t a 1d a t a 2 r u n d a t a 2 v a r i d y 1 y 3 3 d a t a 1 + a l l i d v a r y 1 y 3 x 3 3 3 3 . 3 . 3 MERGEステートメント(マッチマージ) MERGEステートメントによるマッチマージでは、全てのデータセットに存在する共通の変数 を参照し、その値が等ししものどうしを結合する。共通する変数は BYステートメントにより指定 するので BY変数と呼ばれる。各データセットは予め BY変数 l こより:ノートされておりデータセッ ト中のオブザ、ベーションは BY変数により一意に決まる必要がある。結合する 2つのデータセ ットに BY変数以外で共通の変数が存在する場合、結合後のデータセットにおけるその共通 の変数の値は、 MERGEステートメントで、右側に指定したデータセットの値となる。その値が右 側のデータセット上で欠損の場合も欠損で置き換えられる。 例) d a t aa l l m e r g ed a t a 1d a t a 2 b yi d; r u n d a t a 1 d a t a 2 i d v a r l1 y 1 I +I2 I 14 a l l y4 I 3 . 3 . 4 SETステートメントによるデカルト積の作成 先に、「複数の SETステートメントにおいて複数の入力デ、ータセット内に同じ変数が含まれ る場合は、最後に指定した入力データセットの値となる」と説明したが、これは SETステートメ ントが実行される度にプロク守ラムデータベクトルの内容が書き換わることを意味する。そこでこ オプションを付けて両方のデータセットから の性質を利用して、 SETステートメントに POINT= 1オブザ、ベーションずつ読み込む度 l こOUTPUTステートメン卜で出力することにより、デカルト 積を作成する。 ‑259

256.

d a t aa [[ d ox= 1t o2 s e td a t a 1p o i n t = x ̲ 一= 1t o2 d oy s e td a t a 2p o i n t = y ̲ o u t p u t e n d e n d s t o p r u n d a t a 1 a l l d a t a 2 田+田 x x 1 x l x 2 x 2 y y l y 2 y l y 2 以上の処理におけるプログ、ラムデータベクトル上の値の変化を以下に示す。 x x y y 1│xl│0│ N x x y 1I x l I1 y N 一 x 一 一1 x‑ d ‑ ‑ x ‑ vy‑ E‑ ‑ y ‑バ 一 X ‑ ‑ 1 一 x‑ d ‑ X E 一 v2 一 一 x‑ 一2一 x‑ d ‑ x ‑ y ̲ M川 ‑ 唱 ︒ ‑ N x ︐ y x d ox= 1 s e td a t a 1p o i n t = l d oy ̲ = 1 s e td a t a 2p o i n t = 1 o u t p u t ‑ ‑ E一 y ‑ Jん‑ M川 ‑ 唱 ︒ ‑ M川 ‑nt‑ VE‑‑L川 ‑ ‑ ι ︐ ︒ ‑ 一 v3 一 一 一 x y ̲ y ̲ N ̲ 2I x 2I 1 Iy l I1 I x xx y ̲ y ̲ N ̲ 2I x 2 I2 Iv 2I 1 I d oy一= 2; s e td a t a 2p o i n t = 2 o u t p u t d ox= 2 s e td a t a 1p o i n t = 2 d oy 一= 1 s e td a t a 2p o i n t = 1 o u t p u t d oy ̲ = 2; s e td a t a 2p o i n t = 2 o u t p u t 3 . 3 . 5 データの結合とスペルチェックの流れ スペルチェックプログラムは、 AERS薬剤データセットのオブ、ザベーション数(マクロ変数 o b s dに格納)だけ繰り返す DOループと、辞書データセットのオブ、ザベーション数(マクロ変 数o b s ̲ tに格納)だけ繰り返す DOループのネストの中で SETステートメントを繰り返し、スペ ルチェックの条件に適う場合のみ出力する手順で、行う。つまりプログラムの構成は次のようにな ̲ 260 ̲

257.

る 。 d a t ao u t ニ1t o& o b st . d oi s e tt e x tp o i n t = i d oj = lt o& o b s ̲ d . s e td i cp o i n t = j スペルチェック処理ステートメント o u t p u t e n d e n d s t o p r u n 3 . 4 スペルチェックの実行 dl, d2,・・・」及び I t l, t 2, ・ ・ ・ 」 を 事前にスペル分割して作成しておいた 1 文字ずつの変数 I それぞれ配列 I d { d i } J及 び I t { t i }Jに格納する。そして t iに関する DOループの中で、スペルマッ iの値を動かすことで A ERS薬剤名のスペルを l文字ずつチェックし チングの状態によって d ていく。 t { 1 } と d{1}の比較からループはスタートする。両者が同じ場合 可汀Tt!2i iは DOループの は DOループは次の繰り返しに移る。この際に t iは割り当てステートメントにより 1追 中で自動的に 1繰り上がり、 d { l }と d{1}が異なるときは、スコアを 1追加しスペルミス・ 加する。 t 削除・挿入のいずれかをチェックする(下の処理に進む)。 t { 1 } と d { 2 }を比較する。これが等しい場合はスペルの削除とな iをもう 1つ追加する。よって DOループの次の繰 る。このときは d { 2 }とd { 3 }とし、うことになる。 t { l }とd { 2 }が異なる場 り返しの比較は t こ進むo 合はスペル挿入のチェック i t { 2 }と d{1}を比較する。これが等しい場合はスペルの挿入とな iを 1減らす。すると DOループの次の繰り返しで る。このときは d はt{2 }とd {l}を再度比較することになる。 t { 2 }とd { l }が異なる場合 { 2 }とd { 2 }の比 はスペルミスとして DOループの次の繰り返しでは t 較を行う。 │ t { l } It { 2 } It { 3 }I 争 │d{1 } Id { 2 } Id { 3 } Id { 4 } d { d i }を最後まで走査する前に t { t i }が終わってしまった場合は スペルの削除(その逆はスペルの挿入)としてスコアに加算して 。 く 以上から実行するプログラムは以下のようなものとなる。 d a t ao u t d oi = lt o& o b st . s e tt e x tp o i n t = i a r r a yt { & m a x ̲ t .1$ ̲2 6 1̲

258.

' ' ' ' ' ︐ ︐ ︐ ︐ ︐ ** 除入 削挿 *ー*ー ' ' ' ' ' ︐ ︐ ︐ ︐ ︐ 11 +一 JUJu ‑一= inuJ何u nn ouou l n H ・ n H +L+L 1111 di‑‑ ︑EP﹄︑EP﹄︐︐︐︐︐ 41・1・'* +AU JUJ口+明卑 Il=iE 同 盟 'inu︑ h ﹃﹂﹂何uhHA =4l一回目 null+﹂口EU 一 采みがμ +L+L r﹄Btr﹄Btou .︐ou+L+Ltte* hH+// n u & ﹃ ﹄ E n u EU 伺 FO .︐Junn二・・ ︑sjgugus w'nH‑EE+L 命︑ .︐.︐au・'Enu︐nu&E﹄nHHU ‑JthHIt‑‑ep ‑‑tJ・一+LnuJunnHLH+L Ju=JunJu=ouρu+LUU 一+L一eAUA・'111﹄ O ノ snx・'Il一elj ¥/¥Ju ‑hu‑‑an・'s・141・1・l・'一n Dom‑IDe‑‑t+Autne oαnvoa ニ +L314legs s ・ ' 4 l e h H fi‑‑ ﹀ + t = f f + i t ocJUJU4l‑Bacu‑‑siEitJu'・It‑‑ +L・l=Au=zlnAU/¥qd JUHY・︐.Tis‑口・leAu‑‑'・l 1 ノ 412u+LSlnHnH・1lJ何UFO =+Lv'AHvitauoui口﹂口' .︐JOUVE‑‑nunHSIS‑‑︐ eoqophu︐nuou‑Il‑‑lE u 伺・ ・ ・ onHnv JueJuo' nH+L ouponH H u ' v 3 . 5 サウンデックスアルゴリズムによる候補選ぴ SOUND‑LIKE演算子 r = 刊による候補選びを行ってみる。この演算子は WHEREステー トメント上で使用するもので、、 I Fステートメントでは使用できない。ところが、以下に示すプログ ラムのように複数の SETステートメントによる結合の中で実行しようとすると、 WHEREステート メント上に記述された変数は両方のデータセットに存在しないとし、けないので、エラーとなる。 d a t ao u t s e tt e x t s e td i c i c w h e r et e x t=*d r u n よってこの場合は SQLプロシジャを利用する。 p r o cs q l c r e a t et a b l eo u t 2a s i c s e l e c tt e x t,d f r o mt e x t,d i c w h e r et e x t=* d i c q u i t 4 マッチンゲ結果 3194の薬剤名に対して 6269の候補名があがった。マッチしなかった AERS薬剤名には 以下のようなものがあった。 #1FORMULATION,1CONCOMITANTDRUG,1 2INJECTION,150GREENSTONE 2BEERS,2HARDPLASTICSCREWS, ALOTOFMEDICATIONS APLATEWASALSOUSED. AWHOLEBUNCHOFOTHERS サウンデ、ックスアルゴ、リズ、ムによる候補選びで5は 、8 870の薬剤名に対して、 215529の候補 ‑262

259.

名があがった。 例として AERS薬剤データの I CEFTAZIDINEjに対して、両者は次のような候補をあげて きた。 BITAP CEFTAZIDIME SOUND‑LIKE CEFOTAXIME CEFTAZIDIME CEFTIAXONE 他2 2語 ちなみに G o o g l eで I CEFTAZIDINEjを検索すると、「もしかして CEFTAZIDIMEjと返して きた。 5 まとめ SOUND‑LIKE演算子による候補選びは、かなりの幅で返してくるのでほとんど参考にはな らなかったが、今回提案したプログラムでは、ある程度の候補絞りができた。また、辞書データ の質によるところが大きく、正しい薬剤名であっても辞書に載っていないためにマッチしなかっ たり、間違った候補をあげられたものもあった。 プログ、ラミングPにあたっては、 2 つのデータセットのオブ、ザベーション位置及び、 2 つの文字 列のスペル位置をどのように制御するかが焦点だ、った。特にスペル位置については、当初マ クロ変数で佑J I 御することを考えたが、マクロ変数はかなりのしばりがかかるため、コーデ、イングの 自由度が制限されてうまくで、きなかった。結果配列に落として、片方のスペル位置の DOルー プの中で割り当てステートメン卜によってもう一方のスペル位置を決めることにしたが、意外にシ ンプルなコード、になった。 今後は用法・用量の文字列をエスケープする機能や、複数の薬剤名への対応などの機能 アップを図りたい。 参考文献 ( 1 )M arcelo C o c a ‑ P e r r a i l l o n, e t al .( 2 0 0 4 ) Complementing SAS w i t hP e r l、 P r o c e e d i n g so ft h e2 9 t hSASUsersGroupI n t e r n a t i o n a lC o n f e r e n c e,2004 ( 2 )RonCody ,e tal .( 2 0 0 4 ) :AnI n t r o d u c t i o nt oP e r lRegularE x p r e s s i o n si nSAS9、 P r o c e e d i n g so ft h e29thSASUsersGroupI n t e r n a t i o n a lC o n f e r e n c e,2004 ( 3 )SunWu, e ta l .( 19 9 1 ): F a s tT e x tS e a r c h i n gWithE r r o r s,T e c h .R e p .TR‑91・1 1、 Departmento fComputerS c i e n c e,U n i v e r s i t yo fAr i z o n a,1 9 9 1 2 6 3‑

260.

ド111 SASシステムオプションを用いた パフォーマンスの調整 深井剛史 住商情報システム株式会社 C o n t r o l l i n gM e m o r yU s a g ea n d D a t aS t o r a g eS p a c e TakeshiF u k a i SumishoComputerSystemsC o r p o r a t i o n 要旨: ト 一 一 一 一 一 二 孟 りλ SASシステムを利用する場合システムオプションの使用 l フオーマンスの向上が期待できる。 本稿ではそれらシステムオプションを紹介すると共に、シミュレーショ ンに基づ、いたパフォーマンス検証結果を報告する。 キーワード: SystemO p t i o n、 BUFSIZE、 BUFNO、 SASFILEStatement 、 COMPRESS 2 6 4

261.

I n t r o d u c t i o n ト一一一← ‑情報社会の発展に伴い,社会が生成・管理する情報量が急速に 増えており、そこからの有用な情報抽出が重要視されている。 ‑そのため大規模データから有用な情報を抽出する際、データの整 理・加工などについて従来以上の効率的な手法や技術が求めら れる。 ‑例)人工衛星時系列データ.GPSデータ.POSデータ,マイクロアレ イデー夕、メガスタディデータ(医薬品開発) I n t r o d u c t i o n ト一一一一 • SASシステムではパフォーマンスを調整するための様々なシステ ムオプションが用意されている。 ‑ 大規模データセットに対して加工処理をする際、これらオプションを 使用することでパフォーマンスの向上が期待できる。 ‑大規模データに対してこれらシステムオプションを調整した際のパ フオーマンスをシミュレーションにより集積した。 ‑本稿では、それら集積したデータに基づき検証した結果を報告す る 。 ‑2 6 5‑

262.

Whati sP e r f o r m a n c e ? 5 日 ~D ' あ r 6 . 1t i m e( b ye n . b l i n gt h r e a d i n gi nS A S 9 . 1 ) CPUtime S白 I t b t b 〉 さt anycomputerr e s o u r c e ョmc o m p l e x i t y ) ( b yi n c r e a s i n gp r o g r p r o g r 芭打、 e rt i m e I t b日己 む ' 4 T r a c kandr e p o r to nr e s o u r c eu t i l i z a t i o n ト一一一一 • SASLOG p t i o n ‑S T I阿ERO p t i o n FULLST阿ERO ~. 圃 P e r f o r m a n c e阿o n i t o r (WinXP: プログラム〉管理ツー l レ >J~フオーマンス) ! : z jtiisj • ExecutionTime‑>実行時間 • 昨今のハイスペックなシステム環境において CPU占有時間やメモリ消費量 はそれほど意識されない。 そこで本発表では実行時間に着目したパフォーマンス検証結果を報告す る 。 ‑2 6 6‑

263.

R e l a t i o n s h i pbetween1 / 0andmemory .SASシステムは d i s k (外部記憶装置)と B u f f e rの間でデータの移動を繰り返しながら 処理を行っている。 .Bu仔e rとは d i s kに対する入出力操作を行う際に、入出力されるデータを保持するの に使われる一時的なデータ格納領域である。 ‑ページサイズとは 1回の論理入出力操作で、移動させるデータのバイト数である。 .1回の移動におけるページサイズの容量や数を SASシステムオプションやステート メントで調整するとプログラム実行時間に影響を与える。 l e作lOr y diskspace 作 日d One1 /0 operation R e l a t i o n s h i pbetween1 / 0andmemory One1 /0 白 町八﹀ EJ'~ PDV 1I D IPRDIVALI l I I o u 句u tSASd a t a l e作l O r y 作 • BUFSIZE, BUFNOシステムオプションは B u f f e rのサイズや数を調整できるオプション ・ SAS円 LEStatementは実行前 I こデータをメモリに読み込むためのオプション ・ COMPRESSシステムオプションは i n p u tSASd a t aを圧縮するオプション .SORTSIZEシステムオプションは SORT プロシジャで利用するメモリ量を指定するオプション これらオプションを調整することで実行時聞が短縮できるか検証した。 2 6 7‑

264.

BUFSIZEO p t i o n トー一一一 以下 SASシステムヘルプより抜粋 、1 , 0 2 4 (キロバイト)、 1 , 048, 576(メガバイト)の倍数で指定し ‑バッフアサイズをそれぞれ、 1 I えば、 8 1ま8バイト、 3MI ま3, 1 4 5, 7 2 8バイトを示します。 ます。何J ・ BUFSIZEシステムオプションを使用すると、 SASファイルの永久バッファサイズを指定で きます。 .Windowsでは、 512‑2.147. 4 8 3 . 6 4 7バイトの値を指定できます。デフォルト値の 0を使用す ると、オブザベーシヨンのサイズごとに異なる値がエンジンによって選択されるため、バッ ファのサイズを最適化できます。 園経験が豊富なユーザーの場合、 BUFSIZEシステムオプションの値を設定することによっ て、最大メモリ使用量や、ページごとのオブザベーション数を最大にすることがで、きます。 .BUFSIZE 二のデフォルト値は、オペレーティングシステムにより、順次アクセスを最適化す るように設定されます。直接アクセス(ランダムアクセス)時のパフォーマンスを向上するに は 、 BUFSIZE=の値を変更します。 自 S i m u l a t i o n l ~ l I j t e s t d a t aContents ーオブザベーション数 1 0 0万 、3 0 0万 80 オブザベーション長 6 (CD lSC>SDTM>LBドメインをモデルとし た) i 四 … …) l u e二 (2‑4 シミュレーション回数 1 0 0 0回 オブザベーション数と BUFSIZEを一様乱 数を用いてランダムに設定した。 同 実行時聞を集積し分析する。 く対象プログラム〉 / * O p t i o nBUFSIZE=XXX;*/ Datasample(BUFSIZE=X 氾α ) ; Setく t e s t d a t a > ; Run; XXX=variable v a l u e 本 < 一 > CPUI n t e lCore2Duo 3GHZx2 memory2GB WindowsXPp r o f e s s i o n a l SASV 9 . 1 以降のシミュレーションはすべて閉じ PCを 268 ‑

265.

R e l a t i o n s h i pbetween E x e c u t i o nt i m eandBUFSIZEOption M 臥N 至S T D ( 蕊e i N u m b e ro fO b s e r v a t i o n‑ 一 一 ー 1000000 3000000 300 一 一 ‑ 2 ‑4 。 ・ ・ 包 ‑ 4 51ω'1‑‑ ︐・旬・ 量1 a I 6 ・ . 引I " t " ・ ・ ・' : : ; ; 's‑ ‑‑ ・ ・ 250 • 4 8 1 6 3 2 6 4 1 2 82 5 65 1 2 1024204840968192 値) B U F S I Z Ev a l u e ( k b y t e ) F i g 1 Relationship b e t w e e nE x e c u t i o nt i m ea n dB U F S I Z Ev a l u e 0 " (d山 R e l a t i o n s h i pbetween E x e c u t i o nt i m eandBUFSIZEOption ト 一 一 一 一 圃B UFSIZEを大きな値にすれば実行時聞が短くなるという単純な関係ではない。 8 k b y t e )から頭打ちになる。 ‑ある値 ( ・頭打ちになる時点の B U F S I Z E値が費用対効果が高く理想的な値であり、それ以降は余計 なメモリを消費することになる。 .BUFSIZEのデフォルト値は 1 6 k b y t eであり理想的な値である。 園今回示したオブ、ザベーション数 ( 1 0 0万 、3 0 0万 OBS)以外のデータセット(以降 DSと略す) でもグラフは同じ形状を示すことを確認した。 0 0 0程度であればオブザベーション数が 3 0 0万あったとしても、 ‑オブザベーション長が 1 BUFSIZEデフォルト値での実行時間と最短実行時間には大差がないと感じた。 ( L ' JMEAN=3 2 s e c ) ‑今回のシミュレーション結果を鑑みると、 BUFSIZE オプションは調整する必要がないと感 1 1 じた。 269

266.

S i m u l a t i o n 2 トー一一一 く対象プログラム〉 ー t e s t d a t aContents ーオフ、サ.ベーション数 50万 ーオブザベーシヨン長 1000、3000、 /*OptionBUFSIZE=XXX;*/ 5000 j立 … Datasample(BUFSIZE=XXXX); 山 M 別 F 同… S 剖 悶I 即 位 Z s t d a 白〉; S e tく 担' ∞ ∞ J シミユレ一シヨン回数 1 叩0 00回 Run; オ ブ ザ ベ ー ル 長 とBUFSIZE日 乱数を用いてランダムに設定した。 実行時間を集積し分析する。 *以X = v a r i a b l ev a l u e 1 2 R e l a t i o n s h i pb e t w e e n E x e c u t i o nt i m eandBUFSIZEOption ト一一一一 M E A N : : ! : : S T D ( s e c ) ︑ ‑ • . ‑ ‑ ‑ ‑ ‑ ‑ e 4 e ︑‑ ︑‑ ︑‑ ︑回 ︐‑ f'‑ ︐''‑ ︐‑ il'ずIB ︑ . ︑‑ ︑‑ ︑戸 ︑‑ E m 昼・阜‑ ー + + 晶 El‑‑ 141 ︐ ︐. ︐ ︐﹃ 4 1 y 2 畠 . ︐ . 官 ・ ・ I I I ‑ ‑ ‑ ‑ ‑ ・ 。 ︑園 ︑ ︑ ︑ 斗 ‑ ‑ aF AUnu nunu ト ZO一トコ口出X出 nuzu • • ・‑e‑‑a' U . J : : ! o ・ ・ (口出回) r n u n u n u • 8 1 6 3 2 6 4 1 2 8 2 5 6 5 1 2 1 0 2 4 f a U 1 1 i F S I Z Ev a │ U巴 ( k b y t巴) F i g 2R e l a t i o n s h i pb 巴t w e e nE x巴c u t i o nt i m ea n dB U F S I Z Ev a l u巴 仙 270 ‑ 1 3

267.

R e l a t i o n s h i pbetween E x e c u t i o nt i m eandBUFSIZEOption ト町一一一一 • BUFSIZEを大きな値にすれば実行時聞が短くなるという単純な関係では ない。 ‑ オフ、ザベーション数が5 0万ほどであってもオブザベーション長が3 0 0 0を超 えると実行時間のばらつきが数分となる。 ‑ 今回示したオブザベーション長 ( 1 0 0 0、3 0 0 0、5 0 0 0 )以外の DSでもグラフは 同じ形状を示すことを確認した。 • BUFSIZEデフォルト値での実行時間と最短実行時間の差はどれぐらい違 うのか? ‑ デフォルト BUFSIZE=16kbyte ・最短実行時間 BUFSIZE 二2 56kbyte で比較した。 1 4 R e l a t i o n s h i pbetween E x e c u t i o nt i m eandBUFSIZEOption 一 一 一 一‑iif凪 l証言'iD(sec) . .. . . . . . . . ̲ . ̲ . ̲ . . . . 一 一 2 1 0 0 1 B U F SI Z E( k b y t e ) 一一ー 1 6 ‑ 一 ‑ ー 262 1 8 0 0 ~ 1 5 0 0 " ' w 三 1 2 0 0 ト‑ z Cコ トー 弓 w x w 。 1 0 0 0 2 0 0 0 3 0 0 0 4 0 0 0 5 0 0 0 6 0 0 0 L e n g t ho fO b s e r v a t i o円 F i g 3R e l a t i o n s h i pb e t w e e nE x e c u t i o nt i m ea n dL e n g t ho fO b s e r v a t i o円 Len 1 6 ( d d f a u l t ) I 186 262 I 182 = ‑ 5 2000 386 396 守 I ‑133 ‑ 271 市一間一引 BUFS 区E (Kb 吋 . l I 1000 1 2 7 4 817 ‑457 ‑ 1 5

268.

R e l a t i o n s h i pb e t w e e n IE x e c u t i o nt i m eandBUFSIZEO p t i o n トー一一一 ‑今回の検証で、はオフ、ザベーション長が大きいほど実行時間のぱ らつきが大きくなったため、結果的 l こB U F S I Z Eデフォルト値での 実行時間と最短実行時間で差が発生する D Sがあった。 ‑オブザベーション長が大きい D Sを処理する場合 B U F S I Z Eオプ ションを調整することで実行時間を短くできる可能性がある。但 し 、 memoryの消費量は増大する。 .オブ、サ U F S I 区 Z E i 値直を理論的に求めることはでで、 最短実行時間を実現する B きなかつ T た ニ 。 1 6 BUFNO o p t i o n ト一一一一一 ‑ 以下 S A Sシステムヘルプより披粋 圃 S A Sデータセットを処理するために割り当てられるバッファの数を指定しま す 。 ‑ バッファ数はデータセットの永久的な属性ではなく、現在の S A Sセッション あるいはジョブの間だけ有効です。 • BUFNO=システムオプションでバッファ数を増やすと、 S A Sデータセットの 読み書きに必要な入出力処理の回数を減らすことがで、き、処理効率を向 上することができます。 ‑ →B UFNOについてもシミュレーションに基づ、く検証を試みた。 E テストデー夕、シミュレーション方法は先述した Simulationl方法と同じため ここでは省略する。 17 2 7 2

269.

R e l a t i o n s h i pbetween E x e c u t i o nt i m eandBUFNOOption M E A N : : ! : : S T D( s e c ) 一 一‑1000000 N u m b e ro f Observation一 3000000 1 5 0 噌 ‑ ‑ 1 2 0 3 (に J ‑ ‑ ーーーーーー Q) 出 ‑ ‑ t ‑一ーーー ‑ ‑ ‑ t ‑ーーーーーー『十ーーーーーー‑・ 岩 9 0 ー ト = C z 3 ; : : 6 0 ι ト =ー コ コ L U 〉ム 〈 J 」 3 0 。 • • ' 千一一一 3 • 2 3 4 5 BUFNOvalue Fig4Relationship between Execution time a n d BUFNO value 1自 R e l a t i o n s h i pbetween E x e c u t i o nt i m eandBUFNOOption ‑なぜ効果が表れないのか調べたところ r SASC e r t i f i c a t i o nPrepGuideAdvance において下のような説明が記述されていた。 Programmingf o rSAS9J . I n c r e a s i n gt h enumbero fb u f f e r sm i g h tn o ta f f e c tperformanceundert h eWindows andUNIXo p e r a t i n ge n v i r o n m e n t s .e s p e c i a l l ywhenyouworkw i t hl a r g ed a t a s e t s . ( P . 6 9 2 ) ‑この記述を読む限り大容量 DSの処理l 二BUFr サ0オプションは効果が期待できないと 書かれている。また、以下のような記述もあった。 .Whenyouworkw i t hs m a l ld a t as e , ta l l o c a t ea smanyb u f f e r sa st h e r ea r epagei n ~he d a t as e tsot h a tt h ee n t i r ed a t as e tcanbel o a d e di n t omemory.T h i st e c h n i q u ei s 仔 ' ec t i v ei fyour e a dt h esameo b s e r v a t i o n ss e v e r a lt i m e sd u r i n gp r o c e s s i n g . moste ( P . 6 9 2 ) ‑小さい DSはBUFNOデフォルト値で十分実行時間が短いので調整する必要はな 感じた。 ‑ 273 ‑ Uと

270.

Summarya b o u t BUFSIZEandBUFNOOption ト一一一一 ‑ シミュレーション結果より B U F S I Z Eオプションのテ、フォルト値は費用 (memory)対効果(実行時間)の最も優れた値であることがわかっ た 。 SはB U F S I Z Eによって実行時間にば ‑オブ、ザベーション長の大きい D らつきがある。 UFNOオプションの効果は期待できない 0 ‑大規模データにおいて B ・ランダムアクセス時のパフォーマンスを向上するには B U F S I Z Eの ASシステムヘルプで記述されている。 値を変更するよう S ‑今後はランダムアクセス時の B U F S I Z Eについても検証を試みたい。 20 SASFILES t a t e m e n t ト一一一一 ‑他のパフォーマンス調整方法として SASFILEステートメントがある。以下 SASシステム ヘルプより抜粋 .SAS円 LEステートメントを使用して、 SAS データセットをオープンし、データセット全体を保 持するのに十分なバッファをメモリに割り当てることができます。 .SASFILEステートメントで読み込んだデータはメモリに保持され、後続の DATAステップや PROCステップ、アプリケーションで使用することができます。 ・別の SASFILEステートメントでファイルをクローズし、バッファを解放するか、またはプロ グラムが終了して自動的にファイルがクローズし、バッファが解放されるまで、メモリは保 持されます。 .SASFILEステートメントを使用すると、次の点でパフォーマンスを向上させることができま す 。 ~SASデータセットを処理するときに行われる、複数回のオープン/クローズ操作 (バッファ用メモリの割り当て/解放を含む)を 1固に減らす。 》メモリにデータを保持することによって入出力処理の回数を減らす。 2 7 4‑ 2 1

271.

SASFILES t a t e m e n t トー一一一 • SASFII モ ーs a s ‑ d a t a ‑ f i / e) ・OPEN ‑o p e n st h ef i l ea n da l l o c a t e st h eb u f f e r s . • LOAD ‑Openst h ef i l e .a l l o c a t e st h eb u f f e r s .andr e a d st h e d a t ai n t omemory. • CLOSE ‑C l o s e st h ef i l eandf r e e st h eb u f f e r s . 22 S i m u l a t i o n 3 t e s t d a t aC o n t e n t s ー オブザベーシヨン数: 1 0万 、1 0 0万 、 2 0 0万 一 オブザベーション長: 6 8 0 (CDISC>SDTM>LBドメインをモデルとし た) …… 対象処理s e ts シミュレーション回数 2 5 0回 オブザベーション数とSASFILEステートメ ントの値を一様乱数を用いてランダムに 設定した。 実行時聞を集積し分析する。 日 ゴモ‑ 口 ミ 戸 DSl 己 但し、 SASRLEStatement 実行時の時 間は含めない 2 3 ‑275 一

272.

R e l a t i o n s h i pb e t w e e n E x e c u t i o nt i m eandSASFILES t a t e m e n t 〈対象プログラム〉 s a s f i l et e s t<OpenI LOADI CLOSE>; M 臼N ( s c c ) d a t a̲OUT; ( O ω 凶)凶E 一﹄ ZO一﹄=口凶X凶 s e tt e s t d a t a; r u n ; c ! o s e叩 e nI o a d c ! o s e o p e nl o a d c l o s e叩 . nl o . dS A S FI L ES t a t e 耐 n tS t a t u s ‑10<沼田『 炉 問 削0 0 ‑ ←2 0 0 0 α M 日‑ N 叩D e ro fO b s e r v a t i o n F i g 5 . 1R e l a t i o n s h i pb e t w e e nE x e c u t i o nt i m ea n dS A S F I L ES t a t e m e n t 24 R e l a t i o n s h i pb e t w e e n E x e c u t i o nt i m eandSASFILES t a t e m e n t 〈対象プログラム〉 s a s f i l et e s t<OpenI LOADI CLOSE>; M 臥 . N( s e c ) 、 p r o cso代 data=t e s t d a t aout=一OUT; ( o ω ω ) 凶主一﹂ 'zo 一﹄コ口一円高凶 ' Yv a i a b / e ; r u n; c l o s o叩Ilnl o a d c [ o s eo p e nJ o a d c l o s e0田 nJ o a dS A S F J L ES t a t e m e n tS t a t u s ー1αm∞ ‑ ‑ 1∞ ∞ 田 ・ ‑ 2 0 0 0 α M 日 司 N 由 田crofObservatjon Fi g 5 .2R eI a ti o n s hi pb e t w e e nE x e c u ti o nti m ea n dS A S FI L ES t a t e m e n t 2 5 2 7 6‑

273.
[beta]
R
e
l
a
t
i
o
n
s
h
i
pbetween
E
x
e
c
u
t
i
o
nt
i
m
eandSASFILES
t
a
t
e
m
e
n
t
〈対象プログラム〉
s
a
s
f
i
l
et
e
s
t<OpenI
LOADI
CLOSE>;

M
E
A
H
{
s
e
c
)

procmeansdata=t
e
s
t
d
a
t
a
;

I
a
b
/
e
;
v
a
r回 '
(Oωω) 凶孟一﹄

run;

Z
E
‑
‑
=
口凶珂凶

nI
o
a
d c
l
o
s
e0田 n1日 dS
A
S
F[
L
ES
t
a
t
e
m
e
n
tS
t
a
t
u
s
c
l
o
s
eo
p
e
n!
o
a
d c
l
o
s
e叩 e
‑1以JO∞
ー
・
‑
1
0
0
0
冊 0‑
・
‑
2
印刷凹→
N
u
m
b
e
ro
fO
b
s
e
r
v
at
i
o
n
F
i
g
5
.
3R
e
l
a
t
i
o
n
s
h
i
pb
e
t
w
e
e
nE
x
e
c
u
t
i
o
nt
i
m
ea
n
dS
A
S
F
I
L
ES
t
a
t
e
m
e
n
t
26

SASFILES
t
a
t
e
m
e
n
t
ト一一一一一

.MEANSプロシジャの実行には効果的である。 (SASヘルプでは PRINTプロシジャにも効果
的であると記述されている)
.SORTプロシジャには効果がない。 (SASヘルプに記述されている)

圃一旦データをメモリに保持しておけばプロシジャ実行要求のたびにファイルを OPENした
りLOADする必要がなくなり、実行時聞が短縮できる。
‑ある DSをもとに複数の DSを作成する場合、また MEANS'PRINTプロシジャを連続して実
行する場合は一旦 memorylこ読み込むことで実行時聞が短縮できる。

¥ッファを解放しファイルをクローズ、しなければならない。
‑但し、 DSを更新する場合は 1

白
+
白
明
ロ
口

‑277

2
7

274.

COMPRESSO p t i o n トー一一‑" ‑ 他のパフォーマンス調整方法として COMPRESSシステムオプションがある。 以下 SASシステムヘルプより抜粋 ・データファイルの圧縮は、それぞれのオブザベーションを表現するために 必要なバイト数を減らすことによりファイルサイズを小さくするプロセスで す 。 ‑ ファイルを圧縮すると、ファイルに必要な記憶領域を減らしたり、処理中の データの読み書きに必要な入出力操作を少なくで、きるというメリットが得ら れます。 ‑ ただし、圧縮ファイルを読み込むためには多くの CPUリソースが必要であ り(各オブザベーションの解;車!こオ‑/¥ーヘッドがあるため)、得られるファ イルサイズが小さくならずに逆に大きくなるという場合もあります。 28 COMPRESSOpt i o n Uncomoressed Data FileStructure P a g e 1 1 6 b y t e OH Obs1 Obs2 Obs3 Unused S p a c e ObsOH Page2 1 6 b y t e OH Obs4 Obs5 Obs6 Obs7 PageN 1 6 b y t e OH ObsY ObsZ D e s c r i p t o r UnusedSpace 沈 p e r 1 b ObsOH ( ! 7 1 己 四 l b i tp e r ObsOH UnusedSpace Compressed Data File Structure P a g e l 回霊 Pa Differentlength, S附 moreobserva伽 s 2 四 1 Z 4 b r o y O r 胎回 s znus , 1 a 2 h 0 r ω I D… 旬r Unused ̲ J 2 n 1 a 2 4 b v 0 y n r t e h s R ‑2 7 8‑ Unus白 dS p a c白 1~:IObS Y IObSX

275.

S i m u l a t i o n 4 r一 一 民 testdataContents オブザベーション数 一 オブザベーション長 〈対象プログラム〉 200万 680 optionCOMPRESS=<YESINO>; 一 欠 損 値 率 14、 33、 100% (CDISC>SDTM>LBドメインをモデルとし T こ) 1 ‑ 対象処理:setstatement,SORT,MEANS data̲OUT; s e tt e s t d a t a; run; : シ ミ ユ レ ー シ 珂 数 50回 オブザベーション数と COMPRESSの値を 一様乱数を用いてランダムに設定した。 同 実行時間を集積し分析する。 30 R e l a t i o n s h i pb e t w e e n E x e c u t i o nt i m eandCOMPRESSO p t i o n M E A N ( s e c ) (OU回)出E 一ト ZO一トコ口出)白 NO YES Compress Status RATE o f Missing value Fig6 Relationship between Execution time and COMPRESS system option ー14~ ~33 →← 100 寸 ‑279 31

276.

COMPRESSO p t i o n トー一一一 ‑ 実行する前に圧縮するかレビューすることが有効である。 圃く有効な D S> 一大規模 DS ‑多くの長いテキスト値を含む DS ー多くの繰り返しテキストもしくは b i n a r y 値 一多くの m i s s i n gv a l u e ‑ く無効な D S> 一小規模 DS ‑短いテキスト変数 一少ない繰り返しテキスト変数 一少ない m i s s i n gv a l u e 32 SORTSIZEO p t i o n ト一一一一 ‑他のパフォーマンス調整方法として SORTSIZEシステムオプション がある。以下 SASシステムヘルプより抜粋 ・デフォルトでは、このオプションは 2MBIこ設定されます。 SORTSIZE システムオプションによって、データセットのソートの際に行われる スワッピングの回数を減らすことができます。 • SORT プロシジャでは、指定したメモリ量よりも多くのメモリが必要 ディレクトリに、データを格納するための一時 な場合、 SASWORK ユーティリティファイルが作成されます。 ‑すべてのメモリ構成で、最適な値は 2Mです。使用しているコン ビュータの物理メモリが 12MB以上で、大きいデータセットをソート . . . . . . S M B !こ設定するとパフォー する場合は、このオプションの値を 2 マンスが上がる可能性があります。 3 3 ‑2 8 0一

277.
[beta]
SORTSIZEO
p
t
i
o
n
U
t
i
l
i
t
yf
i
l
e

野
、

己判 口 吟臼
T q

i
n
p
u
tSASd
a
t
a

c

o
u
t
p
u
tSASd
a
t
a

SORTSIZEmemory

日d
票
。
口

F可持事官、可問。島司自調。恥-,"哩、^_".-も昏、必骨量帆守柄。凶岳民-劇院m骨骨制"同"持叫',~.9・伽肺訴島争認u_ ,_、、

也
"
‑

恥 守 市 柚 刻 闘 咽 " , , , 、q、 守 吋 持 品J

A培 、 、 河 崎 噂 ' 刷 側 同 ‑ 、 対 ゆ 白 崎 、V 可0・ X凶4・E持情。伽倒防骨φ何布、

リ
巴

SORTSIZEmemory

34

S
i
m
u
l
a
t
i
o
n
5
〈対象プログラム〉

.
. t
e
s
t
d
a
t
aContents

r
o
cs
o
r
td
a
t
a=t
e
s
t
d
a
t
a
0万、 1
0
0 p
ーオブザベーション数 5
S
O
比
s
i
z
e
=
え
コ
(
X
k
万
o
u
t
=
a
;
ーオブザベーション長 6
8
0
b
ys
o
r
t
k
e
y
ls
o
r
t
k
e
y
2s
o
r
t
k
e
y
3;
(CDISC>SDTM>LBドメインをモ
デルとした)
r
u
n
;

: Byステートメンは 3変数指定する。

•
E

E

COMPRESSオプションと組み合わせ
たシミュレーションも行う。
シミュレーション回数 1
0
0回 x2

オブザベーション数と SORTSIZEの値
を一様乱数を用いてランダムに設定
。
こ
しT
実行時間を集積し分析する。

‑2
8
1‑

35

278.

SORTSIZEO p t i o n M E A N : : ! : : S T D(sec) 「 一 一 一 一 一 一 N u m b e ro fObservation 1 2 0 1 1 0 一 一 1000000 一 一 ー 500000 1 0 0 (口由回)出E 一﹄ . ︐ i ‑ト ・ + ・ ・ ‑ 3 0 S‑ Tat‑. v e ‑ III ・ Z O一﹄2 0出)白 9 0 8 0 7 0 6 0 5 0 4 0 2 0 1 0 L . . . . , ‑ 0 . 1 1 O .0 1 0 0 .0 1 0 0 0 . 0 1 0 0 0 0 . 0 S O R T S I Z EV a l u e ( M b y t e ) F i g 7 Relationship b e t w e e nE x e c u t i o nt i m ea n d SORTSIZEvalue l d ' f " [ t‑.J 1 .O 3 6 SORTSIZEO p t i o n M E A N : : ! : :S T D( s e c ) 1 2 0 1 1 0 1 0 0 • N u m b e ro fO b s e r v a t i o n‑ 一 一 ー 1000000 一 一 ・ 1 0 0 0 0 0 0Compress . . . . . . φ 5 0 0 0 0 0 一… 500000Compress 申 (UU悶)山室一﹄ Z O一﹄コ口出)︿出 9 0 8 0 7 0 6 0 5 0 4 0 3 0 2 0 1 0 。 L . . , . ー 0 . 1 1 .O l d o f " [ t l l ) 1 O .0 1 0 0 .0 1 0 0 0 . 0 1 0 0 0 0 . 0 S O R T S I Z EV a l u e ( M b y t e ) Fi g 8 Relationship b e t w e e nE x e c u t i o nt i m ea n dSORTSIZE v a l u e ‑2 8 2‑ 37

279.

SORTSIZEOption ト一一一一 ‑ 必要なワークスペース量がSORTSIZEオプションの値より少なけれ ぱ、並べ替えはメモリ中で行われ実行時間を減らす。 圃必要なワークスペース量がSORTSIZEオプションの値より多ければ、 ディスクにユーティリティファイルが作成され実行時間が増える。 ・圧縮が有効な DSで、あればCOMPRESSオプションと組み合わせる ことで更に実行時聞は短縮できる。 • SORTSIZEを大きくしすぎると PC全体のパフォーマンスが落ちる。 ‑並べ替えに必要なワークスペース量の計算式は [SASプログラミ . . . . . . .上級テクニックと効果.......]で参照可能。 ング m 38 C o n c l u s i o n ト一一一一 圃 SASシステムの BUFSIZE、BUFNOはデフォルト値で十分早い実行 時間を実現している。 ‑ しかしながら、大規模データを扱う際はシステムオプションを調整 することで更なる実行時間の短縮が可能となる。 ・数分の実行時間短縮であっても大規模データ処理を継続的に実 行する場合、総短縮時間は相当量になる。 • SASシステムの処理構造を理解しておくことは、これらシステムオ プション作用の理解の一助となることも併せて主張したい。 39 2 8 3‑

280.

R e f e r e n c e 一 • 圃 • SASI n s t i t u t eI n c .SASC e r t i f i c a t i o nPrepG u i d e,Advanced Programmingf o rSAS9,Chapter20,C o n t r o l l i n gMemoryU s a g e . 2 0 0 7 . SASI n s t i t u t eI n c .SASランゲージリファレンス ,6 . 71 ' ¥フオーマン スの調整.1 9 9 5 . SASI n s t i t u t eJ a p a n .SASプログラミング m . . . . . .上級テクニックと効 果. . . . . . . 2 0 0 7 . 4日 ‑2 8 4‑

281.

金融関連分野

282.

!ムミユザー総会ァんらんふぷμ ム ジ い … ♂ … 一 一 一 一 一 … … I WEEDSSAS‑Tr a c eセキュリティのご紹介 ウイーズ・システムズ株式会社 代表取締役社長 豊嶋正裕 日 ' im ユーザー総会アトヵデミア/子山一肝心 ーふんショ 1 ) 星会社概要 社名ウイーズ・システムズ株式会社 設立 2003年 1月 事業内容 ーソフトウェア製品開発・販売 一受託開発及びコンサルティング 従業員数 10名(平成 20年 6月時点) "TI~I~I)S 日ロ ヨ叉ロロ ‑ WEEDS Reports ‑ WEEDSTraceSeries ‑ WEEDS OfficeDoc • WEEDS DB‑Trace ‑ WEEDS PC‑Protect • WEEDS UNIX‑Trace ‑ WEEDS DiskCrush • WEEDS WINDOWS‑Trace ‑ WEEDS Repositorymanager • WEEDS ITGC‑Trace • WEEDS SAS‑Trace • WEEDS SFDC‑Trace 2 2 8 7一

283.

111ザー治アカデミァテウ~ソい ‑セキュリティ対策に欠けている点は? 胃 語 雲 l ま" t 戸 1 1 . すべての操作ログを 保持 不正操作の監査 ~II. だけでは不十分 1 1 . ~II. え 呈 7巨: アクセスコントロール [ : 1 1 . Z五 ﹁情報漏洩﹂事件は︑内部犯罪が 80% アクセスブロック アクセスコントロール 企業が重視するリスクのトップは﹁情報漏洩﹂ : │ 静 権 限 アm • i l . 1 1 . j ~II. >>、.< ※トーマツ調査 3 l │ SASユ ー ザ ー 総 会 アカデミアテラノロジー&ソリユーシヨンセンシヨン ‑セキュリティ対策に欠けている点は? ーアクセスコントロールだけでは不十分一 品﹁ 様々なアクセスコントロールを施したセキュリティ対策ですが、果たして効果は? の一以 内限一ド ‑''aav ア山mw 外部媒体の 使用禁止 不 使用禁止 動 一 間 ⁝ USBメモリーの 匂 ユーザーIDの を ム WEZ 均ωj ‑ : 11)ンヲーの 使用制限 省盤滋滋留渇望嵯望峰 i 為a ゐ 柄ゐ 憤 ︐〆 9 ジ﹀ この結果、情報漏えいや不正操作、不正アクセスは減ったので、しようか? 4 ‑288 一

284.

同芯立広蕗刃設ラlUftームソリみ…;んふ 一 一 一 . γ ‑セキュリティ対策に欠けている点は? 一特権ユーザーの不正アクセスは防止できない一 情報漏えいが起った背景・手段 管理体制を強化していたが、 「悪意を持った内部者」 への管理が不十分だった為、 個人情報流出が起った。 既存の情報管理体制 背景 圃委託先との個人情報に関する契約締結 圃個人情報保隆に関するマネジメントシステムを 構築し、プライバシーマークを取得 ・電算処理室に監視カメラを鼓置し、 不正な行 を牽司自j 圃電算処理室での生体認恒による 入退室管理を強化し、郵外者の侵入を防止 ・ポケットのない作業風着用による a " i ※電算処理室にて 仏閣 光磁気ディスク (MO) 1 1 .ミ H デ-~等の持ち出し防止 への情報書込 ' ‑ l 1 1 1 吋なここが鶴題 原因 権限保持者が、権限内の業務を行うことが、不正とみなされない、 肉部者による犯行多防止するには不+分なセキュリティ体制 5 R I お平総謀説日高‑流山一一明ーで 何 一 f TE7EI ‑セキュリティ対策に欠けている点は? ーアクセスコントロールだけでは不十分一 読本孟錨酋縫街宣吃ゴ記栓imd 司芽細幾何 J ニニニぷんい縦一二捕8 e j 共用パソコンから株に関する広告掲載を閲覧し、職場用パソコンから株取引実施 ミ itp 騒 客 情 報 流 出 掛 湾 初 鷲6 2 7 T : ざま祭笠畿管 制努繍幾 3 諺~"'$鰍 システム開発業務を委託していた会社の取引社員が個人情報を抽出し、売買。 マ N 吋刊で袖論説i芸 品ι F 質量判明i事ふ議議室薬事議議官ずて二宮ご毒 コンビューターセンターに預けられたシステムから地銀の顧客情報を抜き出し、 ローンカードを偽造。自身の入退室等の行動記録を削除していた。 ‑みずほ銀行行員による暴力関に個人情報を譲り渡し 1 . 2 6 8 件 業務監査部行員が、支庖勤務時代に支庖のパソコンを用いて顧客情報を抽出し、 暴力団に譲り渡していた。 6 ‑2 8 9

285.

1 「:忘却平催予山初ぷおロおお宅……一吋………… ‑セキュリティ対策に欠けている点は? 一全てのアクセス記録を監査する必要がある一 様々な禁止事項を施しても、内部犯罪は防ぐことができません プリンターの 使用制限 すべてのコンビューター操作記録、データアクセスを保持し、 定期的に内部監査を施すことが 最大のセキュリティ対策" Jメ すべての操作履歴巷取得する事が必要不可欠 7 十 一川叩 S r . 川 ~ユーザー総会アカデミア/テウノロジー&ソリューションセy ション h 片 山 一 一 置 S ASのセキュリティを強化するWEEDSS A S ‑ T r a c eのご紹介 WEEDSS A S ‑ T r a c e Jとi ま 「 .WEEDS丁目c eシリーズ rWEEDSW i n d o w s ‑ Tr a c e JをSASクライアントソフト用に ASクライアント側の操作を取得しログ生成します。 ログ取得機能を強化し、 S どのデータセットを参照したか、サーバーからデータをインポートしたか、 E x c e lでタスクを 実行したか、など、誰が・いつ・どの端末で実行したか、取得し監査することができます。 圃S ASクライアントでの操作と、 SASサーバーへのアクセスを突合し、 SAS全体の操作記録を レポーティングできることが実現できます。 これで、 S ASの操作記録は完全に取得でき、監査証跡としても十分な記録を残すことが 出来ます。 .SAS操作記録を監査レポートとして出力する事が出来るので、システム監査、内部統制など 様々なシーンでご活用いただけます。 次ページより、 WEEDSS AS‑ T r a c e取得項目や出力レポートをご紹介いたします。 8 2 9 0

286.

l i . . f . l ; a ザ主主かんF子 ん 一 一 ソ ク ー 一 一 一 一 一 川一一一一一一一一i • WEEDSSAS‑ Trace操作雇歴取得内容 rSASE n t e r p r i s eG u i d e J 標準的なものから高度なものまで多岐にわたった解析機能と、 それらを簡易に実行する操作性を提供する機能です。 主な機能として、 ・ローカル PC上の SASデー夕、および MicrosoftExcelや MicrosoftAccessなどの 外部ファイル/データへのアクセス .SASSystemサーバ上の SASデータや、 Oracle、DB2など 他のリレーショナルデータベースへのリモートアクセス .SASデータを UNIXから PCへ・・・といった移動がドラッグ&ドロップで可能 EGクライアント操作雇歴杢全て取得するのがWEEDSSAS‑ Traceです n 9 [竺そ?二総会片手ふーん:/-&:t'):l-:/3:'- 1! '~:/3/ …一一一…~一一一 I • WEEDSSAS‑ Trace操作雇歴取得内容 rSASE n t e r p r i s eG u i d e J . ・. ‑. 左記のような様々な操作内容を取得し、監 査レポートとして出力します。 EGでSASデータが不正利用されていない 事を証明する事が出来ます。 π統制対応・セキュリティ強化・システム監査など 様々な舞台にご活用頂けます。 〈デ ‑ 1 1インポート〉 〈プリントアウト〉 1 0 2 9 1‑

287.

111ユーザー総会市三ア円ノロジ-&,/ I)~圃 WEEDSSAS‑ Trace操作履歴取得内容 r SASE n t e r p r i s eMinerJ データマイニングに求められるすべてのプロセスを一元的に実行・管理できる、 業界唯一のデータマイニング統合ツールです。 主な機能として、 ・サンプル抽出 (膨大なデータからサンプルを作成したり、様々な形式にデータを分割。) ‑データ探索 (データの特徴を統計的・視覚的に捉え、データ加工の準備) ‑データ加工 (分析のためのデータ準備を行い、変数の追加や既存変数の変換、 自己組織化マップの作成など豊富なデータ加工機能を実装) EMクライアント操作雇歴巷全て取得するのがWEEDSSAS‑ Traceです n 1 1 ヲお!!fnじみみよ泌二,.二三万三M U 叩戸川町みで巧一一‑ マャーォ • WEEDSSAS‑ Trace操作雇歴取得内容 r SASE n t e r p r i s eMinerJ . . . . 左記のような微々な操作肉容を取得し、監 ・ . . 査レポートとして出力します。 . . . . . . . . ‑ . . . . . . 現データ分析におけるセキュリティ補強を実 します。 B SASEM操作 署 農 s 戸・ 圃薗園幽圃 〈デ一世変換〉 〈デ一世加工〉 汀統制対応・セキュリティ強化・システム監査など . 犠々な舞台にご活用頂けます。 ・ ' . 1 2 292

288.

!一一一川町山 パ … 一 一 一 一人刊…一一一一‑ル S~ ユーザー総会アカデミアテウノロジー晶ソlJ.Jューションセy シヨン γ γ • WEEDSSAS‑ Trace操作雇歴取得内容 rSASAdd‑Inf o rM i c r o s o f tO f f i c eJ MicrosoftO f f i c eのメニューから直接 SASを実行し、データの分析結果を取得し 高度な分析機能を利用出来ます。 主な機能として、 圃 MicrosoftOfficeユーザーが使用可能な高度な分析機能 ‑容易に SASデータにアクセスし、クエリやデータ分析を実行、レポートを作成 ‑使い慣れたWordや Excelインターフェイスにてデータ加工、分析が実現 AMOクライアント操作屋歴を全て取得するのがWEEDSSAS‑Traceです。 1 3 戸都草区ヲ右手ミ山辺二沼山市設内信仰伊平均…ー.門会内……. I • WEEDSSAS‑Trace操作雇歴取得内容 rSASAdd‑InforMicrosoftOfficeJ <SASデlIll1!縄〉 〈千世分析〉 書 パ 、 s 凱ASA M c 必 O操作 司 号 込 主 左記のような様々な操作内容を取得し、監 査レポートとして出力します。 守 一 司 貯 . 旬 『 一 〔 九 巴 λ ; 言苧4 1 じ. " ' " ご 了 で で ♂ 弓 τ τ 引 J 、 ぶ ぷ 試 主 ぷ ぷ . . れ ι 唱 ; 事 援 . . . ・ •••• MSOfficeでの SASデータ利用状況を漏れ EE置蘭樺画面・ ・ ・ . 〈デ一宮加工〉 なく把握する事が出来ます。 I T 統制対応・セキュリティ強化・システム監査など 微々な舞台にご活用頂けます。 1 4 2 9 3

289.

SrMユーザー 会アカヂ主ア/テ~ノ~ソリユ四シヨジ 1 ̲WEEDSSAS‑Traceシステム概要 SAS ヲライアントでの操作眉匿 を取得し、 SASのセキュリティを サポート致します。 SASヲライアント 月々 監査E跡となるロゲを統合管理し、 一箇所{ロゲ量によって増減)のロ ゲリポジトリサーバ に蓄積します。 SASの操作 lo録をロゲリポジトリ サーバーへ蓄積し レポートマネー ジャーにて監査レポートをExceDア イんで生成します。 ここ~ : I リボントリ メンテナノス ~ パ7ヲ?ッブ/車道 ヂータファイル v SAS サ パーより出力されるロゲを取 得し、解析する事で SASのプロセスをよ り強〈補完致します。 を補完 1 5 一 一 ⁝ 一ト; 一 一 一 ⁝ 「品五二石町一説話ぷ;以斗よみ L二 三 日1 与す十 ……マ… w η γ… ρ 開 問 抑 争 ‑ a q u z r h ι P J U N ‑ ‑己江守 培 ︑R 一一日息子町田川 0 . 判明書﹃許守口暢コも A 一一一⁝同﹄一甲山ブ品川 一 r と噌!! ̲ WEEDSSAS‑Traceサンプルレポート rEG操作 :SASデータエクスポート」 42T??‑rf ‑ ‑ ‑ , . . . . E:ユ広ニニニ出現i f 一一品 m 一一同吐品副弘明‑‑併川崎 〈デ一世エヲスポ ト 〉 ‑ a・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ 圃 . . . . く操作履歴取得〉 ‑ • 国時 〈レポート生成〉 ログリポジトリサ " 294 ‑ 一 し 一日ふーん 眠ニ 4~f@!ニ広三思r.u醐副#よji:l都島一:官 「ユーザー名 J 「どのデータセットから J 「エクスポートファイル名 J など EG操作履歴の詳細までレポーティングが 出来ます。 I

290.
[beta]
1

川石二両つ蒜IM.
J
J
ぷお:ご京湾アー一……一門一一一
• WEEDSSAS‑Trace
サンプルレポート rEM操作:データ加工/分析」

.
‑

<EM子一宮加工操作〉

ー
.
.
.
.
.
.
.
.
.
・
・
・
・
・
・
.
.
.
.
.
.
.
.
.
.
.
.
.
.
•
圃

く操作履歴取得>

:

「誰が」
r~ 、つ」

「どのデータセットに対して操作を行ったのか」
など詳細な操作履歴まで監査する事が出来ます。

E惨

掴
ログリポジトリサーバー

1
7

「 巡 目 指 ? 謀 説 % に お お む お ア マ ー 明 諮 問 一 一 一 一 一 …E
‑WEEDSSAS‑
T
r
a
c
eサンプルレポート「検索条件」
くレポ ト 画 面 > 品 目 叫 中4 一一一一一̲̲"'‑̲..,

;:t

‑ .. ,11<

町一一一…

.0当
一 山

"̲
<
主 rョ
,
,
:
.
. .",."'品,~ ,>

~

".
",
・
,
.

3
1
:

~

・

1
1 ;
‑ :
.
0 I
C
" J

様々な角度から条件指定が可能です。
1つの操作に特化した監査が実現出来ます。

18

‑295 ‑

291.
[beta]
…
…
…
一
吋
…
一
一
一
…1

「浪芸;こ叫ぶぷ弘山おお五日;二J

国 WEEDSSAS‑Trace
サンプルレポート「月間利用状況概要」

月間トータルでの
「ユーザー数 J
r端末数 J
rログイン数 J
r操作内容」
などを時間内/時間外での利用状況を出力します。
※グラフで利用状況を把握する事が出来ます。

く月間利用状況概要〉
を
]
フ
‑
,
.
(
J
I
.
(
f
) "̲v 夜 示 国

栂λ @ 書 武 田 ヴ ー ル @ デ ー タ 申 引 ン 円 脚

口語副首晶~~品'11> 8 ・""~・ x

^~掠どP

色 z ・空軍 1
1曲 品 田

ー出.L.iI晶出"'!JII申告地崩

;
‑
二
一
一
一
一珊柵冊
ι手 戸 /
J‑o
. 一
一
一
一
一 ・~.
岡 山 伽t
ho
:
;
.'1 ・ H r
. lJ .
a曹 司 郎 申 X . .~市哲明'"・"・ 4 ・.

H

I

阿 一 串s
哨
鞘
唱月
…
""

;
:
町
…
宿
い
い
同
吋
;│
9

ヲ
。
1
1

事

,
.

M

4~

l

人

柵軒~,

1
4省

Bヲイン量

'"回

固

"固

77噌"噌』ヲン.
.

拠固

n固

ロ困

監慣 F
・
内.
.

"回

82回

開車止陣何回

5図

。固

5回

.

"自

関図

3固

再司同何回

'"回

ロZ畠

"図

│

岨

│

暗

"
雪
も
、
可
a
2
1
量

A

r

E豆ヨ i

崎
咽
眉
叩
.
附
…
岳
引
帥
唱
情
畑
作
帽
思
割
軒
会

│

1
1

ii;i!E i!
γ
"
.
,
間
酎
歯

‑・・田圃コ守 :
:
.
.
‑
f.
.
円
冒
歯

レ吋".ヨマ

4
二圃晶J
斗

一週i..:斗

1
:
=:
=
1

ー
ー
"
ー
円
.
,
ー
"
・
剖

I
‑

12

・・"、宮,..."丘""'‑J

1
9

I
.
己二手二誕百三品川二五五五二二二%;JJt
m‑…

ー

で夕刊一尉‑

WEEDSSAS‑
Trace新機能ご紹介

‑SASが発特するSQL
文を取得
e
J
'
¥
ージョンアップにて、 r
S
A
S発 行SQL
文」を取得致しました。

この蜘により、 S
AS操作 +SASでの DB要求操作が取得できます。

〆戸一一一ィ;ぷ是正L34J
ぷ長こ五千:]

一

一 軒‑ J ; /

...事寸比三哩‑
‑
1
f
│

グケ

・盟国E軍曹園

格納

盟関

I

レポート生成

ψ

SASfこて発行された SQL
文を取得出来るので、
SQL
セッション毎に監査する事が可能になります。

20296
292.

門 ! 側三〉ザザが L怠 泌 硲 釜 忌 l m 1 I I 主 か ? μ 必 子瓦幼デ初砂山戸山必必こμ L 亙 五均ゆ泊叫ジ ・ 1 I I ‑ 弓 弓 市 . ミ 宅 宰 辛 言 ミ 安 三 言 ぎ 三 手 三 芝 弓 手 翠 言 雲 ‑予言. WEEDSSAS‑ Traceシステム情報 一 一 一 一 J 事跡靖鐘薗醒瞳盟盛盟国 0~r'/ 雪国 各種目グ情報を解析して、リポジトリへ格納するプロセス 鱗註 盟 幽 踊 画 臨 盟d 幽 掴 園 SAS製品に特化した Windowsの操作履歴 リポジトリに格納された操作履歴を Webにて照会 監査レポートを Excelファイルで生成 盤輔醒盤罷盟園・・ 冒盟国庫盟理盟国盟盟圃・E SAS/¥ージョン ISAS9 OS/¥ージョン A I X .SunS o r a l i s .HP‑UX. Windows ※他順次対応予定 SASE n t e r p r i s eG u i d e SASE n t e r p r i s eM i n e r SASAdd‑Inf o rM i c r o s o f tO f f i c e ※他順次対応予定 2 1 l m 一一手二おぶ九五五千五J 己主斗みぷ斗‑一一……日… ご清聴ありがとうございました。 ウイーズ・システムズ株式会社 東京都豊島区高閲 1 ‑36‑10干 1 7 1 ‑ 0 0 3 3 アベックヒルズ目白本社 3 0 1号/開発センター3 0 2号 TELI FAX 0 3 ‑ 5 9 50‑6 3 5 0 URL:http://www.weeds てj apan心 ojp 2 2 ‑ 297

293.

「デフォルト確率推定モデル作成における WOE変換の役割とその利用方法」 大勢待手Ij明 株式会社数理技研金融工学センター Theu s eofWOEi namodelt oe s t i m a t ePD T o s h i a k iOhsemachi , SURIGlKENCO., LTD. F i n a n c i a lE n g i n e e r i n gC e n t e r 要旨 WOEによる連続変数・カテゴリ変数の加工方法。 WOE値から作成される W 値と一変数レベルでの CAP曲線比較による変数選択の方法。この手法によるモデ、ル作成手順とモニタリング方法について紹介 する。 e i g h t sOfEvidence、 I n f o r m a t i o n V a l u e ( = I V )、 CAP曲線 キーワード: W 1 はじめに この論文を執筆している 2008年は、新銀行東京の過熱貸付によるニュースで幕を開けた。当行はスコアリ ング・モデルの判定結果を元に中小企業へ融資を行うというビジネスモデルで、ある。この業務体系を売りに していたが、約 400億円もの損失を出してしまった。その影響により今日、スコアリング・モデルの有効性 が問われており、再びリレーショナルバンキング、の重要性が取りざたされている。 しかし、スコアリング・モデルが役に立たなし、かと言えばそんなことは決してない。スコアリングの判定 結果とリレーショナルバンキングとの融合を図っていけば、現在よりも効果的な融資ができることは間違い ない。 数理技研は、スコアリング・モデ、ルの高精度化を目指し日々精進している。この論文を発表することで、 スコアリング・モデル作成の手助けとなり、与信業務の更なる効率化に貢献できれば幸いである。 2 本論文の目的 WOEを利用した連続変数・カテゴリ変数の加工方法を解説する。変数加工の結果、変数の水準値が決まっ たら、次はどの変数をモデル作成に使用すべきかとしづ議論になる。これに答えるため、 WOE値から作成さ ‑2 9 8‑

294.

れる I n f o r r n a t i o n V a l u e( = I V ) 値と一変数レベルにおける CAP曲線の比較による変数選択の方法を解説する。そ して、この手法を利用したモデ、ル評価とモニタリング、方法について紹介する。以上が本論文の目的である。 3 発想、の原点 スコアリング・モデ、ルに使用されているモデルは、ロジスティック回帰モデル、決定木、判別分析、ニュ ーラルネットワーク、生存時間モテ、ルなど種々あるが、スコアリングに使用するモデル自体は飽和状態を迎 えている。「どのロジックをモデルに使うか」というロジック選択に依存したスコアリング・モデルの精度向 上の時代は終意を迎えつつある。スコアリング・モデル作成において精度向上に向けてカイゼンできる分野 は、モデルを作成する前段階の変数の前処理にある。つまり、モテ ル作成に有効な変数を準備で、きるかどう かにかかっている。 例えば、一変数レベルで=考えて みる。一変数で単回帰モデ、ルを作 成してみよう。説明変数を年齢層、 被説明変数を年齢層別のデフォ ルト率として、単回帰モデルを作 [主デル作成 l 成する。ここで、 20才代、 50才 (当てはめ│ 代が同一のデフォルト確率であ った場合、モデル当てはめ結果が 20才代、 50才代で同じになるこ m 降・十対守門h 開珊描瑚四割描哨皿 とは決してない。説明変数に、年 代のカテゴリ値そのものを使用 しているからである。一変数レベ ルにおいて、すでに変数の実際の 値とモテ ~oiてと 50代は同じデフォルト率 i だが、線形モデルでは違う水準 i ル算出値の事離がある のだから、多変数をモデル作成に 使うとなると、相当な君離を生み 出してしまうことは避けられない。それでは、どうすればいし、かというと、次のような手立てが望まれる。 年齢層という変数でいうならば、同一のデフォルト率をもっ年代に対して、同一のカテゴリ値を設定するこ とである。同一のカテゴり値を設定できれば同じデフォルト率を算出することができる。 この考えを実現するために WOEという手法を採用することにした。以下で、この WOEの紹介、 WOEの 使い方とその応用について論ずる。 4 WOEとは WOE の由来は、 1950年、ジョン・グッドとしづ統計学者によるって提唱された。地質学の分野で応用さ れていた手法である。その後、医療の分野で利用され、近年、信用りスクの分野でも外資系の金融機関で利 用され始めている。ターゲットとする変数が、デフォルトか正常かの 2値の場合、以下の式で WOEの値を 得ることができる。 ‑2 9 9

295.

WOE(W e i g h t sO f E v i d e n c e ) J W句 h t sOfEvidence, t t r i b u t c=log(P ̲Default, n r i b u t c/P̲Normal, 山 P̲Default, t t r i b 山 =N umberOfDefault 附 ,b u t c/NumberOfDefaultt o t a 1 P̲Normal, t t r i b u t c=NumberOfNormal, t t r i b u t c/NumberOfNormalt ' o tl 次項より WOEの利用方法を順に説明していく。 5 WOEの利用方法 5 . 1 連続変数をカテゴリ変数に変換 発想、の原点のところで、年齢層というカテゴリ変数を例に出した。しかしその前に、年齢層というカテゴ リ変数を作成するための"年齢"という連続変数が デフォルト率の差が最大になるようにクルーア化 26 才 2~ ある。連続変数はグループ分けして、カテゴリ変数 1 0 才 力子コリ2 力子ゴリ l : : ‑ l に変換しておいた方が利用しやすい。ここでは、分 =ANOVA(=Analysiso fV a r i n a c e ) )により、連 散分析( 続変数をカテゴリ化してし、く。 1 2 宅 江 守 才 2 ? 2 7 有 了 2 ? 7 ? 年齢を例にして説明する。まず 20 才 ~70 才の連 続値の順に並べ、このグループの分散が最大、つま りデフォルト率の差が最大になる年齢で、 2つのグ ノレープに分離する。そして次に、各 2グループに対 して同じ作業をする。どこまでグ、ループ化していくかについては、事項で説明する。これで、連続変数がカ テゴリ変数へと変換された。各グループには、 20 才 ~22 才だったら 20 、 23 才 ~26 才だったら 23 と、名義 尺度としての水準値を付与。欠損値は欠損値として残しておく。 P Normal PD e f a u l t D e f a u l t e f a u l t s a WOE ormals a 値 カテゴリ値 年 齢 層 カテゴリ値 count N 廿i b u t e D t 廿i b u t e r a t e t l s s l n g 1 6 . 0百 0 50 42 2 . 3 % 8 4 . 1 % . 5 7 9 0 . 5 7 9 m l s s t n g 打l 48 2 4 . 0 弘 20‑22 200 8 . 4目 1 . 0 8 4 1 . 0 8 4 2 4 . 9 % 20 152 23‑26 23 300 246 1 3 . 6弘 54 2 8 . 0百 1 8 . 0百 0 . 7 2 0 0 . 7 2 0 1 .1 百 2 27‑29 27 450 2 2 . 4 % 2 . 6百 . 1 5 8 ‑2.158 405 5 1 3 . 0百 30‑35 500 2 6 . 3也 5 . 0百 一0 25 . 7 0 8 一0.708 30 475 35‑44 350 1 8 . 8百 1 1 5 . 7覧 3 . 1覧 ‑ 1 .1 9 1 一 1 .1 9 1 35 339 44+ 44 150 147 8 . 1覧 3 1 .6覧 2 . 0百 一 1 .655 一 1 .655 d E h ヨ 量 ロ 一ι E 2000 9 . 7 % 1807 193 出典:B a r tB a e s e n s ( 2 0 0 5 ) I n f o n n a t i o n V a l u e( = I V )=0 . 0 6 6 5 . 2 カテゴリ変数を W O E変換 次 に 、 カ テ ゴ リ 変 数 に 対 し て WOE 変 換 を 施 す 。 各 変 数 の 値 に 対 す る 対 す る P N o r m a l a t t r i b u t cと 山を計算し、 P Defaulta t t r i b WeightsOfEvidence削 b u t c=log(P ̲Defa 山 amhire/P‑Nomala 山 ‑ 300 一

296.

WOE値を算出する。その際、 20‑22才であることを示す 20というカテゴリ値は、名目の値にすぎないので、 { 直に置き換える。この変換を与えることにより、年齢層という変数は、線型モ カテゴリ値それ自体を WOEi デルで完全に説明される変数になる。欠損値は欠損値として WOE変換によってそのまま変換できるので欠 損値処理をする必要はない。 例 年 齢 層 を WOE変換 年齢層のデフォルト率の分布(生デ一世) 3 0 . 0 ¥ 2 5 . 0 ¥ 2 0 . 0 ¥ 1 5 . 0 ¥ 1 0 . 0 ¥ 5 . 0 ¥ 0 . 0覧 m i s s t n g 20‑22 WOEにより一変数レベルで完全に線形モデルに当てはまる変数に変換された。 欠損値も欠損処理をせずにそのまま利用できる。 5 . 3 安定かつ有効な変数の選択方法 連続変数をカテゴリ変数に変換し、カテゴリ変数を WOE変 換する一連の手続は、オーバーフィッティングの問題を含ん でいる。安定したモデルを作成するには、安定性のある変数 を使用しなければならない。そこで変換の手続のチェックが 必要になる。以下で安定性の高い変数を選択する方法につい て述べる。 WOE変換手続を作成する変数変換用データと、その手続を 検証するための検証用データを用意する。 変数変換用データから、「連続変数をカテゴリ変数に変換し、 カテゴリ変数に WOE変換を施す手続」を作成する。その手続 を、検証用データに当てはめて、変数変換用データと検証用 データに関して一変数レベルでの CAP曲線を作成する。 そして 2つの CAP曲線の差を算出する。君離が大きければ、 オーバーフィッティングであり、'*離が少なければ安定した 変数が作成されていることが実証される。 '*離状態を修正するには、連続変数をカテゴリ変数に変換 する際の区切りを調整することによって可能になる。分散分 析 (=ANOVA(=AnalysisofV a r i n a c e ) )によるグループ化を再度検 討することにより調整する。 以上の操作を行ない、変数変換用データと検証用データに 3 0 1 │CA 抽線の差の少は閣を採用│

297.

ついて一変数レベルで CAP曲線を比較する。その結果、事離が少ないものをモデ、ル作成用データとして採用 未満であることが望ましい。 する。採用の目安としては、最大の車離が 10% 安定性の高い変数が特定されたら、次はその変数の有効性を確認する。安定性の高い変数であっても、正 常かデフォルトかを判別するのに有効な変数でなければならなし、からである。そこで WOE値を使って計算 n f o r r n a t i o n V a l u e( = I V )とし、う指標により、変数の影響力の大きさを計ることにする。 できる I I n f o r r n a t i o n V a l u e とは、カテゴリ変数の影響力を測定する指標で、グ、ループ分けの妥当性の判定に使われ ている。目安としては I n f o r r n a t i o n V a l u eの値が、 0 . 0 2未満で影響力なし、 0 . 0 2‑0 . 1で影響力が弱い、 0 . 1・0 . 3 で影響力は普通、 0 . 3 以上で影響力が強いと判定できる。先に掲載した年齢層の表の I n f o r r n a t i o n Valueは 0 . 0 6 6 となっており、影響力は小さいと判定できる。 I n f o r r n at i o nV a l u e( =I V ) 工((P̲Default IV= 川 山 ー P̲Normal.ttribute)* WOE 的同) a t 変数の影響力 <0 . 0 2 : u n p r e d i c t i v e 0 . 0 2‑0 . 1: weak 0 . 1・0 . 3 :medium s t r o n g 0 . 3+: 以上の操作をへて算出された CAP曲線の最大差と I n f o r r n a t i o n V a l u eの評価値より、モデル作成用変数とし て有効である変数を選択する。例えば、変数が年齢層、変数 A、変数 B、変数 C、変数 D ・・・とあったと o r r n a t i o n V a l u eの値が 0 . 3以上の変数を確 する。それぞれの変数について、 CAP曲線の最大差が 0.1以下、Inf 認すると、モテ。ル作成用の変数として変数 A と変数 Cが採用されることになる。 例変数選択 CAP曲線の 年齢層 │変数A │変数 B │変数C i 変 数D .. 評価 。 . ・ . . .. モデル作成用 変数として 。 。。 。 。。 。 最大差 I n f o r m a t i o n V a l u e 安定性 影響力 X . 0 5 0.066 0.02 0 . 6 0.12 0 . 4 X 0 . 4 0. 4 0 . 2 0 . 1 ム .. ‑ ・ . . 採用 採用 .. ‑ 302 ‑

298.

6 WOE変換のモデル作成・検証での利用 これまで述べてきた手続きは、モデル作成手順の中に位置づけられる(下図を参照)。まず元データを、モデ ル作成用データとスコアデータに分劃する。モデル作成用 データをさらに、変数変換用データと検証用データに分割。 変数変換用データから、連続変数をカテゴリ変数に変換す る手続きを作成、次に、カテゴリ変数を WOE変換する手 続きを作成する。この 2つの手続きを、検証用データに当 てはめる。変数変換用データと検証用データの各変数に対 して一変数レベルで CAP曲線を作成し、その差を確認し n f o n n a t i o n V a l u e て、安定性のある変数を特定する。続いて、 I を算出し、説明カの高い変数を特定する。これらの手続き によって、安定性がありかっ説明カの高い変数が選択され ることになる。 r‑rー ーーーー・ー‑,.‑, Ir‑‑‑‑‑ー‑‑‑‑,.‑. lit臨 時 を : ! I~ 連続愛知 l j L 巴zzl竺竺~_!lj__7J_~ヲリ里堅二iJ CAP曲線の差と I n f o n n a t i o nV a l u eは、連続変数をカテゴ リ変数に変換する際のカテゴリ区分の影響を受けるので、 r, ーーーーーーーーーマ ‑.Ir‑rーーー ー"ー‑,.‑. il カテゴリ賓換を: : 1伊予ゴリ費自民t li II WOE 夜換;; ; 1;~lO E 喪換" L ‑ ̲ ー ー ー ー ー ー ̲ . . . J̲JIIーム一一一・ーーー̲.J̲ J I̲ 比較結果が芳しくない場合は、連続変数をカテゴリ変数に 変換する段階に立ち戻って、カテゴリ区分を調整し、再び CAP曲線の差と I n f o r m a t i o n V a l t 胞を確認する。この作業を 繰り返す。 変数が選択されたらモデ、ル作成を行う。一変数レベルで は、安定性があるかもしれないが、投入変数が多くなると、 各変数のわずかな誤差が積み重なり、結果として誤差の大 きい結果を算出するモデルが作成される可能性がある。よ ってモデルが作成されたら、そのモテ ルも CAP曲線によ って安定性を検証する。 CAP曲線の差が大きい場合は、一 変数レベルで CAP曲線の差が大きいものから外してゆき、 モデ〉レ作成→ CAP曲線の差の検証を繰り返す。目安として CAP曲線の差の最大値が 0 . 1以下になった時点で、モデル 作成の完了とする。 なお以上のプロセスの実証データに基づく検証結果に ついては、数理技研提携先との契約により公開することは できないが、以上の手続きによって、モテ ノレの安定性を確 保し、かつ変数加工前のデータと比べて、デフォルト確率の算出結果の精度向上が確認されている。 ‑3 0 3

299.

7 WOE変換のモデ、ルのモニタリングへの応用 最後に、モデ.ル自体のモニタリング方法について紹介する。モデルを作成して与信判定のシステムに取り 込むまではいいが、日寺が経つにつれてモデル自体は劣化していく。筆者の経験上、高い費用を払ってモデル を作成したはいいが、その後、モデルのメンテナンスを実施しないケースをよく目にする。そして年月が経 ち、モデ、ルの精度が劣化した時点で、再び、高い費用を払ってモデルを作成するというサイクルが展開され ている。そもそも日々入手するデータは変化するので、その変化に合わせてモデル自体の劣化状況も随時チ エツクすべきである。劣化に応じてモデルの更新を図っていくことが最適なモデル運用で、ある。 それでは、以下でそデ ∞ ∞ 2 B年 3月 ルのモニタリングへの 2 B年 3月 WOE 変換の応用例を述 ベる。 イベ;ノト算事1 2008年 3 月時点で新 モデルを作成したとす る。イベント期間を 2年 とすると 2006年 3月時 ‑ 一 年4 五乱た時点で ①一変数レベルで CA P ! 曲 線 ・ I V 1 直 のE 判a f j '此 重 宝 点のデータを利用する ②モデ J J . , O )CAP 医院比較 ・一年前社団乱変賓がある場合、モデル切替 ことになる。この 2006 年 3月データに対して、 これまで解説してきた、 変動があればニューモデルへ咳潜 一連の変数変換、変数選択を施してモデルを作成する。そして I年問、このモデルを運用したとする。次に 2009年 3月になったとすると、モデル作成には 2007年 3月時点のデータを使うことができる。そこで 2006 年 3月時点で作成した一連の変数変換・変数選択のプロセスを、 2007年 3月時点のデータに当てはめてみる。 すると一年前と現在との各変数の変動状況を把握することができる。 2007年 3月時点での一変数レベルでの CAP 曲線の最大差と I n f o r m a t i o nV a l u巴の値の変化を比較する。その結果、モデル作成に使用された変数に大 きな変動がなければ、モデルの切り替えは必要ないし、反対に、大きな変動があれば、モテ ルの切り替えが 急務ということになる。最後に、各モデ、ルの CAP曲線を比較して、変動があるかなし、かを確認し、モデル切 り替えの意思決定を行う。 以上が WOE変換のモデ、ルのモニタリングへの応用の説明である。 8 まとめ 本稿は、モデ、/レ作成を行う前段階として、各変数に対して次の操作を行った。①連続変数を ANOVAによ りカテゴリ変数に変換する。②カテゴリ変数に対して WOE変換を行う。③カテゴリ変数の値それ自体も WOE 値に置き換えて、完全な線型の形式にする。という操作である。 次に、変数変換用データから上記の変換手続のプロセスを作成し、変数変換用データと評価用データに当 てはめた。その結果を使い、変数変換用データと評価用データの各々の変数について一変数レベルでの CAP 曲線を作成する。そして各々の CAP 曲線の最大差が 0 . 1 以下の変数をモデル作成用データとして採用した。 また説明力を示す I n f o r m a t i叩 V a l u cの値も算出し、 0 . 3以上の説明力の高い変数を採用する。 ‑ 304

300.

その結果、変数加工前のデータと比べて、安定性の高い変数を使用し、かっ説明力の高い変数をモデ ル作 成に使用することになるので、安定性の高くかっ高精度のモテ ルの作成が可能になっている。 またモデルのモニタリングの手1頃としては、一変数レベルでの変動状況を追い、変動が大きければモデ、ル の切り替えが必要であり、変動が小さければ、モデ、ルの切り替えは必要ないということを説明した。 参考文献 [ I J 山下智志,) [ 1口昇,敦賀智 ( 2 0 0 3 )r 信用リスクモデ、ルの評価方法に関する考察と比較」 [ 2 JB a r tB a e s e n s ( 2 0 0 5 ) :r C r e d i tS c o r i n gF o rB a s e lI lJ [ 3 JW e i g h t sofEvidenceM e t h o d :h t t p : / / w w w i . g e . u n i c a m p . b r / w o f ( 巴I d o c u m e n t a t i on/w口氏 i n廿 ‑3 0 5

301.

E Mアルゴリズムを利用した 不動産賃料の推定モデル 小野潔 三菱東京 U F ]銀行 中小企業部 ApartmentR e n tP r e d i c t i o nU s i n gEMAlg o r i t h m Ki y o s h iOno 吋i u mEn t e 中r i s eBar記ngD i 吋s i o , nTh eBank o fTh k y o ・ M i t s u b i s h iUFJ , L t d . Small&M 要旨 今までの研究から、 2 3区内のマンションの不動産賃料は居住面積あたりの賃料のみで、 7割以上の説明力を有することが判明している。そこで本研究では、駅ごとの居住面積当 りの平均賃料データを説明変数に追加することを試みた。 Web上から駅ごとの部屋タイプ Iが欠損値で、あった。そこで不動産賃料の欠損値を EMアルゴ の賃料を探索したがその 4害J リズムにより補足したのちに、不動産賃料の推定モデ、ルを構築した。 EMアルゴリズムは 初期依存性を有するため、欠損値の初期値に一番近い駅の同じタイプの部屋の賃料を採用 し、局所解に陥ることを避けた。その結果、昨年開発したモデルに比べ、誤差が 24%から 1 9 犯と減少した。 キーワード: L E Mアルゴリズム データマイニング 欠損値 不動産の賃料推定モデル ] A R E F E(不動産金融工学学会) 研究の位置づけ 近年、日本でも急成長している不動産投資ファンドは、複数マンションを投資対象にす る。その配当の原資は不動産の賃料であるため、投資案件を決定は短時間かっ低コストで 賃料を予測できる不動産賃料の推定モテ、ルのニーズ、が高まっている。不動産の賃料推定モ デルは 1 970年代からニューラルネットワークやロジスティック回帰による研究がされて きたが、学術対象でしかなかった。しかし不動産ファンドが販売されると、米国では実務 に利用できる精度が高い不動産の賃料推定モデ ルが開発された。 以上の経緯から日本不動産金融工学学会では不動産賃料の推定のデータコンペを国内 ( 2 0 0 7 )と国際大会 ( 2 0 0 8 )で開催した。本研究は日本不動産金融工学学会が主催した 2008 年第 1回国際コンペティション大会で開発したモデルに基づく。 306 ‑

302.

2 . 昨年までの研究成果 2 0 0 7 )にも参加しており、その際に開発した 筆者は日本不動産金融工学学会の国内大会 ( モデルは 2 007年 SASユーザー会にて発表した。本研究はその続きに位置づけられるので、 昨年の発表内容を要約する。 多くの実務家は統計学にあまりなじみがなく、統計の専門家が構築する複雑なモデ、ルで、 は理解しづらい。そこで不動産の実務家にわかりやすいモデルという観点から、前回は統 計の専門家でなくとも直感的にわかりやすい(可読性の高しつ推定モデ ルを開発した。こ のモデルは、①決定木の構造ツリーと、②割安/割高表から成り立つ。[構造ツリー]は、低 賃料と高賃料の要因の差異が明らかにし、[割安/割高表]は、実務家でも容易に賃料を導く ファクターを理解できる。 分析手法は連続値(賃料)を直接推測するのでなく、与えられた賃料が割安と割高を判 定する 2値判別問題に帰着させる。具体的には割安/割高の境界値(=闇値)を 1 0万円とし 0万円以上を割高とし、 1 0万円未満を割安とする目標変数を設定する。 た場合、月賃料が 1 複数の闇値を設定し、闇値ごとに決定木で割安/割高を判定する。最後に割安/割高の結果 を表にまとめると、実務家にわかりやすい賃料推定ができる。 国内大会で開発したそテ、ルは決定木を用いたため、構造がわかりやすく、実務家に好 評であったが、モデ、ルは低精度で、あった。今回、本研究では EMアルゴリズムを採用し、 データの補正を行いながら、精度を大幅の向上を目指した。 3 .研究概略 昨年の研究から 2 3区内のマンション賃料は、居住面積のみで 7割以上が説明でき、不 動産賃料は単位面積当りの賃料が最も有効な説明変数であることが判明した。そこで本研 究では最寄駅の居住面積当りの平均賃料をデータに追加することを試みた。 Webの公開情 報である、『駅ごとの部屋タイプ別 (1 ルーム, 2DK 等)の賃料と部屋面積~ ( 表2 )から DB を構築したが、欠損値が全体 45% (960個)におよび、汎用的な不動産賃料推定ができな し 、 。 そこで EM アルゴリズムを利用して駅ごとの居住面積当りの平均賃料の欠損値を補充 した。 EM アルゴリズムの課題の一つは、初期値依存性を有することである。そこで今回 は欠損値の初期値に一番近い駅の同タイプの部屋の賃料を採用し、大局解となるように推 定モデ ルを構築した。 さらにその DBに基づいて、精度の高い不動産賃料モデ、ルを開発した。推定賃料を安定 化させるために、 5種類の多変量回帰の平均モデルを採用した。また低賃料の場合、実際 よりも低く算出するため、低賃料用モデ、ルを別に作成した。 3 0 7

303.

4 . EM アルゴリズム コンヒ。ュータの発達は分析の手法の高度化のみならず、欠損値の補正技術の発達も促し た。欠損データへの対処には多重代入法がある。多重代入法は欠損箇所に複数個の値を代 入し、擬似的に完全データを作成する。多重代入法のプロセスの手順を示す。①欠損箇所 に特定数の異なる値を代入し、異なる擬似的な完全データセットをつくる。②複数の擬似 的完全データセットに対して、通常の完全データセット用の手法で解析する。③解析結果 を統合して、最終的な分析結果を出す。 多重代入法は、代入値の生成法の違いにより①最尤推定法、②マルコフチェーン・モン テカルロ法、③ノンパラメトリック法に分類できる。最尤推定法は欠損部分をその期待値 に置き換えて「擬似的な完全データ」とし、扱い易い完全データの尤度関数を用いる。 EM ア ル ゴ リ ズ ム は 欠 損 値 を 補 充 す る た め 、 最 尤 推 定 法 (MaximumL i k e l i h o o d E s t i m a t i o n ) が使われる。言い換えると EMアルゴリズムは、擬似的な完全データの尤度 関数の最大化と期待値計算を反復することで最尤推定量を求める方法である。 EMアルゴ リズムでは、期待値を計算する E ステップと、パラメータを更新する M ステップの二つ の反復計算から成り立つ。 E ステップでは、実際の観測データと推定すべきパラメータの 暫定値を設定した上で、擬似的な完全データの対数尤度の条件付期待値を計算する。 M ス テップは、そこで求めた対数尤度の条件期待値の最大化によって推定パラメータの値を更 新する。この二つのステップを繰り返すことにより、観測データに基づく対数尤度の最尤 推定値を求めることができる。 EMアルゴリズムの問題の一つは、初期値依存性を有するため、欠損部分の初期値によ り大局解にならず、局所最適解に陥ることである。 E ステップの初期値が最初から欠損部 分の最大期待値に近似できれば、大局解へ至る可能性が高い。本研究では、不動産の経験 から初期値に工夫を行い、最初から欠損部分の期待値の最大化を計り、大局解となるよう に推定モデルを構築した。不動産の経験とは、近距離の二つの駅の 1日乗降数に大きな差 異がなければ、両駅の居住面積当たりの平均賃料はほぼ近似できるとしづ経験的事実であ る。この事実を用いて、 M ステップの効用関数を作成した。 5 . データの概要 ( 1 ) 基本情報(学会提供情報) コンペティションでは、推定モデル構築のために賃料を含む 540レコードと、競技用の 賃料を含まない 150レコードが提供された。なお競技用の賃料を公表されていないため、 本稿では 540個で作成したモデルを論及する。 賃料(円/月) 管理費 所在地名 2 徒歩(m) バス停名称 築年 専有面積 部屋数 番地 徒歩(分) 建物名称 築月 緯度 礼金月数 登録日 建物名 パス(分) 地上階層 部屋数 経度 敷金月数 県名称 沿線名称 停歩(m) 地下階層 関取タイプ 保証金月数 所在地名 1 駅名称 停歩(分) 所在階 駐車場有無 表 l 基本情報の項目 ‑ 308 ‑ 駐車場料金

304.

説明変数は 32種類あり(表 1参照)、それ以外に設備の有無データが約 100種類存在する が、昨年の研究から設備データは説明力が低いため、今回は説明変数に含まない。加工デ ータは 1部屋当りの面積(専有面積/部屋数)、初期費用(礼金月数+敷金月数十保証金月 数)、設備数、駐車場有無フラグ等を作成した。ただし名称(沿線名称、駅名称、所在地、 パス亭名称、建物名称、県名称、所在地名)は説明変数から除いた。 データソースはアットホーム社による 23区内の居住用賃貸物件の情報である。なお国 内大会も国際大会も同じデータが使われた。 ( 2 ) 駅ごとの居住面積当りの賃料 (Web取得情報) 駅ごとの賃料、専有面積、平均単価は、アットホーム社の「数字で見る不動産情報(統 計・賃料相場情報)J から情報を取得できる。 Web上に駅ごとのタイプ別の平均賃料が表 示されているが、その 4割は欠損値である。表 2は山手線の駅のため、欠損値は少ない。 i 平均話科 i 戸F均 専 有 面 積 〈 平 常 ) , 平 均 平 常 阜 イ 面 │ 表 2 駅ごとのタイプ別の賃料、専有面積、平均単価 資料元:アットホーム社の「数字で見る不動産情報(統計・賃料相場情報)J httn:llwww.athome.co.in/atwebs t a t i c l k a n r e n / s o ubaldatalm1 O.shtml ‑ 309 ‑

305.

( 3 ) 学会提供情報と部屋タイプ別の居住面積当たりの賃料情報のマージ 表 3の左側は学会提供情報であり、右側は表 2から作成した該当駅と一致したタイプ別 の平均賃料をマージしたものである。この欠損部分を EMアルゴリムで捕捉する。 Webから取得情幸E 部屋タイプ別賃料 学会提供情報 ト 品 。 日1 q 9 日 2 5 1 2 8 0 5 6 る 2 7 3 4 2 5 4 3 2 2 4 7 2 4 4 2 8 5 4 2 8 自1 2 1 日1 2 7 8 4 5 6 6 8 官官星空イ 平均 平均平 l R 口OM l L D K . 3K . 3 3 L D K 平均賃料 面積 米 K J D K 11Lγ 2 単価 ( m ' ) O K . 8 0日 日 4 . 3 0 0 2 3 8 . 8 目 日 日 日 日 日 l A3岨日 2 3 8 . 8 目 日 3 4 9 4 3 5 . 6 3 71 3 9 . 7 1 6 1 3 L D K 山手線│恵比売 I 日 , 日 自 日 飴 日 JR 2 2 Z 9 . 1 )0 陥 R O O M 3 5 .必41 3 9 . 7 1 5 1 0 4 . 3 0 0 3 B . 0 0 0 1 1 2 6 1 ! 3 , . m 2 3 8 . 8 0 0 3 埼京線馬関 l . J R 1 3 8 . 0 3 9 . 7 1 3 1 3 2 9 4 . 7 日 日 日 日 日 8 5 . 0 日 BJR山手線 恵比舞 l R O O M 3 5 . 6 4 51 1 1 ! 34 0 0 2 3 8 . 8 0 0 3 3 8 0 4 4 3 3 D 8 0 E 2 1 3 8 B 4 D 3 E 日 S 日 日 刀0 0 1 M 孔7 日 出 3 9 . 7 1 2 1 3 4 3 . 4 0 0 2 L D 民 活8 . 3 0 0 軽業主主j,トロ日 恵比海 2 4 5 0 . 0 0 耳 与 o : i 71 3 5 . 6 4 91 3 9 . 7 1 7 1 3 日0 0 0 l A 3. 4 日 2 2 3 EB E 0 3 4 1 8 抑 0 . 0 0 協 S JR山手続 恵比寿 2 3 8 E 4 4 3 3 D 8 D E 1 3 日 3 4 普 J , 3 3 0 E S 日 6 2 9 4 N η 4 4 7 7 8 0 8 日 I R L D O K O F f 3 5 . 6 4 11 A3. 4 U O 8 . 8 0 0 3 9 . 7 1 3 1 3 8 , 0 0 0 l . , 18 山手線 買t!t~寿 3 5 . 6 6 91 3 9 . 7 1 2 1 3 5 6 . 6 0 0 7 5 原宿 2 K 日 3 1 7 . 9 0 0 5 . 6 0 5 日2 0 0 │ ω 山 手 手 S 続 j 堅 JR 3 1 7 , 9 9 8 E O 8 1 3 1 9 ぬ 4 D E D E 立 E 3 5 . 6 7 11 3 9 . 7 1 3 1 3 L D K お品A 耳 Q 3 1 7 5 8 . 2 0 0 原宿 J.8w 3 5 . 6 2 11 3 9 . 7 2 3 1 9 . 3 0日 . 1日 2 4 9 . 0 0 0 JR 山手車畢 五反田 2 l D K 4 3 . 3 0 0 9 6 9 . 9 0 0 6 5 4 9 9 0 8 0 83 2 6 6 P 9, , g 0 0 0 m 2 3 3 3 6 6 2 2 0 8 7 7 , 6 a s E 0 g 2 。5 4 ) 0 0 1 2 0 . 0 0 0 JRW. 2 L D 民 3 5 . o 2 1 1 3 9 . 7 3 0 争 宇 J 郷 Z o 9号館 五度 [ I E 1 4 3 . 3 手線 9 . 3 0日 2 S l D K 3 5 . 6 2 61 3 9 . 7 2 4 1 A 3. 3 0 0 9 0 7 . 6 0 0 2 R 山手 禄 五反田 2 鈎 3 d ,,B 鈴0 0 号 6 P. 9 9 0 8 0 E3 , E G 寝 日B 静 JR 3 1 8 m E 3 宇. 1 3 2 1 6 9 l D 民 S 5 . o Z 31 9 9 . 潤 お6 . 0 0 0 日 4 , Z D D 4 3 . 3 . . 2 0 7 . 6 0 0 2 J 手9 皇 五反田 S 日 日 l 4 . 2 日 3 5 . 6 2 71 3 9 . 7 2 6 9 . 9 0 0お 五反田 3 l D K A 3. 3 0 0 9 0 7 . 6 0 0 2 3 3 6 . 0 0 0 日 労P 3 3 0 滋 日 2 3 3 6 6 0 E 0 総 o 4 1 5 5 9 0 3 , O 5 E 8 9都 4宮 R山 i 主手互 主 事 線 日 B 6 9 . 9 l D K . 3 5 . 6 2 i l1 3 9 . 7 2 0 1 日 5 4 . 1 0 4 3 . 3 0 0 2 0 7. 2 4 9 . 9 0 0 6 6 0 0 2 1i反沼 2 日1 3 9 . 1 2 1 4 . 0 0 0 JR 1 4 2 . 5 0 山手占星 1 l R O O M 3 5 . 6 5 21 日 2 6 0 . 5 0 日 日 1 5 7. 2 0 0 3 5 1 8 . 2 0 1 5 . 0 0 0 f t 谷 々 4 2 3 3 , 5 5 B 0 B 日 1 i 5 5 7 7 1 2 E 8 E 6 2 l Q K e 3 5 .o 5 01 4 5 3 9 . 7 0 2 1 4 2 , 5 0 0 2 6 0 . 5 0 0 , 7 0 0 6 0 0 . 0 l ) 0J . RllJ手続 渋主主 5 0 0 7 ~1.~"2!lO. ゐ都. 日 日 日 日 2 3 . 5 4 5 0 . 8 5 6 . 1 0 3 L D K 2 0 日 日 3 9 . 6 9 3 1 5 7. 6 7 9 日 a , 5 0 0 4 3 A u 5 ' d.d 5 61 1 4 E 2 立5 4 8 9 9 日 2 2 4 1 8 4 . 2 7 ω 0 0 5 1 7 1 B R 2 1 8 日8 J J R R 山 l l J 手 手 線 1 8 3 . 0 0 0L l L D K 五 3 11 3 9 . 7 2 2 1 10 0 3 1 5 . 6 0 05 1 7 9. 31 4 6 3 : 9 0 0 .9 0 0 1 恒星 賃料 , 邑 車 車 ブ t 量度 経度 ∞ お 〆 ザ 〆 n ,'V' ∞ ∞ l 刊 表 3 基本情報と Web情報をマージした表 ( 4 ) 駅と駅の距離 駅と駅の距離は、駅の位置(緯度経度)から直線距離から求める。駅の位置は正確では ないが、最寄駅が同じ賃貸物件の緯度・経度の平均を利用する。 23区内のすべての駅 (256 駅)の距離を計算し(表 4 )、次に駅ごとに近い駅の順位を決定する。この順位が EMアル ゴリズムの M ステップで、期待値の最大化に使われる順序になる。 M ステップでは実務デ ータとの誤差が 10%以内になるように繰り返す。 ... .. . .. . .. . ... .. . .. . ... .. . ... . .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. ... . .. . .. . .. . .. .. .. . ... ... B .. . . . . 1 0 . ..... ... . .. . .. . .. . .. . .. ... ... ... ー. . .. . ... .. ... . .. ., . . .. . .. . .. . .. ... . .. ... ... 。 2 5 6 . 阿佐ヶ谷 戸イE~圏 お花茶屋 ときわ台 l 主 克 司 事 井荻 曳舟 一之江 稲荷町 日 1 6 日2 4 70 2 4 7 3 0 7 日. 0 2 1 2 7 0 日6 6 1 8 3O .日4 3 0 6 8 日. . 2 1 1A36 日. . 0 7 8 1 1 1日 . 2 2 4 2 3 60 2 ときわ台 0 。 1 8 2 6 4 日1 5 2 6 9 2 日. . 1 6 0 2 4 7 0 . 0 7 2 0 7 5 日1 0 7 1 5 4 8 日. 2 1 6 8 4 80 . 1 1 4 8 8 9ー 。1 3 7 7 3 9 3 向性ヶ谷 0 . 2 1 1A 3 60 日 0 . 0 4 6 3 2 90 . 2 日9 3 2 9 日0 2 6 6 6 4 日. 2 5 0 9 9 8 日1 5 1 8 1 70 . 1 7 8 3 0 4 . 0 7 2 0 7 5 4 戸花公園 日2 4 7 3 0 70 日 日. 2 4 7 7 7 3日 8 3 8 5 日. 2 1 0 4 5 日6 0 日0 9 日2 7 7 1 5 1 日1 . 1 1 8 2 6 40 . 0 4 6 3 2 9 0 . 0 2 1 2 7 日 日 日 7 3 9 1 日 0 . 1 5 2 6 9 20 . 2 0 9 3 2 90 . 2 4 7 7 7 3 日 ー 日5 5 綾」漕 0 . 2 1 9 7 9 70 6 0 9 3 . 0 9 8 9 4 5 0 . 2 2 4 2 3 60 。 . 0 7 1 5 4 80 . 0 2 6 6 6 40 . 0 6 0 0 0 90 . 2 1 9 7 9 7 . 1 6 8 4 5 10 6 弁荻 . 1 9 A 3 6 5 0 . 2 6 9 6 9 0 . 0 7 8 1 1 10 7 7 1 5 1日 . 日9 8 9 4 5 0 日 7 一之;ヱ 0 日9 9 8 日2 0 . 1 0 2 5 1 1 。. . 2 1 6 8 4 80 . 2 5 . 2 6 9 6 9 0 7 91 自 稲荷町 0 日 . 0 6 6 1 8 30 . 1 1 4 8 8 90 . 1 5 1 8 1 7ー 。1 8 3 8 5 0 . 0 7 3 9 1 8 日1 6日4 5 1 日1 0 2 5 1 1 0 . 0 2 6 6 6 5 日 日4 P 曳舟 3 0 6 80 日 7 8 3日4 日. 2 1 0 4 5 日 . 日5 6 0 9 3 日1 9 4 3 6 50 . 0 7 9 4 4 10 . 0 2 6 6 6 5 . 1 3 7 7 3 9 日1 お花茶屋 表 4 駅間の距離順序 ‑3 1 0‑

306.

( 5 ) 駅の乗降数 表 4 の駅ごとの近距離駅のランキングは乗降数が大きく相違しない場合に有効である。 23区内の駅の乗降数は、各路線の電車会社のホームページから取得できる。該当駅がメイ ン駅でなく、情報がない場合は、挟まれた駅の平均値を利用した。 6 . 賃料の算出手順 ① 基 本 情 報 を SASデータセットにインポートし、データクリーニングを行う。 ② Web上から駅ごとの賃料、専有面積、平均単価の情報を取得し、 SAS上に DBを開発 する。同様に駅の乗降数も DB化を行う。 ③①の基本情報に、物件の最寄駅の②の情報をマージする。 ④欠損値の初期値は、該当物件の最寄駅に距離の近い駅に居住面積当りの平均賃料で補充 する。 E Mアルゴリムに利用するデータは表 3を用いる。 ⑤距離は、提供された物件の最寄駅の緯度・経度の平均を最寄駅の位置とし、該当駅に距 離の近い駅の順位を算出する。 M ステップで探索する近距離の駅は最大 7個とする。 ⑥ただし近距離の駅が最寄駅の乗客数と比較して、 1日の 2倍以上相違する場合は、その 駅は外す。 ⑦ す べ て の 4タイプの居住面積当りの平均賃料が判明しているケースが少ないため、 1タ イプでも補充できれば、そこから他タイプの推定を行う。駅ごとに 4タイプの居住面積 当りの平均値の差異から他タイプを推測する。単位面積当りの賃料は 1ルームが最高値 で 2K、 3Kと同じ賃料とし、 4 Kでやや賃料が安くなる。駅ごとにタイプ別の賃料格 差から、平均賃料を推定する。 ⑧補完して完全データとなった表 3から、居住面積当りの平均賃料と物件の居住面積をか けて標準賃料(推定値)を算出する。 ⑨標準賃料(推定値)と学会からの提供の実際の賃料が 10%以上の事離を有する場合は単 位面積当りの平均賃料を変更する。修正は近距離の駅の順序に従う。 ⑮平均賃料を修正したデータから、また新しい賃料を予測する。 ⑪予測賃料の誤差が 10%未満になるまで、平均賃料を変更し、⑤ ⑮の推定を繰り返す。 表3 )を得られる。この DBだけでも賃料を推測できるが、 ⑫以上から完成データの DB( さらに他の基本情報を追加して、最終的な賃料推測モデ、ルを作成する。 ⑬賃料推測モデルはデータのランダムサンプリングで、 5種類の多変量分析のモデルを開 発し、その平均値を賃料の推定値にした。 7 . 結 果 本研究では、駅ごとの住居タイプ別の平均賃料の欠損値を E Mアルゴリズムで補正し、 これを説明変数に追加した。この完全データを多変量解析で分析し、安定化させるために 5種類のモデルを開発した。 5種類のモデ、ルの有効説明変数の t値を表 5 にまとめる。平 均賃料から算出する標準賃料(平均単価*専有面積)が他の説明変数よりも t値がきわだ EA 唱 Tよ ﹃υ

307.

って大きい。説明変数に標準賃料を加えることで、約 20%の誤差の減少が見られた。 求める推定賃料は 5種類のモデルから算出した賃料の平均を用いた。 Model1 Model2Model3 Model4Model5 v a l u e s 5 . 1 0 5 . 9 8 6 . 5 9 専有面積 1 .6 0 保証金/賃料 一 1 .8 0 礼金/賃料 2 . 1 6 1 . 9 7 / 敷金/賃料 6 . 7 9 4 3 . 6 0 1 標準賃料(平均平米単価指専有面積) 1 5 . 8 0 1 7 . 0 5 1 5 . 5 1 4 . 2 5 5 . 2 6 5 . 6 2 5 . 6 5 部屋タイプ(1ルーム) 部屋タイプ( 1K .1DK ) 2 . 8 0 3 . 2 3 3 . 7 3 3. 47 . 3 7 部屋タイプ( 1L D K .2 K .2 D K .2 S K ) 0 . 41 0 . 3 3 0 0 . 6 8 ‑ 4 . 7 0 4 ‑ 4 . 1 2 部屋タイプ(2LDK . .2 SLDK.3 K .3DK) . 3 3 4 . 8 5 ‑ 4 . 5 1 ‑ 4 . 3 3 3 3. 4 4 ‑ 4 . 1 6 . 5 6 ‑ 建築年数 . 0 8 管理費の有無フフク 3 . 2 4 2 3 . 6 3 2. 49 ‑ 2 . 3 0 ‑ 2 . 6 7 . 18 2 . 8 1 2 墜事場の有無フフグ 表 5 モデルの t値 8 . SASのプロシージャーについて 多重代入法による擬似データの生成は、 SAS ver8 から可能になった。 PROC MI と PROC MIANALYZE を用いることで、①回帰による方法、②傾向スコアに基づく方法、 ③マルコフチェーン・モンテカルロによる方法の代入法が可能になる。筆者はこれらの方 法を表 3に適用したが、芳しい成績が得られなかった。そのため、不動産の知識をいれた 効用関数を作成し、本研究の成果を導いた。 SASのプロシジャーMIと MIANALYZEは、文献にある岩崎氏の著作と、下記から引け る SAS社の小野氏の文献が詳しい。 http://www.sas.com/searchJQuerv.html?Qt=MI&nh=10&Qc=extsas&amニO&rf=O&raニO 9 .結び 本研究のオリジナリティは、不動産賃料は駅ごとの単位面積当りの賃料が、最も有効な 説明変数になる点に注目し、 Web上から情報収集を行ったが、欠損値が多いため E Mアル ゴリズムで捕捉した点である。成果は E Mアルゴ、リズムに、不動産の知識を取り入れた効 用関数を導入することで、初期依存性を避けることができた点である。 本研究で最も労力を費やした点は、 Webからデータ取得である。 Web上では DBにな っておらず、駅ごとのデータを手作業で DBに書き写した。その作業にかなり作業時間を 要した。そのため、モデルの構築に時間をかけることができなかったことが反省点である。 なお、本モデルの成績は、不動産金融工学学会の国際大会の 4位で、あった。競技用の 150 レコードの平均誤差率は、 1位 12%, 2位 &3位 18%, 4位 19%, 5位 22%であった。同じデ ータを用いた前回の国内大会では、筆者の誤差が 24%であったので、予定どおり精度の向 312 ‑

308.

上を達成した。 1 0 . 謝 意 日本不動産金融工学学会には、 S ASユーザー会への投稿・口頭発表を許可して頂きまし た。ここに当学会とデータの提供元の(株)アットホーム社へ謝意を申し上げます。 11 . 参 考 文 献 ‑岩崎学,"不完全データの統計解析"エコノミスト社, 2 0 0 2 . ・渡辺美智子,山口和範, "EMアルゴ、リズムと不完全データの諸問題",多賀出版, 2 0 0 0 . ・小西貞則,越智義道,"計算統計学の方法(シリーズ(予測と発見の科学))ブーストトラップ・ EM アルゴリズム・ MCMC",朝倉書居, 2 0 0 8 . ・浅野正彦,"欠損データの分析法"選挙学会紀要,v o I 1, 1 0 1 ‑ 1 2 3, 2 0 0 3 . .C.M.ビショップ,元田浩,栗田多喜夫,樋口知之,"パターン認識と機会学習上 ベイズ理論に よる統計的予測"シュプリンガー・ジャパン出版, 2 0 0 7 . • ) 1 1口有一郎"不動産金融工学",清文社, 2 0 0 1 ・刈屋武昭,藤田昌久"不動産金融工学の発展(ジャフレ・ジャーナル)",東洋経済新報社, 2 0 0 6 . Ei 唱 円叫U ηJ

309.

+SASユーザー会世話人 人 話劇 世人問 表話閣 代世田 大橋靖雄/東京大学 岩崎学/成躍大学 小野潔/株式会社三菱東京 UFJ銀行 北田 祐幸/総務省政策統括官(統計基準担当)付 堺伸也/イーピーエス株式会社 周防節雄/兵庫県立大学 菅波秀規/興和株式会社 八木章/近畿大学 山之内 直樹/第一三共株式会社 φSASユーザー会事務局 S A SI n s t i t u t eJ a p a n株式会社内 干 1 04‑0054 東京都中央区勝どき 1 ‑ 1 3 ‑ 1 TEL:03・3533・6936 イヌイビル・力チドキ FAX:03・3533・3781 E ‑ m a i l :j p n s a s w g @ s a s . c o m h t t p : / / w w w . s a s . c o m / j a p a n / ・ 000 g 2008 SASユーザー総会 アカテ、ミア/テクノロジ4 ソリユーションセッション論文集 2008年 7月 23日 初版第 1刷発行 発行 S A Sユーザー会 S A SI n s t i t u t eJ a p a n株式会社