はい、False Positiveと説明していただいて問題ないと思います。
私見ですが、Lengthの設定でデータが切れるような設定を積極的にすすめる意図はTCGにもないと思いますので、プログラム的にマージやセットでデータが切れるような
lengthの設定は避けるべきだと思います。SUPPに関しては転置してから使うデータなので転置前のlengthに意味はないので、各データごとに最適化されても問題ないと考えます。
よろしくお願い致します。
中尾
中尾様、いつもお世話になります。
P21CのFalse Positiveに関して、下記2点教えていただけないでしょうか。お手数ですがよろしくお願いいたします。
Q1Define-XMLのType=FloatのLengthと上記の件について、False Positiveと説明することで問題ない旨、本Forumより教えていただいております。
現時点で、その他にFalse Positiveと把握されている事象はありますでしょうか。
(もしまとまって掲載されている場所などありましたらご教示いただけると大変助かります)
A: 大変申し訳ないのですがFalse Positiveについては、Engine/Rule/TCG/CDISCの資料などを、質問の中で提供していただいた限定された情報で判断しています。
データもdefine.xmlも見ない状況で全ての判断をできるわけではないので、個別に判断させて頂ければ幸いです。
Q2: 既知のFalse Positiveに関して、今後の修正される予定などは立っていますでしょうか。
ありがとうございます。修正がすんだらなるべくこちらにもポストします。
上位の文書や具体的な修正依頼がこちらにポストされれば修正させて頂く場合もあります。
上位文書(CDISCやAgencyの文書)に依存する場合は弊社の独自の解釈で変更することは避けています。
当局ののエンジンは弊社が自由に修正しているわけではないのでその点ご理解いただければ幸いです。
中尾
中尾様、ご回答いただきありがとうございます。Q1、Q2について状況承知いたしました。
今後ともよろしくお願いいたします。
P21Cにてデータセットのvalidationを行っています。
これまでタイトルにある各ドメインのIDVARVALのLENGTHは,そのドメインに格納したIDVALVALのそれぞれの変数長を設定しておりました。
しかし,TCGの3.3.3章を参照すると,変数長はデータセット横断的な最大長でよく,SUPP--は個別のデータセットの最大長,と読むことができます。
"The allotted length for each column containing character (text) data should be set to the maximum length of the variable used across all datasets in the study except for suppqual datasets. For suppqual datasets, the allotted length for each column containing character (text) data should be set to the maximum length of the variable used in the individual dataset. This will significantly reduce file sizes. For example, if USUBJID has a maximum length of 18, the USUBJID’s column size should be set to 18, not 200."
TCGに従いSUPP--ドメイン以外で横断的最大長でLENGTHを設定すると,SD1082エラーが出てしまいますので,nSDRGに「TCGに従った」と記載することになると思います。
これはFalse Positiveという認識でよろしいのでしょうか?ご助言いただければ幸いです。