同意します。
Define-XMLにUNICODEを使用する場合は、データセットにもUNICODEを使用する必要があります。
また、メタデータにXMLを使用する場合は、データセットにもXMLを使用できるようにする必要があります。
したがって、PMDAがDataset-XMLに移行し、XPTの必要性を停止する時期が来ています。
XPTは30年以上前のものであり、IBMメインフレーム専用でした。
それはパンチカードの最初の後継者でした。
データセットへの移行-XMLは簡単なステップです。
Q: SJISのXPORTファイルは利用してはいけないのか、またなぜUNICODEを推奨するのか?
XPORTについてもUTF-8のASCII文字のみのデータセットを推奨します。
ASCII部分はUNICODEとSJISで共通なのでSJISのXPORTファイルが使えないわけではありません。
ただし以下の理由によりSJISを推奨しません。
-ASCII(<128)のであるというチェックをしていない申請者様が多い。(PMDA、FDAのTechnical Conformance Guide参照)
-UNICODEのEDCが多い。(文字コード変換 UNICODE > SJISで文字化けが発生する可能性がある。Transcode Errorが発生しプログラムが落ちる可能性がある)
-UNICODEのdefine.xmlが多い。(データとメタデータは、文字コードが一致していることが前提)
-海外で(本社、支社、委託先、導出先、外国当局)、問題が発生した場合に、SJISのインストールされていないことが多い。
(データを復旧するのに時間と手間がかかる)
-海外のシステムは2バイト文字など想定していないこともある。(FDA TCG参照)
リスクの一番少ない状況は、以下のとおりです。
“EDC/CDMS” & SAS & DEFINEの文字コードが一致している。(文字コード変換が発生しない)
ASCII文字(<128)のみでデータもdefine.xmlも作成
UNICODEのSASはどの環境でもインストールされていることが多いのでUNICODEを利用。
以上、複数の方からメールを頂きましたので、転載します。
質問はこちらにポストして頂けると大変助かります。
中尾 親彰
<ENCODING> <SJIS> <UTF-8>