データ交換で使われるテキストデータの種類
システム、プログラム間のデータ交換で使用されるデータの形式をまとめてみました。
主に、データの区切り方で分かれます。
▼固定長
区切り文字はなく、予め決められた桁数で値が並ぶ昔からの形式です。
データとして見づらいので好きでありませんが、古くからあるシステムや、設計した人が好む場合は、今でも見受けられます。
エクセルでも固定長データは読み込むことができます。
▼TSV:Tab Separated Value
各項目がタブコード(\t)で区切られたデータ形式です。 Excelのシートをコピーペーストした場合は、この形式になっています。
▼CSV:Comma Separated Value
各項目がカンマ(,)で区切られたデータ形式です。 タブで区切られている場合でもCSVと呼んでしまっている場合もあります。
▼RSV:Row Separated Value
余り使わない言葉ですね、最近初めて目にしました。
列の区切りを表す言葉で使用するようです。
固定長データで、データの並びの途中に、種類が分かれるような場合に、RSVとして、何桁かの空白文字が挿入されたりします。
▼任意の区切り文字
システムによっては、区切り文字は好きな様に設定することもあります。
よく見るのは、”|”とか”;”でしょうか。
値の中にカンマを含みたい場合に、手っ取り早く値として使わない文字を使用します。
ちなみにCSV形式で、値の中にカンマを使う場合は、値そのものを””で囲います。
▼XML
最近では、これが多いですね。
データをタグ<>で囲い、データを階層化させる定義です。
HTMLやRSSなど、ネット上でやり取りされるデータは、XMLが圧倒的に多いですね。
でも、XMLはルールが膨大なので、使い方を覚えるのが大変です。
▼完全オリジナル
そのシステム内だけで通用する自由な形式の場合もたまにあります。
システムで使いやすいように、定義できるので、作り勝手は良いですが、他のシステムとのやり取りでは使えないですね。
以上、まだ全てではないですが、よく使うものをご紹介しました。
== ランキングに参加しています。ぜひクリックお願いします ==
レンタルサーバーはロリポップで十分? [Java] バイト配列をテキストデータ化する