実はLibreOffice CalcはCSVエディターとして使用するのもまた便利です。今回はそのコツを紹介します。
CSVエディターとして優秀なCalc
LibreOffice Calcは,
準備
まずはCSVファイルを入手する必要があります。何でもいいですが,
LibreOfficeで扱うCSVファイルは何でもいいと書きましたが,
インポートダイアログ
LibreOfficeでCSVファイルを開くと,
図1がそのダイアログですが,
- 注1)
Windowsだと既定で拡張子が非表示になっていたりしますので,
念のため。 - 注2)
なお現在翻訳の見直し中であり,
将来的には別の訳語になる可能性が高いです。
- 「文字エンコーディング」
はその名のとおりで, もし誤っている場合は下にあるプレビューが文字化けします。逆に言えば, ここで文字化けしない文字エンコーディングを指定してください。日本語ではUTF-8かUTF-16かShift-JISかWindows-932のいずれかに該当する可能性が極めて高いです (注3)。 - 「言語」
は特段の理由がない限りは 「日本語」 でいいでしょう。外国のデータを扱う場合は, その国に変更する必要があります。 - 「固定幅」
「区切る」 は, 固定長の場合は前者を, 可変長の場合は後者を選択してください。さらに, 可変長の場合は区切り文字 (デリミタ) を指定します。ご覧のとおり複数選択できますし, 「その他」 でデリミタを指定することもできます。おかしなフォーマットをCalcにインポートしたい場合, この機能は意外と使えます (注4)。 - 「フィールド区切りの結合」
は完全に意味不明ですが (注5), ここにチェックを入れると空の項目がある場合はそこをスキップしてインポートします。もちろん複数のデータがある場合は, 項目がずれるようなことにはなりません。 - 「テキストの区切り記号」
はそのままで, テキストを括る引用符を指定します。 - 「フィールドをテキストとして引用する」
は誤訳であり, 「区切り記号で括られたフィールドをテキストに」 とするのが妥当です (注6)。 「テキストとして」 とはどういうことなのかというのは後述します。 - 「特殊数値を検出」
は, 日付や時間や指数表現をそれとしてインポートします。チェックを入れない場合は, 数値としてインポートします。日付や時間や指数表現は国によって違うので, 「特殊数値」 が意味するところも違ってくるのが難しいところではあるのですが。 - 「列の種類」
は, その列の型を変更します (図2)。たとえば数字の場合は数値としてインポートしますが, 今回のように頭の 「0」 に意味がある場合, 数値にすると消えてしまいますが, これだと困ります。というわけで, ここで 「テキスト」 にすると, この 「0」 は消えませんが, その代わりテキストとして扱われるので計算などは原則としてできなくなります (注7)。前述の 「テキストとして」 も, つまりはそういうことです。あとは 「日付(YMD)」 と 「非表示」 は使用することがあるかもしれません。
- 注3)
Excel用語のUnicodeはUTF-16です。
- 注4)
筆者の実体験では,
「・」 (中点) がデリミタのデータを受け取った時に困りましたが, 結局これで解決しました。その列だけ抜き出してCSVファイルを作成し, Calcでインポートしたのです。 - 注5)
ちなみに原文は
“Merge delimiters” です。 - 注6)
4.
4.1で修正しました。 - 注7)
実のところ4.
3以降ではオプションによっては計算できるのですが, 今回は省略します。