Ubuntu Weekly Recipe

第363回 CSVエディターとしてのLibreOffice Calc

この記事を読むのに必要な時間:およそ 2.5 分

実はLibreOffice CalcはCSVエディターとして使用するのもまた便利です。今回はそのコツを紹介します。

CSVエディターとして優秀なCalc

LibreOffice Calcは,CSVエディターとしてもなかなか優秀です。CSVはComma Separated Values(コンマ区切り値)の略であることはよく知られていますが,タブや他の記号で区切られているデータであってもCSVと呼ぶことがあったりして,かなり振り幅の大きなフォーマットとして使用されているのが現状です。ということは,CSVエディターにも柔軟性が求められるわけですが,LibreOffice Calcは充分にこれに応えてくれます。

準備

まずはCSVファイルを入手する必要があります。何でもいいですが,今回は郵便番号データを使用することにします。いくつかの種類があって,どれでもいいですが,読み仮名データの促音・拗音を小書きで表記するもの(zip形式)「全国一括」にしました。データが大きいので,北海道だけでいいとも思います。

LibreOfficeで扱うCSVファイルは何でもいいと書きましたが,拡張子はcsvでなければなりません。txtとかだと,Writerでファイルを開いてしまいます。タブ区切りだからといってtsvとかにする必要もありません。

インポートダイアログ

LibreOfficeでCSVファイルを開くと,必ずインポートダイアログが表示されます。もし表示されない場合は,拡張子を確認してください注1)⁠

図1がそのダイアログですが,詳細に解説します注2)⁠

注1)

Windowsだと既定で拡張子が非表示になっていたりしますので,念のため。

注2)

なお現在翻訳の見直し中であり,将来的には別の訳語になる可能性が高いです。

  • 「文字エンコーディング」はその名のとおりで,もし誤っている場合は下にあるプレビューが文字化けします。逆に言えば,ここで文字化けしない文字エンコーディングを指定してください。日本語ではUTF-8かUTF-16かShift-JISかWindows-932のいずれかに該当する可能性が極めて高いです注3)⁠
  • 「言語」は特段の理由がない限りは「日本語」でいいでしょう。外国のデータを扱う場合は,その国に変更する必要があります。
  • 「固定幅」⁠区切る」は,固定長の場合は前者を,可変長の場合は後者を選択してください。さらに,可変長の場合は区切り文字(デリミタ)を指定します。ご覧のとおり複数選択できますし,⁠その他」でデリミタを指定することもできます。おかしなフォーマットをCalcにインポートしたい場合,この機能は意外と使えます注4)⁠
  • 「フィールド区切りの結合」は完全に意味不明ですが注5)⁠ここにチェックを入れると空の項目がある場合はそこをスキップしてインポートします。もちろん複数のデータがある場合は,項目がずれるようなことにはなりません。
  • 「テキストの区切り記号」はそのままで,テキストを括る引用符を指定します。
  • 「フィールドをテキストとして引用する」は誤訳であり,⁠区切り記号で括られたフィールドをテキストに」とするのが妥当です注6)⁠⁠テキストとして」とはどういうことなのかというのは後述します。
  • 「特殊数値を検出」は,日付や時間や指数表現をそれとしてインポートします。チェックを入れない場合は,数値としてインポートします。日付や時間や指数表現は国によって違うので,⁠特殊数値」が意味するところも違ってくるのが難しいところではあるのですが。
  • 「列の種類」は,その列の型を変更します(図2)⁠たとえば数字の場合は数値としてインポートしますが,今回のように頭の「0」に意味がある場合,数値にすると消えてしまいますが,これだと困ります。というわけで,ここで「テキスト」にすると,この「0」は消えませんが,その代わりテキストとして扱われるので計算などは原則としてできなくなります注7)⁠前述の「テキストとして」も,つまりはそういうことです。あとは「日付(YMD)」「非表示」は使用することがあるかもしれません。
注3)

Excel用語のUnicodeはUTF-16です。

注4)

筆者の実体験では,⁠・」⁠中点)がデリミタのデータを受け取った時に困りましたが,結局これで解決しました。その列だけ抜き出してCSVファイルを作成し,Calcでインポートしたのです。

注5)

ちなみに原文は⁠Merge delimiters⁠です。

注6)

4.4.1で修正しました。

注7)

実のところ4.3以降ではオプションによっては計算できるのですが,今回は省略します。

図1 インポートダイアログ

図1 インポートダイアログ

図2 ⁠列の種類」のオプション

図2 「列の種類」のオプション

著者プロフィール

あわしろいくや

Ubuntu Japanese Teamメンバー。Ubuntu Japanese Teamではパッケージングなどを担当。ほかには日本語入力関連やOpenOffice.org日本ユーザー会コミッティも兼任。

コメント

コメントの記入