今回は,
IFilterの構造
現在,
また,
IFilterはファイル形式ごとに登録されたCOMのインターフェースを通じて,
現在,
IFilterを独自のファイル型式に対応させるには,
IFilterの種類
現在,
MicrosoftのSharePointのIFilterダウンロードページ
SharePoint製品のサポートページ内に設けられたIFilterのダウンロードページです。Visio 2003/2002, 一太郎, Adobe PDF, DocuWorks 4. 01のIFilterが紹介されています。 一太郎 IFilter
前述のMicrosoftのSharePointのIFilterダウンロードページからもこのリンクが参照されていますが,一太郎Ver. 5, 6, 一太郎7, 8, 9, 10, 2007のファイル用のIFilterがダウンロードできます。 Adobe PDF IFilter
Adobeの提供するPDF用のIFilter v6.0です。
一方,Adobe LabsのページからはAcrobat 8に対応したAdobe PDF iFilter 8 - 64-bit support (プレリリース版) がダウンロードできます。IFilterShop
このサイトから,商用/非商用の沢山のIFilterがダウンロードできます。トップページには次のIFilterが紹介されています。 - ASPX IFilter indexes ASPX files and associated Master Page files
- CHM IFilter for Compiled HTML Help files
- DWF IFilter for design documents in Autodesk Design Web Format
- Inventor IFilter for Autodesk Inventor documents
- MindManager IFilter for Mindjet MindManager documents
- Msg IFilter for emails stored in MSG format
- MS Project IFilter for Microsoft Project documents
- PDF+ IFilter enhanced IFilter for Adobe PDF files
- PostScript IFilter for PostScript files
- RAR IFilter indexes content of RAR archives
- SHTML IFilter indexes files in HTML format and their Server-Side Includes (SSI)
- StarOffice/
OpenOffice IFilter for StarOffice, OpenOffice and OASIS OpenDocument files - vCard IFilter for Electronic Business Card files
- WMV/
WMA IFilter for Windows Media Video and Windows Media Audio files - XMP IFilter indexes Adobe XMP metadata in JPEG, GIF, TIFF, PNG, PS, EPS, PSD, AI and SVG files
- Zip IFilter searches content of ZIP archives
IFilter.
Org
こちらも多くのIFilterが紹介されています。以下のようなIFilterがあります。こちらのJPEG IFilterを使うとEXIFのメタ情報を取得できるそうです。- Archive Files (like CAB, ZIP, RAR or self-extracting EXE)
- CHM Compiled HTML files
- CSF Content Sealed Format
- DjVu
- HLP Help Files
- Image Files (digital photos, JPEG, etc.)
- MHT MIME Encapsulation of Aggregate HTML Documents
- Palm Desktop
- RTF
- Office Suites (Microsoft, WordPerfect, StarOffice, OpenOffice)
- Visio
IFilterの関連ツール
IFilterの開発や,
filtreg.exe
このツールを実行すると,
C:\> filtreg .386 --> Null filter (query.dll) .aif --> Null filter (query.dll) ... 以降 Null filterは省略 ... .doc --> Microsoft Office Filter (OffFilt.dll) .docm --> Office Open XML Format Word Filter (C:\PROGRA~1\COMMON~1\MICROS~1\Filters\offfiltx.dll) .docx --> Office Open XML Format Word Filter (C:\PROGRA~1\COMMON~1\MICROS~1\Filters\offfiltx.dll) .dot --> Microsoft Office Filter (OffFilt.dll) .msg --> Office Outlook MSG IFilter (C:\PROGRA~1\COMMON~1\MICROS~1\Filters\msgfilt.dll) .pdf --> PDF Filter (C:\Program Files\Adobe\Acrobat 8.0\Acrobat\AcroIF.dll) .pot --> Microsoft Office Filter (OffFilt.dll) .pps --> Microsoft Office Filter (OffFilt.dll) .ppt --> Microsoft Office Filter (OffFilt.dll) .pptm --> Office Open XML Format PowerPoint Filter (C:\PROGRA~1\COMMON~1\MICROS~1\Filters\offfiltx.dll) .pptx --> Office Open XML Format PowerPoint Filter (C:\PROGRA~1\COMMON~1\MICROS~1\Filters\offfiltx.dll) .tif --> MODI Document Filter class (C:\PROGRA~1\COMMON~1\MICROS~1\MODI\11.0\MSPFILT.DLL) .tiff --> MODI Document Filter class (C:\PROGRA~1\COMMON~1\MICROS~1\MODI\11.0\MSPFILT.DLL) .txt --> Plain Text filter (query.dll) .xlb --> Microsoft Office Filter (OffFilt.dll) .xlc --> Microsoft Office Filter (OffFilt.dll) .xls --> Microsoft Office Filter (OffFilt.dll) .xlsm --> Office Open XML Format Excel Filter (C:\PROGRA~1\COMMON~1\MICROS~1\Filters\offfiltx.dll) .xlsx --> Office Open XML Format Excel Filter (C:\PROGRA~1\COMMON~1\MICROS~1\Filters\offfiltx.dll) .xlt --> Microsoft Office Filter (OffFilt.dll) Filters loaded by class: Filter: Plain Text filter (query.dll) ... 以降抜粋 ... Adobe Acrobat Document Filter: PDF Filter (C:\Program Files\Adobe\Acrobat 8.0\Acrobat\AcroIF.dll) Extensions: .xfdf (AcroExch.XFDFDoc) .rmf (AcroExch.RMFFile) Extensions: .fdf (AcroExch.FDFDoc) Microsoft Office OneNote Section Filter: Microsoft Office OneNote Filter (C:\PROGRA~1\MI69DF~1\Office12\ONFILTER.DLL) Extensions: .one (OneNote.Section.1) Microsoft Office Word Filter: Microsoft Office Filter (OffFilt.dll) Extensions: .dotx (Word.Template.12) Microsoft Office PowerPoint Filter: Microsoft Office Filter (OffFilt.dll) Extensions: .potx (PowerPoint.Template.12) Filter: Plain Text filter (query.dll) Extensions: .wri (wrifile)
filtreg.
filtdump.exe
filtdump.
filtdump.
-b | 詳細なテキスト以外の情報を出力しません |
---|---|
-o 出力ファイル名 | 出力先のファイル名を指定します。 |
実際の使い方は次のようになります。ここではWord 2007のdocx形式のファイルを指定しています。
C:\> filtdump -b -o C:\test\output.txt C:\test\sample.docx
ここで,