alfresco bulk import toolのご紹介
TRANSCRIPT
第 32 回 Alfresco 勉強会
Bulk Import tool のご紹介
2016 年 3 月 23 日Moritaka Soma
自己紹介
相馬 盛孝オープンソースコンサルティングチーム所属Alfresco のカスタマイズやサポートをしています
発表内容
本日の発表内容 :
Alfresco の Bulk Import tool についての紹介
• 具体的にどんなことができるのか?• 実際の画面・操作 デモ
Bulk Import tool
Alfresco Bulk Import tool
Bulk Import tool
Alfresco Bulk Import tool
元は Add on として提供されていたが、Alfresco 4.0 以降製品に同梱されるように
Alfresco をインストールしてすぐに使えます!
Bulk Import tool
Alfresco Bulk Import tool他の手段に比べてのメリット :• Alfresco4.0 以降ならデフォルトで利用可能• ファイルツリー構造をインポート可能• ファイルサーバ機能を利用するより高速• インポートと同時にメタデータ、
ファイルの履歴情報を付加可能(但し、準備が必要)
• インポート状況を確認可能
Bulk Import tool
ファイルメタデータファイルの末尾に” .metadata.properties.xml” を付加したメタデータファイル ( 例 : sample.txt.metadata.properties.xml) を作成することでメタデータを与えることができます
メタデータファイル例 : (sample.txt.metadata.properties.xml)<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"> <properties> <entry key="type">cm:content</entry> <entry key="aspects">cm:versionable,cm:dublincore</entry> <entry key="cm:title">A Sample Text File.</entry> <entry key="cm:description">A Sample Text file for Alfresco Study #32.</entry> <entry key="cm:created">2016-01-01T12:34:56.789+09:00</entry> <!-- cm:dublincore properties --> <entry key="cm:author">admin</entry> </properties>
Bulk Import tool
ファイルメタデータフォルダにもメタデータを与えることができます
メタデータファイル例 : (SubFolder.metadata.properties.xml)<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"> <properties> <entry key="cm:title">A Sample Folder.</entry> <entry key="cm:description">A Sample Folder for Alfresco Study #32.</entry> <entry key="cm:created">2016-01-01T12:34:56.789+09:00</entry> </properties>
Bulk Import tool
ファイル履歴情報ファイルの末尾に” .v< バージョン番号 >” を付加する ( 例 : sample.txt.v2) ことで、ファイルに履歴情報を与えることができます
例 :以下のファイルがインポート元の同一フォルダにある場合• Sample.txt• Sample.txt.v1• Sample.txt.v2
末尾に何も付かないファイル (Sample.txt) が最新バージョン
Sample.txt.v2 がひとつ前のバージョン
Sample.txt.v1 が一番古いバージョン
としてインポートされます。
Bulk Import tool
ファイル履歴をインポートする際の注意点:
• 指定したバージョン番号のファイルとしてインポートされるわけではない末尾に付加した番号は履歴順の特定のみに使われる
例 :• Sample.txt• Sample.txt.v1• Sample.txt.v3
Sample.txt が最新バージョン (ver. 3.0)
Sample.txt.v3 がひとつ前のバージョン
Sample.txt.v1 が一番古いバージョン
Bulk Import tool
ファイル履歴をインポートする際の注意点:
• 最新バージョンの番号は同一ファイルの数で決まる• Sample.txt• Sample.txt.v1• Sample.txt.v3と 3 ファイルある場合、Sample.txt のバージョンは 3.0 (4.0 ではない)
• バージョン番号指定に使えるのは整数のみSample.txt.v1.5 等の小数点を持つバージョン番号は使えない
Bulk Import tool
インポート状況の確認:http://<alfresco host>/alfresco/service/bulkfsimport/status で確認可能WebUI からキックした場合は自動で遷移します
Bulk Import tool
2 種類のインポート方法を提供Streaming Import:• ファイルシステムから、コンテンツストアへファイルを
コピーしてインポート• Community 版でも利用可能
In-place Import:• Enterprise 版のみ利用可能• 事前にコンテンツストア内にあるファイルをコピーせずに
登録(ファイルコピー無し、高速)• コンテンツストア内に mount されたファイルでも OK
但し、 Alfresco から常にアクセス可能な必要がある
Bulk Import tool (Streaming Import)
Alfresco Bulk Import tool(Streaming Import)http://<alfrescohost>/alfresco/service/bulkimport で WebUI にアクセスできます
Bulk Import tool (Streaming Import)
Alfresco Bulk Import tool(Streaming Import)設定項目• Import directory:
ファイルシステム上の Import 元ディレクトリ
• Target space(Path or NodeRef):Alfresco 内の Import 先を、Path( 例 : /Company Home/ImportTest) かNodeRef ( 例 : workspace://SpacesStore/6e32e892-c5dd-47e6-90fe-bce0e7f509c6 )で指定
• Disable rules:Import 作業中に Import 先フォルダの Rule の実行を無効化
• Replace existing files:Import 作業中に同名のファイルが存在した場合に上書きを行う
Bulk Import tool (Streaming Import)
Alfresco Bulk Import tool(Streaming Import)設定項目 ( つづき )• Batch Size:
一度に Import するファイル / フォルダ数設定しない場合はデフォルト値 (Alfresco One 5.1 の場合 20) を使用
• Number of Thread:Import に利用する Thread 数設定しない場合はデフォルト値 (Alfresco One 5.1 の場合 4) を使用
Bulk Import tool (Streaming Import)
Alfresco Bulk Import tool(Streaming Import)
デモ :
Bulk Import tool (In-place Import)
Alfresco Bulk Import tool(In-place Import)http://<alfresco host>/alfresco/service/bulkfsimport/inplace でWebUI にアクセスできます
Bulk Import tool (In-place Import)
Alfresco Bulk Import tool(In-place Import)設定項目• Store-relative import directory path( インポートディレクトリパス ):
Alfresco コンテンツストア内のインポート元ディレクトリの相対パス
• Content Store( コンテンツストア ):インポート元フォルダのあるコンテンツストアの指定
• Target repository path( ターゲットリポジトリパス ):Alfresco 内のインポート先のリポジトリパス
• Disable rules:• Batch Size:• Number of Thread:
Streaming Import と同じ
Bulk Import tool (In-place Import)
In-place Import の際の注意点 :
In-place Import ではインポート元のフォルダ構造がそのまま利用されるため、効率のために 1 フォルダ内に大量のコンテンツが存在することを避けることが推奨されています最大でも 1 フォルダ内に子コンテンツが数 1000 以下であることが推奨されます
Alfresco デフォルトのコンテンツストアでは、コンテンツが/ 年 / 月 / 日 / 時 / 分 / のフォルダ構造の下に置かれ、 1 フォルダ以下に
大量のコンテンツが置かれることのないようになっています
インポート元フォルダが Alfresco リポジトリと同期する機能ではありませんあくまでインポートであり、 Alfresco 上に登録されるのはインポート時に存在したファイル / フォルダのみです
Bulk Import tool (Streaming Import)
Alfresco Bulk Import tool(In-place Import)
デモ :
ありがとうございました。