コンテンツマネジメント の基礎 c · ・...

19
+ CD0 - 001 対応 合格に必要な 全知識を わかりやすく解説 ドキュメント ソリューションの 基礎が身に付く 実務に役立 コンテンツマネジメント の基礎 C DIA テキスト

Upload: others

Post on 04-Jul-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

+CD0-001対応

合格に必要な

全知識を

わかりやすく解説

ドキュメント

ソリューションの

基礎が身に付く

実務に役立つコンテンツマネジメントの基礎

CDIAテキスト

Page 2: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

xii

第1章 コンテンツマネジメントの基礎

1-1 コンテンツマネジメントの基礎知識 ………………………………………… 31-1-1 コンテンツ ……………………………………………………………………… 4

1-1-2 コンテンツマネジメント ………………………………………………………… 7

1-1-3 コンテンツ管理システム ………………………………………………………… 9

第2章 コンテンツのキャプチャと利用

2-1 コンテンツの入力と認識 ……………………………………………………… 19

2-1-1 コンテンツの取得 …………………………………………………………… 20

2-1-2 画像認識 ……………………………………………………………………… 28

2-1-3 文字認識 ……………………………………………………………………… 31

2-1-4 データのファイル形式 ………………………………………………………… 33

2-2 コンテンツのスキャニング …………………………………………………… 41

2-2-1 スキャナーの接続と設定 …………………………………………………… 42

2-2-2 スキャニング処理の手順 …………………………………………………… 44

2-3 コンテンツの活用 ………………………………………………………………… 49

2-3-1 ワークフロー ………………………………………………………………… 50

2-3-2 共同作業 /共同オーサリング ………………………………………………… 54

2-3-3 索引 …………………………………………………………………………… 57

2-3-4 コンテンツの検索 …………………………………………………………… 60

2-4 コンテンツの公開と出力 ……………………………………………………… 63

2-4-1 コンテンツの公開 …………………………………………………………… 64

2-4-2 コンテンツの出力 …………………………………………………………… 68

2-5 コンテンツの保存と廃棄 ……………………………………………………… 75

2-5-1 保存とアーカイブ …………………………………………………………… 76

2-5-2 コンテンツの廃棄 …………………………………………………………… 79

第3章 ECMとITインフラストラクチャー

3-1 ネットワーク ………………………………………………………………………… 85

目次

Page 3: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

xiii

3-1-1 LANとWAN ………………………………………………………………… 86

3-1-2 ネットワークセキュリティ ……………………………………………………… 97

3-2 クライアント/サーバー ………………………………………………………… 1013-2-1 クライアントとサーバー ……………………………………………………… 102

3-2-2 仮想化 ………………………………………………………………………… 104

3-3 ストレージ …………………………………………………………………………… 1093-3-1 ストレージとメディアの種類 ………………………………………………… 1103-3-2 ストレージ戦略 ……………………………………………………………… 1183-3-3 高可用性と冗長化 …………………………………………………………… 1203-3-4 クラウド ……………………………………………………………………… 127

第4章 セキュリティとコンプライアンス

4-1 セキュリティ ………………………………………………………………………… 1354-1-1 セキュリティの基礎 …………………………………………………………… 1364-1-2 コンテンツのセキュリティ …………………………………………………… 145

4-2 コンプライアンス ………………………………………………………………… 1514-2-1 ECMとコンプライアンス …………………………………………………… 152

第5章 プロジェクトマネジメントとECM導入

5-1 プロジェクトマネジメントの基礎知識 …………………………………… 1595-1-1 プロジェクトマネジメントの基礎知識 ………………………………………… 1605-1-2 立上げプロセス群 …………………………………………………………… 1665-1-3 計画プロセス群 ……………………………………………………………… 1695-1-4 実行プロセス群 ……………………………………………………………… 1805-1-5 監視コントロールプロセス群 ………………………………………………… 1845-1-6 終結プロセス群 ……………………………………………………………… 188

5-2 ECM導入 …………………………………………………………………………… 1915-2-1 企画 …………………………………………………………………………… 1925-2-2 設計 …………………………………………………………………………… 1965-2-3 導入 …………………………………………………………………………… 200

Page 4: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

xiv

学習にあたり

本書の使い方

これからCDIA+(CD0-001)試験を受験する方は、本書を最初から順番に読み進めていくことをおすすめします。興味のある章から読むこともできますが、知識を体系的に学習しやすいように本書は構成されています。

本書は、CDIA+(CD0-001)試験に必要な知識が得られるように構成されています。

本書の構成

・ 本書は章・セクション・項目に分けて構成されています。・ 各章の初めには、「この章で学ぶこと」と、その章で学習するセクションタイトルが表記されています。「この章で学ぶこと」には章全体で学習する内容がまとめられているので、最初にその章で学習する内容の全体像を把握しましょう。・ 各セクションの表紙には、そのセクション内で学ぶ項目のタイトルが表記されています。・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めてください。

・ 重要な部分は、太字で表記されています。・ 欄外には、本文中の※印の付いた語句についての補足説明が記載されています。・ セクションごとに穴埋め式の確認問題があります。学習した内容の習得度を確認できます。・ 章末には選択式の章末問題があります。

※難しい英語名称は名称の後のカッコ( )内に、フルスペルを表示しています。

TAC株式会社は独立した企業であり、CompTIAとは関係を有しません。本書は、CompTIA認定試験に対応した学習書です。CompTIA、著者、発行所およびTAC株式会社は、本書の使用によるCompTIA認定試験の合格を保証するものではありません。

● A+、Network+、Server+、CDIA+、Security+、Linux+、CTT+、Project+、Storage+、Strata IT Fundamentals、Cloud Essentials、Cloud+、Mobility+、Mobile App Security+は米国CompTIAの登録商標です。

● その他記載されている社名、製品名はそれぞれの会社の商標および登録商標です。

Page 5: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

xv

本書の全体像

第5章プロジェクトマネジメントとECM導入

第1章コンテンツマネジメントの基礎

第4章セキュリティとコンプライアンス

作成 処理 保管 保存 廃棄

ECM

スキャニング共同作業

コンテンツ管理レコード管理

コンテンツ活用ワークフロー

第2章コンテンツのキャプチャと利用

第3章ECMとITインフラストラクチャー

Page 6: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

49

コンテンツの活用

コンテンツのキャプチャと利用

2

2-3-1 ワークフロー

2-3-2 共同作業 /共同オーサリング

2-3-3 索引

2-3-4 コンテンツの検索

コンテンツの活用

2-3

2-3

Page 7: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

50

ワークフローの特徴1ワークフローは、業務やビジネスルールの一連の処理手続きを定義し、流れ図などを用いて表現

する、あるいはその業務の一連の流れ(ルーティング)です。

請求書、受発注書、承認処理などの組織内で繰り返し行われている業務プロセスを可視化し、定

義された手順にしたがって、文書がアクションの関与者から別の関与者に渡される流れを定義しま

す。

ワークフローの導入により、既存の業務プロセスが可視化されるため、問題点が把握しやすくな

り、担当者間で作業量を分散させるなどのプロセス改善へつながります。ECMのワークフロー機能を利用することで、既存の業務フローをシステム化することができます。

ワークフローの活用例2ワークフローは、単体の作業ではなく、繰り返し可能な一連のプロセスを可視化し、処理の流れを効

率化します。そのため、処理手順が定型化されていない例外処理はワークフローには向きません。

企業において、ワークフローが活用される処理には、次のようなものがあります。

● 発注書処理● 経費処理● 請求書処理● 承認処理● 昇格処理● 社員のオン・ボーディング(職場導入支援 )/オフ・ボーディング(離職支援)

例えば、経費処理としては、交通費申請があります。交通費申請では、ユーザーが入力フォームに

必要事項を入力して申請依頼を行うと、所属長はPC画面上で申請内容が確認でき、承認ボタン

を押すことで総務部門に申請依頼が自動的に送信されます。その後、会計システムと連携し、支

払処理まで自動化することができます。

そのほか、社員のオンボーディング(職場導入支援)は、新入社員をスムーズかつ迅速に新しい組

織に馴染ませ、迅速にその人の持つパフォーマンスを促進させるプロセスのことです。内定後、新

入社員が組織に馴染み、生産的になるまで継続されます。

2-3-1 ワークフロー

文書などをビジネスルールにしたがって閲覧・決裁などを行う仕組みをワークフローといいます。ここではワークフローが、どのように使われているかを説明し、ワークフローの分類や機能について学習します。

学習ポイント

Page 8: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

51

コンテンツの活用

コンテンツのキャプチャと利用

2ワークフローを導入することで、新入社員の入社関連資料に不備がなく確実に届け出が行われて

いることの確認や、入社関連資料の閲覧状況を追跡することができます。

逐次プロセスと並列プロセス3ワークフローは処理手続きにより次のように分けることができます。

● 逐次(シーケンシャル)プロセス逐次(シーケンシャル)プロセスは、複数の処理を1つずつ順番に行うことで、ある人が作業を完

了したことをトリガーとして、別の人が次の作業を行います。

課長 部長申請者

シーケンシャルプロセス

● 並列(パラレル)プロセス並列(パラレル)プロセスは、複数の処理を並列して同時に行うことで、例えば稟議書の承認処理において、前の作業が完了した後に、1つの作業タスク(承認作業)を複数の人が同時並行に実行

する場合などがこれにあたります。

課長

担当

担当

担当

役員

総務など

申請者

パラレルプロセス

ワークフローの機能4ECMのワークフロー機能には、次のような機能が備わっています。

● フロー定義機能ECMで、業務フローを定義する場合、一括承認や代理承認、差戻しなどをフロー(ルール)エンジ

ンで定義した上で、アイコン化された申請者および承認者を配置し、矢印でフローの流れを決定し

ます。

ワークフロー機能のビジネスルールは、条件定義の基準となります。例えば、「1万円以上の物品

購入の場合、上司の承認が必要」というビジネスルールがあるならば、1万円以上の物品購入を

申請した場合には、承認処理のワークフローが開始されるように設定することができます。

2-3

Page 9: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

52

BPM企業活動で行われている業務プロセスを効率分析し、より効果的に行えるよう改善を行うプロセス。より効率的なプロセスを探る機能や自動化することを手助けするための機能を備えたソフトウェアが販売されている。

ERP企業にある人や資金、設備などの資源を管理し、業務の効率化や経営の最適化を行うためのプロセス。この活動を支援するためのソフトウェアが販売されている。

このようにワークフロー定義機能は、情報の伝達手順を可視化することで、情報を常に適切な手

順で適切な人に伝達することができます。

● フォーム作成機能フォーム作成機能は、申請のための入力フォームを作成する機能です。

フォーム作成機能を利用すると、画面上で自由に必要な部品を配置し、申請に必要な内容を入力す

るためのフィールドを簡単に作成できます。また、外部システムからデータを呼び出してフォーム画

面に表示することも可能で、複数のシステムを連携させたフォームの作成も行うことができます。

● 組織管理機能組織管理機能は、業務フローを定義する際に必要な、申請者や承認者などの組織情報を管理します。

人事情報をワークフロー内に取り込み、組織横断的な役割などの詳細な情報については組織管理

機能で新たに設定します。

ユーザーには、業務上の役割に基づいてアクションを割り当てることができます。ユーザーごとに

タスクキュー(割り当てられた仕事を蓄積する待ち行列)が定義され、自身に割り当てられたタスク

を確認し、アクションを起こすことができます。

● 外部システムとの連携最近では、ワークフローに、ERP※(イーアールピー:Enterprise Resource Planning)やBPM※

(ビーピーエム:Business Process Management)などの外部システムの情報をリンクさせること

もあります。外部システムの情報を利用することで、より正確な判断をすることができます。

例えば、稟議申請画面に販売管理と連携して予算と実績の数字の表示や、在庫管理と連携して発

注画面に引き当て可能な在庫数を表示するなど、用途に応じて連携することができます。

● タイマー機能タイマー機能は、プロセス途中での処理の一次停止や再開を定義するもので、例えば経理上の締め日の2日前に自動的に業務を再開する、などの設定ができます。

また、すべてのプロセス上で時間を測定し、プロセスにおけるボトルネックになっている部分がわか

るものもあります。

Page 10: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

53

コンテンツの活用

コンテンツのキャプチャと利用

2

2-3

メトリクス測定するための基準のこと。

● アラート/通知機能アラート/通知機能は、ワークフローの状態をチェックして、条件に合致した場合にアラート(警告)メッセージを通知します。

例えば、処理対象者が存在しない場合や、案件が開始されてから指定日を経過しても完了していな

い案件があった場合などに、あらかじめ指定しておいた担当者へメールで通知することができます。

● ステータスの評価 /レポート機能管理対象の業務プロセスの状態を評価するためのメトリクス※を設定し、エラー発生 /完了 /期限

切れ/実行中のワークフロー数、ワークフローが完了するまでの平均時間、過去数か月の使用状

況の概観などをレポーティングします。

ワークフロー履歴の集計分析を通じて、プロセスに内在する問題の把握や、業務プロセスに対す

る目標達成の成否を調べることができます。

● モバイルデバイスとの連携機能社内にあるPCだけでなく、スマートフォンやタブレットのようなモバイルデバイスでの利用ができる

ものもあります。例えば、持ち運びができるタブレットを利用し、店舗で顧客と対話しながらタブレッ

トで入力し、ワークフローを使ってすぐに承認を受け、生産部門への発注処理が行われる、といっ

た使い方ができます。

Page 11: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

54

2-3-2 共同作業/共同オーサリング

ここでは、ECMにおける共同作業 /共同オーサリングの概要と機能について学習します。同時編集を避けるためチェックインチェックアウト機能や注釈にはどのような種類があるのか理解しましょう。

学習ポイント

共同作業/共同オーサリング1共同作業 /共同オーサリング(authoring)は、文書、画像、ソフトウェアなどのコンテンツを共同編

集することをいいます。共同編集を行う場合には、そのコンテンツがリポジトリと呼ばれる領域

(フォルダー)に格納されます。

共同編集を行うための基本機能としては次のようなものがあります。

● バージョン管理● チェックイン/チェックアウト

● ユーザーとログの管理● 注釈機能

ECMの共同作業機能には、専用のワークスペースや、インスタントメッセージング、オンラインミー

ティング、画面共有、ブログ、ディスカッションフォーラムなどを利用できるものもあります。これら

を利用することで、距離や場所に関係なくコミュニケーションを取りやすくし、共同作業をスムーズ

に進めることができます。

最近では、コンテンツをクラウド※に保存し、いつでも、どこからでも作業できる製品も増えていま

す。クラウドの利用とユーザーに対するアクセス制限により、企業内だけでなく、企業間での共同

作業も安全に行うことができるようになりました。

バージョン管理2バージョン(履歴)管理とは、文書などの内容を変更した場合に、元の文書とは別の文書(バージョン)として管理する機能です。複数のバージョンを管理することで、必要な時期および内容のバー

ジョンに文書を戻して、編集・閲覧することができます。

クラウド「3-3-4 クラウド」を参照。

Page 12: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

55

コンテンツの活用

コンテンツのキャプチャと利用

2

2-3

ある文書を複数のユーザーで共同編集する場合に、バージョン管理機能を使用することで、常に最

新版のファイルを編集できます。その他に、複数の文書バージョンの保存、編集を元に戻すロール

バックなどに対応します。

この際、文書は複数の共同編集者によって長時間にわたって開かれたままになることがあるため、

共同編集する文書のバージョン管理は一定の時間の間隔で実行するようになっています。

バージョン管理機能は、Microsoft Office WordやPowerPointなどにも搭載されています。

チェックイン/チェックアウト3チェックイン/チェックアウトは、同一ファイルにおける同時編集を避ける機能です。

あるファイルに対してチェックインを行うと、そのファイルはチェックインしたユーザーのみが編集な

どの作業を行えます。

その他のユーザーに対しては、そのファイルがチェックイン状態にあることが明示され、読み取り専

用になります。作業が終わり、ファイルに対してチェックアウトを行うとファイルが開放され、他の

ユーザーが編集などを行えるようになります。

この機能を利用すると、作業ファイルにアクセスできるユーザーは、あるタイミングでは必ず一人と

なります。

注釈4注釈(アノテーション)は、文書の編集時などに語句の意味や用法を解説したり、補足的な説明を加えたりする機能です。

文書を作成するソフトウェアでは、本文の一部に対して注釈を設定できるものが多くあります。注

釈の種類には、次のようなものがあります。

● テキスト注釈テキスト注釈は、文書に入力した文章が追加表示されます。文書に不足している文章を追加する場合に利用されます。

● ハイライト注釈ハイライト注釈は、文書の一部にハイライト(色)を付け、その付近に記述した注釈を表示します。色がついているため目立ちやすく、どこに注釈が追加されたのかがすぐわかります。

● メモメモは、その文書に関するさまざまなことを記述できます。例えば、文書に対するコメントや連絡事

項などを記述します。

Page 13: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

56

● スタンプスタンプは、画像をスタンプ(印鑑)のように追加し、文書のステータスを示すウォーターマーク※

やスタンプを表示します。

スタンプ注釈の画像には、さまざまなものがありますが、「承認」、「重要」、「受信済」または「却下

済」といった、よく企業で使われるものが用意されています。

スタンプの例

● 改訂改訂(リダクション)は、注釈の表示・非表示を管理するもので、文書に対する権限によって自動的

に設定することや手動で設定することもできます。例えば、特定のユーザーに必要がない注釈を表

示させないようにすることができます。

ウォーターマーク「4-1-2 コンテンツのセキュリティ」参照。

Page 14: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

57

コンテンツの活用

コンテンツのキャプチャと利用

2

索引の生成1索引(インデックス)は、コンテンツに含まれる要素から構成され、元のコンテンツを高速に検索するためのキーワードです。コンテンツやデータベースなどの大量のデータを検索する場合に利用さ

れます。文字情報を持たない静止画像にも索引を付加することで、検索を行うことができます。索

引を生成するには、次のような方法があります。

● メタデータ

● インポートファイル

● 文字認識● キーボードによる入力● スクリーンスクレイピング

メタデータによる方法2メタデータとは、コンテンツに関するデータのことで、図書館の目録のように、作成者(属性)や日時(タイムスタンプ)、文書の設定(ドキュメントクラス)、ファイルの種類、内容について説明する

情報です。このような情報はファイルのプロパティで確認することができ、ファイルに格納されてい

ます。これらの情報を索引として登録します。

● メタデータの継承ファイルのプロパティ(属性)としてのメタデータの継承は、コンテナーあるいはフォルダー単位で階層的に行われます。複数の文書を管理するときに、文書をフォルダーに格納するイメージで、同

じ種類の文書をまとめて保存すると管理が容易になります。フォルダーの役割をする箱をコンテ

ナーともいいます。コンテナー内には、複数の文書またはコンテナーを階層的に関連づけることが

できます。

例えば、プロジェクト単位で文書をまとめて管理するために、プロジェクトAコンテナーをフォルダー

として用意し、フォルダーに資料を格納するイメージで見積書や企画書および仕様書ファイルを管

理できます。

このときファイルのプロパティ(属性)としてのメタデータは、コンテナーあるいはフォルダー単位で

階層的に継承されます。

2-3

2-3-3 索引

ECMから情報を取り出す際に利用するのが索引です。ここでは、索引の生成と関連する項目について学習します。学習ポイント

Page 15: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

58

マルチプラットフォーム複数のOSやコンピューターなどに対応していること。

マークアップ言語文書の構造をテキストファイルに記述するための言語。文書における文字の大きさといった指定のことをマークアップという。この指定にはタグと呼ばれる文字列を使用する。

プロジェクトA 見積書

企画書

仕様書

20131220.xml

20131225.xml

メタデータの継承

インポートファイルによる方法3ECMで管理する文書ファイルにメタデータとして索引を付加する場合、特定のファイル形式を利用

してメタデータをインポート(入力)することもできます。これらのファイルはテキストで記述される

ため、プラットフォームや環境によらず利用できます。

メタデータのインポートに使われるファイル形式としては、次のものがあります。

● TXTTXT(テキスト:TeXT)ファイルは、文字データだけで構成されたファイルです。どのような機種お

よびOSが搭載されたコンピューターであっても、共通して利用できる数少ないファイル形式です。

● タグ付きタグ付きは、タグ付きテキストとも呼ばれ、タグという内容を表す記述と、タグに対応した値がセットになっているファイル形式です。

● XMLXMLは、文書やデータの意味や構造を記述するための汎用的なマークアップ言語※の1つで、テ

キスト形式で記述されるためマルチプラットフォーム※に対応でき、インターネットでの情報交換に

利用されています。また、XMLではタグを独自に設定することもできます。

Page 16: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

59

コンテンツの活用

コンテンツのキャプチャと利用

2

2-3

● CSV/TSVCSV(シーエスブイ:Comma-Separated Values)は、いくつかのフィールド(項目)を「,(カンマ )」

で区切ったテキストデータおよびテキストファイルです。拡張子は 「.csv」で表現されます。タブ区

切りされたTSV(ティーエスブイ:Tab-Separated Values)とまとめてCSVと呼ばれることが一般

的です。

データ交換用のデファクトスタンダードとして、古くから多くの表計算ソフトやデータベースソフトで

使用されています。

文字認識による方法4大量の紙文書から索引を生成する場合に文字認識を利用します。例えば、大量の帳票を処理する

場合、伝票OCR(エリアOCR)による情報の入力が有効です。帳票の決められた位置から、申込

み番号など帳票を特定できる部分を認識し、索引値として抽出し、電子化ファイルに付加すること

で、大量の文書から特定の文書を検索する際に役立ちます。

また、MFPにも機種によってはこのような機能があり、スキャニングした文書を迅速に索引づけす

ることができます。その他、XMLタグを利用する方法もあります。

キーボードによる入力5検索時に必要な情報をキーボードを使って入力するのは、画像や映像をECMに登録する場合で

す。また、少量の紙文書をスキャニングした場合にも、この方法が使われることがあります。最近

では、画像や映像にある文字情報を抽出して情報を登録することができるものもあります。

スクリーンスクレイピング6スクリーンスクレイピングとは、他のシステムからデータを抽出することです。この機能を利用する

ことで、他システムのデータを利用して索引を作成することができます。

Page 17: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

60

検索の方法1ECMシステムに登録された大量のコンテンツは、システムやソフトウェアが提供する検索機能を使

用して希望するコンテンツを探し出すことができます。検索機能によって提供される検索方法に

は、次のような種類があります。

● 全文検索全文検索(フルテキスト検索)とは、対象コンテンツのすべてのメタデータ(属性)と内容を直接検索する方法です。全文検索は、検索方法としては最も網羅的な方法で、検索に時間がかかります。

全文検索技術には、逐次検索と索引(インデックス)検索があります。

■逐次検索逐次検索は、コンテンツの内容を順次走査し、目的の文字列を検索します。逐次検索では検索のたびに全文書を走査するため、大量の文書がある場合には非常に時間がかかります。

■索引検索索引(インデックス)検索は、あらかじめ検索対象のすべてのコンテンツを走査し、高速検索できるような索引データ(文書名、作成者、作成日など)を準備することで、検索速度を向上させます。

● 見出し語検索見出し語検索は、ファイル名やデータベースの項目名のみを検索します。見出し語検索は、データベースの特定の項目だけを検索対象にしたいという場合に効率的な検索を行うことができます。

● 横断検索横断検索(メタサーチ)は、社内にある複数のシステムからデータなどを同時に呼び出し、一括検索する仕組みです。ユーザーは、横断検索によって、幅広い情報から効率よく検索することができ

ます。

● エンタープライズ検索エンタープライズ検索は企業内検索とも呼ばれ、企業内の文書や人事、経営情報などを検索することができます。

2-3-4 コンテンツの検索

ここでは、ECMからコンテンツを探し出す際に利用する検索方法について学習します。特にあいまい検索で使用するワイルドカードやブール演算子の利用法を確認しましょう。

学習ポイント

Page 18: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

61

コンテンツの活用

コンテンツのキャプチャと利用

2

2-3

● あいまい検索検索は、基本的にキーワードが完全一致しているものを結果として表示します。しかし、あいまい

検索(自然語検索)は、検索条件が完全には一致しない対象を決められたルールの下で抽出する検索方法であり、類似語や同義語、表記の揺れにも対応します。

あいまい検索をする場合は、ワイルドカードやブール演算子などを使用します。

■ワイルドカードあいまい検索時に使用される、一部不明な文字の代わりに利用する代替文字をワイルドカードと

いいます。ワイルドカードには、次のような種類があります。

*(半角アスタリスク) 任意の文字および文字数を表す。?(半角疑問符) 任意の一字を表す。! [ ] [ ]以外の文字列を対象とする。

いずれもWebブラウザや文書ファイルにおいて文字列の検索や置き換え、フィルタの抽出時に使

用される便利な文字です。

■ブール演算子ブール(論理)演算は、ソフトウェアプログラミングの基礎となる演算方式で、「真」(true)、「偽」

(false)の2通りの値(真偽値)しか持たないデータの演算です。データ検索時に、検索条件の設

定や論理検索ブール演算子が利用されます。

論理積(AND) 入力値がすべて真のとき出力値が真となる。論理和(OR) 入力値のいずれかが真のとき出力値が真となる。否定(NOT) 入力値を反転して出力する。

ブール演算の基本演算子

NAND(NOT AND) AND演算の結果を反転させる。NOR(NOT OR) OR演算の結果を反転させる。XOR(EXCLUSIVE OR) 入力値の1つのみが真であるときに真となる。XNOR(EXCLUSIVE NOT OR) XOR演算の結果を反転させる。「<」と「>」 大小関係を表す。

拡張演算子

例えば、「2013年11月中」の文書を検索する場合、範囲としては「2013/11/01から2013/11/30

までの間」を対象に指定するため、「>=2013/11/01(2013/11/01以降)and(かつ)

<=2013/11/30(2013/11/30まで)」と指定します。

「<=2013/11/01(2013/11/01以前)or(または)>=2013/11/30(2013/11/30以降)」と指定す

ると、「2013年11月2日~11月29日を除く期間」が対象となります。

Page 19: コンテンツマネジメント の基礎 C · ・ セクションの最初には、「学習ポイント」が挙げられています。ポイントを掴み、効率よく学習を進めて

62

答 え

確認問題

①ワークフロー②逐次(シーケンシャル)③並列(パラレル)④共同作業 /共同オーサリング⑤チェックイン/チェックアウト⑥XML⑦CSV

⑧スクリーンスクレイピング⑨全文(フルテキスト)⑩エンタープライズ⑪あいまい(自然語)⑫ワイルドカード

次の に当てはまる語句を答えてください。

1 1. ① は、業務やビジネスルールの一連の処理手続きを定義し、流れ図などを用いて表現す

る、あるいはその業務の一連の流れ(ルーティング)です。

1 2. ① は処理手続きにより、複数の処理を1つずつ順番に行うことで、ある人が作業を完了し

たことをトリガーとして、別の人が次の作業を行う ② プロセスと、複数の処理を並列して

同時に行う ③ プロセスがあります。

1 3. ④ は、文書、画像、ソフトウェアなどのコンテンツを共同編集することをいいます。

1 4. ⑤ は、同一ファイルにおける同時編集を避ける機能です。

1 5. ⑥ は、文書やデータの意味や構造を記述するための汎用的なマークアップ言語の1つで

す。

1 6. ⑦ は、いくつかのフィールドをカンマで区切ったテキストデータおよびテキストファイルで

す。

1 7. 他のシステムからデータを抽出することを ⑧ といいます。

1 8. ⑨ 検索とは、対象コンテンツのすべてのメタデータ(属性)と内容を直接検索する方法で

す。

1 9. ⑩ 検索は企業内検索とも呼ばれ、企業内の文書や人事、経営情報などを検索することが

できます。

1 10. ⑪ 検索は、検索条件が完全には一致しない対象を決められたルールの下で抽出する検索

方法です。

1 11. ⑪ 検索時に使用される、一部不明な文字の代わりに利用する代替文字を ⑫ とい

います。

2-3 コンテンツの活用