6 minutes

機密情報を安全に保護するには?~マスキング処理の失敗例とベストプラクティス

データセキュリティーはタイミングがすべてです

マスキング機能との重要性について

ミスや誤った情報が間違った相手にタイミング悪く渡ってしまった場合、ディールの失敗に繋がりかねないだけでなく、金融取引におけるバリュエーションを下げることもあり得ます。

さらに別の状況においてプライバシーの侵害は、罰金、訴訟の法的費用、評判の低下を引き起こす可能性があります。

そのため、機密情報を共有する際には、関連スタッフがデータの流れを管理するツールと知識を備えていることが大切です。これには物理的なファイルそのものに加え、文書に記載されている情報も含まれます。

一般にマスキング機能として知られる文言削除は、文書を共有する前に情報をフィルターするためのものです。しかし、もし企業が、重要性の高い情報のマスキングを誤った場合のリスクを理解しなかった場合、彼らとそのクライアントがリスクにさらされることは明白でしょう。

この記事では、一般的に使われているデジタルマスキング手法についての解説に加え、文書内の情報をフィルタリングする際に、情報の保護、納品期限の短縮、コスト削減につながるベストプラクティスをご紹介します。

通常のマスキング方法

かつては油性マーカー、はさみ、油性ペンなどを使って紙の上でマスキング作業を行っていました。今ではほとんどのマスキング機能はプロセスをスピードアップするためにデジタル化されています。以下に、一般に使用されているデジタル技術とその安全性、作業時間、コストに関する影響について説明します。

プリント、マニュアルでのマーキング、スキャン

多くの人は、完全にデジタル化された方法と昔ながらの方法の中間を採用しています。現在も文書を印刷し、手動でマーキングし、編集された文書を再びスキャンします。これは木や紙が無駄になるだけでなく、面倒でもあり、特に削除された部分を後で明らかにする必要がある場合は、作業を繰り返すことになるため、スピードが遅くコストのかかる多くのプロセスを伴います。こうした方法による校正作業は、人の目に頼って機密データを含む細かな文字を一行ずつ追っていくため、負担が大きく時間のかかる作業となります。

その場しのぎの解決策

ある編集者はデジタルソリューションを使用して、検索可能な文字や選択可能な文字などの機能を活用し、機密性の高いキーワードや文字列の校正を自動化しています。しかし彼らは、マスキングを統合するためのメールを含め、様々なサードパーティ製ツールを外部委託しています。こうした不規則な方法では、一元化することも一貫性を保つこともほとんどできず、プロセスの混乱と遅延を引き起こす可能性があります。さらに異種のシステムやアプリケーションの至る所に文書が保存されてしまう可能性があります。その結果、チーム担当者は文書の最新版を見つけられなくなったり、不適切に編集されたファイルを間違ったメールアドレスに送信してしまう可能性があります。

マスキングを使った解決策

編集者はネット上で見つけてきたソリューションを活用することもできます。こうしたソリューションはアクセスしやすく使いやすいため、好まれている手段です。しかし、こうしたウェブベースのツールは基本的に文書の閲覧と統合を行うために設計されているため、マスキングされている部分の内容を削除するためにファイルを直接編集する機能がありません。

その代わりに、注釈や網掛け、画像を上に重ねたりすることで文字を隠すことができます。したがってベストプラクティスは、選択/検索可能な文字を削除し、隠された内容を含む文書を静的画像形式に変換してから、さらにすべてをビットマップにフラット化してファイル内の非表示レイヤーを削除することです。

しかし編集者がこの2番目のステップの必要性すら理解していないとすれば、文書を適切にフラット化する方法などなおさら見過ごされていることでしょう。米国法曹協会(American Bar Association)が発行した マスキング作業の失敗例 に証明されているように、マスキングされた部分の下に隠された情報を他人が抽出することは難しいことではありません。

このリストには、ロビイスト兼コンサルタントでドナルド・トランプ陣営の元選挙対策本部長を務め、後に脱税および銀行詐欺で有罪判決を受けたポール・マナフォート氏の訴訟も含まれています。マナフォート氏の弁護団は、2019年1月にジャーナリストのみに向けたインタラクティブなPDF文書の中で、証拠となる内容にマスキング処理を行ったものの、場所によっては単にマスキングされた部分を選択しノートパッドにコピー&ペーストしていただけのものでした。

これと似たケースとして、このほど米国政府が発表したジェフリー・エプスタインに関する調査の中でも、マスキング処理が不十分であったため、一般人でもその下に隠されていた機密情報を見ることが可能となったことが報告されています。これもやはり単に選択とコピー&ペーストを行っただけのものでした。 

正しいマスキング処理

編集者は文書内の機密情報を保護すると同時に、選択可能/検索可能な文字に関してインタラクティブなファイル形式を維持したいと考えます。これは編集者と、編集済み文書の利用者の両方にとって作業をスピードアップさせる利点があるからです。

多くの人が編集にPDFを選択するのはこのためで、フォーマットにインタラクティブなテキストと注釈があるほか、理論的には編集作業のワークフロー全体がサポートされています。これには、ドラフトモードでの校正とマスキング処理、ユーザーによるマスキングの提案とその承認、および基本ファイルのマスキングされた部分からの特定内容の最終削除が含まれます。

PDFTronとSS&Cイントラリンクスが協働し、ウェブベースのマスキングに関する問題を解決

現在のところウェブ上で確実にPDFマスキング機能を行えるツールはほとんどありません。そこでイントラリンクスは、ソフトウェア開発者向けの文書技術ソリューションの大手プロバイダーである PDFTronと協力し、イントラリンクスのバーチャルデータルーム(VDR)に専門的なウェブベースのマスキング機能を直接搭載しました。

この提携により、マスキング処理の一連の作業が一元化および合理化され、典型的なマスキング処理に伴う繰り返し作業やエラー、遅延、その他のコストを省くことができます。

編集作業において解決すべき問題の一つは、作業を迅速に行うために、機密性の高いキーワードと文字列を自動的に検出・削除できるようにすることでした。

しかし、PDFフォーマットが複雑なため、最新の検索テクノロジーでも対応できません。多くの人にとって意外なことの一つは、PDFファイル内の文字は期待するように保存されないことです。これは自然に読み取られる順序に従って、文字は単語に、単語は文章に、文章は段落へとグループ化されていくためです。一方で、PDFは各文字を配置する際に座標系を使用します。そのためPDFの作成方法によっては、単語が文書の最初にある場合でも、その文字が違う場所で検出されることがあります。例えば「Hello」という単語の場合、「H」「e」「ll」「o」のそれぞれの文字が分離されて別々の場所に配置されるといったことです。

そのため、検索アルゴリズムにおいては、文字の相対的な位置関係に基づいて、PDF上の文字を正しい読み取り順序で再構築する必要があります。こうしたケースやその他多くの微妙な場合を想定して慎重に調整されない限り、文章中の単語間の意図した空白や改行は、アルゴリズムから抜け落ちてしまいます。また、検索ツールが検索対象の文章を検出できなかった場合、ツール自体は99%正確であったとしても、ユーザーはその文章を見逃す可能性があります。

(上記)交渉中のディールを保護し、増大するデータセキュリティ規制に準拠するために、大切なデータや情報にはマスキングのみを許可できる追加のセキュリティ層が必要です。

そのためイントラリンクスは、PDFTronによる高度なPDF検索アルゴリズムに頼り、ユーザーが膨大な文書においてマスキング処理を完璧に行うことができるようにしています。

一方、イントラリンクスのチームは、PDFTronの別の技術のカスタマイズに取り組み、例えばトレーニングなしですべてのユーザーが高度な検索を行えるようにしました。

カスタマイズされた領域の一つは、PDFTronの強力な正規表現検索です。基本的なキーワード検索とは異なり、正規表現検索は数式を使用して、電話番号、社会保障番号、住所など文書内にある繰り返しパターンを検出します。正規表現検索の背後にある数学を理解する必要なく、ユーザーは電話番号などの削除したいパターンの種類をクリックすることができ、イントラリンクが残りの作業を行います。

また、イントラリンクスではマスキングをすぐに取り消しできる機能を追加しました。これにより、ユーザーは必要に応じて削除された内容を復元することで後で表示することができ、文書全体を再度編集し直す必要がなくなります。

未来のマスキング機能

イントラリンクスは今後もPDFマスキング技術の改善に努め、文書内の情報フィルタリングを迅速かつ安全に行うための機能を引き続き追加していきます。

その間、お客様からのフィードバックを活用したいと考えます。お客様が共有したいマスキング機能に関するご意見や失敗例などがございますか?マスキング機能をご利用になったご感想やご意見をお寄せください。

アダム・ペッツ(Adam Pez)