6 minutes

디지털 리댁션(Redaction) 실패 및 모범사례: 민감한 정보를 안전하게 지키는 방법

데이터 보안은 타이밍이 가장 중요합니다.

What is Redaction and why is it important

실수, 즉 적절하지 않은 시점에 엉뚱한 당사자에게 잘못된 정보가 노출되는 일은 딜을 위태롭게 하는 지연 또는 금융거래의 밸류에이션 하락으로 이어질 수 있습니다.

또 다른 상황에서, 개인정보 유출은 잠재적 벌금, 법적소송 비용, 평판 훼손의 위험을 유발할 수 있습니다.

그러므로 민감한 정보 공유와 관련하여, 딜팀들은 데이터 흐름을 전체적으로 통제할 도구와 지식을 확보해야 합니다. 여기에는 문서 내 정보는 물론 물리적 파일 자체도 포함됩니다.

리댁션으로 더 널리 알려진 '콘텐츠 삭제'는 문서를 공유하기 전에 정보를 필터링하는 데 사용됩니다. 하지만 그 리스크를 이해하지 못하는 회사들이 리댁션을 잘못된 방식으로 실행하여 그들 자신과 고객을 노출시킴으로써 세간의 이목을 끄는 리댁션 실패 사례를 흔히 볼 수 있습니다.

이 글은 문서에서 정보를 필터링할 때, 정보를 보호하고 처리시간과 비용을 줄이는 모범사례를 적용하기 위해 보편적으로 사용되는 디지털 리댁션 기술과 요령에 대해 알아봅니다.

전형적 리댁션 방법

과거에는 종이에 유성펜이나 가위를 사용해 리댁션을 수행했습니다. 현재는 대부분의 리댁터들이 디지털 방식을 통해 프로세스 속도를 높입니다. 널리 사용되는 몇 가지 디지털 기술과 보안, 소요시간, 비용에 대한 영향을 소개합니다.

프린트, 수동 표시, 스캔

많은 사람들이 완전한 디지털 방식과 과거 방법의 절충을 선택하여, 여전히 문서를 프린트하고 수작업으로 표시하고 리댁트된 사본을 다시 스캔합니다. 이 방법은 나무와 종이를 낭비할 뿐 아니라 다소 지저분하며, 느리고 비용이 드는 여러 단계를 포함하고, 특히 리댁트된 콘텐츠 일부를 나중에 복구해야 할 때 같은 작업을 반복해야 합니다. 또한 이런 방법을 통한 프루프리딩은 오로지 육안으로만 민감한 정보가 담긴 수백 개의 구절을 한 줄씩 검사하므로 매우 힘들고 느립니다.

임시방편적 솔루션

일부 팀은 디지털 솔루션을 사용하여, 민감한 키워드 및 문자열을 자동으로 검사하는 검색가능/선택가능 텍스트 같은 기능을 활용합니다. 하지만 이들은 리댁션 공동작업을 위한 이메일 등의 제3자 도구 모음을 아웃소싱합니다. 그러므로, 체계적이지 못하고 중앙집중화나 일관성이 거의 없는 이 방법들은 혼란과 지연을 초래할 수 있습니다. 또한, 문서들이 여러 종류의 시스템과 앱 사이를 떠돌아다니게 됩니다. 그 결과로, 팀들은 문서의 최신버전을 놓치거나 잘못 리댁트된 파일을 엉뚱한 이메일 주소로 보낼 가능성이 있습니다.

마스킹 솔루션

어떤 팀은 온라인에서 찾은 솔루션을 접근 및 사용이 쉽다는 이유로 선호하며 활용하기도 합니다. 하지만 주로 문서 열람과 공동작업을 위해 설계된 이 웹기반 툴은 대개 리댁트된 부분에서 파일을 직접 수정하여 콘텐츠를 완전히 삭제하는 기능이 없습니다.

그 대신 이 툴은 주석, 어두운 하이라이트 또는 이미지 레이어링을 통해 콘텐츠를 가릴 수 있게 합니다. 그러므로 이 툴의 모범사례는 가려진 콘텐츠가 있는 문서를 정적 이미지 형식으로 바꾸는 것이고 그렇게 함으로써 선택가능한/검색가능한 텍스트를 삭제하지만, 모든 것을 비트맵으로 획일화함으로써 파일 내의 숨겨진 부분까지 삭제하게 됩니다.

그러나 팀들은 문서를 적절히 획일화하는 방법은 고사하고, 이 두 번째 단계가 필요한지조차도 인식하지 못할 수 있습니다. 따라서 미국변호사협회(ABA)가 발간한 기다란 리댁션 실패 리스트에서 입증됐듯이, 아래의 가려진 정보를 누군가 추출하는 것이 어렵지 않을 것입니다.

이 리스트에는 로비스트와 컨설턴트, 그리고 세금 및 은행 사기로 유죄판결을 받은 전 트럼프 선거본부장 폴 매너포트의 재판이 포함되어 있습니다. 매너포트의 법정변호사들은 양방향 PDF 문서 내 콘텐츠를 가렸고, 2019년 1월 단지 가려진 부분만을 선택 후 노트패드에 복사하여, 유죄를 입증하는 아래 콘텐츠를 기자들만이 경우에 따라 볼 수 있게 했습니다.

이와 마찬가지로, 미국정부가 제프리 엡스타인 조사의 일환으로 최근 공개한 PDF 문서 역시 단지 선택 및 복사하여 가려진 아래의 민감한 콘텐츠에 다수가 접근할 수 있게 함으로써, 부적절하게 리댁트된 것으로 보고되었습니다.

올바른 리댁션

팀들은 문서 내 민감 정보 보호를 원하는 동시에 양방향 파일 형식의 이점을 보존하기도 원할 것입니다. 예를 들면, 선택가능/검색가능 텍스트에 대해 리댁터와 리댁트된 콘텐츠를 사용하는 다운스트림 사용자 모두 워크플로 속도를 높이려고 합니다.

바로 이런 이유로 많은 사람들이 리댁션을 위해, 포맷에 양방향 텍스트는 물론 주석 기능이 있어서 이론적으로 전체 리댁션 워크플로를 지원하는 PDF를 선택합니다. 여기에는 초안 모드에서의 프루프리딩 및 리댁션 표시 단계, 리댁션에 대한 사용자 논의 및 승인, 아래 파일에서 리댁트된 부분의 특정 콘텐츠 최종 삭제가 포함됩니다.

PDFTron과 SS&C Intralinks의 협력을 통한 보편적 웹기반 리댁션 고민 해결

그러나, 현재 웹상에서 확실한 PDF 리댁션을 지원하는 툴은 거의 없습니다. 그리고 바로 이것이 Intralinks가 전문적인 웹기반 리댁션을 Intralinks VDR에 직접 장착하기 위해 소프트웨어 개발자용 문서기술 솔루션의 선도적 공급자인 PDFTron과 팀을 이룬 이유입니다.

이 파트너십은 리댁션 워크플로를 중앙집중화하고 간소화하여 반복작업, 실수, 지연, 그리고 전형적 리댁션 방법과 관련한 비용을 제거합니다.

우리가 해결하기 원했던 한 가지 이슈는 팀들이 리댁션을 신속히 수행하는 데 있어 흔한 장애물인 민감 키워드 및 구절 탐지와 제거를 자동화하는 것이었습니다.

하지만 현대의 검색기술 역시 PDF 형식의 복잡성 때문에 고심하고 있습니다. 많은 이들을 놀라게 하는 한 가지는 PDF 파일의 텍스트, 즉 단어를 이룬 문자들, 문장을 이룬 단어들, 단락을 이룬 문장들 등이 사람들이 기대하는대로 본래의 읽기순서에 따라 저장되지 않는다는 점입니다. 그 대신, PDF는 각 문자의 배치를 위해 좌표계를 사용합니다. 그러므로 PDF가 어떻게 생성되는지에 따라 문자들이 어떤 순서로든 보여질 수 있으며, 단어가 문서 시작부에 나타나더라도 마찬가지입니다. 예를 들어, 단어 ‘Hello’는 ‘H,’ ‘e,’ ‘ll,’ ‘o’로 분리될 수 있고 각 문자가 다른 위치에 나타날 수 있습니다.

따라서 검색 알고리즘은 PDF 텍스트를 문자의 상대적 위치를 토대로 본래의 읽기 순서로 재조립해야 하는 어려움에 부딪힙니다. 구절 내 단어들 간의 추가 여백이나 줄바꿈은 알고리즘이 이들 및 기타 여러 예외적 경우를 고려하도록 주의 깊게 조정되지 않으면 그 알고리즘을 배제하는 것으로 알려져 있습니다. 그리고 검색 툴이 검색해야 할 구절을 탐지하지 못하는 곳에서 사용자 역시 그것을 놓칠 수 있으며, 이 툴이 99% 정확하더라도 달라지지 않습니다.

딜을 보호하고 급증하는 데이터 보안 규제를 준수하려면, 정보는 오직 리댁션을 통해서만 가능한 추가 보안단계를 필요로 합니다.

Intralinks는 PDFTron의 정교한 PDF 검색 알고리즘을 이용하여 사용자들이 막대한 양의 문서에 대해 거침없이 자신감 있게 리댁션을 수행할 수 있도록 합니다.

한편, Intralinks 팀은 PDFTron의 다른 기술을 맞춤구성하여 어떤 교육도 없이 모든 사용자가 진보된 검색에 접근할 수 있도록 했습니다.

그리고 맞춤구성의 일부로 PDFTron의 강력한 정규식 검색을 포함했습니다. 기본적인 키워드 검색과 달리, 정규식은 수학공식을 사용하여 문서에서 전화번호, 주민등록번호, 주소 등의 반복되는 패턴을 감지합니다. 이제 사용자들은 정규식 이면의 수학을 이해해야 하는 대신에 전화번호 같은 제거하고자 하는 패턴유형을 클릭하면 되고, 나머지는 Intralinks에서 처리합니다.

또한 Intralinks 팀은 즉각적인 언리댁트 기능을 추가했으므로, 사용자들은 추후에 타당할 경우 전체 문서를 다시 리댁팅하는 대신에 제거된 특정 콘텐츠를 신속히 복구하여 다시 보이게 할 수 있습니다.

리댁션의 미래

우리는 계속 함께 일하며 Intralinks 내 PDF 리댁션 기술을 개선하고 문서 내 정보 필터링을 더욱 빠르고 안전하게 하는 기능을 추가해 나갈 것입니다.

그러는 동안, 우리는 여러분의 도움을 받을 수 있습니다. 공유하고자 하는 리댁션 팁이나 실패사례가 있으신가요? 주저하지 마시고 그 스토리와 조언을 우리에게 전해주세요.

Adam Pez