11Data Type 정의하기Data Type 정의하기
Data Type 은 DLP 규칙의 building block 이자 정책의 토대입니다. 무엇을 지킬지를 Data Type이 규정하므로, DLP를 잘 쓰려면 결국 규칙보다 Data Type에 집중 해야 합니다.
어디서부터 시작하나
가장 좋은 출발점은 경험으로 이미 아는 명백한 데이터 입니다. 소스 코드, 직원 연락처, 비밀번호, 가격표처럼 "이건 밖으로 나가면 안 된다"가 분명한 것부터 잡고, 그다음 Data Owner와 상의해 조직의 기밀·무결성 절차에 맞는 복잡한 Data Type으로 넓혀 갑니다. Data Type은 카테고리별로 정렬 되는데, 그중 Compliance 카테고리가 중요합니다 — PCI 기준상 고객 신용카드 번호를 평문으로 외부에 보내선 안 되는 것처럼, 규제 기준을 그대로 강제하는 기본 제공 Data Type이 여기 모여 있습니다. Data Type을 만들면 규칙에 넣고 정책을 설치합니다.
Data Type Wizard — 다섯 가지 식별 방식
새 Data Type은 Data Type Wizard 로 만드는 것이 가장 좋습니다(DLP 탭 > Data Types > New). 마법사는 트래픽 종류를 고르고, 식별 방식을 정의 하는 식으로 진행됩니다. 대표적인 다섯 방식을 보면 다음과 같습니다.
Keywords 는 키워드 목록을 데이터와 대조 합니다. ALL(모두 일치)·ANY(하나면 충분)·특정 개수(Threshold) 중 매칭 기준을 고르는데, Threshold가 높을수록 결과가 정밀 해집니다. 예컨대 위원회 의원 이름이 한 이메일에 모두 들어 있어야 의심스럽다면 "모든 단어 일치"로 둡니다.
Pattern 은 정규식으로 콘텐츠를 매칭 합니다(참고의 정규식 문법). 패턴이 한 번이라도 걸리면, 또는 정해진 횟수까지 허용하다 그 이상이면 매칭하도록 설정할 수 있습니다 — 다섯 개 제품의 전체 가격표를 잡으려면 가격 패턴의 발생 횟수를 5로 두는 식입니다.
Template 은 사내 문서 템플릿을 기준으로 문서를 보호 합니다. 법원 명령서처럼 헤더·푸터·서식이 같은 문서를 잡을 때 쓰며, Similarity 슬라이더로 얼마나 닮아야 매칭할지 정합니다.
Fingerprint 는 앞의 방식들과 결이 다릅니다. 데이터를 묘사하는 게 아니라, 파일마다 고유한 서명(지문)으로 식별 합니다. Repository(조직 밖으로 나가면 안 되는 파일들이 있는 네트워크 위치)를 지정하면 DLP가 그 파일들의 지문을 만들고, 게이트웨이를 지나는 파일의 지문을 저장소의 지문과 대조 해 일치하면 차단합니다. 마지막으로 Compound Data Type 은 여러 Data Type을 조합해 더 정밀하게 식별합니다(MultiSpect). 완전 맞춤형이 필요하면 CPcode 로 매칭 로직을 직접 짤 수도 있습니다.
Repository — 지문의 원천
Repository 는 문서 저장에 쓰이는 네트워크 위치 로 두 종류입니다. Fingerprint Repository 는 나가면 안 되는 문서 를 담아 지문 Data Type의 원천이 되고(지문 Data Type을 만들면 자동 생성), Whitelist Repository 는 나가도 되는 문서 를 담습니다. 저장소 파일은 계속 바뀌므로 기본적으로 매일 자동 스캔 되며(CIFS·NFS 지원), 변경 없는 파일은 건너뛰어 재스캔이 빠릅니다. 큰 저장소는 기밀 폴더만 지정하거나 특정 Data Type에 맞는 파일만 스캔 해 효율을 높입니다(예: spreadsheet 파일만). 전체 파일이 나가지 않아도 일부 구간만 복사돼 새는 것을 잡으려면 부분 일치 를 켜는데, 텍스트 구간의 비율 또는 일치 구간 개수로 매칭을 판단합니다.
Whitelist Policy — 절대 매칭하지 않을 파일
반대로 DLP가 절대 건드리지 않아야 할 파일 은 Whitelist Policy 로 지정합니다. 두 방법이 있는데, SmartConsole의 Whitelist Policy 창에 직접 추가 (파일 수가 적을 때 권장)하거나 네트워크의 Whitelist Repository에 두는 것입니다. 화이트리스트에서 제외되려면 파일이 목록의 파일과 정확히 동일 해야 합니다. 만든 Data Type을 규칙에 넣는 구체적 절차와 카테고리별 목록은 분량이 크니 원문을 참고하세요.