AI プライバシーシールド:AnonyMask が LLM および RAG ワークフロー向けのデータ編集を自動化する仕組み

Image

AnonyMask:明示的および暗黙的なプライバシーデータの自動マスキングおよびアンマスキング

AnonyMask は、プライバシーデータを自動的に検出、マスク、およびアンマスクするために設計されたプライバシー保護ツールです。様々なファイル形式全体でプライバシーデータを処理します。企業は大規模言語モデル(LLM)またはRetrieval-Augmented Generation(RAG)の力を活用しながら、プライベートまたは機密情報が安全で準拠した状態に保たれることを保証できます。1 クリックで、明示的および暗黙的なプライバシーデータの両方を匿名化してから LLM または RAG に送信して分析することができます。また、スマートなアンマスキング機能を使用して、後で元のコンテンツを復元することができます。AnonyMask は、.pdf、.docx、.xlsx、.csv、.txt などの一般的なファイルタイプと互換性のある、安全でカスタマイズ可能、およびオフライン対応のプライバシー保護ドキュメントを提供します。

AnonyMask の背景にある動機

エンタープライズ環境での AI の急速な採用—特に顧客インサイト、HR 分析、財務処理、および法的文書の要約—は、新しいプライバシー上の課題をもたらしました。実例は、患者データを LLM に入力する医療スタッフから専有コードを共有する従業員まで、様々なユーザーが LLM または RAG システムとやり取りする際に意図せずに機密情報を公開する可能性があることを示しており、データ保持、漏洩、およびプライバシー違反のリスクが生じます。

GDPR およびインドネシアのUU PDPなどの規制があるにもかかわらず、多くのユーザーはどのような個人データが抽出され、どのように処理されるか、どこに終わるのかについて認識していません。AnonyMask は、ドキュメントが LLM または RAG に到達する前に、セキュアで自動化されたマスキングシステムを提供することでこのギャップに対処するために作成されました。明示的および暗黙的なプライバシーデータ検出をサポートし、その後アンマスキングを可能にします。これにより、コンプライアンス、データ保護、および安心が保証されます。

主な機能

番号 主な機能 説明
1. 自動プライバシーデータマスキング トランスフォーマーベースの AI モデルを使用して、明示的および暗黙的(33 ラベルなプライバシーデータを検出およびマスクします。
2. 複数ファイル形式のサポート .txt.csv.pdf.docx.xlsx、および.xls形式での入出力をサポートします。
3. セキュア LLM/RAG 統合 プライバシー安全なドキュメントを準備し、生の PII が外部 LLM または RAG に公開されないことを保証します。
4. スマートアンマスキング LLM または RAG 処理後に元のコンテンツを復元します。内部トークンマッピングを使用してマスクされた値をシームレスに逆転させます。
5. カスタマイズ可能なマスキングルール ユーザーがマスクするまたは除外するエンティティを定義できるようにします。マスキングプロセスに対して完全な制御を提供します。
6. プライバシーバイデザイン すべての処理はオフラインでローカルに実行されます。データは外部に送信または保存されず、完全な機密性を保証します。
7. 透過的なログ記録 すべてのマスキングおよびアンマスキング操作のログを保持し、トレーサビリティと監査可能性を確保します。
8. 多言語モデルサポート XLM-RoBERTa などのモデルを使用して、英語とインドネシア語などの複数の言語でプライバシーデータを自動検出します。
9. ポータブルデスクトップアプリケーション スタンドアロン.exeとして実行します。ユーザーのマシンに外部依存関係を必要としません。

あなたのプライバシー、あなたのルール

番号 インターフェース タイプ 説明
1. マスキング 編集済みマスキング すべてを****に置き換え、元のコンテンツを完全に隠します。
部分マスキング 値を部分的に隠し、読みやすさを保つためにフラグメントのみを表示します(例:J*** ***e0*******1)。
完全マスキング – カテゴリ カテゴリラベルに置き換えます(例:[名前][メール][生年月日])。
完全マスキング – 値 カスタムユーザー入力に置き換えます。指定されない場合、デフォルトはカテゴリラベルです。
完全マスキング – すべてランダム すべてのプライバシー値を独立してランダム化します。繰り返されるデータが存在する場合でも(例:John → Axel、次にJohn → Rey)。
完全マスキング – 同じランダム データを一貫してランダム化し、同じ入力は毎回同じ出力を取得するようにします(例:John → Axel、すべてのJohnAxelのまま)。
2. アンマスキング 自動アンマスキング マスキング中に生成されたトークンマッピングログを使用して、処理されたファイルに元のコンテンツを復元します。

インストール&使用

翻訳元: https://meterpreter.org/anonymask-automated-privacy-data-masking-llm-rag-security/

ソース: meterpreter.org