ゲートニュース、4月22日—OpenAIは、テキスト内の個人を特定できる情報 (PII) を検出し、マスクするよう設計されたオープンソースの言語モデル「Privacy Filter」をリリースしました。このモデルはローカルで動作し、単一のフォワードパスで長文書を処理でき、最大128,000トークンのコンテキストに対応します。総パラメータ15億、アクティブパラメータ5,000万により、Privacy Filterは、氏名、住所、メールアドレス、電話番号、URL、日付、口座番号、パスワード、APIキー、その他の機密情報を特定します。
このモデルはHugging FaceおよびGitHubで、Apache 2.0ライセンスのもと提供されています。個人の連絡先情報、金融情報、認証クレデンシャルなど、幅広いPIIカテゴリを特定できます。
OpenAIは、プライバシーフィルターは、学習データの準備、インデックス作成、ログ記録、コンテンツモデレーションのようなプライバシー保護型ワークフローでの利用を意図していると述べました。
Related News