logo 本ツールに関するお問い合わせやトライアル版のご利用に興味がある方はこちら

DOGUE

Data-Optimized Generalization Universal Engine

ツール概要  ▼詳細説明を展開

  1. 本ツールの操作はPCからのみ可能です。
  2. 本ツールはGoogle Chromeが対応しています。
  3. 本ツールはメンテンナンス等のため、告知なくアクセスできない場合があります。

本ツールでは、個人情報などの重要な情報を含むようなデータを加工することにより、安全性を高めることを目的としています。
また、情報を加工し個人を特定出来なくすることを匿名化と呼びますが、本ツールではサンプリング・ノイズ付加・一般化といった複数の匿名化手法を同一の指標でリスク評価を行うことが出来ます。
本ツールの基本的な操作手順としては以下の通りです。

  1. 匿名化対象の属性選択
  2. データのサンプリング・ノイズ付加
  3. 各属性のヒストグラム確認
  4. 一般化に用いる一般化階層木の編集
  5. 対象のデータ検索・一般化
  6. 安全性の集計
  7. 匿名化したデータの出力

上記1~7についてはツールの該当箇所で説明します。

本ツールで扱うデータ  ▼詳細説明を展開

試用版のため、操作対象となるデータセットはダミーのもので、実在するものではありません。
本ツールでは「年齢」「性別」といったデータの各項目のことを『属性』と呼びます。
属性のうち、数値に意味を持つデータを量的属性、項目に意味を持つデータを質的属性、複数の項目を持ち得るデータを集合型属性としています。

データの属性について

年齢
量的属性。
学歴
質的属性。以下の値から1つの値を持ちます。
[中卒, 高卒, 専門学校卒, 短大卒, 四年制大学卒, 大学院卒(修士), 大学院卒(博士)]
婚姻状況
質的属性。以下の値から1つの値を持ちます。
[既婚, 未婚, 離婚, 死別]
性別
質的属性。以下の値から1つの値を持ちます。
[男, 女]
労働時間
量的属性。週当たりの労働時間(h)です。
住所
質的属性。都道府県から1つの値を持ちます。
趣味
集合型属性。以下の値から1つ以上の値を持ちます。
[野球, フットサル, ゴルフ, カメラ, 旅行, 楽器, DIY, 料理, 読書, 映画]

本ページでは1, 2を実施することになりますので、それらの説明を記載します。

  1. 匿名化対象の属性選択
    匿名化を実施するにあたって、属性によっては加工を実施したくないものも存在するケースがあります。
    本ツールでは属性毎に匿名化の対象とするか、対象外とするかを選択することが出来ます。
    対象外とした属性に関しては、本ツールの全機能の対象から除外されます。
  2. データのサンプリング・ノイズ付加
    • サンプリング
      例えば、Aさんの情報が必ず含まれていると分かってしまっていると、Aさんの一部の情報を知っている悪意ある人が検索を利用し、Aさんの個人情報を盗み出す可能性があります。
      サンプリング機能は全てのデータセットのうち何%かを抜き出す機能で、データセットに必ずAさんの情報が含まれているといった状況を避けることが出来ます。
      サンプリング率を上げることでデータセットの母数が大きくなり、データの有用性を上げることができますが、匿名化の度合いは低くなります。
      サンプリング率を下げることでデータセットの母数が小さくなり、匿名化の度合いは高くなりますが、データの有用性は下がります。
    • ノイズ付加
      例えば、A~Zさんの年齢情報を含んだ個人情報の名前を伏せて公開する場合、A~Zさんの年齢情報を知っている悪意ある人が公開されたデータセットとつき合わせることにより、A~Zさんの個人情報を盗み出す可能性があります。
      ノイズ付加機能は全ての量的属性の値を増減させる機能で、この機能を使用することにより上記のようなつき合わせによって特定される可能性を下げることが出来ます。
      ノイズを大きくすることで元の値より離れた値を取りやすくなり、匿名化の度合いは高くなりますが、データの有用性は下がります。
      ノイズを小さくすることで元の値に近い値を取りやすくなり、データの有用性を上げることができますが、匿名化の度合いは低くなります。

対象属性選択

匿名化対象・対象外へ切り替えたい属性をクリックすることで切り替えることが出来ます。

サンプリング・ノイズ付加

  • サンプリング率を1.00~0.01まで設定することが出来ます。
    1.00の場合は全てのデータセットを、0.01の場合は1%のデータセットを抜き出すことが出来ます。
  • ノイズの大きさについて、[なし, 小, 中, 大]から選ぶことが出来ます。
  • ※ サンプリングを行わない場合は一番左に設定してください。

    1.00