work on eval

2020-07-24 11:12:18 -05:00 · 2020-07-24 11:12:18 -05:00 · 5048d0afd0
commit 5048d0afd0
--- a/evaluation/README.md
+++ b/evaluation/README.md
@ -1,16 +0,0 @@
-Fawkes Evaluation
-----------------
-
-
-We offer two ways to test the protection is effective, 1) train a local face recognition model using transfer learning, 2) use Microsoft Azure API. 
-Note that we can't guarantee the protection is always successful due to new development in face recognition technique. 
-
-Evaluation with Local Model
---------------------------
-forthcoming...
-
-
-Evaluation with Microsoft Azure
---------------------------
-forthcoming...
-
--- a/evaluation/eval_local.py
+++ b/evaluation/eval_local.py
@ -1,189 +0,0 @@
-import argparse
-import glob
-import os
-import random
-import sys
-
-import keras
-import numpy as np
-
-random.seed(1000)
-from fawkes.utils import init_gpu, load_extractor, load_victim_model, get_file, preprocess, Faces, filter_image_paths
-from keras.preprocessing import image
-from keras.utils import to_categorical
-from fawkes.align_face import aligner
-
-
-def select_samples(data_dir):
-    all_data_path = []
-    for cls in os.listdir(data_dir):
-        cls_dir = os.path.join(data_dir, cls)
-        for data_path in os.listdir(cls_dir):
-            all_data_path.append(os.path.join(cls_dir, data_path))
-    return all_data_path
-
-
-class DataGenerator(object):
-    def __init__(self, original_images, protect_images):
-        l = int(len(original_images) * 0.7)
-        self.original_images_test = original_images[l:]
-        self.protect_images_train = protect_images[:l]
-
-        other_classes = range(0, 20946)
-        selected_classes = random.sample(other_classes, args.num_other_classes)
-        print("Downloading additional data...")
-        model_dir = os.path.join(os.path.expanduser('~'), '.fawkes')
-
-        self.id2label = {-1: 0}
-        self.id2path = {}
-        self.id2pathtest = {}
-        idx = 1
-        for target_data_id in selected_classes:
-            image_dir = os.path.join(model_dir, "target_data/{}".format(target_data_id))
-            os.makedirs(os.path.join(model_dir, "target_data"), exist_ok=True)
-            os.makedirs(image_dir, exist_ok=True)
-            self.id2label[target_data_id] = idx
-            idx += 1
-            for i in range(10):
-                if os.path.exists(os.path.join(model_dir, "target_data/{}/{}.jpg".format(target_data_id, i))):
-                    continue
-                try:
-                    get_file("{}.jpg".format(i),
-                             "http://sandlab.cs.uchicago.edu/fawkes/files/target_data/{}/{}.jpg".format(target_data_id,
-                                                                                                        i),
-                             cache_dir=model_dir, cache_subdir='target_data/{}/'.format(target_data_id))
-                except Exception:
-                    print("error getting http://sandlab.cs.uchicago.edu/fawkes/files/target_data/{}/{}.jpg".format(
-                        target_data_id,
-                        i))
-                    pass
-
-            all_pathes = glob.glob(os.path.join(model_dir, 'target_data/{}/*.jpg'.format(target_data_id)))
-            test_path = random.sample(all_pathes, 2)
-            train_path = [p for p in all_pathes if p not in test_path]
-            self.id2path[target_data_id] = train_path
-            self.id2pathtest[target_data_id] = test_path
-
-        self.num_classes = 1 + len(self.id2path)
-
-        np.random.seed(12345)
-
-        self.all_id = selected_classes + [-1]
-
-    def generate(self, test=False):
-        while True:
-            batch_X = []
-            batch_Y = []
-            cur_batch_path = np.random.choice(self.all_id, 32)
-            for p in cur_batch_path:
-                cur_y = self.id2label[p]
-                if test and p == -1:
-                    continue
-                # protect class images in train dataset
-                elif p == -1:
-                    cur_x = random.choice(self.protect_images_train)
-                else:
-                    if test:
-                        cur_path = random.choice(self.id2pathtest[p])
-                    else:
-                        cur_path = random.choice(self.id2path[p])
-                    im = image.load_img(cur_path, target_size=(224, 224))
-                    cur_x = image.img_to_array(im)
-
-                cur_x = preprocess(cur_x, 'imagenet')
-                batch_X.append(cur_x)
-                batch_Y.append(cur_y)
-
-            batch_X = np.array(batch_X)
-            batch_Y = to_categorical(np.array(batch_Y), num_classes=self.num_classes)
-
-            yield batch_X, batch_Y
-
-    def test_original(self):
-        original_y = to_categorical([0] * len(self.original_images_test), num_classes=self.num_classes)
-        return self.original_images_test, original_y
-
-
-class CallbackGenerator(keras.callbacks.Callback):
-    def __init__(self, original_imgs, protect_imgs, original_y, original_protect_y, test_gen):
-        self.original_imgs = original_imgs
-        self.protect_imgs = protect_imgs
-
-        self.original_y = original_y
-        self.original_protect_y = original_protect_y
-        self.test_gen = test_gen
-
-    def on_epoch_end(self, epoch, logs=None):
-        _, original_acc = self.model.evaluate(self.original_imgs, self.original_y, verbose=0)
-        print("Epoch: {} - Protection Success Rate {:.4f}".format(epoch, 1 - original_acc))
-
-
-def main():
-    sess = init_gpu(args.gpu)
-    ali = aligner(sess)
-    print("Build attacker's model")
-    image_paths = glob.glob(os.path.join(args.directory, "*"))
-    cloak_file_name = "_cloaked"
-
-    original_image_paths = sorted([path for path in image_paths if "cloaked" not in path.split("/")[-1]])
-    original_image_paths, original_loaded_images = filter_image_paths(original_image_paths)
-
-    protect_image_paths = sorted([path for path in image_paths if cloak_file_name in path.split("/")[-1]])
-    protect_image_paths, protected_loaded_images = filter_image_paths(protect_image_paths)
-
-    print("Find {} original image and {} cloaked images".format(len(original_image_paths), len(protect_image_paths)))
-
-    original_faces = Faces(original_image_paths, original_loaded_images, ali, verbose=1, eval_local=True)
-    original_faces = original_faces.cropped_faces
-    cloaked_faces = Faces(protect_image_paths, protected_loaded_images, ali, verbose=1, eval_local=True)
-    cloaked_faces = cloaked_faces.cropped_faces
-
-    if len(original_faces) <= 10 or len(protect_image_paths) <= 10:
-        raise Exception("Must have more than 10 protected images to run the evaluation")
-
-    num_classes = args.num_other_classes + 1
-    datagen = DataGenerator(original_faces, cloaked_faces)
-    original_test_X, original_test_Y = datagen.test_original()
-    print("{} Training Images | {} Testing Images".format(len(datagen.protect_images_train), len(original_test_X)))
-
-    train_generator = datagen.generate()
-    test_generator = datagen.generate(test=True)
-
-    base_model = load_extractor(args.base_model)
-    model = load_victim_model(teacher_model=base_model, number_classes=num_classes)
-    cb = CallbackGenerator(original_imgs=original_test_X, protect_imgs=cloaked_faces, original_y=original_test_Y,
-                           original_protect_y=None,
-                           test_gen=test_generator)
-
-    model.fit_generator(train_generator, steps_per_epoch=num_classes * 10 // 32,
-                        epochs=args.n_epochs,
-                        verbose=1,
-                        callbacks=[cb]
-                        )
-
-    _, acc_original = model.evaluate(original_test_X, original_test_Y, verbose=0)
-    print("Protection Success Rate: {:.4f}".format(1 - acc_original))
-
-
-def parse_arguments(argv):
-    parser = argparse.ArgumentParser()
-
-    parser.add_argument('--gpu', type=str,
-                        help='GPU id', default='0')
-
-    parser.add_argument('--dataset', type=str,
-                        help='name of dataset', default='scrub')
-    parser.add_argument('--num_other_classes', type=int,
-                        help='name of dataset', default=500)
-
-    parser.add_argument('--directory', '-d', type=str,
-                        help='name of the cloak result directory', required=True)
-    parser.add_argument('--base_model', type=str,
-                        help='the feature extractor used for tracker model training. ', default='low_extract')
-    parser.add_argument('--n_epochs', type=int, default=5)
-    return parser.parse_args(argv)
-
-
-if __name__ == '__main__':
-    args = parse_arguments(sys.argv[1:])
-    main()