@cww97 2017-12-28T10:25:31.000000Z 字数 1956 阅读 1080

人脸识别

机器学习

陈伟文 10152510217

一张图片转换成一个列向量，各个像素点就是列向量中的元素，然后这些训练的图片集就是A（训练数据集）。b就是testing,一张图片，我们要迭代x，使得让最后b作为测试的图片带入这个方程

算法原理

人脸的稀疏表示是基于光照模型。即一张人脸图像，可以用数据库中同一个人所有的人脸图像的线性组合表示。而对于数据库中其它人的脸，其线性组合的系数理论上为零。由于数据库中一般有很多个不同的人脸的多张图像，如果把数据库中所有的图像的线性组合来表示这张给定的测试人脸，其系数向量是稀疏的。因为除了这张和同一个人的人脸的图像组合系数不为零外，其它的系数都为零。

Src算法

image.png-220.9kB

数据加载

image.png-243.5kB

在这里，我们将每一张图片转换为一个列向量，行数为像素点的个数。一组照片为一系列列向量的集合。然后把 30 组的照片的测试集合都集合在一个矩阵中，用于迭代系数x（每组照片五张用于训练，一张用于测试）。另外，将用于预测的图片 testImg 转换为单独的列向量

N, M = 112, 92
EPS = 0.025
def Normalize(A):
    m = A.shape[1]  # col
    B = np.empty(shape=[N*M, 0])
    for i in range(m):
        b = A[:, i] / np.linalg.norm(A[:, i], ord=2)
        b = np.reshape(b, (N*M, 1))
        B = np.concatenate((B, b), axis=1)
    return B
def load_data():
    testImg = np.array(Image.open('data/feret/1-1.bmp'))
    testImg = np.reshape(testImg, (N*M, 1))
    testImg = testImg / np.linalg.norm(testImg, ord=2)
    #print(testImg)
    A = np.empty(shape=[N*M, 0])
    for i in np.arange(1, 31):
        for j in np.arange(1, 6):
            img = np.array(Image.open('data/feret/' + str(i) + '-' + str(j) + '.bmp'))
            img = np.reshape(img, (N*M, 1))
            A = np.concatenate((A, img), axis=1)
    A = Normalize(A)
    print(A, 'shape = ', A.shape)
    return A, testImg

算法主过程

近端梯度下降法实现，数值计算很重要啊

def proximal_gradient(A, testImg):
    L = np.linalg.norm(2*np.dot(A, A.T))**2
    lamada = 5
    x1 = np.ones((A.shape[1], 1))
    cnt = 0
    while True:
        cnt += 1
        x0 = x1
        gradient = 2*np.dot(np.dot(A.T, A), x0) - 2*np.dot(A.T, testImg)
        z = x0 - gradient / L
        e0 = np.linalg.norm(np.dot(A, x0) - testImg, ord=2)**2 + lamada*np.linalg.norm(x0, ord=1)
        for i in np.arange(0, x0.shape[0]):
            if z[i, 0] > lamada/L:
                x1[i, 0] = z[i, 0] - lamada/L
            elif z[i, 0] < -lamada/L:
                x1[i, 0] = z[i, 0] + lamada/L
            else:
                x1[i, 0] = 0
        e1 = np.linalg.norm(np.dot(A, x1) - testImg, ord=2)**2 + lamada*np.linalg.norm(x1, ord=1)
        print('cnt = ', cnt, ', :', e0-e1)
        if e0-e1 < EPS: break
    return x1

分组测试

def get_group_data(x, i):
    new_x = np.zeros((x.shape[1], 1))
    for j in np.arange(5*i,i*i+5):
        new_x[j, 0] = x[j, 0]
    return new_x
def test(A, x, y):
    Min = float(np.inf)
    idx = -1
    for i in range(29):
        dis = np.ninalg.norm(y - np.dot(A, get_group_data(x, i)))
        if dis < Min:
            Min, idx = dis, i
    return idx

正确率100%，大概是所有给的数据都是很正的，即人脸都充满整张图，大概如果数据没这么舒服可能就会难很多，明年有个项目想做人脸识别模块，数据预处理果然永远比机器学习算法更重要，灰度化，从照片中抠出一张人脸，再压缩成规定像素，哇哦，这门课叫数字图像处理