@mShuaiZhao
2018-01-04T15:00:43.000000Z
字数 1958
阅读 411
CNN
2017.12
Baidu's face recognition demo
face verification -
face recognition -
one-shot learning
Learning a "similarity" function
= degree of difference between images
if
if
[Taigman et. al., 2014. DeepFace closing the gap to human level performance]
siamese network architecture
encoding of the image
[2015,FaceNet:A unified embedding for face recognition and clustering]
Learning Objective
anchor image
positive
negative
want :
is called margin
确保总是等于0的情况不出现,并且使得负样本和正样本分别距anchor之间距离的差存在一定的margin。
Loss function
给定三张图片
有多张图片的
training set: 10k pictures of 1k persons
Choosing the tripets
选择相近的P、N来训练以提升网络的效能
Learning the similarity function
将两张脸同时输入网络中(e.g. siamese network), 得到两个输出,然后同时输入一个logistic regression unit,得到最后的结果。全部相同为1,不同为0. 转化为一个2分类问题。
如何进行可视化?
在一个隐藏层中,选取使它的activation最大的几个图像的patch,看看是什么。
Neural style transfer cost function?
给定一张content image C
再给定一张style image S
得到generated image G
定义cost function
Find the generated image G
先随机初始化为一定大小
利用梯度下降法不断迭代
Gram Matrix
利用Gram矩阵来衡量风格的相似度。
之前讨论的都是2D的图像
1D的卷积
3D的数据,例如X-ray照片,有多个切片
卷积在不同信号上的应用