Prototypical Networks for Few-shot Learning

2 min readApr 24, 2020

主題：

簡單來說，這篇文章提出一個比較簡單的架構來解決few-shot classification，舉個實際例子來說，手機臉部解鎖這項功能，一開始拿到新手機時，你只會給手機幾張你自己的照片，接下來，手機必須知道新進來的影像到底是不是你，這樣才能解鎖手機．由於你給的圖片太少，於是這是一個few-shot classication problem.

架構：

假設我有五種類別的影像，我想知道新進來的這張影像是屬於哪一個類別的，以上上面這個例子來看，每張影像都會透過CNN轉到另一個領域，我們稱之為embedding，透過Similarity function，可以幫我們量測兩個embedding的相似程度，如果兩張影像越相近，其分數愈高，反之則越低．在這個案例，我們新進來的影像是從image 3所選出的，所以我們希望這整個系統能夠產生出{0,0,1,0,0}這樣的輸出，也就是說，這系統需要辨識出“新進來的影像屬於第三類”

演算法：

Figure 1想說的是，如果是few-shot，也就是說輸入影像不只一張，我們可以在embedding domain取平均，再跟輸入影像去算similarity的分數，再往softmax送，得到最後的類別機率(category probability).

這篇文章簡單易懂，然而 similarity function 可能會有點麻煩，因為選用不同的方式去評估相似度，很容易造成效能差異，這一部分可以再改進．

Prototypical Networks for Few-shot Learning

Written by LAAI