Prototypical Networks for Few-shot Learning

LAAI
2 min readApr 24, 2020

主題:

簡單來說,這篇文章提出一個比較簡單的架構來解決few-shot classification,舉個實際例子來說,手機臉部解鎖這項功能,一開始拿到新手機時,你只會給手機幾張你自己的照片,接下來,手機必須知道新進來的影像到底是不是你,這樣才能解鎖手機.由於你給的圖片太少,於是這是一個few-shot classication problem.

架構:

假設我有五種類別的影像,我想知道新進來的這張影像是屬於哪一個類別的,以上上面這個例子來看,每張影像都會透過CNN轉到另一個領域,我們稱之為embedding,透過Similarity function,可以幫我們量測兩個embedding的相似程度,如果兩張影像越相近,其分數愈高,反之則越低.在這個案例,我們新進來的影像是從image 3所選出的,所以我們希望這整個系統能夠產生出{0,0,1,0,0}這樣的輸出,也就是說,這系統需要辨識出“新進來的影像屬於第三類”

演算法:

Figure 1想說的是,如果是few-shot,也就是說輸入影像不只一張,我們可以在embedding domain取平均,再跟輸入影像去算similarity的分數,再往softmax送,得到最後的類別機率(category probability).

這篇文章簡單易懂,然而 similarity function 可能會有點麻煩,因為選用不同的方式去評估相似度,很容易造成效能差異,這一部分可以再改進.

--

--