先介紹一下你的博士論文題目吧?
大家好!我是 Philip,我的學(xué)校是慕尼黑工業(yè)大學(xué)(TU Munich),目前是計算機(jī)科學(xué)專業(yè)博士三年級,我的導(dǎo)師是 Daniel Cremers。我的研究方向是計算機(jī)視覺,就是要讓計算機(jī)理解圖像和視頻。對計算機(jī)來說,圖像和視頻僅僅是一大堆沒什么含義的數(shù)字而已。不過如果用顏色把他們表示出來,人類就可以馬上分辨出來圖像中有什么內(nèi)容。
為了讓計算機(jī)也能做到這樣的事情,我的方法是訓(xùn)練神經(jīng)網(wǎng)絡(luò);這是一大類模型,它們可以看作是“迷你視覺皮層”的一種實例。訓(xùn)練的目標(biāo)是把組成圖像的那些數(shù)字映射更成有意義的東西,就比如“貓”這樣的類別標(biāo)簽。神經(jīng)網(wǎng)絡(luò)在這種任務(wù)上的表現(xiàn)非常好。我研究過的問題包括 光流 optical flow(“視頻中一幀到下一幀之間發(fā)生了什么?”)、領(lǐng)域適應(yīng)(“如何讓一個領(lǐng)域的知識/標(biāo)簽在另一個領(lǐng)域發(fā)揮作用,比如讓手寫圖像的標(biāo)簽在谷歌街景的門牌號識別任務(wù)中發(fā)揮作用”)。
在做研究之外,我還有一個 YouTube 頻道“Pill's Physics”,里面的內(nèi)容是我做一些科學(xué)實驗、討論一些科學(xué)知識。
你是如何選擇做這個方向的?
2014年的時候,我剛剛在美國加州大學(xué)圣克魯茲分校拿到物理學(xué)碩士學(xué)位。那時候我在一個研究如何給盲人移植視網(wǎng)膜的跨學(xué)科小組里面,有一次實驗中我們需要處理一些采集起來非常費(fèi)錢的數(shù)據(jù),然而我們又沒法充分利用這些數(shù)據(jù),因為我們的數(shù)據(jù)處理程序過于簡單了。所以我就開始自學(xué)機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)。我很快就對這東西著迷了,然后開始聯(lián)系在這個領(lǐng)域做研究的教授們。Daniel Cremers 邀請我過去展示我的工作成果,我覺得非常榮幸,后來他也就成為了我的博士導(dǎo)師。
你選擇來谷歌實習(xí)的原因是什么?你的導(dǎo)師起到的幫助大嗎?
深度學(xué)習(xí)領(lǐng)域的進(jìn)步速度非?。幾乎每周都有人發(fā)表突破性的新神經(jīng)網(wǎng)絡(luò)或者訓(xùn)練方法。很多時候,論文作者都是來自谷歌的。這就讓我非常好奇谷歌在這個領(lǐng)域都做了些什么樣的研究。在一個夏令營中,我遇到了 Olivier Bousquet,他做了一個關(guān)于谷歌大腦團(tuán)隊的演講,講得非常棒。他給我介紹了谷歌研究實習(xí)生的事情,我就很快發(fā)了申請。我的博士導(dǎo)師也很支持我,因為接觸新的觀點、跟別人接觸、跟別人交換意見永遠(yuǎn)是好事,尤其是在深度學(xué)習(xí)這樣的新領(lǐng)域中。而且,谷歌有很多的資源可以用于研究,很多大學(xué)里沒有條件計算的實驗都可以在這里完成。
你實習(xí)期間做的是什么項目?
我很榮幸可以和 Alexander Mordvintsev 一同工作,他是 DeepDream 的創(chuàng)始人之一。我們做的項目是關(guān)于一種用無標(biāo)簽數(shù)據(jù)和半監(jiān)督學(xué)習(xí)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的新方法的。
我們開發(fā)出的新方法叫“從聯(lián)想中學(xué)習(xí)(Learning by Association)”。它的思路和“聯(lián)想游戲”很像,給你一個單詞,然后你要回答你聯(lián)想到的第一個東西。幾輪聯(lián)想下來,一般都會形成很好玩的聯(lián)想鏈。
我們做的事情就跟這個很類似:我們首先訓(xùn)練一個能夠生成表征(神經(jīng)激活模式)的神經(jīng)網(wǎng)絡(luò),這樣的表征也可以用來做聯(lián)想。這樣的聯(lián)想就可以把有標(biāo)簽數(shù)據(jù)和無標(biāo)簽數(shù)據(jù)聯(lián)系起來。假設(shè)我們能夠生成一條有標(biāo)簽數(shù)據(jù)和無標(biāo)簽數(shù)據(jù)之間的聯(lián)想鏈,然后就可以從無標(biāo)簽數(shù)據(jù)進(jìn)行第二次聯(lián)想,再聯(lián)想到有標(biāo)簽數(shù)據(jù)。這樣就形成了一個“聯(lián)想循環(huán)”。那么,你就可以把這個循環(huán)開頭的那個標(biāo)簽和最后聯(lián)想到的標(biāo)簽做對比。我們的目標(biāo)是建立連續(xù)的聯(lián)想循環(huán),意思就是說循環(huán)中的標(biāo)簽都是相同的。我們給這個過程建立了一個損失函數(shù),然后通過實驗表明了這個方法可以極其有效地用更少的數(shù)據(jù)訓(xùn)練分類神經(jīng)網(wǎng)絡(luò)。
你在谷歌實習(xí)期間有發(fā)表論文嗎?
有的,我寫了一篇論文并且提交到了CVPR,這是世界上最大的計算機(jī)視覺會議;我還在CVPR 2017現(xiàn)場展示了這篇論文。出席大會的旅費(fèi)也是谷歌出的,所以這段實習(xí)經(jīng)歷不僅給我?guī)砹撕芏鄻I(yè)界公司的經(jīng)驗,而且也讓我發(fā)表了一篇引以為豪的論文。
你在實習(xí)期間所做的研究和你的博士研究題目聯(lián)系緊密嗎?
剛開始的時候,我和谷歌大腦團(tuán)隊的人一起探索了很多不同的題目,最后選中的這個和我的博士研究題目配合得非常完美。另外,即便做一個和博士研究題目完全沒有關(guān)系的項目也會有很大幫助,比如在編程和項目管理技能方面。
你自己寫代碼了嗎?
寫了好多呢!我尤其要感謝谷歌的代碼審查,讓我的代碼質(zhì)量提高了很多,而且讓我對代碼風(fēng)格和可拓展性也做了很多思考。谷歌允許代碼開源的這一點也讓我很高興,這就跟研究領(lǐng)域的慣例是一樣的。這樣一來,我在谷歌之外也可以繼續(xù)研究這個題目,并和全世界的研究人員一起共享這些代碼。我還寫了一篇后續(xù)論文“聯(lián)想領(lǐng)域適應(yīng)(Associative Domain Adaptation)”,剛剛也被 ICCV 接收了。
現(xiàn)在你在谷歌實習(xí)已經(jīng)是第二次了,你回到谷歌有哪些原因?
谷歌里面有趣的研究項目太多了,一次實習(xí)經(jīng)歷怎么能夠呢?哈哈,不開玩笑了,Sylvain Gelly 團(tuán)隊有一個非常有趣的項目邀請我參加。去年我就和他和他的同事碰過面,他們?nèi)硕己馨,我不想錯過這個和他們一起工作的機(jī)會。
在谷歌的這段時間里,你都學(xué)到了哪些關(guān)鍵技能?
我的代碼質(zhì)量提高了很多。在谷歌有機(jī)會跟著有很多經(jīng)驗而且非常聰明的編程人員身上學(xué)習(xí),他們寫的代碼完善、快速,而且他們還能教你如何寫出這樣的代碼。我還和谷歌中很多不同團(tuán)隊、不同背景的人都建立了聯(lián)系;我遇到了一些優(yōu)秀的產(chǎn)品經(jīng)理,給我講了他們設(shè)計成功的產(chǎn)品的時候都有哪些深入的見解。我甚至還跟他們一起開發(fā)了一個新的YouTube功能,因為我剛好是一個YouTube內(nèi)容開發(fā)者。其實還有很多,我最后再說一點,我在谷歌內(nèi)部的健身中心里加入了一個“最強(qiáng)泥人”團(tuán)隊,經(jīng)過鍛煉以后我的身體素質(zhì)也有提升。
這段實習(xí)經(jīng)歷對你的博士學(xué)業(yè)有哪些影響?
現(xiàn)在回頭來看的話,這段實習(xí)經(jīng)歷是我博士期間重要的里程碑。我申請實習(xí)的時候其實沒有期待它會幫我改變一切,但是我覺得自己結(jié)束實習(xí)的時候是帶著滿腦子的新點子和渾身的動力回到學(xué)校的。
那根據(jù)你現(xiàn)在的經(jīng)驗做個回顧:你覺得博士生應(yīng)該申請去谷歌實習(xí)嗎?有什么建議給他們嗎?
當(dāng)你的博士讀到一半的時候,肯定會有那種覺得自己困在問題里走不出去的時候。這時候你就需要接觸一些新東西。還可以是當(dāng)你想試著做一個需要用到1000個GPU的實驗的時候;或者是當(dāng)你覺得自己無所不知無所不能、想要挑戰(zhàn)自己的時候;又或者是你開始考慮博士畢業(yè)之后做什么,你在想象寫大型程序、帶來大的改變會是什么感覺。我覺得一段實習(xí)經(jīng)歷可以有很多不同的理由。那么谷歌也就是一個很有意思的地方,可以挑戰(zhàn)自己,也可以收獲一篇好論文、一群好朋友、各種好點子,甚至在谷歌工作的機(jī)會。
中國-博士人才網(wǎng)發(fā)布
聲明提示:凡本網(wǎng)注明“來源:XXX”的文/圖等稿件,本網(wǎng)轉(zhuǎn)載出于傳遞更多信息及方便產(chǎn)業(yè)探討之目的,并不意味著本站贊同其觀點或證實其內(nèi)容的真實性,文章內(nèi)容僅供參考。