华为天才少年谢凌曦:关于视觉识别领域发展的个人观点
華為天才少年謝凌曦:關(guān)于視覺識(shí)別領(lǐng)域發(fā)展的個(gè)人觀點(diǎn)
作者:謝凌曦
編輯:桃子
【新智元導(dǎo)讀】計(jì)算機(jī)視覺識(shí)別領(lǐng)域的發(fā)展如何?華為天才少年謝凌曦分享了萬(wàn)字長(zhǎng)文,闡述了個(gè)人對(duì)其的看法。
最近,我參加了幾個(gè)高強(qiáng)度的學(xué)術(shù)活動(dòng),包括CCF計(jì)算機(jī)視覺專委會(huì)的閉門研討會(huì)和VALSE線下大會(huì)。經(jīng)過(guò)與其他學(xué)者的交流,我產(chǎn)生了許多想法,千頭萬(wàn)緒,便希望把它們整理下來(lái),供自己和同行們參考。當(dāng)然,受限于個(gè)人的水平和研究范圍 ,文章中一定會(huì)存在許多不準(zhǔn)確甚至錯(cuò)誤的地方,當(dāng)然也不可能覆蓋所有重要的研究方向。我期待與有興趣的學(xué)者們進(jìn)行交流,以充實(shí)這些觀點(diǎn) ,更好地探討未來(lái)發(fā)展方向。
在這篇文章中,我將會(huì)著重分析計(jì)算機(jī)視覺領(lǐng)域 ,特別是視覺感知(即識(shí)別)方向所面臨的困難和潛在的研究方向。
相較于針對(duì)具體算法的細(xì)節(jié)改進(jìn),我更希望探討當(dāng)前算法(尤其是基于深度學(xué)習(xí)的預(yù)訓(xùn)練+微調(diào)范式)的局限性和瓶頸 ,并且由此得出初步的發(fā)展性結(jié)論 ,包括哪些問(wèn)題是重要的、哪些問(wèn)題是不重要的、哪些方向值得推進(jìn)、哪些方向的性價(jià)比較低等 。
在開始之前,我先畫出如下思維導(dǎo)圖。為了尋找合適的切入點(diǎn),我將從計(jì)算機(jī)視覺和自然語(yǔ)言處理(人工智能中兩個(gè)最受關(guān)注的研究方向)的區(qū)別開始談起,引出圖像信號(hào)的三個(gè)根本性質(zhì) :信息稀疏性 、域間差異性、無(wú)限粒度性