北京单场销售点
GSOL
世界經理人
論壇
  • 全站
  • 文章
  • 論壇
  • 博客
高級
 
 

計算機視覺如何尋找突破口?三維重建或許是一個

04-20 05:35:45




又一年ICCV論文提交截止,ICCV2019的官方推特也在上周末第一時間公布了本屆會議的論文投遞情況。根據官方消息,2019年共收獲4328篇論文,與上一屆2143篇相比,數量多出了將近一倍。

ICCV由IEEE主辦,全稱為IEEE International Conference on Computer Vision,即國際計算機視覺大會。與計算機視覺模式識別會議CVPR和歐洲計算機視覺會議ECCV并稱計算機視覺三大頂級會議。ICCV論文數量的翻倍,也能看出近年來計算機視覺的發展有多么迅猛,無論是國內還是國外,都誕生了很多一批專注于計算機視覺的企業,如曠視科技、商湯科技、極鏈科技Video++、依圖科技等優秀的初創AI企業,微軟、阿里巴巴、百度等大廠。



1998年到2012年,十幾年來,卷積神經網絡的架構還是一樣的,但是它的內部發生了很大的變化,而發生這些變化有亮點非常重要:當下因為深度學習技術的發展,人工智能變得愈加火爆,計算機視覺作為人工智能的一個領域,也逐漸被企業所重視。不過當前計算機視覺的研究和應用主要集中在“識別”上,“識別”只是計算機視覺的一部分,如果要去做一些交互和感知,必須先恢復三維,所以在識別的基礎上,下一個層次必須走向“三維重建”。

一.英偉達研發了GPU,GPU最早是為游戲而不是人工智能誕生的。

二.華人學者、斯坦福大學教授李飛飛創建了ImageNet,她把數百萬張照片發到了網絡上并發動群眾做了標注。

至今,在2012年訓練AlexNet模型需要使用兩塊GPU,花費6天時間,到今天做同樣的事情只需要一塊最新GPU,十幾分鐘就能搞定。

計算機視覺與三維重建



三維重建指對三維物體建立適合計算機表示和處理的數學模型,是在計算機環境下對其進行處理、操作和分析其性質的基礎,也是在計算機中建立表達客觀世界的虛擬現實的關鍵技術。

上世紀80年代左右,計算機視覺有了最初的發展。那個年代基本所有的計算機視覺研究都以D.Marr的研究為理論依據。他的可計算數學模型都是以edges為主的邊緣提取。有了edge之后,再把它高層話后的線段元做簡單的統計分類或者三維重建。

它從外部世界的圖像逐步產生對景物的三個層次的描述:

1.初始簡圖:這是最基本意義的灰度變動的局部幾何性質,以線條勾畫出的草圖形式出現。

2.二維半簡圖:該圖主要描述物體可視面的表面方向和觀察點到表面的距離。

3.三維模型表示:這是物體形狀的全部而清晰的描述。也是D.Marr教授的視覺計算理論對計算機視覺研究的最杰出的貢獻。

當前,每個人都在研究“識別”,但是識別只是計算機視覺的一部分,真正意義上的計算機視覺要超越識別,感知三維環境,做到交互和感知,就需要把世界恢復到三維。人類可以通過眼睛得到有深度的三維信息,但獲取深度信息的挑戰很大。它本質上是一個三角測量的問題,第一步需要將兩幅圖像或兩只眼睛感知到的東西進行匹配,也就是“識別”。但這里的“識別”是有標注情況下的識別,是通過兩幅圖像之間的識別,沒有數據庫,不僅要識別物體,還要識別每一個像素,所以對計算機要求非常高。

計算機視覺:機遇與挑戰并存

據羿戓設計所了解,伴隨著人工智能產業升溫,計算機視覺行業有望邁向新的發展階段。據專業機構預測,2016-2020年中國計算機視覺市場將維持20%的增長率,遠高于全球的8.4%平均水平,中國計算機視覺產業將迎來新一輪爆發式增長。雖然整個計算機視覺領域迎來了前所未有的關注和接踵而至的投資熱潮,這些既來自于風險投資、互聯網公司和傳統公司,還吸引了國家政府前所未有的關注,但在此過程中,挑戰也依然存在,拋開計算機視覺產業鏈,上層為基礎支撐層,包括人工智能芯片、算法技術和數據。中層為技術提供層。下層則是具體的場景應用。當前國內計算機視覺領域初創公司中,布局中上層的企業非常少,絕大多數企業都只是集中于中下游技術提供層和場景應用層,能打通全產業鏈的企業更是鳳毛麟角。

舉幾個已經基本達到商業化的例子:

1.**十年代的指紋識別算法已經非常成熟,在指紋的圖案上面去尋找一些關鍵點,尋找具有特殊幾何特征的點,然后把兩個指紋的關鍵點進行比對,判斷是否匹配。

2.2001年基于Haar的人臉檢測算法,在當時的硬件條件下已經能夠達到實時人臉檢測,現在手機相機里的人臉檢測,都是基于它或者它的變種。

3.基于HoG特征的物體檢測,它和所對應的SVM分類器組合起來的就是著名的DPM算法。DPM算法在物體檢測上超過了所有的算法,取得了不錯的成績。

但這種成功例子太少了,因為手工設計特征需要大量的經驗,需要你對這個領域和數據特別了解,然后設計出來特征還需要大量的調試工作。另一個難點在于,你不只需要手工設計特征,還要在此基礎上有一個比較合適的分類器算法。同時設計特征然后選擇一個分類器,這兩者合并達到最優的效果,幾乎很難完成。

小結:

隨著計算機視覺和深度學習的發展,自動駕駛、生物識別、視頻識別、無人機等都迎來了發展的浪潮,但這些領域想要達到完全的商業落地,三維重建或許是一個很好的突破口,但是真正能發展到何種程度,還是得看企業對三維重建的重視與利用。


羿戓logo.webp.jpg


相關關鍵詞:
E-MAIL營銷
收藏 舉報
上一篇:三問AI芯片發展未來 中國AI... 下一篇:2019年第一季度機器人產業數...

確認推薦關閉

是否確定推薦本文?

取消推薦標題:

確定 取消

 

用戶評論

登錄后參與評論。

共0條回帖
登錄/注冊
 
 

熱門帖子

  • 收藏最多
  • 最“贊”
  • 點擊最高
  • 評論最多
 
 
 
 
 
 

世界經理人論壇推薦

熱門關鍵詞

  • 熱門
  • 經典
  • 管理
  • 文章
  • 論壇
  • 博客
 
 
 
一鍵發帖 資訊訂閱
世界經理人 iphone app
世界經理人微信 為你推送和解讀最專業的管理資訊
北京单场销售点