前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇計算機視覺發展報告范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
關鍵詞 模式分析 計算機視覺 教學改革
中圖分類號:G643.2 文獻標識碼:A DOI:10.16400/ki.kjdkz.2016.03.015
Research and Practice on Course Group of Pattern Analysis and
Visual Processing for Graduated Students
SUN Han, CHEN Songcan, LIU Ningzhong, HUANG Yuanyuan, ZHU Qi
(College of Computer Science and Technology, Nanjing University of
Aeronautics and Astronautics, Nanjing, Jiangsu 210016)
Abstract By analyzing the teaching status of pattern analysis and visual processing course group, this paper puts forward the new teaching goal, which includes improving students' international vision, the ability of linking theory with practice, and promoting the engineering practice ability and innovative consciousness. Then this paper discusses the whole process of course group reform. Firstly the structure of teachers' group is optimized. And then the knowledge system of course group is sorted and the teaching mode is improved. Finally the practice system of course group is optimized and the assessment system is reformed.
Key words pattern analysis; computer vision; teaching reform
1 背景
我校模式分析與智能計算研究所師資團隊是江蘇省“青藍工程”創新團隊,主要研究領域包括智能數據分析、圖像處理和機器視覺等方向,承擔研究生和本科生的模式識別、機器學習、數據挖掘、智能信息檢索、數字圖像處理、計算機視覺等課程的教學任務。以往的教學過程中雖然積累了豐富的教學經驗,但當前新知識不斷涌現、新技術發展迅猛,對模式分析與視覺處理課程群的知識體系、實踐體系改進提出了新的挑戰。
近年來,國內外高校在該類課程教學上,已涌現出眾多新理念、新方法。Coursera聯合創始人Andrew Ng推出的機器學習課程,開啟了教育領域的MOOC時代,引領了教育教學方法的新革命。①深圳大學、②江蘇科技大學③分別進行了基于CDIO工程教育理念的計算機視覺課程教學改革實踐,實現多層次項目設計的教學模式改革,講座式、討論式、實踐式教學方法的探索。國防科技大學④在計算機視覺課程中引入研討式教學模式,通過案例教學、小組研討的方式來替代傳統的教學方式。華中科技大學⑤從教學內容國際化、教學方式國際化、教學成果國際化三個方面開展了計算機視覺課程的國際化建設。另外,也有高校進行了圖像工程課程群建設,⑥基于圖像分析與計算機視覺應用課程結合的項目協同創新能力培養實踐。⑦
在分析上述國內外高校該類課程改革的基礎上,我們重點以模式分析與視覺處理課程群的實踐教學體系改革為切入點,優化師資隊伍結構,梳理課程群知識體系,優化課程授課模式,完善課程群實踐體系,改革實踐考核模式,實現學生國際化視野、理論聯系實際、工程實踐和創新能力全面提升的目標。
2 模式分析與視覺處理課程群特點
模式分析與視覺處理課程群涵蓋了模式識別、機器學習、數據挖掘、數字圖像處理、計算機視覺等多門課程。該類課程存在以下特點。
(1)該類課程屬于多學科交叉,涉及的知識面既廣又深。由于該方向涉及計算機科學與技術、應用數學、自動化、電子科學與技術、信息工程等多學科內容,而學生在大學本科階段很難學習和了解如此多的知識模塊,這對研究生階段學習來說,具有相當大的挑戰。同時,對于每個知識模塊,所要求的數學基礎較高,理論具有相當的深度,理解和掌握不容易。
(2)該類課程既重視扎實的基礎理論,也強調良好的工程實踐能力。該類課程的基礎理論教學一直受到各高校的重視。隨著近年來產業界的迅猛發展,計算機視覺應用層出不窮,對學生的工程實踐也提出了更高要求,需要能夠在系統層次上有整體認知,同時要能對各功能模塊進行優化,提升系統的整體性能。
(3)該類課程所面向的選修學生面廣。該類課程既是多學科交叉,也面向計算機應用、電子科學與技術、自動化、應用數學等不同研究方向、不同水平層次的研究生開設。這對課堂教學和實驗實踐也帶來更大挑戰。
3 模式分析與視覺處理課程群改革舉措
針對上述分析的課程群特點,我們重點以實踐體系改革為突破口,通過優化師資隊伍結構,梳理課程群知識體系,優化課程授課模式,完善課程群實踐體系,改革實踐考核模式等舉措,實現學生國際化視野、理論聯系實際、工程實踐和創新能力全面提升的目標。
3.1 師資隊伍結構優化
為了學生能夠適應模式分析與視覺處理產業的快速發展,在課程群建設過程中更強調學生的工程實踐和創新能力培養。這首先對師資隊伍結構提出了新的要求。
近年來,課程教學團隊引進海內外具有深厚理論功底和較強工程能力的高水平師資4名,大大充實了機器學習、數據挖掘、圖像處理等課程的教學力量。對于現有教師隊伍,鼓勵教師跟產業一線企業廣泛合作,目前已與華為、中興等企業在視頻檢索、智能交通視覺處理等方面開展了實質合作。這些來源于產業界的高質量課題對科研和教學起到了良好的促進作用。
與此同時,通過研究生工作站、企業短期實習等渠道,鼓勵企業高級研發人員參與到學生實踐能力培養環節中,將實際項目進行適當切分或提煉,實現該類課程實踐環節的模塊化、專題化訓練。
綜上,通過引培并舉,優化校內師資隊伍結構;通過校企合作,積極吸引企業師資參與。良好的師資隊伍為該類課程的實踐體系改革提供了有力支撐。
3.2 課程群知識體系梳理與授課模式改革
模式識別、機器學習、數據挖掘、智能信息檢索、數字圖像處理、計算機視覺等課程既有一定的邏輯關系,也存在相互交叉的混雜關系。一般認為,模式識別、機器學習是模式分析與視覺處理領域的基礎理論課程,數據挖掘是建立在模式識別、機器學習和數據庫基礎上的應用類課程,智能信息檢索則是數據挖掘基礎上更為具體的應用實現。數字圖像處理為計算機視覺課程提供了基礎支撐,計算機視覺則是在綜合利用模式識別、機器學習、數字圖像處理、數據挖掘等知識模塊基礎上面向應用的系統實現。但是,這些課程也存在著知識點的交叉或重復。例如,模式識別和機器學習中都有貝葉斯參數估計、支持向量機模型等知識點,但視角和側重點有所不同;圖像處理、計算機視覺中都有顏色模型、成像模型等知識點,也同時存在與模式識別、機器學習交叉的知識點。
我們針對來自不同研究領域的學生群體,對該課程群的知識點進行系統梳理,既避免知識點的重復講授,也防止重要知識點的缺漏。課程教師集體討論,形成每門課程的核心知識集,和針對不同研究領域的選講知識集。學生在學習課程時,在掌握核心知識集的基礎上,結合自己的研究方向選擇相關的選講知識集學習。
在課程教材和參考書的選擇上,注重挑選國際上有影響力的教材。例如,模式識別的參考書為Richard O. Duda等人編著的Pattern Classification;機器學習的參考書為Tom M. Mitchell編著的Machine Learning和Christopher M. Bishop編著的Pattern Recognition and Machine Learning;數據挖掘的參考書為Jiawei Han等人編著的Data Mining:Concepts and Techniques;數字圖像處理的參考書為K. R. Castleman編著的Digital Image Processing;計算機視覺的參考書為D. A. Foryth編著的Computer Vision: A Modern Approach和Richard Szeliski編著的Computer Vision: Alogrithms and Applications。這些教材已被國內外著名大學普遍采用。同時,每門課程都提供相關的國內外頂級會議和期刊的列表,供學生課后追蹤研究領域的熱點問題。
在課堂授課環節上,注意采用靈活多樣的授課方式。對于核心基礎知識模塊,以教師講授為主,同時提供國內外該類課程的熱門MOOC網址給學生參考。對于選講知識模塊,鼓勵學生事先結合各自研究方向有目的自學,在學生報告的基礎上進行課堂討論方式進行。充分發揮學生學習的主體作用,也便于教師了解學生的水平和學習狀況。
除此以外,不定期邀請國內外著名學者來校做學術報告,讓學生充分了解該研究領域的最新前沿動態,并就熱點問題進行專題討論。
3.3 課程群實踐體系完善與考核方式改革
工程實踐和創新能力的培養是該課程群改革的重要目標。我們在上述師資隊伍結構優化、課程群知識體系梳理與授課模式改革的基礎上,著力進行課程群實踐體系的改革與完善。我們通過多層次菜單式的實驗項目選擇、項目牽引的創新能力訓練、學生綜合研究能力的全面考查等方面來實現。
首先,整合和優化課程群實踐內容,實現多層次菜單式靈活選擇。根據各研究領域的要求進行靈活搭配,根據學生個體的能力與水平選擇適當規模和難度的實踐內容,通過課程內的基礎實驗、課程間的綜合實驗、課程群的創新實驗來選擇和組合,如圖1所示。
圖1 多層次菜單式實驗內容示意圖
基礎型實驗內容主要是各課程核心知識點的實驗驗證,主要包括模式識別,機器學習,數據挖掘,圖像處理與分析,計算機視覺等課程的實驗。要求選課學生對這些基礎實驗必做,打下良好的研究基礎。
綜合探索型實驗在基礎型實驗基礎上,既有單門課程內總的綜合實驗,也有課程間知識的綜合應用。主要分為兩大塊,包括模式分析與機器學習方向的綜合實驗,以及圖像處理與機器視覺方向的綜合實驗。實驗目的主要是針對這兩大塊方向重點知識的綜合分析和比較,能夠熟練掌握和靈活應用。例如模式分析、機器學習、數據挖掘等方向都用到的線性判別分析、支持向量機、均值聚類等內容;圖像處理與機器視覺中的圖像特征抽取、視覺系統選型、目標檢測、特定平臺的算法優化等內容。學生可根據各自研究方向有目的的選擇兩塊綜合實驗的大部分內容。
在綜合型實驗基礎上,該課程群通過若干創新型實驗來檢驗學生理論知識掌握程度和實踐方法應用能力,為后續的研究課題開展打下良好的科研素養。主要內容包括人臉識別、二維條碼識別、車輛屬性識別、智能視覺監控、以及企業來源的關鍵技術等。這些項目實踐既涉及用到圖像處理與機器視覺的內容,也涉及模式分析與機器學習方向的知識。并且需要學生在綜合運用相關知識的基礎上有創新能力。
其次,重視各類項目牽引的創新能力訓練。一方面,鼓勵教師從國家自然科學基金、企業合作項目等研究中提煉出問題規模和難度適中的訓練項目,作為課程群的綜合能力訓練項目。另一方面,鼓勵學生參加挑戰杯、全國研究生智慧城市技術與創意設計大賽等各類具有挑戰性的競賽項目,以賽代練,提升學生的工程實踐和創新能力。同時,也鼓勵學生利用百度、微軟等相關研究領域的企業實習機會,參與產品一線的工程實踐能力訓練。
再次,注重考核環節,實現科研素養和實踐能力的全面考查。只有嚴格、公平、公正的考核,才能保證實驗實踐的質量和水平,才能提升學生的科研素養和實踐能力。我們主要在手段、方式方法上進行了改進。在題目選擇上,根據學生個體水平和研究領域要求的差異,在選題上有適當的難易區分度,讓每位學生都有鍛煉和提升的機會;在考核方式上,采用結題書面報告來檢驗學術論文的寫作能力,采用程序演示檢驗系統的設計與實現水平,采用上臺匯報的方式檢驗學生的表達能力,多管齊下全面檢查學生的綜合科研素養;在考核成績評定上,采用現場教師和學生共同評分的方式,公平合理;最后,通過網站展示、發表學術小論文、專利、軟件著作權等方式展示和公開優秀成果,激發學生的學習熱情,并由此形成積累,有利于學生實驗實踐氛圍的傳承。
4 結語
本文在分析國內外高校模式分析與視覺處理類課程群改革現狀的基礎上,以學生國際化視野、理論聯系實際、工程實踐和創新能力全面提升為目標,重點開展了師資隊伍結構優化、課程群知識體系梳理、課程授課模式改革、課程群實踐體系完善和實踐考核模式改革等工作,取得了良好的效果,并為校內其他課程群的教學改革作為示范推廣。
注釋
① https:///learn/machine-learning/
② 郭小勤,曹廣忠.計算機視覺課程的CDIO教學改革實踐.理工高教研究,2010.29(5):98-100,148.
③ 史金龍,白素琴,龐林斌,錢強.研究生機器視覺課程的CDIO教學改革實踐.計算機教育,2013.9:40-43.
④ 陳芳林,劉亞東,沈輝.在《計算機視覺》課程中引入研討式教學模式.當代教育理論與實踐,2013.5(7):112-114.
⑤ 王岳環,桑農,高常鑫.計算機視覺課程的國際化教學模式.計算機教育,2014.19:101-103.
1)等高線生成及等高線分析:等高線圖是人們傳統上觀測地形的主要手段。可以在等高線圖上精確地獲知地形的起伏程度、區域內各部分的高程等等。等高線圖可以從格網數字地形模型仍TM)中獲取,也可在不規則三角形格網T(NI)中生成。
2)立體透視圖分析:當用戶需要從直觀上觀察地形的概貌時,用繪制透視圖的方法(還可以用色彩)可以更逼真地顯示地形。
3)坡度分析、地表面積計算及挖、填土方體積計算:建立DTM后就可以用之計算坡度、面積和挖、填土方體積,以其作為土地適宜性評價的因子。
4)斷面圖分析:斷面圖主要有利于工程設計和工程測量,如工程勘察的縱向圖分析、地質鉆孔分析等。
一 CIS技術在礦區土地管理信息的具體形式
在以往的測量中,選擇的測量方式還是完全采用機械的形式,但是在使用了計算機CIS技術精密測量后,完成了許多以往技術所不能達到的任務。在我們的研究中,計算機CIS技術測量的原理是通過攝像機將被處理的對象采集進行影像采集,在多個控制點的數據采集完成后,系統會自動將這些圖像進行整合,得出相關的幾何多變參數,再在計算機上以具體的數據顯示出來,以供礦區技術人員使用參照。
在上面所說的攝像機并不是我們通常意義上生活中使用的攝像機。它是一種可視化較強,表針比較敏感的測試儀。可以將視覺中的二維形態通過顯影,記錄在機械的光譜儀上,再將這種的二維圖像做數學處理,有二階矩陣轉換為三階矩陣,通過播放儀呈現出三維的影像。這時的圖像變為立體化,更有層次感,效果上也有了明顯的變化,這是一種顯示方法。此外還有一種造價較高的儀器,我們不常使用,就是圖像提取器。同樣是采集控制點的數據,將數據整合在系統之內,然后對于原始的圖像進行預處理,不再經過有曝光這個程序,將圖像中關鍵點的坐標在整個內部軸面上體現出來,提取數據幀數,再運用機器的智能識別系統,對控制點的坐標進行數據分析,自動生成圖形,這也可以用于精密測量。它的優點就是使用上極其的方面,基本只要架立儀器和打開開關,其他的工作機械系統都會自動的完成。使用的困難就是造價極其的高,不適合一般企業使用。在基于計算機視覺圖像測量中使用上的原理如下:
(1) 計算出觀察控制點到計算機視覺圖像測量儀器的有效距離;
(2) 得出觀察點到目標控制點之間的三維的運動幾何參數;
(3) 推斷出目標控制點在整個平面上的表面特征( 大多時候要求形成立體視覺) ;
(4) 還通過觀察可以判斷出目標物體的幾何坐標方位。
在整個計算機CIS技術精密測量的在礦區土地信息管理中最關鍵的元件就是壓力應變電阻儀,這也是傳感器的一部分。壓力應變電阻儀的使用方式是將應力片粘貼在控制點位上,事先在物體表面打磨平整,清理干凈后,涂抹丙酮試劑,在液體完全風干后就可以黏貼應力片,通過導線的聯接,形成了一小段閉合的電路,時刻讓計算機CIS技術系統可以感應到并作跟蹤觀察。因受到來自不同方面諧波的影響后,應力片會產生一定數值的電阻,在電路中,這些電阻會轉化為電流,視覺圖像系統接收到了電流后就會顯示在儀表盤上相應的數據,我們就可以根據儀表盤中的數據記錄測量中的數據,很好的解決了原始機械在使用過程中大量的做無用功所消耗資源的現象。傳感器對每個應點都進行動態的測量,將數據模轉換成現實中的圖像,精確的成像可以測算出控制點的位置,用計算機視覺圖像精密測量結合數據方面的相關的分析,得出礦區施工中的可行性報告分析,減低了施工中的成本,將施工的預算控制在一個合理的范圍之內。
當無法觀察到控制點是,計算機CIS技術測量可以通過接收信號或是相關的頻率波段來收集數據,不會因為以往測量的環境不好,距離太遠,誤差太大的影響。
二 計算機CIS技術測量的關鍵技術分析
在計算機CIS技術測量中解決了很多以往很難完成的任務,但是在使用過程中還是發生了很多的問題。尤其在土地信息的選擇中,無法使用高幀數的圖片顯示,無法將計算機測量的關鍵技術的優點發揮出來。我們就計算機CIS技術測量的關鍵技術中常見的問題進行討論。
1. 降低失誤的概率
在很多的數據誤差中,有一部分是出現在人為的因素上面。對于機器的不熟悉和操作中的疏忽都會在一定程度上對圖像的視覺感模擬帶來麻煩。對于網絡設備的配置上,要經常性的學習,將配置在可能的情況下設置的更加合理和使用,保證網絡連接系統的安全性。為防止更多因操作帶來的誤差,選用系統登入的制度,用戶在通過識別后進入系統,在采集數據后,確定最終數據上又相關的再次確定的標識,系統對本身有的登錄服務器和路由器有相關的資料解釋,記錄好實用操作的時間,及時備份。
2. 對于權限的控制
權限控制是針對測量關鍵所提出的一種安全保護措施,它是在使用計算機CIS技術測量的關鍵技術中對用戶和用戶組賦予一定的權限,可以限制用戶和用戶組對目錄、子目錄、文件、打印機和其他共享資源的瀏覽和更改。圖像中的運行服務器在停止的情況下可以做出不應答的操作指令,立刻關閉當前不適用的界面,加快系統的運行速度,對于每天的日志文件實時監控,一旦發現問題及時解決。對于數據終端的數據可采用可三維加密的方法,定時進行安全檢測等手段來進一步加強系統的安全性。如果通過了加密通道,系統可以將數據自動的保存和轉換為視圖模式,對于數據的審計和運行可以同時進行,這樣就可以很好的保證大地測量中的圖像數據安全,利用防護墻將采集中廢棄的數據革除在外,避免數值之間發生紊亂的現象,進一步改善計算機CIS技術。
3. 開啟自動建立備份系統
計算機CIS技術測量的關鍵技術的完善中會常遇到系統突然崩潰或是圖像受到嚴重干擾導致無法轉換的一系列情況,發生這種情況最大的可能性就是系統在處理多組數據后無法重新還原成進入界面。這時為保證圖片轉換成數字的系統數據不丟失,我們對系統進行備份。選定固定的磁盤保存數據,定期將產生的數據(轉換前的圖像和轉換后的數值)導出,保證程序的正常運行。當系統一旦發生錯誤,可以盡快的恢復數據的初始狀態,為測量任務的完成爭取更多的時間。我們還要減少信號源周圍的干擾,定期的更新系統數據庫,保持數據采集的穩定性,把攝像機記錄出的數據節點保存在相應的技術圖紙上,用這樣的方式來知道測量工作。系統備份的數據還可以用于數據的對比,重復測量后得出的數據,系統會自動也備份的數據進行比對,發現誤差值在規定以外,就會做出相應的預警,這樣也能在工作中降低出現誤差的概率。
三 CIS技術測量的關鍵技術遇到的困難和使用前景
計算機CIS技術測量的關鍵技術作為一種新興技術在使用時間上不過十幾年,其使用的程度已經無法估算。正是因為它的簡單、使用、精度高以及自動化能力卓越的特點受到了礦區土地信息管理部門的廣泛青睞。在測量調控方面的這些可靠性和穩定性也是有目共睹的。這項關鍵技術中涵蓋的學科非常的多,涉及到的知識也很全面,一旦出現了機器的故障,在維修上還是一個很大的問題,如何很好的解決計算機視覺圖像技術的相關核心問題就是當下亟待解決的。
我們都知道,人的眼睛是可以受到吱聲的控制,想要完成礦區土地觀測是十分簡單的,但是在計算機CIS技術中,畢竟是采取攝像機取景的模式,在取得的點位有的時候不是特別的有代表性,很難將這些問題具體化、形象化。達不到我們設計時的初衷。所以在這些模型的構建中和數據的轉換上必須有嚴格的規定和要求,切不可盲目的實施測量,每項技術操作都要按規程來實施。
四 結束語
關鍵詞:智能 傳感器
傳感器象人的五官一樣,是獲取信息的重要工具。它在工業生產、國防建設和科學技術領域發揮著巨大的作用。但與飛速發展的計算機相比較,作為“五官”的傳感器遠遠趕不上作為“大腦”的計算機的發展速度。
隨著測控系統自動化、智能化的發展,要求傳感器準確度高、可靠性高、穩定性好,而且具備一定的數據處理能力,并能夠自檢、自校、自補償。傳統的傳感器已不能滿足這樣的要求。國外有的文章稱傳統的傳感器為Dumb sensor(愚蠢的、笨啞的傳感器)。另外,為制造高性能的傳感器,光靠改進材料工藝也很困難,需要利用計算機技術與傳感器技術相結合,彌補其性能的不足,計算機技術使傳感器技術發生了巨大的變革,微處理器(或微計算機)和傳感器相結合,產生功能強大的智能傳感器。國外稱為Intelligent sensor(智能傳感器)或Smart-sensor(靈巧的、機敏的、智能傳感器)。另外,傳統的傳感器一般只能測量一個參數,有些場合需要同時測量多個參數的體積小的多功能傳感器。現在多國科學家已重視這一方向的開拓,并已研制出一些多功能傳感器。
1 傳感器的智能化
目前國內外學者普遍認為.智能傳感器是由傳統的傳感器和微處理器(或微計算機)相結合而構成的,它充分利用微處理器的計算和存儲能力,對傳感器的數據進行處理,并能對它的內部行為進行調節,使采集的數據最佳。
傳統的傳感器只能作為敏感元件,檢測物理量的變化,而智能傳感器則包括測量信號調理(如濾波、放大、A/D轉換等)、數據處理、數據顯示以及自校自檢自補償等功能,圖1是智能傳感器的原理框圖。
圖1 智能傳感器原理框圖
微處理器是智能傳感器的核心,它不但可以對傳感器的測量數據進行計算、存儲、數據處理,還可以通過反饋回路對傳感器進行調節。由于微處理器充分發揮各種軟件的功能,可以完成硬件難以完成的任務,從而大大降低了傳感器制造的難度,提高傳感器的性能,降低成本。需要指出的是,除微處理器以外,智能傳感器相對于傳統傳感器的另一顯著特征是其信號調理電路。被測的物理量轉換成相應的電信號后,送到信號調理電路中,進行濾波、放大、轉換,再送入計算機(微處理器)中進行處理。與計算機技術的結合,使智能傳感器相對于傳統傳感器具有如下功能:
①自補償能力:通過軟件對傳感器的非線性、溫度漂移、時間漂移、響應時間等進行自動補償。
②操作者輸入零值或某一標準量值后,自校準軟件可以自動地對傳感器進行在線校準。
③自診斷功能:接通電源后,可對傳感器進行自檢,檢查傳感器各部分是否正常,并可診斷發生故障的不見。
④數值處理功能:可以根據智能傳感器內部程序,自動處理數據,,如進行統計處理,剔除異常值等。
⑤雙向通信功能:微處理器和基本傳感器之間構成閉環,微處理器不但接收、處理傳感器的數據,還可將信息反饋至傳感器,對測量過程進行調節和控制。
⑥信息存儲和記憶功能。
⑦數字量輸出功能:輸出數字信號,可方便地和計算機或接口總線相連。
日前,世界各國都在研制和開發各類智能傳感器,隨著科學技術的不斷發展,智能傳感器的功能將逐步增強,它將利用人工神纖網絡、人工智能、信息處理技術(如信息融合技術、模糊理論等),使傳感器具有更加高級的功能,具有分析、判斷、自適應、自學習的功能,并可以完成圖像識別、特征檢測、多維檢測等復雜任務。
隨著計算機技術的飛速發展,智能傳感器技術必將大放異彩。
2 智能傳感器的發展狀況
2.1 物理轉化機理
由于集成智能傳感器可以很容易對非線性的傳遞函數進行校正,得到一個線性度非常好的輸出結果,從而消除了非線性傳遞對傳感器應用的制約。該機理具有穩定性好、精確度高、靈敏度高的特點。利用同一硅片上集成的智能檢測電路,可以迅速提取頻率信號,使得諧振式微機械傳感器成為國際上傳感器領域的一個研究熱點。
2.2 數據融合理論
數據融合是集成智能傳感器理論的重要領域,也是各國研究的熱點,對于多個傳感器組成的陣列,數據融合技術能夠充分發揮各個傳感器的特點,利用其互補性、冗余性,提高測量信息的精度和可靠性,延長系統的使用壽命。
2.3 CMOS工藝兼容
目前,國外在研究二次集成技術的同時,集成智能傳感器在工藝上的研究熱點集中在研制與CMOS工藝兼容的各種傳感器結構及制造工藝流程,探求在制造工藝和微機械加工技術上有所突破。
2.4 傳感器的微型化
集成智能傳感器的微型化決不僅是尺寸上的縮微與減少,而且是一種具有新機理、新結構、新作用和新功能的高科技微型系統,并在智能程度上與先進科技融合。其微型化主要基于以下發展趨勢:尺寸上的縮微和性質上的增強性;各要素的集成化和用途上的多樣化;功能上的系統化、智能化和結構上的復合性。
3 智能傳感器的應用
3.1 立信眼球
由愛立信微波技術公司研制的ERIEYE(愛立信眼球)采用了智能傳感器技術和一個用戶界面友好的指揮和控制系統,可以快速獲取準確和綜合的信息。它是一種出色的雷達系統,可以在陸地和水面上分辨和跟蹤海上及空中目標,通過儀器觀測到的距離遠遠超過了地平線之外。
3.2 計算機視覺系統
在計算機視覺系統中,智能傳感器不僅直接確定數據集的范圍,還通過測量確保系統的安全。獲得需要到達的地點信息,安置系統以得到高質量的信息。適應實踐和環境的變化,甚至獲得特殊的指令,控制器件的動作。
4 現狀與發展
目前,世界各國都在研制與開發各種智能傳感器和多功能傳感器。其中最成功的是美國Honeywell公司研制的DSTJ-3000智能壓差壓力傳感器在同一塊半導體基片上用離子注入法配置擴散了壓差、靜壓和溫度三個敏感元件,整個傳感器還包括變換器、多路轉換器、脈沖調制、微處理器和數字量輸出接口等。
智能傳感器是測量技術、半導體技術、計算技術、信息處理技術、微電子學、材料科學互相結合的綜合密集型技術。目前各國科學家正在按下列技術途徑開發研究:
(1)利用新型材料研制基本傳感器。基本傳感器是智能傳感器的基礎,它的制作及其性能對整個智能傳感器影響甚大。除硅材料具有優良的物理特性,能夠方便地制成各種集成傳感器。此外還有功能陶瓷、石英、記憶合金等都是制作傳感器的優質材料。
(2)利用新的加工技術。近年來利用微加工技術日趨成熟,可以加工高性能的微結構傳感器、ASIC制作技術,也可用于制造智能傳感器。
(3)采用新的測量原理和方法。諧振式傳感器輸出數字量,可以直接和微機及接口總線連接,不用A/D轉換器。另外,光纖傳感器、化學傳感器、生物傳感器新型傳感器,為智能傳感器提供新的信息來源。■
參考文獻
1.Clarkson M. Smart Sensors. Sensors, 1997, 14:14
2.White N. Intelligent Sensors. Sensor Review 1997,17(2);9
3.ィンテリヅェントセンサシステムの現狀と展望。日本電氣學會,電氣學會技術報告(Ⅱ)部第272號,昭和63年6月,P4~5
據統計,2017年中國人工智能核心產業規模超過700億元,隨著各地人工智能建設的逐步啟動,預計到2020年,中國人工智能核心產業規模將超過1600億元,年復合增長率將達31.7%。
隨著人工智能技術的不斷成熟,人工智能創業的難度逐步降低,越來越多的創業公司加入人工智能的陣營。
2018年被稱為人工智能爆發的元年,人工智能技術應用所催生的商業價值逐步凸顯。人工智能逐步切入到社會生活的方方面面,帶來生產效率及生活品質的大幅提升。智能紅利時代開啟!資本、巨頭和創業公司紛紛涌入,將人工智能拉到了信息產業革命的風口。
如何把握產業動向,抓住風口機會?創業邦研究中心憑借在人工智能等前言科技領域持續研究、洞察的能力,在對國內人工智能創業公司進行系統調研的基礎上,推出《2018中國人工智能白皮書》,對人工智能的核心技術、主要應用領域、巨頭和創業公司的布局、未來發展態勢和投資機會進行了深度解析。
第一部分人工智能行業發展概述
1.人工智能概念及發展
人工智能(Artificial Intelligence, AI)又稱機器智能,是指由人制造出來的機器所表現出來的智能,即通過普通計算機程序的手段實現的類人智能技術。
自1956年達特茅斯會議提出“人工智能”的概念以來,“人工智能”經歷了寒冬與交替的起起伏伏60多年的發展歷程。2010年以后,深度學習的發展推動語音識別、圖像識別和自然語言處理等技術取得了驚人突破,前所未有的人工智能商業化和全球化浪潮席卷而來。
人工智能發展歷程
2.人工智能產業鏈圖譜
人工智能產業鏈可以分為基礎設施層、應用技術層和行業應用層。
A基礎層,主要有基礎數據提供商、半導體芯片供應商、傳感器供應商和云服務商。
B技術層,主要有語音識別、自然語言處理、計算機視覺、深度學習技術提供商。
C應用層,主要是把人工智能相關技術集成到自己的產品和服務中,然后切入特定場景。目前來看,自動駕駛、醫療、安防、金融、營銷等領域是業內人士普遍比較看好方向。
人工智能產業鏈
資料來源:創業邦研究中心
第二部分人工智能行業巨頭布局
巨頭積極尋找人工智能落地場景,B、C 端全面發力。
資料來源:券商報告、互聯網公開信息,創業邦研究中心整理
第三部分機器視覺技術解讀及行業分析
1.機器視覺技術概念
機器視覺是指通過用計算機或圖像處理器及相關設備來模擬人類視覺,以讓機器獲得相關的視覺信息并加以理解,它是將圖像轉換成數字信號進行分析處理的技術。
機器視覺的兩個組成部分
資料來源:互聯網公開信息,創業邦研究中心整理
2.發展關鍵要素:數據、算力和算法
數據、算力和算法是影響機器視覺行業發展的三要素。 人工智能正在像嬰兒一樣成長,機器不再只是通過特定的編程完成任務,而是通過不斷學習來掌握本領,這主要依賴高效的模型算法進行大量數據訓練,其背后需要具備高性能計算能力的軟硬件作為支撐。
深度學習出現后,機器視覺的主要識別方式發生重大轉變,自學習狀態成為視覺識別主流,即機器從海量數據里自行歸納特征,然后按照該特征規律使圖像識別的精準度也得到極大的提升,從70%+提升到95%。
3.商業模式分析
機器視覺包括軟件平臺開發和軟硬件一體解決方案服務。整體用戶更偏向于B端。軟件服務提供商作為技術算法的驅動者,其商業模式應以“技術層+場景應用”作為突破口。軟硬件一體化服務供應商作為生態構建者,適合以“全產業鏈生態+場景應用”作為突破口,加速商業化。
(1)軟件服務:技術算法驅動者—“技術層+場景應用”作為突破口
這種商業模式主要是提供以工程師為主的企業級軟件服務。有海量數據支撐,構建起功能和信息架構較為復雜的生態系統,推動最末端的消費者體驗。
此類商業模式成功關鍵因素:深耕算法和通用技術,建立技術優勢,同時以場景應用為入口,積累用戶軟件。視覺軟件服務按處理方式和存儲位置的不同可分為在線API、離線SDK、私有云等。
國內外基礎算法應用對比
資料來源:互聯網公開信息,創業邦研究中心整理
(2)軟硬件一體化:生態構建者—“全產業鏈生態+場景應用”作為突破口
軟硬一體化的商業模式是一種“終端+軟件+服務”全產業鏈體系。成功的因素是大量算力投入,海量優質數據積累,建立算法平臺、通用技術平臺和應用平臺,以場景為入口,積累用戶。亮點是打造終端、操作系統、應用和服務一體化的生態系統,各部分相輔相承,銳化企業競爭力,在產業鏈中擁有更多話語權。
4.投資方向
(1)前端智能化,低成本的視覺解決模塊或設備
從需求層面講,一些場景對實時響應是有很高要求的。提供某些前端就本身有一定計算能力的低成本的視覺模塊和設備將有很大市場需求。前置計算讓前端設備成為數據采集設備和數據處理單元的合體,一方面提升了處理速度,另一方面可以處理云端難以解決的問題。
機器視覺在消費領域落地的一個障礙是支持高性能運算的低功耗、低價位芯片選擇太少。從低功耗、高運算能力的芯片出發,結合先進的算法開發模塊和產品,這類企業將在機器視覺領域擁有核心競爭力。
(2)深度學習解決視覺算法場景的專用芯片
以AI芯片方式作為視覺處理芯片有相當大的市場空間。以手勢識別為例,傳統的識別方案大都基于顏色空間,如 RGB,HSV ,YCrBr,無法排除類膚色物體及黑色皮膚對識別精度的干擾。借助深度學習,如通過 R-CNN 訓練大量標注后的手勢圖像數據,得到的模型在處理帶有復雜背景及暗光環境下的手勢識別問題時,比傳統方案的效果好很多。
(3)新興服務領域的特殊應用
前沿技術帶來的新領域(如無人車、服務機器人、谷歌眼鏡等),對機器視覺提出了新要求。機器視覺可以讓機器人在多種場合實現應用。服務機器人與工業機器人最大的區別就是多維空間的應用。目前國內的機器視覺,涉及三維空間、多維空間,其技術基本上處在初始階段,未來存在較大市場增長空間。
(4)數據是爭奪要點,應用場景是著力關鍵
機器視覺的研究雖然始于學術界,但作為商業應用,能解決實際問題才是核心的競爭力。當一家公司先天能夠獲得大量連續不斷的優質場景數據,又有挖掘該數據價值的先進技術時,商業模式和數據模式上就能形成協同效應。創業公司要么通過自有平臺獲取數據,要么選擇與擁有數據源的公司進行合作,同時選擇一個商業落地的方向,實現快速的數據循環。
第四部分智能語言技術解讀及行業分析
1.語音識別技術
(1)語音識別技術已趨成熟,全球應用持續升溫
語音識別技術已趨成熟,全球應用持續升溫。語音識別技術經歷了長達60年的發展,近年來機器學習和深度神經網絡的引入,使得語音識別的準確率提升到足以在實際場景中應用。深度神經網絡逐步找到模型結構和調參算法來替代或結合高斯混合算法和HMM算法,在識別率上取得突破。根據Google Trends統計,自2008年iPhone及谷歌語音搜索推出以來語音搜索增長超35倍。百度人工智能專家吳恩達預測,2020年語音及圖像搜索占比有望達到50%。Echo熱銷超過400萬,帶動智能音箱熱潮。
(2)語音識別進入巨頭崛起時代,開放平臺擴大生態圈成主流
語音識別即將進入大規模產業化時代。隨著亞馬遜Echo的大賣,語音交互技術催生的新商機,吸引大大小小的公司構建自己主導的語音生態產業鏈。各大公司紛紛開放各自的智能語音平臺和語音能力,欲吸引更多玩家進入他們的生態系統。
(3)語音識別技術發展瓶頸與趨勢
低噪聲語料下的高識別率在現實環境使用中會明顯下降到70-80%,遠場識別、復雜噪聲環境和特異性口音的識別是下一個階段需要解決的問題。
麥克風陣列類前端技術不僅是通過降噪和聲源定位帶來識別率的提高,帶環境音的語料的搜集、標注可用于模型的訓練,有助于打造更新一代的語音識別引擎技術。語音巨頭已經在布局。
在IOT包括車載領域,云端識別并非通行的最優方案,把識別引擎結合場景進行裁剪后往芯片端遷徙是工程化發展的方向。
2.自然語言處理(NLP)發展現狀
(1)多技術融合應用促進NLP技術及應用的發展
深度學習、算力和大數據的爆發極大促進了自然語言處理技術的發展。深度學習在某些語言問題上正在取得很大的突破,比如翻譯和寫作。2014年開始LSTM、Word2Vec以及Attention Model等技術研究的進展,使DL有了路徑在語義理解領域取得突破,并且已經有了明顯的進展。對話、翻譯、寫作新技術成果里都開始逐漸混合入DL的框架。2014-2015年,硅谷在語義理解領域的投資熱度劇增。
深度學習能最大程度發揮對大數據和算力資源的利用,語義理解的發展還需要深度學習、搜索算法、知識圖譜、記憶網絡等知識的協同應用,應用場景越明確(如客服/助理),邏輯推理要求越淺(如翻譯),知識圖譜領域越成熟(如數據飽和度和標準性較強的行業),技術上實現可能性相對較低。在各種技術融合應用發展的情況下,具備獲取一定優質數據資源能力并可結合行業Domain knowledge構建出技術、產品、用戶反饋閉環的企業會有更好的發展機會。
(2)NLP主要應用場景
問答系統。問答系統能用準確、簡潔的自然語言回答用戶用自然語言提出的問題。基本工作原理是在線做匹配和排序。比如 IBM 的 Watson,典型的辦法是把問答用FAQ索引起來,與搜索引擎相似。對每一個新問題進行檢索,再將回答按匹配度進行排序,把最有可能的答案排在前面,往往就取第一個作為答案返回給用戶。
圖像檢索。同樣也是基于深度學習技術,跨模態地把文本和圖片聯系起來。
機器翻譯。機器翻譯的歷史被認為與自然語言處理的歷史是一樣的。最近,深度學習被成功地運用到機器翻譯里,使得機器翻譯的準確率大幅度提升。
對話系統。對話系統的回復是完全開放的,要求機器能準確地理解問題,并且基于自身的知識系統和對于對話目標的理解,去生成一個回復。
(3)創業公司的機遇
1)機器翻譯方面:經過多年的探索,機器翻譯的水平已經得到大幅度提升,在很多垂直領域已經能夠在相當大程度上替代一部分人工,機器翻譯技術的商業化應用已經開始進入大規模爆發的前夜。
2)應用于垂直領域的自然語言處理技術
避開巨頭們對語音交互入口的競爭,以某一細分行業為切入點,深耕垂直領域,對創業公司也是一個不錯的選擇。
第五部分人工智能在金融行業的應用分析
人工智能產業鏈包含基礎層、技術層、應用層三個層面。基礎層的大數據、云計算等細分技術被應用到金融征信、保險、理財管理、支付等金融細分領域;技術層的機器學習、神經網絡與知識圖譜應用于金融領域的征信與反欺詐、智能投顧、智能量化交易,計算機視覺與生物識別應用于金融領域的身份識別,語音識別及自然語言處理應用于金融領域的智能客服、智能投研;應用層的認知智能應用于金融領域的智能風控。
人工智能在金融行業的典型應用情況
資料來源:創業邦研究中心
第六部分人工智能在醫療行業的應用分析
1.人工智能在醫療行業的應用圖譜
人工智能在醫療行業的應用潛力巨大,目前在健康管理、輔助診療、虛擬助理、醫學影像、智能化器械、藥物挖掘和醫院管理等領域均有企業在布局,其中醫學影像、藥物挖掘、健康管理,輔助診療、虛擬助理的應用發展速度較快。
圖 人工智能在醫療行業的應用圖譜
資料來源:創業邦研究中心
2.人工智能在醫療行業的具體應用場景
醫學影像。人工智能應用于醫學影像,通過深度學習,實現機器對醫學影像的分析判斷,是協助醫生完成診斷、治療工作的一種輔助工具,幫助更快的獲取影像信息,進行定性定量分析,提升醫生看圖/讀圖的效率,協助發現隱藏病灶。 人工智能通過影像分類、目標檢測、圖像分割、圖像檢索等方式,完成病灶識別與標注,三維重建,靶區自動勾畫與自適應放療等功能,應用在疾病的篩查、診斷和治療階段。目前較為火熱的應用有肺部篩查、糖網篩查、腫瘤診斷和治療等。
藥物挖掘。人工智能在藥物研發上的應用可總結為臨床前和臨床后兩個階段。臨床前階段:將深度學習技術應用于藥物臨床前研究,在計算機上模擬藥物篩選的過程,包括靶點選擇、藥效和晶型分析等,預測化合物的活性、穩定性和副作用,快速 、準確地挖掘和篩選合適的化合物或生物,提高篩選效率,優化構效關系。臨床后階段:針對臨床試驗的不同階段,利用人工智能技術對患者病歷進行分析,迅速篩選符合條件的被試者,監測管理臨床試驗過程中的患者服藥依從性和數據收集過程,提高臨床試驗的準確性。
虛擬助理。醫療虛擬助理是基于醫療領域的知識系統,通過人工智能技術實現人機交互,從而在就醫過程中,承擔診前問詢、診中記錄等工作,成為醫務人員的合作伙伴,使醫生有更多時間可以與患者互動。醫療虛擬助理根據參與就醫過程的功能不同,主要有智能導診分診,智能問診,用藥咨詢和語音電子病歷等方向。
第七部分智能駕駛行業分析
1.智能駕駛行業產業鏈
智能駕駛行業的中心業務是以Google、百度為代表的智能駕駛操縱解決方案提供商和以特斯拉、蔚來為代表的成車廠商。該類廠商,上接上游軟硬件提供商,下接公司和消費者,在整個業務鏈中扮演至關重要的一環。
產業鏈上游廠商多為細分技術提供商,如深度學習、人機交互、圖像識別和新材料、新制造新能源等。
智能駕駛產業鏈圖譜
資料來源:創業邦研究中心
2.智能駕駛市場分析
伴隨著 ADAS 技術的不斷更新,推斷全球 L1-L5 智能駕駛市場的滲透率會在接下來 5年內處于高速滲透期,然 后伴隨半無人駕駛的普及進入穩速增長期。在未來的 2025 年無人駕駛放量階段后,依賴全產業鏈的配合而進入市場成熟期。預測到2030年,全球 L4/5 級別的自動駕駛車輛滲透率將達到 15%,單車應用成本的顯著提升之 外,從 L1-L4 級別的智能駕駛功能全面滲透為汽車產業帶來全面的市場機會。
按照 IHS Automotive 保守估計,全球 L4/L5 自動駕駛汽車產量在 2025 年將接近 60 萬輛,并在 2025- 2035 年間獲得高速發展,年復合增長率將達到43%,并在2035年達到2100萬輛。另有接近 7600 萬輛的汽車具備部分自動駕駛功能,同時會帶動產業鏈衍生市場的大規模催化擴張。
根據獨立市場調研機構 Strategy Engineers 的預測,L4 高度自動駕駛等級下,自動駕駛零部件成本約在 3100 美元/車,其中硬件占比 45%,軟件占比 30%,系統整合占比 14%,車聯網部分占比 11%。按照全球 1 億輛量 產規模計算,理想假設所有車輛全部達到 L4 高度自動駕駛水平,那么全球自動駕駛零部件市場規模在 2020 年 將達到 3100 億美元。
第八部分中國人工智能企業畫像分析
隨著人工智能技術的不斷成熟,人工智能創業的難度逐步降低。創新的大門吸引眾多創業企業進入。為了觀察行業風向,助力創新企業發展,創業邦研究中心對國內200多家人工智能創業公司進行了系統調研,從發展能力、創新能力、融資能力等多維度指標,評選出“2018中國人工智能創新成長企業50強”。
地域分布
全國88%的人工智能企業聚集在北京、上海、廣東和江蘇。其中,北京人工智能企業最多,占比高達39.66%;其次是上海,人工智能企業占比達21.55%;位列第三的是廣東,人工智能企業占達15.52%。北京以領先全國其他地區的政策環境、人才儲備、產業基礎、資本支持等,成為人工智能創業首要陣地;華東地區的上海、江蘇、浙江均有良好的經濟基礎和科技實力,人工智能應用實力雄厚,也聚集了一批人工智能垂直產業園;廣東互聯網產業發達,企業對數據需求強烈,依靠大數據產業鏈推動人工智能產業發展。
行業分布
從行業大類分布來看,行業應用層的企業占比最大,為56.03%;其次是應用技術層的企業,占比達31.04%;基礎技術層的企業占比最小,僅為12.93%。隨著人工智能技術的發展,人工智能與場景深度融合,應用領域不斷擴展,行業應用公司比重不斷提升。在基礎層技術方面,國際IT巨頭占據行業領先地位, 國內與國際差距明顯,中小初創企業很難進入。
從行業應用來看,智能金融企業占比最大,為16.92%;其次是機器人企業,占比達15.38%;位列第三的是智能駕駛和智能教育,占比均為12.31%。金融行業的強數據導向為人工智能的落地提供了產業基礎,智慧金融被列入國家發展規劃中,龐大的金融市場為人工智能落地帶來了發展前景。機器人作為人工智能產業落地輸出, 目前市場需求較大,商業機器人占據較大份額。中國智能駕駛市場在資本推動下進入者較多,企業積極推動應用落地,百度、北汽等大型企業嘗試商業化落地智能駕駛汽車。人工智能推動教育個性化落地,相關初創企業涉入教育藍海,推動智慧教育的發展。
收入情況
收入分布在500-10000萬之間的企業最多,占比達49.14%;500萬以下的企業位居其次,占比達 26.72%;位列第三的是10000-100000萬之間的企業,占比為17.24%。
最新估值
企業最新估值均在億元級別,且分布較為均衡。三成企業估值超過15億元,還有企業估值達到百億級別,如優必
選科技、達闥科技和商湯科技等,將來或將躋身人工智能獨角獸企業。(備注:分析樣本量剔除一半未披露企業)
第九部分典型企業案例分析
1.Atman
企業概述
Atman由來自微軟的人工智能科學家和產業經驗豐富的產品團隊創辦,提供專業領域機器翻譯、機器寫作、知識圖譜、大數據智能采集挖掘等語言智能產品,致力于成為醫學、新聞、法律等專業領域語言智能專家,為專業領域用戶賦能,推動專業領域用戶進入人工智能時代,助力專業領域文字智能水平實現跨越式提升。Atman已為強生、新華社參考消息、北大法寶、君合律師事務所等世界領先藥企、新聞媒體、法律服務機構開發機器翻譯、機器寫作、知識圖譜、大數據智能采集挖掘等語言智能產品。
目前Atman在北京和蘇州兩地運營,能快速響應全國各地客戶需求。
企業團隊
創始人&CEO:馬磊
清華大學計算機系畢業,曾先后在微軟研究院和工程院擔任研究員和架構師,機器學習專家、多次創業者、曾主導多項人工智能重大項目,和申請國際專利共計15+項。
Atman公司核心團隊由來自微軟、百度、法電等領域高端人才和資深技術人才組成,公司員工40人,其中碩士以上學歷占比60%,技術開發人員占比70%,一半以上來自微軟亞洲研究院和工程院。
核心技術與產品
技術方面,擅長機器學習(深度學習、強化學習、群體智能)在復雜問題的應用,和國際專利15項,Atman神經網絡機器翻譯系統于2016年9月首秀,早于谷歌的GNMT,專業領域翻譯效果在公測標準和行業客戶測試中均持續領先。核心產品為垂直領域機器翻譯、機器寫作、知識圖譜抽取構建、大數據智能挖掘等語言智能產品。
Atman的機器翻譯產品可自動翻譯編輯專業文獻、報告、音視頻和網頁,支持私有部署和云端混合部署,提供包括數據隱私安全以及自學習的端到端解決方案。
機器寫作可對海量數據進行快速搜索、過濾、聚類,根據行業需求自動生成專業文檔,適用于所有專業寫作場景,可大幅減少專業報告寫作過程中的繁復工作,大幅提升專業領域寫作效率。
知識圖譜可實現海量數據的語義檢索、長鏈推理、意圖識別、因果分析,形成一個全局知識庫。大數據智能采集挖掘系統為專業領域用戶提供智能數據源管理、海量專業數據獲取和非結構化數據自動解析并結合知識圖譜提供auto-screening、知識重構、專業決策輔助,幫助用戶建立強大的以專業大數據為基礎的業務輔助能力。
2.黑芝麻
企業概述
黑芝麻智能科技有限公司是一家視覺感知核心技術與應用軟件開發企業,2016年分別在美國硅谷和上海成立研發中心,主攻領域為嵌入式圖像、計算機視覺,公司核心業務是提供基于圖像處理、計算圖像以及人工智能的嵌入式視覺感知平臺,為ADAS及自動駕駛提供完整的視覺感知方案。
目前公司和博世、滴滴、蔚來、上汽、上汽大通、EVCARD、中科創達、車聯天下和云樂新能源等展開深入合作,提供基于視覺的感知方案;除此之外,公司還在消費電子、智能家居等領域布局為智能終端提供視覺解決方案。目前公司已經完成A+輪融資。
企業團隊
團隊核心成員來自于OmniVision、博世、安霸、英偉達和高通等知名企業,平均擁有超過15年以上的產業經驗,畢業于清華、交大、中科大和浙大等知名高校。
創始人&CEO:單記章此前在硅谷一家全球頂尖的圖像傳感器公司工作近20年,離職前擔任該公司的技術副總裁一職,工作內容覆蓋了圖像傳感器研發和設計、圖像處理算法研發和圖像處理芯片設計。
核心技術和產品
在汽車領域,黑芝麻可提供車內監控方案(DMS),自動泊車方案(AVP),ADAS/自動駕駛感知平臺方案。黑芝麻智能科技提供的解決方案包括算法和芯片兩個核心部分:黑芝麻感知算法從基礎的控光技術,到面向AI的圖像處理技術出發來提高成像質量,以及應用深度神經網絡訓練,結合視頻處理和壓縮技術,形成從傳感器端到應用端的處理過程;黑芝麻芯片平臺采用獨有的神經網絡架構,包括獨有的圖像處理,視頻壓縮和計算機視覺模塊,與黑芝麻視覺算法結合,采用16nm制程,設計功耗2.5w,每秒浮點計算達20T。
3.乂學教育
企業概述
乂學教育,成立于2014年,是一家網絡教育培訓機構,采用人工智能和大數據技術,為學生提供量身定制學習解決方案和個性化學習內容。核心團隊來自美國Knewton、Realizeit、ALEKS等人工智能教育公司,銷售團隊有全國40億toC銷售額的經驗。
企業自主研發了針對中國K12領域的學生智適應學習產品,其核心部分是以高級算法為核心的智適應學習引擎“松鼠AI”,該產品擁有完整自主知識產權,能夠模擬真實特級教師教學。企業發表的學術論文得到了全球國際學術會議AIED、CSEDU、UMAP認可,并在紐約設計了人工智能教育實驗室,與斯坦福國際研究院(SRI)在硅谷成立了人工智能聯合實驗室。
主要產品
學生智適應學習是以學生為中心的智能化、個性化教育,在教、學、評、測、練等教學過程中應用人工智能技術,在模擬優秀教師的基礎之上,達到超越真人教學的目的。該產品性價比高,以人工智能+真人教師的模式,做到因材施教,有效解決傳統教育課時費用高,名師資源少,學習效率低等問題。
智適應學習人工智能系統
智適應學習人工智能系統模擬特級教師,采用圖論、概率圖模型,機器學習完成知識點拆分和個人學習畫像,采用神經網絡、邏輯斯蒂回歸和遺傳算法為學生實時動態推薦最佳學習路徑,實現個性化教育。
業務模式
線上與線下,2B和2C相結合。以松鼠AI智適應系統教學為主,真人教師輔助,學生通過互聯網在線上學習課程。開創教育新零售模式,授權線下合作學校,已在全國100多個城市開設500多家學校。
4.云從科技
企業概述
云從科技成立于2015年4月,是一家孵化于中國科學院重慶研究院的高科技企業,專注于計算機視覺與人工智 能。云從科技是人工智能行業國家隊,是中科院戰略先導項目人臉識別團隊唯一代表,唯一一家同時受邀制定人 臉識別國家標準、行業標準的企業。2018年,云從科技成為祖國“一帶一路”戰略實行路上的人工智能先鋒,與 非洲南部第二大經濟體津巴布韋政府完成簽約。
云從科技奠定了行業領導地位: 國家肯定,國家發改委2017、2018年人工智能重大工程承建單位;頂層設計,唯一同時制定國標、部標和行標的人工智能企業;模式創新,三大平臺解決方案,科學家平臺、核心技術平臺和行業應用平臺。
企業核心團隊
創始人
周曦博士,師從四院院士、計算機視覺之父—ThomasS.Huan黃煦濤教授,專注于人工智能識別領域的計算機視覺 研究。入選中科院“百人計劃”,曾任中國科學院重慶研究院信息所副所長、智能多媒體技術研究中心主任。
周曦博士帶領團隊曾在計算機視覺識別、圖像識別、音頻檢測等國際挑戰賽中7次奪冠;在國際頂級會議、雜志 上發表60余篇文章,被引用上千次。
核心技術團隊
云從科技依托美國UIUC和硅谷兩個前沿實驗室,中科院、上海交大兩個聯合實驗室上海、廣州、重慶、成都四 個研發中心組成的三級研發架構。目前研發團隊已經超過300人,80%以上擁有碩士學歷。
技術優勢
全方位多維智能學習模塊適應不同場景要求;模塊化設計為在工業視覺、醫學影像、自動駕駛AR等領域擴展打下良好基礎。
云從科技具有高技術壁壘:世界智能識別挑戰賽成績斐然,在CLEAR、 ASTAR、 PASCAL VOC、 IMAGENET、FERA以及微軟全球圖像識別挑戰賽上共計奪得7次世界冠軍;在銀行、公安等行業智能識別技術 PK實戰中,85次獲得第一;2018年,云從科技入選MIT全球十大突破性技術代表企業。
在跨鏡追蹤(ReID)技術上取得重大突破。Market-1501,DukeMTMC-reID,CUHK03三個數據同時集體刷 新世界記錄, Market-1501上的首位命中率達到96.6%,首次達到商用水平。
正式在國內“3D結構光人臉識別技術”,可全面應用于手機、電腦、機具、設備、家電。相較以往的2D人 臉識別及以紅外活體檢測技術,3D結構光人臉識別技術擁有不需要用戶進行任何動作配合完成活體驗證的功能, 分析時間壓縮到了毫秒級以及不受環境光線強弱的影響等諸多優點,受到國際巨頭公司的關注。
行業應用
目前國內有能力自建系統的銀行約為148家。截止2018年3月15日,已經完成招標的銀行約為121家,其中云從科 技中標了88家總行平臺,市場占有率約為72.7%;在安防領域推動中科院與公安部全面合作,通過公安部重大課題研發火眼人臉大數據平臺等智能化系統,在民航領域,已經與中科院重慶院合作覆蓋80%的樞紐機場。
5.Yi+
企業概述
北京陌上花科技是領先的計算機視覺引擎服務商,為企業提供視覺內容智能化和商業化解決方案。致力于“發現視覺信息的價值”。
旗下品牌Yi+是世界一流的人工智能計算機視覺引擎,衣+是時尚商品搜索引擎。公司在圖像視頻中對場景、通用物體、商品、人臉的檢測、識別、搜索及推薦均達到領先水平。
目前公司和阿里巴巴、愛奇藝、優酷土豆、中國有線、CIBN、中信國安、海信、華為、360等數十家頂級機構/產品深度合作,通過提供邊看邊買引擎、圖像視頻內容分析引擎、人臉識別引擎等基于視覺識別技術的數據結構化產品服務于海量用戶,同時幫助政府機構、廣電系統、內容媒體、零售商、電商、視聽設備等行業實現智能分析、智能互動與場景營銷。目前公司已經獲得B輪融資。
企業團隊
團隊成員來自于斯坦福、耶魯、帝國理工、新加坡國大、南洋理工、清華、北大、中科院等名校及谷歌、微軟、IBM、英特爾、阿里巴巴、騰訊、百度、華為等名企。
創始人&CEO:張默
北京大學軟件工程碩士, 南洋理工大學創業創新碩士。連續創業者, 曾任華為算法工程師、微軟WindowsMobile工程師、 IBM SmarterCity 架構師,北方區合作伙伴經理,主機Linux中國區負責人,中國區開源聯盟負責人,年銷售額數億。 2013年創業于美國硅谷和新加坡,2014年6月在中國設立北京陌上花科技有限公司。
核心技術與產品
技術方面,在國際頂級計算機視覺競賽ImageNet中,成績曾超過谷歌、斯坦福等,2015-2016年2年獲得十項世界第一。2018年3月,人臉識別準確率位列LFW榜首。Yi+通過遵循無限制,標記的外部數據協議。 Yi+的系統由人臉檢測,人臉對齊和人臉描述符提取組成。使用多重損失和訓練數據集訓練CNN模型,其中包含來自多個來源的約10M個圖像,其中包含150,000個人(訓練數據集與LFW沒有交集)。在測試時, Yi+使用原始的LFW圖像并應用簡單的L2norm。圖像對之間的相似性用歐氏距離來測量,最終取得優異成績。
公司的核心產品主要包括視覺搜索引擎,圖像視頻分析引擎以及人臉識別和分析引擎:
行業解決方案
針對營銷、安防、相機和電視的不同特點,推出相應解決方案。
營銷+AI。場景化廣告方案中,大屏AI助理信息流推薦、神字幕、物體/人臉AR動態貼圖、video-out、場景化角標與廣告濾鏡等形式的廣告內容推薦,適用于快消、汽車、電商、IT、金融、旅游服務等多個行業。
智慧城市+AI。使用計算及視覺助力智慧城市,在智慧安防、智慧交通、智慧園區等方面提供解決方案。在智慧安防實時識別上,實時處理直播攝像頭信息,算法反應敏捷,相應迅速。建立智慧園區方案模型,考慮擴展性&靈活性、數據管理、松散耦合性、安全性、實時整合性以及功能性和非功能性需求等技術方案要素,從業務和技術兩方面整合解決方案實現步驟。
電視+AI。電視+AI的解決方案賦予智能電視多樣播放能力和營銷能力。
相機+AI。相機更具交互能力。用戶通過搜索關鍵字標簽同步展示圖片,打通相冊和購物一站式體驗。準確識別人物屬性特征,動態適應表情變化,可以在視頻以及圖像中對人臉實時檢測,基于深度學習技術,進行人臉相似度檢測,實現面部關鍵點定位、妝容圖像渲染,試用與粉底、唇彩以及眼影等多種虛擬試裝方式。實時檢測攝像頭中出現的物品、場景和人臉等,添加AR效果,SDK支持本地檢測、識別、追蹤,平均檢測幀率可達到25fps。
新零售+AI。Yi+新零售解決方案是基于公司自主研發的人臉識別、商品識別和其他圖像識別算法技術為核心,建立一整套基于人臉、商品的智能零售門店管理方案。Yi+新零售解決方案主要包含數據采集、算法模型說明和部署方案三部分,其中數據采集包括人臉數據采集、商品數據采集;算法模型說明包括識別算法訓練、商品識別、識別輸出;部署方案包括本地部署、云端部署、本地部署與云端部署結合。
6.擎創科技
企業簡介
擎創科技成立于2016年,專注于將人工智能和機器學習賦予傳統IT運維/企業運營管理,為企業客戶提供智能運維大數據分析解決方案,從而取代和改善對高技能運維人員嚴重依賴的現狀。2017年,擎創科技已實現全年2000萬營收,迅速成為國內AIOps領域的領跑者和中流砥柱。2018年初,擎創科技完成了數千萬人民幣的A輪融資,由火山石投資領投,晨暉創投、元璟資本及新加坡STTelemedia跟投。
核心團隊
擎創團隊的核心成員主要由BMC、微軟等美國企業服務上市公司的運維老兵,與新浪、餓了么等知名互聯網公司的大數據、算法專家組成,核心團隊成員至少擁有10年以上的行業經驗。其中CEO楊辰是國內最頂級的B端銷售,曾帶領團隊獲得10倍的業績增長;CTO葛曉波擁有長達15年的企業級軟件開發和運維經驗;而產品總監屈中泠則來自甲方,創業前為浦發硅谷銀行企業架構師,深知甲方對企業運維產品的需求。這個曾經深耕于運維企業服務市場的團隊,如今在智能運維企業服務賽道繼續領跑,讓擎創科技成為最懂企業的客戶,最值得企業客戶信賴的軟件廠商。
主要產品
“夏洛克AIOps” 作為擎創自主研發的大數據智能運維主打產品,自2016年上線以來,已從1.0版本升級至1.9版本,可應用在金融、大型制造業、鐵路民航、能源電力等涉及國家發展和民生問題的多種行業。在2017全球運維大會上,夏洛克AIOps獲得由中國信息通信研究院與高效運維社區聯合頒發的“年度最具影響力AIOps產品”獎。
“夏洛克AIOps”充分利用自研算法輔助客戶實現IT運維價值,結合客戶的現有情況,規劃從傳統ITOM至AIOps智能運維的一站式路徑,助其運營落地,由此打破數據孤島,建立統一的大數據智能分析平臺,實現以人工智能為核心,驅動傳統IT運維監、管、控三個層面,并將相關運維數據及業務數據實時展現。
“夏洛克AIOps”擁有多項自研算法,猶如運維界的福爾摩斯,能迅速發現并定位運維問題的根因,實現秒級排障,最大程度避免企業產生重大損失。更有價值的是,“夏洛克AIOps”還能通過長期的數據積累和機器學習,運用新型深度神經網絡算法對企業的業務數據進行預測,幫助企業提前規劃IT資源,高效預防各類黑天鵝事件的發生。
商業模式
目前,擎創科技已與多家金融和制造行業標桿客戶形成穩定的合作關系,包括浦發銀行、浦發硅谷銀行、國家開發銀行、上海鐵路局、銀聯、海爾、浙江能源等。針對不同客戶,采用個性化的商業模式進行服務,目前主要有私有模式和SaaS模式兩種,都具有較強的可復制性。
核心優勢
1.無論從社會認知還是應用需求角度,中國從2017年3月開始正式進入人工智能驅動的經濟數字化轉型階段。
2.本研究根據大眾對人工智能的認知由淺入深分為基本認知、專業認知和技術認知三個層次。從全國來看,人工智能社會認知的過程先經歷平穩期,再進入快速上升期。基本認知和專業認知在2016年3月進入快速上升期,技術認知在2017年3月才進入快速上升期。
3.本研究從技術應用和行業應用兩個角度考察大眾對人工智能的應用需求,技術應用需求的發展先是經歷成長期和平穩期,在2017年進入躍升期,行業應用需求整體上一直是上升趨勢,但是目前逐漸趨于飽和。
4.無論是人工智能社會認知方面,還是應用需求方面,南方城市在排名上都比北方城市具有優勢,南方城市有集中在華東和華南地區;排名靠前的城市主要為北上廣深和省會城市。
5.從技術需求角度來看,北京、上海、深圳、廣州、成都、蘇州和重慶為“全技術需求驅動型”城市;武漢、南京、西安和長沙是“雙技術需求驅動型”城市,由語音語義和深度學習需求來驅動;杭州、鄭州、天津和濟南是“單技術需求驅動型”城市,由計算機視覺技術需求驅動。