<rt id="m4md3"></rt>
  • <bdo id="m4md3"><meter id="m4md3"></meter></bdo>
  • <label id="m4md3"></label>
      <center id="m4md3"><optgroup id="m4md3"></optgroup></center>
      產(chǎn)品分類

      當(dāng)前位置: 首頁 > 傳感測量產(chǎn)品 > 工業(yè)傳感器 > 視覺傳感器 > 3D視覺傳感器

      類型分類:
      科普知識
      數(shù)據(jù)分類:
      3D視覺傳感器

      探索多模態(tài)交互之智能語音、機(jī)器視覺、移動底盤之旅

      發(fā)布日期:2022-04-18 點(diǎn)擊率:54


      我們再談多模態(tài)交互之智能語音、機(jī)器視覺、移動底盤之間的結(jié)合。

      現(xiàn)在講多模態(tài)技術(shù)最難的地方就是各個企業(yè)之間,基本上都在自己熟系的領(lǐng)域去深耕,對相互之間的技術(shù)結(jié)合基本上都不是很熟系,這就困擾多模態(tài)技術(shù)之間的結(jié)合。

      從這次1號機(jī)器人網(wǎng)研討會上反饋的信息來看,機(jī)器人企業(yè)期待上游的企業(yè),如科大訊飛能夠提供再進(jìn)一步的技術(shù)方案,或者有能夠直接提供多模態(tài)交互技術(shù)的產(chǎn)品,而上游的技術(shù)企業(yè),則認(rèn)為這是終端機(jī)器人產(chǎn)品集成商應(yīng)做的事情。

      這就導(dǎo)致我們想要的多模態(tài)技術(shù)交互都是有缺陷的。

      在技術(shù)上來說,智能語音、機(jī)器視覺、移動底盤在使用的過程中都還存在問題,這讓很多機(jī)器人企業(yè)非常的折騰。

      從移動底盤上來說,深圳市步科電氣有限公司(簡稱:步科)營銷總監(jiān)溫琦說:“移動底盤產(chǎn)品是成熟的,可以應(yīng)用到各種機(jī)器人身上,但是目前確沒有成熟的SLAM技術(shù)方案。”

      還比如機(jī)器視覺,很多廠家都說,機(jī)器人植入深度視覺后,在行走的過程中,可以躲避障礙物,但是應(yīng)用到場景里,還是存在很多的問題,比如機(jī)器人前面多幾個人行走,就會導(dǎo)致機(jī)器人行走速度會變得很慢,或者直接不靈了。

      最后是智能語音,對很多機(jī)器人企業(yè)而言,目前是最頭疼的問題,因為很多語音企業(yè)都說識別準(zhǔn)確率高達(dá)90%以上,但是從機(jī)器人企業(yè)的反饋來看,應(yīng)用到場景里體驗是不好的。

      其實這里有一個問題,智能語音包括語音與語義,如果語音識別準(zhǔn)確率達(dá)到90%,語義識別準(zhǔn)確率也達(dá)到90%,其實這兩者是相乘的,一結(jié)合可能就只有81%的識別準(zhǔn)確率。

      而且目前我們所涉及的語義還只是文本,對于視頻、圖片、運(yùn)動數(shù)據(jù)等更多元的素材采集,基本上非常困難。

      深圳市狗尾草智能科技有限公司(簡稱:狗尾草)首席科學(xué)家張博說:“從多模態(tài)交互的角度去看,在目前的智能語音技術(shù)上,再去擴(kuò)展視頻、圖片、運(yùn)動數(shù)據(jù)等素材采集,我們只能通過語義處理語義,視頻處理視頻等方式去處理,如果要結(jié)合起來是非常困難的。”

      先不說把圖片、視頻、文本等結(jié)合,就算以文本的角度去講也很難,小I機(jī)器人售前顧問甘楚輝說:“小I的數(shù)據(jù)庫里,各個領(lǐng)域的知識庫是分開,如果要結(jié)合在一起,占用的資源會變得非常大,對整體的性能影響也會很大,就算要結(jié)合也只能是分開穿線。”

      所以在多模態(tài)交互的探索上,我們基本上還處在剛開始的階段。

      目前我們先不深入的去探究,站在我們現(xiàn)有的產(chǎn)品集成上,我們可以做到怎樣的多模態(tài)交互。

      把智能語音、移動底盤、機(jī)器視覺結(jié)合,目前已有落地的機(jī)器人產(chǎn)品。

      比如深圳市銳曼智能技術(shù)有限公司名下的小曼機(jī)器人,當(dāng)我們呼叫小曼機(jī)器人時,它是可以定位我們的聲源,甚至還可以走到我們的面前。

      科大訊飛股份有限公司(簡稱:科大訊飛)商務(wù)總監(jiān)廖凱說:“這三者結(jié)合的多模態(tài)交互,在生活中可以做到,我在與機(jī)器人一邊走路,一邊講話的時候,它是可以進(jìn)行人臉的捕捉,移動的追蹤,所以它會在移動時面朝著你,這會讓你感覺非常好。”

      就從這三個技術(shù)的成熟度來講,在這次研討會上,很多嘉賓認(rèn)為,以目前的技術(shù)水平,能夠?qū)崿F(xiàn)產(chǎn)品盈利的也只能是玩具級的產(chǎn)品,如果是商用級的產(chǎn)品,我們還需要花很長的時間做研發(fā)投入。

      過去我們追捧機(jī)器人+資本的模式,通過資本的進(jìn)入去進(jìn)行產(chǎn)品技術(shù)的研發(fā),但是這條路從去年以來已經(jīng)變得越來越窄。

      如果還只是拿上游企業(yè)的產(chǎn)品,比如:智能語音、移動底盤、機(jī)器視覺,再進(jìn)行定制化場景應(yīng)用的機(jī)器人,估計已經(jīng)很難再拿到資本。

      因為很多投資人已經(jīng)知道內(nèi)部的事情,而且也知道內(nèi)部細(xì)節(jié)的難度在哪里。尤其是融合的階段,什么技術(shù)處于可商業(yè)化,什么技術(shù)還達(dá)不到商業(yè)化的階段,所以對機(jī)器人創(chuàng)業(yè)者而來,我們自己也需要理性化,做一些深思熟慮的判斷。

      從營銷策略的角度去分析,特別是對于玩具級別的機(jī)器人產(chǎn)品,我們不要過分讓用戶對產(chǎn)品有太高的期望,廖凱說:“我之前有一個客戶是做香味盒,在這個香味盒上植入了語音交互功能,坦白說,他們二次開發(fā)的語音交互體驗做的并不好,但對用戶而言,就算體驗不好,但是它還是可以提供香味需求。”

      往往我們能夠抓住跟智能無關(guān)的點(diǎn),就會有用戶粘性,其實用戶會給你一個容忍度,給你升級迭代的機(jī)會,但是我們不能給用戶太高的期望。

      在商業(yè)級的服務(wù)機(jī)器人里也有成功的例子,溫琦說:“美國企業(yè)做出來的很多機(jī)器人是在商場里做分揀,它不是服務(wù)于人,或與人做交互,而是為商場管理貨物提高效率。”


      下一篇: PLC、DCS、FCS三大控

      上一篇: 索爾維全系列Solef?PV

      推薦產(chǎn)品

      更多
      主站蜘蛛池模板: 久久精品桃花综合| 热久久综合这里只有精品电影| 色综合久久中文字幕| 天天做天天爱天天爽综合网 | 亚洲熟女综合色一区二区三区 | 狠狠色丁香婷婷综合精品视频| 亚洲综合激情另类小说区| 亚洲国产欧洲综合997久久| 国产综合无码一区二区辣椒| 亚洲欧美熟妇综合久久久久| 久久99精品久久久久久综合| 尹人久久大香找蕉综合影院| 亚洲婷婷第一狠人综合精品| 亚洲综合色视频在线观看| 色综合久久综合网| 久久久综合九色合综国产精品| 国产综合精品一区二区| 狠狠色综合网久久久久久| 久久婷婷五月综合97色| 在线综合亚洲欧洲综合网站| 亚洲五月综合缴情在线观看| 伊人久久大香线蕉综合爱婷婷| 色综合久久久久综合99| 国产成人综合精品| 婷婷六月久久综合丁香可观看| 欧洲 亚洲 国产图片综合| 色欲香天天天综合网站| 97久久久精品综合88久久| 伊人yinren6综合网色狠狠| 亚洲 欧洲 日韩 综合在线| 久久香综合精品久久伊人| 亚洲精品综合在线影院| 色天使亚洲综合一区二区| 亚洲色偷偷狠狠综合网| 亚洲伊人久久大香线蕉综合图片| 久久91精品久久91综合| 亚洲精品综合在线影院| 国产成人亚洲综合a∨| 色综合合久久天天给综看| 亚洲av综合av一区| 亚洲国产成人综合精品|