服務(wù)機器人想要達(dá)到智能化程度,定位導(dǎo)航、人機交互及環(huán)境交互這三大通用底層技術(shù)必不可少,上一篇對于定位導(dǎo)航技術(shù)我們已做出詳細(xì)講解,感興趣的小伙伴可點擊《智能機器人三大核心技術(shù)(一)》進(jìn)行查看。在擁有基礎(chǔ)的自主定位導(dǎo)航技術(shù)后,機器人想要進(jìn)一步發(fā)揮自身作用,還需要擁有人機交互能力。人機交互技術(shù)可讓機器人進(jìn)一步了解人類,了解用戶訴求,從而為用戶提供更個性化的服務(wù)。
從第一代以鍵盤鼠標(biāo)為交互方式的PC互聯(lián)網(wǎng)時代,到第二代以觸屏為主的移動互聯(lián)網(wǎng)時代,再到今天以多模態(tài)人機交互方式的第三代互聯(lián)網(wǎng),人機交互形式發(fā)生了巨大的變化。
目前,人機交互技術(shù)主要包含語音識別、語義理解、人臉識別、圖像識別、體感/手勢交互等技術(shù)。通過語音識別、合成、理解等技術(shù),實現(xiàn)更精準(zhǔn)的營銷和專屬服務(wù)。通過人臉識別,可幫助商家精準(zhǔn)的識別用戶,并主動與用戶打招呼,提升用戶體驗……。這些交互方式的改變將會深層次的影響我們?nèi)粘I畹膽?yīng)用場景。
基于語音的人機交互是當(dāng)前人機交互技術(shù)中最為主要的表現(xiàn)形式,語音人機交互過程中包含信息輸入和輸出的交互、語音處理、語義分析、智能邏輯處理以及知識和內(nèi)容的整合。結(jié)合語音人機交互過程,在人機交互中的關(guān)鍵技術(shù)中包含了自然語音處理、語義分析和理解、知識構(gòu)建和學(xué)習(xí)體系、語音技術(shù)、整合通信技術(shù)以及云計算處理技術(shù)。
自然語音處理技術(shù):包括中文分詞、詞性標(biāo)注、實體識別、句法分析、自動文本分類等技術(shù)。
語義分析和理解:包括知識表示、本體理論、分領(lǐng)域的語義網(wǎng)絡(luò)、機器推理等。
知識構(gòu)建和學(xué)習(xí)體系:包括搜索技術(shù)、網(wǎng)絡(luò)爬蟲、數(shù)據(jù)挖掘、知識獲取、機器學(xué)習(xí)等技術(shù)。
語音技術(shù):包括語音識別、語音合成和聲紋識別等。
整合通信技術(shù):包括跨平臺即時通訊整合技術(shù)、超大負(fù)載消息集群處理技術(shù)、移動客戶端開發(fā)技術(shù)。
云計算技術(shù):包括海量數(shù)據(jù)分布式存儲、統(tǒng)計和分析技術(shù)。
經(jīng)過科研人員的不斷努力,目前語音交互技術(shù)已成功進(jìn)入商用門檻,如今在智能手機、智能音箱、智能臺燈等設(shè)備中大多采用了語音人機交互技術(shù),隨著語音人機交互技術(shù)應(yīng)用價值的逐漸顯現(xiàn),眾多企業(yè)紛紛布局語音人機交互領(lǐng)域,如科大訊飛、谷歌、捷通華聲等企業(yè)。隨著布局企業(yè)的不斷增多,語音人機交互的產(chǎn)業(yè)規(guī)模也在不斷擴大,并帶動了機器人、家電、汽車等相關(guān)產(chǎn)業(yè)的發(fā)展。
除了語音人機交互,基于視覺的人機交互技術(shù)也是目前研究的一大熱點,對于一個人來說最為主觀的就是看臉部表情,未來機器人也需要理解人的感情,這當(dāng)中就會涉及到人臉識別技術(shù),包括特征提取及分類,目前在該技術(shù)中,對于人類基本的七種表情識別率可達(dá)到百分之八十左右,當(dāng)然目前還是一些比較明顯的表情,如在高興或者發(fā)怒的情況下,但在人的自然交流過程中,人的表情還是比較平淡的,對于機器人來說,目前還難以達(dá)到準(zhǔn)確的分辨效果,這些過程是需要進(jìn)行一些更加復(fù)雜的特征來提取。
當(dāng)然,除了對臉部表情的理解,手勢也是人最為直接的表現(xiàn)形式,通過一些手勢也可以達(dá)到很多的命令,不同的手勢形狀可以構(gòu)成不同的動作指令。雖然手勢有很多種,但可以找到比較容易記憶的手勢,然后進(jìn)行交互。
手勢識別是人機交互的重要手段之一,通過手部的動作直接控制計算機,相比傳統(tǒng)的鍵盤、鼠標(biāo)等控制方式,具有自然直觀和便于學(xué)習(xí)等優(yōu)點。
目前常用的手勢識別方法主要包括基于神經(jīng)網(wǎng)絡(luò)的識別方法、基于隱馬爾可夫模型的識別方法和基于幾何特征的識別方法。基于神經(jīng)網(wǎng)絡(luò)的手勢識別方法,具有抗干擾、自組織、自學(xué)習(xí)且抗 噪聲能力等優(yōu)點,但訓(xùn)練時需要采集的樣本量大,且對時間序列的處理能力不強?;陔[馬爾可夫模型的識別方法,能夠細(xì)致的描述手勢信號,但拓?fù)浣Y(jié)構(gòu)一般,計算量相對較大?;趲缀翁卣鞯淖R別方法,是根據(jù)手的區(qū)域及邊緣 幾何特征關(guān)系進(jìn)行手勢識別,該方法無需對手勢進(jìn)行時間上的分割,計算量小,
隨著移動機器人和手勢識別的發(fā)展,人機交互技術(shù)也在不斷更新,自從微軟推出Kinect體感外設(shè)以來,自然的人機交互成為當(dāng)前的研究熱點,通過Kinect外設(shè),可以解除人們受鍵盤、鼠標(biāo)等傳統(tǒng)交互方式的束縛,具有重要的意義。
聲明:本欄目僅代表作者個人觀點,不代表思嵐科技立場
關(guān)鍵字:机器人核心技术,人机交互,机器人