2017年12月14日下午6:00左右,樂山女子王某如往常一樣外出夜跑,但并未按時回家。讓人沒有想到的是7天后,警方在綠心公園一處偏僻的竹林下面發(fā)現(xiàn)了遇害的王某。警方勘察后發(fā)現(xiàn),通過街邊的監(jiān)控錄像顯示,王某最后在唐灣附近出現(xiàn)過,當時時間是6:23,此后便再無錄像記錄。
2020年9月14日晚,廣東揭陽普寧市發(fā)生一起搶劫猥褻單身女高中生事件。男子欲對一名獨自騎車回家的女高中生實施搶劫,因天色較晚,路上車輛以及行人并沒有回應(yīng)女孩呼救。案件發(fā)生后,普寧警方通過調(diào)取監(jiān)控,鎖定了犯罪嫌疑人。
社會安全問題正如人性的弱點一樣不可琢磨、不可完全壓制,但家人智能認為,在當今不計其數(shù)的社會安全解決方案中,一種讓人們在遇到危險的時候用于自救求助,并可以在最短時間內(nèi)獲得幫助的方法將在生活中挽救更多身處于危險的人們。
社會百態(tài)——遇到危險喊救命還管用么?
自媒體行業(yè)興起,有太多的公眾號文章、視頻告訴我們:走夜路要盡量走在有攝像頭的馬路上,要學會防身術(shù)招式以備一招制敵,被歹徒拖拽要掙扎并破壞路邊門市店鋪的設(shè)施以求幫助。為什么傳統(tǒng)的“喊救命”,放在現(xiàn)在好像“沒那么好用“了?
而從個人能力的角度出發(fā),施救者并不足以有對抗歹徒的能力,所以選擇先保護好自己再幫助報警,等待警察到來的方式,久而久之,就會產(chǎn)生就算喊“救命”也不會獲得幫助的感覺??偨Y(jié)多起社會安全事件的發(fā)生地點來看,很多案件都是發(fā)生在較為偏僻的城市角落,人煙稀少,受害者大聲呼喊也許真的不會被路人聽見。并且,絕大多數(shù)的視頻監(jiān)控,并沒有音頻收音的功能,大喊救命,回應(yīng)者寥寥。
在當下的智慧城市建設(shè)中,雖然視頻監(jiān)控仍然是社會安全保護的“主力軍”,但能夠聽取到呼救聲的音頻設(shè)備作為智慧城市中的空白,已暴露出單一視頻監(jiān)控的短板:在危險突發(fā)時,單一視頻監(jiān)控的后臺工作人員往往因不能夠?qū)崟r監(jiān)控屏幕及時發(fā)現(xiàn)情況,導致監(jiān)控視頻只能起到記錄現(xiàn)場狀況、用于事后追溯的用途。因此,搭載音頻功能的監(jiān)控設(shè)備將及時收取到現(xiàn)場聲音,在第一時間引起安防人員重視,再配合視頻監(jiān)控查看現(xiàn)場狀況迅速處理,才能夠全方位的監(jiān)控現(xiàn)場。
家智哨衛(wèi)——耳聞目睹,守護安全
雖然路邊的“天眼”、“監(jiān)控攝像頭”能快速地為偵查破案提供幫助,但是為了更進一步從源頭上有效遏制犯罪行為的發(fā)生,視頻監(jiān)控設(shè)備已經(jīng)不能滿足需求。因此,家人智能專注深耕戶外場景,基于自主采集的戶外聲音數(shù)據(jù)和自主研發(fā)的多重戶外深度學習算法,首度研發(fā)出通過AI技術(shù)識別異常聲音并自動報警的設(shè)備,將AI能力賦予治安防控工程前端設(shè)備。這種戶外AI音頻識別設(shè)備與已成熟建設(shè)的視頻監(jiān)控設(shè)施聯(lián)動,最大程度遏制暴力事件發(fā)生,真正做到?jīng)]有漏報。
家人智能“哨衛(wèi)”系列AI音頻報警設(shè)備全天候監(jiān)控5-10米范圍內(nèi)聲音,一旦監(jiān)測到“救命”、“搶劫”、“報警”等呼救類關(guān)鍵詞,設(shè)備立刻自動報警并聲光震懾,同時安保人員可通過設(shè)備實時對講驅(qū)離歹徒并與報警人溝通,不僅可以實時報警還能及時中止犯罪行為,可有效解決傳統(tǒng)監(jiān)控手段下,呼救聽不到、報警按鍵按不到、監(jiān)控視頻看不全的“三不”難題,將事后追溯轉(zhuǎn)變?yōu)槭虑邦A警及事中干涉。
市場上有眾多關(guān)于音頻的電子智能設(shè)備,但是幾乎無人去做針對于戶外報警的音頻設(shè)備,說明其中暗藏的“玄機”具備了極大的技術(shù)挑戰(zhàn)。家人智能戶外AI+音頻報警設(shè)備——哨衛(wèi),直面“戶外”、“遠距離”、“短詞”三大音頻識別研發(fā)難點。
1. 短詞
無論是從訓練還是從識別的角度來說,識別目標詞越長,特征信息越豐富,越容易獲得較高的喚醒率和準確度。相比市場上絕大多數(shù)的智能音頻產(chǎn)品的喚醒詞,比如Amazon的“Alexa”,Apple的“Hey Siri”,百度的“小度小度”,小米的“小愛同學”等來說,在戶外安防場景中,“救命”關(guān)鍵詞是一個相對短促的多的人聲信號,被侵犯人可能只有一次喊“救命”的機會,從復雜的戶外聲音環(huán)境中去準確識別,對于聲音處理和算法來說是一個極大的技術(shù)挑戰(zhàn)。
2. 遠距離
在智能家居場景中,考慮到房屋格局等因素,智能音箱的識別距離大多在5米以內(nèi)。所以我們通常認為的“遠場聲音識別”,通常是指這個距離范疇。然而對于戶外音頻識別場景來說,5米是一個相對來說剛剛夠用的距離。更遠的10米,甚至20米距離才是戶外音頻識別最期待的距離范疇。例如,已經(jīng)在很多城市商業(yè)化落地的“非法鳴笛識別抓拍”場景中,產(chǎn)品的有效識別距離參數(shù)一般都在20-30米。
但根據(jù)家人智能模擬測試結(jié)果表明:被侵犯人傾盡全力的一聲“救命”,分貝值90db左右,經(jīng)過長達10-20米的傳播之后,聲音的能量呈幾何指數(shù)級下降,信噪比大幅降低。在城市路面周邊、公園濱河路線、校園門口等底噪較大場所,聲音遠距離衰減尤為明顯。因此想要在如此低的信噪比情況下準確識別出短促的“救命”等關(guān)鍵報警詞語,是對算法和場景數(shù)據(jù)收集的雙重挑戰(zhàn)。
3. 戶外
人工智能三大要素之一的“數(shù)據(jù)”,一直以來都是AI訓練的瓶頸難題。如何精準的收集正樣本數(shù)據(jù),這對于戶外音頻識別來說,也是一個需要從0做起的工作。這里的正樣本數(shù)據(jù)采集困難,不僅是必須采集來自于戶外的“救命”等短促人聲,還要覆蓋盡可能多的戶外場景。
戶外場景的多樣性,包含位置的多樣性,如路邊、學校、車站等;包含發(fā)聲者的多樣性,如各個年齡段男女老幼、各地口音方言的發(fā)音等;包含環(huán)境的多樣性,風雨雷電等聲音;包含與拾音設(shè)備相對位置的多樣性,距離、角度、高度等的不同聲音數(shù)據(jù)。行業(yè)里沒有任何一家公司擁有這樣豐富和全面的語料數(shù)據(jù)庫,這就需要盡可能多的覆蓋所有場景去收集正樣本,因此,這對戶外音頻識別來說,又是一個巨大挑戰(zhàn)。
家人智能長期在不同場景收集數(shù)千萬條各類聲音數(shù)據(jù),深入分析各種場景聲音的差異化,從最需要戶外音頻識別的需求入手,將數(shù)十個AI算法模型根據(jù)不同環(huán)境噪聲不同時段靈活調(diào)配,綜合調(diào)參。針對音頻識別領(lǐng)域內(nèi)公認困難的“短詞”識別,實現(xiàn)了在戶外5-10米較遠距離,以語音觸發(fā)快速報警的校園、公園、衛(wèi)生間、偏僻小路等各場景專項解決方案。
戶外場景
基于自主采集戶外聲音數(shù)據(jù);
支持戶外噪音環(huán)境下的遠場識別;
驅(qū)離/干預
實時對講,第一時間遠程介入現(xiàn)場,強光、強烈聲音驅(qū)離;
音視頻聯(lián)動
發(fā)生異常時自動發(fā)送告警信息;
并彈出視頻,彌補視線遮擋等不足;
對講
內(nèi)嵌對講,報警后自動接通中心與端設(shè)備的對講通道;
語音監(jiān)控
全天候監(jiān)控5-10米異常人聲,注意力機制端對端喚醒;
后臺
專門設(shè)計的后臺,可以嵌入常見的中臺和平臺,激活相關(guān)預案。
2017年9月19日,綜治會議中提出”提高預測、預警、預防各類風險能力,增強社會治理預見性、精準性、高效性”,可見提高預測能力是主動治理的基本前提。家人智能順利地將AI+音頻技術(shù)融入“事前預警”及“事中干涉”,彌補傳統(tǒng)安防手段的不足,賦能安防最前端。如果你需要求助,大喊一聲“救命”,家智哨衛(wèi)將給予你最快最可靠的幫助,“耳聞目睹”,守護安全。
江西星火網(wǎng)防科技有限公司工程案例
【萍鄉(xiāng)安防監(jiān)控安裝咨詢熱線:15607994110 強弱電施工、信息光纖光纜熔接等服務(wù),歡迎來電咨詢。】