12 月 3 日消息,據阿里云消息,今日杭州瞳行科技公司正式發布國內首款 AI 助盲眼鏡。該眼鏡基于通義千問 Qwen-VL、OCR 等系列模型,具有出行避障、找物讀物、語音助手和一鍵求助親友等功能。該眼鏡由眼鏡主體、手機、遙控指環、盲杖四部分組成,目前已正式面市。
據IT之家了解,出行一直是視障人士最關注的問題。據統計,中國有超 1700 萬視力障礙人士,其出行高度依賴導航軟件及人工幫助,經常遇到最后十米導航無法找到目的地、服務人員無法及時響應等問題。但目前國內除盲杖外,并沒有其他普及的助盲出行工具。調查顯示,許多視障人士選擇“少出行”或“不出行”。
為解決“出行難”問題,瞳行將自研視覺模型與通義千問結合,配合 121 度超廣角雙攝像頭等硬件,著重打造低延時避障能力,并根據不同場景對模型進行針對性調優。據介紹,在出行場景,該眼鏡可實現 300ms 的超低延遲,相當于每邁出一步,眼鏡即可給出道路提示。
比如在避障場景,大模型會簡單概括周邊環境,識別公交車牌、路牌等,以及時響應;而在找店點餐等場景,大模型則會對文本、環境進行總結和詳細播報,幫助用戶找到目的地以及閱讀特定段落。
杭州瞳行科技公司市場及技術總監陳剛表示:“大模型出現之前,做 AI 助盲產品比較難。一方面,算力成本是目前的十倍左右。算力成本的大幅降低,讓 AI 初創企業能夠快速發展起來;另一方面,有了通義千問,我們通過基模復用 + 微調優化即可快速實現所需功能。