基于手指关键点识别的面向聋哑人的双向交流翻译器
来源: 发布时间:2022-11-07
浏览次数:2511
基本信息
第一作者姓名:鲁沐莀
性别:女
民族:汉族
第一作者学校:上海市第四中学
第一作者人所在年级:七年级
第一作者人所在年级:
性别:
民族:
第二作者人所在学校:
第二作者人所在年级:
辅导教师姓名:张业金
作品摘要
*主要特征:
结合手指关键点识别技术与语音播报技术,设计了一款即时聋哑人与正常人的双向翻译器,不仅能够实现将手语进行翻译播报,还能够接收正常人的语言进行语音识别,将其输出显示在屏幕上。
*主要用途:
患有听障和语言障碍的人被各种问题所困扰,因为生理原因,许多工作无法去尝试和完成,常受到歧视。于是,我想制作一个便携、可以即时识别手语的智能装置,可以进行双向沟通,解决普通人与聋哑人士沟通困难的难题。
*与人工智能的相关性说明:
1.双向交流翻译器完成了双向翻译,使用更加方便。
2.使用百度AI的手指关键点技术学习制作了手语对比库,以此完成手语的识别问题,让计算机机器视觉技术造福社会。
作品说明
*构思形成:
针对聋哑人与正常人的沟通障碍,本课题基于opencv和语音识别技
术设计并开发了一款双向交流翻译器。让正常人与聋哑人的沟通更加顺畅,方便,帮助聋哑人融入社会。
*设计过程:
1.外观设计与制作:使用LaserMaker绘制图纸,使用光切机切割板
材,最后将切割的材料进行组装。
2.语音识别程序:使用mind+编程控制语音识别传感器识别声音,并把识别结果输
出在屏幕上。
3.手语翻译功能:利用百度AI手指关键点技术学习各种手语图库,并建立手语对比
学习库。盲人手语是有一段时间过程。采用的是视频拍摄,然后对视频间隔半秒进
行画面截取。截取图片进行关键点识别后与对比库对比。
*演示效果:
1、手语识别的整体准确度达到86%。其中提问的语句准确度偏低,因为识别过程包含了多个手势的集合。而对于单手势的语句,识别准确度高达百分之百。
2、噪音下声音识别度随着分贝越高,识别准确度就越低。在噪音小于50分贝时准
确度达到80%以上,正好满足我们生活中大部分场景的需求。
3、实验测定使用设备可以让聋哑人与正常人的沟通时间减少了50%左右,准确率提
高了25%。可见有效的帮助聋哑人与普通人交流。
*优点:
该项目对于聋哑人融入社会有着重大意义,未来可针对设备的翻译手语库进行扩充,并使用图片分割技术高效的处理手语翻译中的环境等相关干扰因素。让设备成熟化,既可进行商业化,以此提高聋哑人群的生活、学习等方面。
*还需进一步研究的问题:
后续我会加入脸部识别,能够将聋哑人在进行手语交流时的神态以及面部表情做分析,这样我们不仅知道对方表达的内容,也能够对其心情做一个描述,在与聋哑人交流时同时也能顾及到对方的心情变化,能够走入对方的内心。
作品图片