声音能做什么?在科学家手中,声音能让时光倒流,通过音频视频场景分析,声音能还原某一时刻的场景;声音能做质检员,通过声波测试,能在成千上万的瓶子中找出有裂纹的那一个;声音能返老还童,当人垂垂老矣语音混沌时,受损语音修复技术能让声音重返青春。随着大数据分析、神经网络等人工智能技术的发展,音视频智能化分析取得重大突破,天津大学的一批青年人正致力于这方面的研究,部分核心研究成果居于国内领先,有的已成为国家标准。
“智能媒体是人工智能化体系的一个分支,其技术核心是对音视频信息的处理、分析和理解,从而实现智能化处理。”天津大学自动化与信息工程学院副教授张涛说,他主持的天津大学-TI DSP联合实验室在智能音频和智能视频两个智能媒体的研究领域取得了一定进展。
“实验室主要聚焦于音频场景的分析和受损语音信号的修复两个方面。音频场景分析应用前景广阔,能让设备感知环境,比如能改进机器人导航性能、重建自然或人工场景、提升语音降噪效果、在军事领域用于获取情报、在刑侦领域重建还原犯罪现场……当然也有很多我们平时能用得着的应用领域,比如进行家庭环境监控实现智能家居、对电梯突发状况进行监测等。在受损语音信号修复方面,科研人员可以对因病变、衰老造成的声带受损进行有效修复。”张涛介绍说,这项研究就像给声音赋予智能和感觉,并在此基础上开发出各种各样的应用,改变人们的生活。
据了解,该实验室研究提出的一种新型截取信号的窗函数,已经申请国家专利并被采纳为国家技术标准。(津云新闻编辑曲璐琳)