人文常州打造常州人文第一的门户网站!
   
推荐内容
 
 
 
当前位置: 主页 > 龙城名人 >

访语音处理领域权威科学家颜永红教授(2)

时间:2014-03-05 10:10来源:未知 作者:沈向阳
回国这些年,他经历了酸甜苦辣,最苦的莫过于对妻女的思念。我回国的时候大女儿6岁,小女儿4岁,一个父亲,错过了孩子成长中最关键的时刻,这是我

  回国这些年,他经历了酸甜苦辣,最苦的莫过于对妻女的思念。“我回国的时候大女儿6岁,小女儿4岁,一个父亲,错过了孩子成长中最关键的时刻,这是我这辈子都没办法弥补的遗憾。”颜永红轻声说,“每次我从美国回来的前一天,都能感觉到她们的情绪很低落,出门的时候真的很心酸。”

  好在有视频聊天,“至少现在我每天都能看到她们。”每天早上7点钟,只要不开会,颜永红到办公室的第一件事就是上网和她们聊天,因为这个时间刚好是美国波特兰下午3点钟女儿们放学回家的时候。

  探究声音里的“密码”

  很多人都看见过这样的场景:周杰伦在演唱会现场,用声、光、电技术虚拟出邓丽君,“两人”演绎了一场完满的跨时空对唱。类似这样的虚拟视像演出中,颜永红他们研发的智能语音技术发挥了重要作用。

  回国后,颜永红和他的年轻团队获得了大量专利和4项软件著作权。其中许多已经被国人广泛使用。其研发的嵌入式语音软件被应用在了手机上,这就是大家比较熟悉的语音拨号。“有些人的手机里存了几百上千个电话号码,找起来很麻烦,安装这一软件后,只要对着手机叫出对方名字,即可调出他的资料。”颜永红介绍道。这个嵌入式语音软件支持语音拨号、命令控制、来电短信提醒、语音读出短信、连呼数字拨号等功能。此外,他们还开发出基于分布式集群架构的语音处理平台TSE。

  在此之前,电信级语音识别引擎技术完全被美国公司垄断,“但现在我们完全有底气说,我们占据了大半壁江山。”确实,在国内,真正能够将语音识别产品拿出来,放在电信网上规模使用的,也只有他们研发的产品。

  目前,他们研发的中文电视广播新闻节目识别系统,已经被多家公司采用,并成为其提供给全国各电视台的数字媒体管理系统中一个核心技术模块。当系统“收听”到一段“新闻联播”节目,自动将节目内容生成文字,识别准确率惊人地高。

  在他的语音识别实验室里,视频精确搜索已不是问题。在一段王楠比赛的视频中,你只要输入“侧身抢拉”、“前三板”等关键词,就可以找到精确到秒的视频。这就意味着,如果你想找一部电影里的精彩片段,只需记得其中的经典台词即可搜索。现在,他们的语音技术已经应用于中国电信、中国网通、中国移动、淘宝等多个语音呼叫服务上;他的实验室,语音识别技术在国内多次获得第一名,音乐检索技术在世界音乐搜索组织(MIREX)评测中连续4年获得第一名;他提出的多识别器前端,多特征应用和后端信息融合算法,在美国国防部和标准局举办的年度比赛中两度夺魁。

  虽然现在的收入与在英特尔时比少得可怜,但这位世界级语音技术专家,对自己的选择却依然充满信心。

  他已经过了要勤奋的年纪,但对他而言勤奋已成为一种态度。早上不论多早,晚上不论多晚,人们都能在语音实验室的大楼看见他忙碌的身影。

  面试研究生时,颜永红一般都问两个问题:你想达到什么样的目标?你是否足够勤奋?“这两个问题可不是那么好回答的,它是用接下来几年时间去验证的。”颜永红说,“我觉得自己这个导师当得还行,这几年我培养的9名博士生中,有4个拿到了中科院的院长奖励,一位是院优秀毕业生,两位是‘微软学者’。”对颜永红来说,这个成绩单显然比研发出任何一种新技术更重要。(文/ 沈向阳)

  颜永红简介

  著名语音处理科学家,博士生导师。

  1967年出生于常州,1985年毕业于省常中,1995年获美国俄勒冈研究院博士学位。曾任OGI口语研究中心副主任、英特尔微处理器实验室主任工程师和人机界面总框架师、英特尔中国研究中心主任和首席研究员、英特尔全球人机界面学术委员会主席,现任中科院声学研究所研究员、所长助理、中科信利语音实验室主任,中国科学院“百人计划”入选者。

  长期从事人机界面研究工作,目前从事的研究领域包括:大词表非特定人连续语音识别,多模口语系统,嵌入式系统,多媒体数据检索,系统自适应和快速搜索算法。 

(责任编辑:DY)

------分隔线----------------------------
 
关于我们 全站搜索 联系我们 友情链接 版权声明 注册信息

总部客服QQ:2622593690    值班时间:周一至周日:早上 9:00~晚上 17:00
联系地址:常州市中吴大道1318号富邦广场一楼3008室    电子邮箱:wwwbujiao@163.com
座机电话:0519—88153365    手    机:15151989925  ( 苏ICP备11030947号