日期:2023-09-30 访问次数:次
9月24日,应语言科学院院长曹文邀请,海天瑞声科技股份有限公司创始人、董事长贺琳和首席语言学家郝玉峰为北京语言大学“语言资源学”专业课程班的硕、博研究生带来了一堂别开生面的开学第一课。
曹文院长在开课致辞中提到,早在2015年,北京语言大学和海天瑞声就联合建立了北语-海天瑞声语言研究联合实验室,意在通过学界与产业界的合作,充分发挥各方的专业优势,推动语言学研究与人工智能技术的深度融合。此番邀请语言工程暨企业界的专家,为“语言资源学”课程班专门开设《数据标注实践》,希望能够让同学们切实了解语言资源在人工智能领域的相关运作路径,让理论知识与实践能力更好地结合。
在正式开课环节,海天瑞声创始人、董事长贺琳首先对同学们的开学表示祝贺,然后跟同学们分享了自己的创业经历。她说,成立海天瑞声的初衷源自她当时所在的课题组遇到缺少高质量训练数据的困境,数据问题成为了语音识别、语音合成等研究中非常大的瓶颈。这促使她考虑成立一家公司,帮助相关研究人员更好地解决数据带来的挑战。创业初期公司只有几位团队成员,历经近20年的积累和发展,海天瑞声伴随AI领域的发展一路成长,到今天已成为国内AI数据行业的首家上市企业。不难想象在一路坦途的背后曾面临过多少困境。贺琳表示,秉持着不忘初心、保持热爱的状态,才能够突破困难带领公司不断到达新的高度。
她期望同学们能够热爱自己所长,独立思考,敢于创新,同时也要开拓视野,包容多元文化,培养兴趣爱好,并养成锻炼身体的好习惯,务必成为一个对国家有价值的人。最后她强调,付出总有回报,或许不是当下即现的,或许会在不经意间出现,但大家一定要坚定地去做正确的事。
随后,海天瑞声首席语言学家郝玉峰作为课程讲师,从机器学习、监督学习、自然语言处理、计算机视觉等同学们耳熟能详的AI“核心词”入手,结合实际的应用场景,详细解释了这些复杂概念。
他强调,语言资源在人工智能多年来的发展历程中一直占据着重要地位;机器能够识别的语言——训练数据,可以说是人类语言的数字实体;高质量的训练数据,对模型的质量至关重要,而专业高效的数据处理则是确保模型准确性的关键因素之一。
海天瑞声 首席语言学家 郝玉峰
同学们对课程表现出了浓厚的兴趣。通过这堂“语言资源&AI的第一课”,他们对人工智能领域有了更清晰的认识,也对海天瑞声在语言资源和数据领域的专业积累和技术实力留下了深刻印象。
本课程将持续三个月,每周一次。未来北京语言大学和海天瑞声将继续开展更多合作项目,共同推动语言资源建设及其在人工智能领域的发展,并为同学们提供更多学习和职业发展的机会。
学院微信公众号
团学公众号-言科青语