ICDAR(International Conference on Document Analysis and Recognition,国际文档分析与识别会议)是文档图像分析领域最重要的国际会议之一。今年ICDAR设立了十余项竞赛,吸引了来自谷歌、亚马逊、百度、阿里、腾讯、北京大学、清华大学等诸多国内外顶级科技公司和知名高校参加。
国际顶级赛事,包揽多项佳绩
(资料图)
此次大赛中,视源股份团队在BDVT-QA的端到端视频文字识别任务中获得第一名(V-DA)。
在CROHME手写公式识别赛事的三项任务——在线公式识别(On-line recognition)、离线公式识别(Off-line recognition)、双模态公式识别(Bimodal recognition)均获得第二名(YP_OCR)。
文字识别与公式识别的竞赛任务与视源股份在教育领域布局的业务技术息息相关,据悉当前这些技术已广泛应用在seewo学习机的作业批改、口算计算等产品中。随着底层技术。的成熟和优化,视源股份旗下品牌的产品性能和用户体验有极大提升赢得良好的口碑。
多领域开花,技术实力显现
当前大众对于视源股份的印象仍然停留在售卖“显示器”阶段,其实视源股份一直在积极组建自己的技术团队,并在多年前成立中央研究院。
中央研究院创立之初旨在为视源股份技术促增长战略提供强力支撑,当前中央研究院博士学历研究人员占比25%,主要围绕视觉计算、语音信号信息处理、触觉技术、空间感知、自然语言处理、医学信号处理、数据挖掘等领域进行研究,目前团队已有来自UCLA、清华、中科院、Apple等海内外高层次人才。
今年视源股份中央研究院数据挖掘团队(CVTEDMer)还参与了华为因果推理挑战赛(PCIC),经过线上筛选和决赛答辩最终取得线上第1名、决赛答辩总成绩第2名的好成绩。
从2018年开始,视源股份中央研究院各个研究团队开始参与各类技术比赛,雄厚实力斩获多项殊荣。
以下为视源股份中央研究院团队部分获奖经历:
全国知识图谱与语义计算大会 评测任务:面向音乐领域的命令理解任务(第3名,2018)
阿里天池:“数智教育”数据可视化创新大赛(第1名,2019)
ACM MM Challenge AI Meets Beauty(第3名,2019)
阿里天池:第二届海南大数据创新应用大赛-智能算法-简历解析赛(第5名,2020)
2021 年讯飞 AI 开发者大赛-试题标签预测挑战赛(第2名,2021)
CCL 2022汉语学习者文本纠错竞赛(赛道一第3名、赛道四第2名,2022)……
着眼大局,积极布局多模态感知和交互
视源股份中央研究院的研究方向覆盖领域广泛,纵观技术的发展趋势,结合团队的优势研究领域,当前他们正在深耕研发、积极布局多模态感知和交互技术。
随着互联网技术以及电商潮流的兴起,AR技术在虚拟试衣的应用越来越火爆。针对当前网络购物无法体验衣物材质的痛点和消费者对未来网购的消费期望,视源股份提前布局并深耕纹理反馈技术,并由此延伸,挖掘纹理反馈更多的应用场景。
近些年来手势控制依靠自然、高效、便捷的优势不断出现在各类操作应用中,消费者们尤其赞赏手势隔空操作、不直接接触物体的安全特性。视源股份依靠研究优势对手势交互进行深度研发,力求应用在更多场景、领域、设备中,刷新人们对于多模态的交互体验。
视觉是人类的重要知觉——定位、识别物体、了解环境甚至是辨别面部表情等都是其承载的功能,视源股份中央研究院以“看清世界 看懂世界”为方针,在医学影像、3D场景感知、虚拟人、情感智能等垂直领域进行深度探索,致力打造更加多元化的视觉研究和应用。
在白热化的语音交互赛道,视源结合业务场景对拾音模块进行深入研究,显著提升了课堂和会议场景下的音频拾音质量;通过对语音识别和语义理解方向的研究实现了技术方案平台化,可为各类智能终端设备提供更便捷且睿智的语音交互。
依托于中央研究院对于基础技术及应用技术的深层次研究和实践经验,视源股份当前已在多个新兴领域进行战略孵化。视源股份始终在积极营造进取、包容和开放的科研环境,紧跟前沿技术的趋势,大力推进研究成果在未来教育、企业服务、智能硬件、健康医疗等领域的落地转化,期待充分实现技术的产业价值和社会价值,继续通过科技创新将梦想变成现实。
标签: