实验室围绕可视媒体计算的基础理论算法和工程应用开展研究,致力于技术推广和解决产业实际需求问题。现阶段主要的研究方向包括:
● 面向成像的计算摄像
● 面向内容的媒体计算
● 面向平台的智能计算
人类获取的外界信息百分之八十来自视觉,视觉是人类感受、认识、理解客观世界的主要途径。摄像技术模拟并延伸人类视觉获取外界信息的功能,是机器系统获取与感知视觉信息的核心渠道,深刻影响着人类的生活和生产。随着社会发展与科技进步,人们不断追求对物理世界的完整捕获与感知。将智能、计算等思想应用于视觉信息获取与感知任务中,能够突破传统摄像的极限,发展更细致、更灵敏、更全面的新型摄像技术。实验室研究高质量、高精度、高效率的成像理论和方法,涉及以下相关领域:
● 图像/视频处理
● 计算摄像学
● 人工智能
图像、视频、图形等可视媒体数据构成了互联网、虚实融合、数字孪生等多种应用环境下的主要视觉内容,也成为人工智能时代的数据顶流。而以图形学建模/绘制、深度学习图像生成等为代表内容生成方式能够提供高真实度、多样化、可复用的视觉内容。这既满足了不同应用环境下的内容利用需求,也为人工智能算法提供了数据基础。实验室研究高真实度、高效、便捷的内容生成理论和方法,涉及以下相关领域:
● 计算机图形学
● 虚拟现实/增强现实
● 深度学习图像生成
智慧城市、智能驾驶、虚拟现实/增强现实等应用带动传感器的大量部署,海量可视媒体数据产生于终端设备。现有的终端采集、云端计算的模式难以满足低延时、多样化、安全与隐私的应用需求。而终端设备硬件平台的资源和算力受限,影响了可视媒体智能处理的效果和效率。实验室研究终端平台适用的鲁棒、高效、可靠的智能计算方法与按需部署策略,涉及以下相关领域:
● 边缘计算
● 模型轻量化
● 场景分析与感知