图形与人工智能专题研讨会
CAD&CG GDC 2018 专题研讨:http://cadcggdc.guet.edu.cn/。2018年8月25日下午(14:00-17:00)
研讨会组织
赵耀
北京交通大学,教授
袁晓如
北京大学,教授
程明明
南开大学,教授
李杨彦
阿里巴巴,高级算法专家
胡瑞珍
深圳大学,助理教授
任博
南开大学,讲师
报告安排
- 14:00-14:30 赵耀:弱监督图像语义分割
- 14:30-15:00 袁晓如:非“视”不可 – 当前科学可视化的挑战和机遇
- 15:00-15:30 程明明:智能媒体计算-当图形学遇上视觉
- 15:30-16:00 李杨彦:面向三维数据的深度点卷积神经网络PointCNN
- 16:00-16:30 胡瑞珍:利用人工智能技术辅助解决图形学问题的初步探索
- 16:30-16:50 任博:基于增强学习的可控流固耦合场景物体运动
- 16:50-17:30 专题讨论
报告摘要及讲者简介
弱监督图像语义分割
摘要: 为减少像素级标注的巨大负担,近年来提出了许多弱监督语义分割技术。随着深度卷积神经网络的进步,物体语义分割技术取得了显著的进步。本报告将重点介绍课题组在基于深度学习的弱监督语义分割方面的部分研究成果。
讲者简介: 赵耀,长江学者特聘教授、国家杰出青年科学基金获得者、万人计划科技创新领军人才、科技部重点领域创新团队带头人。现任北京交通大学信息科学研究所所长,“现代信息科学与网络技术”北京市重点实验室主任。研究领域为数字媒体信息处理与智能分析,包括图像\视频压缩,数媒体内容安全,媒体内容分析与理解,人工智能等。主持了973计划、863计划等课题30余项。在包括IEEE Trans.等国内外期刊、会议上发表论文200余篇。作为第一完成人获北京市科学技术奖一等奖等省部级奖励3项。指导的博士生5人获北京市和中国计算机学会优秀博士论文奖。主持的《多媒体技术应用》课程获选网络教育国家精品课程,获北京市高等教育教学成果一等奖。被遴选为IEEE Senior Member、 IET Fellow,并受邀担任了 IEEE Transactions on Cybernetics、IEEE Signal Processing Letters等多个国际杂志编委。曾获霍英东青年教师基金奖,詹天佑铁道科技奖青年奖,北京市五四奖章等荣誉称号,他是国务院学科评议组成员,享受国务院政府特殊津贴。
非“视”不可 – 当前科学可视化的挑战和机遇
摘要: 在可视化各个研究分支中,科学可视化是最早得到重视和充分发展的方向。从微观尺度的生物分子影像分析,到宏观的宇宙演化形成,到剧烈变化的气动力学模拟,各种科学和工程的计算分析都需要高效的科学可视化的支持,可视化成为科学家不可或缺的工具和助手。当前,计算能力的提高,特别是E级超级计算机的出现,以及数据获取能力的飞跃为可视化带来了更加具有挑战性的课题。本报告将关注当前科学数据可视化中的主要问题,从数据管理、任务分配、特征分析等多个层面,探讨大规模复杂科学可视化面临的挑战和机遇。
讲者简介: 袁晓如 北京大学信息科学与技术学院研究员,博士生导师,机器感知与智能教育部重点实验室副主任,大数据分析与应用国家工程实验室常务副主任。2008年初在北京大学建立可视化与可视分析实验室,研究方向包括复杂流场数据可视化,高维/时空数据,交通、社会媒体数据的分析,可视化的快速构建方法。高动态范围可视化的工作获得2005年IEEE VIS大会最佳应用论文奖。2013年来指导实验室团队7次在IEEE VAST可视化分析挑战赛中获奖。和天津、济南、阿贡等国内外超算中心合作,面向科学领域应用发展了大规模流场数据的高效管理和分析方法。数十次担任IEEE VIS, EuroVis, IEEE PacificVis等国际可视化会议程序委员会委员,2017年 IEEE VIS大会论文共同主席(SciVis),创建中国可视化与可视分析(ChinaVis)大会。中国计算机学会理事,杰出会员,杰出讲者。中国计算机学会大数据专家委员会委员,人机交互专委会常委委员和计算机辅助设计与图形学专委会委员。中国图象图形学学会理事、可视化与可视分析专业委员会主任。
智能媒体计算-当图形学遇上视觉
摘要: 传统图形学技术关注从三维模型到真实感图像的绘制过程以及人与计算机的交互过程。传统计算机视觉技术关注从真实图像中获取物体的三维结构、语义标签等信息。近年来,随着互联网图像大数据、深度学习、以及新的采集设备的兴起,计算机图形学和计算机视觉逐渐走向交融。这个报告将通过两个领域共同关注的话题为导引,探讨图形学和计算机视觉的融合与相互促进过程中所产生的机遇和挑战。
讲者简介: 程明明,1985年生。2012年博士毕业于清华大学,之后在英国牛津从事计算机视觉研究,并于2014年回国任教,现为南开大学教授,国家“万人计划”青年拔尖人才,首批天津市杰出青年基金获得者。其主要研究方向包括:计算机图形学、计算机视觉、图像处理等。已在IEEE PAMI, ACM TOG等CCF-A类国际会议及期刊发表论文30余篇。相关研究成果论文他引9000余次,最高单篇他引2000余次。其研究成果在华为、腾讯等公司的旗舰产品中得以应用。其中,显著性物体检测技术被华为Mate 10等旗舰手机作为亮点特性,于产品发布会中展示。其研究工作曾被英国《BBC》、德国《明镜周刊》、美国《赫芬顿邮报》等权威国际媒体撰文报道。
面向三维数据的深度点卷积神经网络PointCNN
摘要: 近年来,基于图片的视觉任务取得了突破性进展,极大提高了计算机理解现实世界的能力。可以预见,结合三维数据,视觉系统能够更有效地理解现实世界,进而更准确地交互和操作。深度学习是近年来图片理解取得突破性进展的核心技术,也被认为有巨大的潜力适用于处理三维数据。然而,三维数据具有非常不同于图片数据的结构特征,将适用于处理图片数据的深度神经网络拓展并用于处理三维数据的尝试并不成功。本报告将回顾近年来三维深度学习方面的进展,并重点介绍我们提出的在多项标准数据集和任务上刷新世界纪录的点卷积神经网络PointCNN。
讲者简介: 李扬彦博士2013年获得中国科学院大学博士学位,之后先后赴美国斯坦福大学和以色列特拉维夫大学从事博士后研究工作,2016年底入选山东大学“齐鲁青年学者”特聘教授加入山东大学计算机科学与技术学院,2018年6月加入阿里巴巴AI Lab任高级算法专家,自动驾驶点云感知技术负责人。研究方向为计算机图形学和计算机视觉,主要研究基于点云以及图片的三维视觉问题,研究成果发表于ACM SIGGRAPH(Asia)、IEEE ICCV和IEEE NIPS等计算机图形学和计算机视觉相关领域的顶级国际会议,受到学术界和工业界的广泛关注。
利用人工智能技术辅助解决图形学问题的初步探索
摘要: 人工智能技术的高速发展为解决传统的图形学问题提供了更多的可能性,但是在利用人工智能技术辅助解决图形学问题的时候,经常碰到的一个难点是图形学问题的复杂度相对较高而可获取的训练数据却相对较少,使得难以直接训练出一个准确度高的端到端的网络。为了克服这一难点,本次报告主要提出了两种初步的解决思路:1)将复杂问题分解成多个简化的子问题并分别求解;2)通过自学习的方式扩充数据集以减少对人为标定数据的需求,并将分别以三维物体的多功能性识别问题和语义重建问题进行举例说明。
讲者简介: 胡瑞珍,女,博士,深圳大学计算机与软件学院助理教授,中科协”青年人才托举工程”(2017-2019)入选者,深圳市海外高层次孔雀人才,深圳市南山区领航人才。2015年6月毕业于浙江大学数学系,取得理学博士学位,并获浙江省优秀毕业研究生称号。攻读博士学位期间,获国家留学基金委资助访问加拿大西蒙弗雷泽大学两年。研究方向为计算机图形学,特别是高层次形状分析、几何处理和模型制造。近些年的主要学术成果均发表在本领域国际顶级会议和期刊,研究课题连贯性强,已初步形成个人研究特色。截止目前,共发表16篇高水平论文,其中9篇发表在计算机图形学顶级会议/期刊ACM SIGGRAPH/ SIGGRAPH ASIA/TOG。担任The Visual Computer编委,Eurographics 2018, SIGGRAPH Asia Techinical Brief & Poster 2017, CAD/Graphics 2017, CVM 2017, ICVRV 2017, SIGGRAPH Asia Workshop 2016等国际会议程序委员会成员。
基于增强学习的可控流固耦合场景物体运动
摘要: AI as a powerful tool is widely used in various scientific and manufactory areas. In this report we will introduce a novel strategy that combines reinforcement learning with fluid simulation in computer graphics, and briefly talk about the potential of machine learning in graphics physically-based animation. We present a learning-based method to control a coupled system involving both fluid and rigid bodies. Our approach influences fluid/rigid simulator’s behavior purely at the simulation domain boundaries, leaving the rest of the domain to be governed exactly by physical laws. Compared with controllers using virtual artificial forces, our generated animations achieve higher physical accuracy and visual plausibility. To solve the challenging control problem, we represent our controller using a general neural-net which is trained using deep reinforcement learning. This breaks the control task into two stages: an computationally costly training stage, and an efficient generating stage. After training, the controlled fluid animations are generated in real-time on a desktop machine by evaluating the neural net. We utilize many fluid properties, e.g. the liquid’s velocity field or the smoke’s density field, to enhance the controller’s performance. We have evaluated our method on a set of complex benchmarks, where our controller drives a fluid jet to move on the domain boundary and shoot fluids towards a rigid body to accomplish a set of challenging tasks such as keeping a rigid body balanced, a two-player pingpong game, and driving a rigid body to hit a specified point on the wall.
讲者简介: 任博于2015年于清华大学计算机科学与技术系获得工学博士学位。2015年7月至今于南开大学计算机科学与信息安全系担任讲师职位。主要研究领域与兴趣为计算机图形学中的真实感模拟、渲染方向,以及三维模型处理方向。
相关论文
- Deeply supervised salient object detection with short connections, Q Hou, MM Cheng, X Hu, Z Tu, A Borji, Z Tu, P Torr, IEEE CVPR, 2017. (华为Mate 10, 荣耀V 10产品发布会展示)
- Richer Convolutional Features for Edge Detection, Y Liu, MM Cheng, X Hu, K Wang, X Bai, IEEE CVPR, 2017. (第一个在最流行的BSD500数据集上超过人工标注的实时算法)
- Global Contrast based Salient Region Detection. Ming-Ming Cheng, Niloy J. Mitra, Xiaolei Huang, Philip H. S. Torr, Shi-Min Hu. IEEE TPAMI, 2015. (2000+次他引)
- STC: A Simple to Complex Framework for Weakly-supervised Semantic Segmentation. TPAMI 2017.
- Fluid Directed Rigid Body Control using Deep Reinfocement Learning, SIGGRAPH 2018.