日前,同济大学「智能大数据可视化实验室」(iDVX Lab) 开源了一个包含 500 余万张卡通人脸表情的高质量简笔画数据集 – FaceX。该数据集由专业设计师绘制生成,不同于以往的图像数据集(例如,ImageNet),此次公开的数据全部为 SVG 格式,完整记录了设计师绘制过程中的一笔一画,旨在帮助人工智能领域的研究人员训练高质量的绘图机器人。
FaceX 数据集的绘制过程严格遵循了相关的设计规范与准则,以保证所生成数据的质量。同时,该数据集的构建也充分考虑到了机器学习算法对训练数据多样性的需求,从性别(男、女),视角(正面、左侧面、右侧面),情绪(中立、开心、伤心、生气、害怕、惊讶、厌恶),以及绘画风格(写实、卡通、极简)四个维度全面确保数据的多样性(如图 1 所示)。
图 1 : FaceX 所包含的四个维度
在数据集的创作过程中,设计师们参照美学标准绘制了多样化的五官图片(图 2),再根据人脸比例框架,通过组合不同的五官,最终拼合成了 500 余万张各不相同、并带有生动表情的卡通人脸。
图 2 : 设计师绘制的人脸五官样例
目前,FaceX 数据集已被用来训练 AI-Sketcher,一款由智能大数据可视化实验室设计开发的绘图机器人(同济大学「智能大数据可视化实验室」开发绘图机器人,相关论文被 AAAI 2019 收录)。关于 FaceX 数据集的更多详情与资源,请登录 FaceX 官方网站进行查看与下载。
地址:https://facex.idvxlab.com