过去开源以Torch为基础,并且在底层以常见C++程式语言实现的Python机器学习资料库PyTorch之后,Facebook稍早再度宣布开源可用于3D环境进行机器学习的资料库PyTorch3D,借此让更多开发者能藉由Python简化3D环境内的机器学习设计,甚至能够将学习结果对应至2D图像内容。
Facebook开源PyTorch3D,让3D环境中的机器学习更容易建置
由于在目前与真实世界有所串接的人工智慧应用,例如机器人对于空间感知能力表现,或是自驾车对于真实世界中的物件远近判断,藉由3D建模进行空间感知学习训练成为相当重要环节,此次Facebook宣布开源PyTorch3D资料库,自然也是希望透过开源方式让3D空间内的机器学习应用可以加快普及,同时也能更容易被广放使用。
而为了简化3D模型建模批次处理流程,Facebook也提出针对机器学习模型打造的Meshes格式,借此处理异构学习模型数据结构,并且让应用程式可以更容易串接3D环境内的机器学习项目。
此外,应用PyTorch3D资料库的学习结果也能转换用于2D图像内容,借此让3D物件转换为2D图像时,依然能让系统分辨图层前后关系,例如用于识别正确照片中的人物前后位置关连,进而能够实现更自然的景深后制调整效果,而不会出现前方人物衣服与背面人物一同被模糊,却只有脸部维持清晰的奇怪现象。
Facebook将PyTorch3D资料库开源之后,预期将能带动更广泛的机器学习应用。