原文:
www.kdnuggets.com/2021/03/10-amazing-machine-learning-projects-2020.html
评论
由 Anupam Chugh,iOS 开发者 | Medium 撰稿人 | BITS Pilani。
照片由 Paul Hanaoka 提供,来源于 Unsplash。
在过去的一年里,机器学习社区发生了很多事情。这里是最受欢迎和最具趋势的开源研究项目、演示和原型的巡礼。它涵盖了从照片编辑到自然语言处理到使用“无代码”训练模型的各个方面,希望它们能激发你在今年构建令人惊叹的人工智能产品。你还可以在 这里找到更多机器学习项目。
背景抠像 v2 受到受欢迎的 The World is Your Green Screen 开源项目的启发,展示了如何实时去除或更改背景。它提供了更好的性能(4K 下 30fps 和 FHD 下 60fps),并且可以与流行的视频会议应用 Zoom 一起使用。
该技术使用额外捕获的背景帧,并将其用于恢复 alpha 遮罩和前景层。为了实时处理高分辨率图像,使用了两个神经网络。
如果你想在保留背景的同时从视频中去除一个人,这个项目肯定会很有帮助。
这里还有另一个 惊人项目,它进行视频天空替换和协调,能够自动生成现实且戏剧性的天空背景,并具有可控的风格。
基于 Pytorch,该项目部分采纳了 pytorch-CycleGAN-and-pix2pix 项目的代码,利用天空抠像、通过光流进行运动估计和图像混合,在实时视频中提供艺术背景。
上述开源项目在电影和视频游戏中具有令人难以置信的潜力,例如添加假雨/晴天等。
将照片卡通化总是一个有趣的机器学习项目。不是吗?
这个项目,AnimeGANv2,是 AnimeGAN 的改进版。它结合了神经风格迁移和生成对抗网络(GAN),以完成任务,同时确保防止高频伪影的生成。
AI 优化的搜索引擎和 QA 聊天机器人始终是当下的需求。这正是这个项目所做的。
通过使用sentence-transformers、transformers和faiss,txtai构建了一个用于上下文搜索和抽取式问答的 AI 驱动引擎。
实质上,txtai支持构建文本索引以执行相似性搜索,并创建基于抽取式问答的系统。
接下来,我们有微软最新的照片修复项目,该项目能自动修复损坏的照片。
具体而言,它通过利用划痕检测、面部增强和其他技术,通过 PyTorch 中的深度学习实现,恢复受复杂退化影响的旧照片。
根据他们的研究论文:“我们训练了两个变分自编码器(VAEs),分别将旧照片和干净照片转换到两个潜在空间。这两个潜在空间之间的转换通过合成配对数据进行学习。这种转换对真实照片的泛化效果很好,因为在紧凑的潜在空间中缩小了领域间隙。此外,为了解决混合在一张旧照片中的多种退化情况,我们设计了一个全球分支,带有一个部分非局部块,针对结构化缺陷,如划痕和灰尘斑点,以及一个局部分支,针对非结构化缺陷,如噪声和模糊。”
该模型显然超越了传统的最先进方法,下面的演示就是明证:
Deepfake 项目在机器学习和 AI 社区引起了轰动。这个项目展示了一个经典的例子,它让你在实时视频会议应用中创建逼真的头像。
基本上,它使用了First Order Model来从视频中提取动作,并通过使用光流将其应用到目标头像图像中。这样,你可以在虚拟相机上生成头像,甚至可以给经典画作动画。从埃隆·马斯克到蒙娜丽莎,你可以尽情模仿任何人以获取乐趣!
这是一个展示如何从低分辨率图像生成真实面部图像的 AI 模型。
PULSE,即自监督照片超分辨率通过生成模型的潜在空间探索,提供了基于创建真实 SR 图像的超分辨率问题的替代公式,该公式还可以正确地缩小回去。
基于研究论文《Encoding in Style: a StyleGAN Encoder for Image-to-Image Translation》,这个项目使用了 Pixel2Pixel 框架,旨在通过使用相同的架构来解决各种图像到图像的任务,以避免任何可能的局部偏差。
基于一种新颖的编码器网络,该网络可以训练以将面部图像对齐到正面姿势、条件图像合成,并创建超分辨率图像。
从将几乎真实的人物从卡通图片生成到将素描或面部分割转换为照片级真实图像,你可以用这个做很多事情。
可能由于预算问题或缺乏明确的愿景,但找到具有相关机器学习专长的人始终是初创公司的挑战。尤其是因为这个领域总是不断进步的。
因此,最近出现了大量无代码机器学习平台,例如 Google 和 Apple 也发布了自己的工具集,以便快速训练模型。
这个令人愉快的开源机器学习项目正是通过允许你训练/拟合、测试和使用模型而无需编写代码来实现这一点的。虽然 GUI 拖放版本仍在开发中,但你可以通过该项目的命令行工具实现很多功能:
//train or fit a model
igel fit -dp 'path_to_your_csv_dataset.csv' -yml 'path_to_your_yaml_file.yaml'
//evaluate
igel evaluate -dp 'path_to_your_evaluation_dataset.csv'
//predict
igel predict -dp 'path_to_your_test_dataset.csv'
还有一个单一命令igel experiment来结合所有阶段:训练、评估和预测。有关更多详细信息,请参阅文档。
最后但同样重要的是,我们有一个网页动画工具。基本上,这个项目使用 PoseNet 和 FaceMesh 地标结果,通过利用一些 TensorFlow.js 模型,将 SVG 矢量图像赋予生命。
你可以通过以下方式为自己的设计或骨架图像添加动画:
原始文章。经许可转载。
相关:
1. 谷歌网络安全证书 - 快速进入网络安全职业生涯。
2. 谷歌数据分析专业证书 - 提升你的数据分析能力
3. 谷歌 IT 支持专业证书 - 支持你的组织进行 IT 工作