Skip to content

Latest commit

 

History

History
691 lines (465 loc) · 39.2 KB

ForFun.md

File metadata and controls

691 lines (465 loc) · 39.2 KB

人脸部分生成 https://github.com/SummitKwan/transparent_latent_gan

用心整理的论文-代码实现列表(w/stars) https://github.com/zziz/pwc

Magenta是Google Brain团队的研究员们发起的一个研究项目,目的是探索利用机器学习生成美术和音乐作品。它的深度学习和强化学习算法可以生成歌曲、图像、绘画和其他作品。 https://github.com/tensorflow/magenta

2018年最火爆的30个机器学习项目汇总 https://mp.weixin.qq.com/s?__biz=MzI4MDYzNzg4Mw==&mid=2247488506&idx=3&sn=06490c6b06bbeb0d181f6d34db63a8ea&chksm=ebb42b2edcc3a238ad95d6f36dc669779d5cbc7c4a71cef54bad1e38067d5b170ab24bf7dc54&mpshare=1&scene=1&srcid=1115alVC9BpLkvxqh5e2tlQ0#rd

高质量二维条码生成库 https://github.com/nayuki/QR-Code-generator

An implementation of paper from NIPS2017 'Towards the Automatic Anime Characters Creation with Generative Adversarial Networks' using pytorch. https://github.com/VincentXWD/CreateGirlsMoe

【Microsoft MakeCode:微软的计算教育实践项目,为不同水平的学习者提供有趣的项目、即时结果、块编辑器和文本编辑器,让所有学生了解计算机科学的实际应用】“Microsoft MakeCode” https://github.com/Microsoft/pxt

PI-REC: Progressive Image Reconstruction Network With Edge and Color Domain. 🔥 图像翻译,条件GAN,AI绘画 https://arxiv.org/abs/1903.10146 https://github.com/youyuge34/PI-REC https://mp.weixin.qq.com/s?__biz=MzAxOTcxNTIwNQ==&mid=2457914983&idx=1&sn=7d2624a39864d915ec7531b6c07c7b22&chksm=8cb6ab8dbbc1229b1550fa6a9ac1903f21f3372b92909f4b63cd2f2ea5f8e8e62b911e6d6823&token=1156490392&lang=zh_CN#rd

Bridging deep learning and logical reasoning using a differentiable satisfiability solver.

https://github.com/locuslab/SATNet

A prototype of an apple-sorting manipulator (OpenCV+Arduino) 苹果分拣机械手的原型

https://www.reddit.com/r/programming/comments/c6xxce/a_prototype_of_an_applesorting_manipulator/

伪 3D 引擎,体积小,简单快速的创建伪 3D 模型。 https://github.com/metafizzy/zdog

仅需3D模型的高效视觉系统机器手控制 https://github.com/zuoym15/craves.ai

Astral:组织你在GitHub上的加星项目 https://github.com/astralapp/astral

机器学习"玩"起来:自制两个小游戏 https://github.com/vibertthio/runn

Keras/Flask/OpenCV表情识别实例

https://towardsdatascience.com/from-raw-images-to-real-time-predictions-with-deep-learning-ddbbda1be0e4

图像AI应用之Google Shopping Ads https://medium.com/@picaas/image-ai-leverage-image-insights-via-ml-picaas-for-google-shopping-ads-picaas-3a1bfeab234

在线制作漫画人物并可将制作的人物图片放在你的网站中 https://github.com/gramener/comicgen https://gramener.com/comicgen/

Repository for the CVPR19 oral paper "Domain Generalization by Solving Jigsaw Puzzles" https://github.com/fmcarlucci/JigenDG

用单张动漫头像生成动画,可指定姿态或从真人示范视频迁移 https://pkhungurn.github.io/talking-head-anime/

用 tf.Keras 打造深度图片搜索引擎 https://github.com/CVxTz/image_search_engine

Fast and accurate interactive segmentation with f-BRS

https://github.com/saic-vul/fbrs_interactive_segmentation

You Only Watch Once: A Unified CNN Architecture for Real-Time Spatiotemporal Action Localization

https://github.com/wei-tim/YOWO

Fast.ai 深度学习课程学员练手项目 https://github.com/jamesdellinger/fastai_deep_learning_course_part2_v3

Code for "Towards Segmenting Anything That Moves"

https://github.com/achalddave/segment-any-moving

fastai 程序员深度学习实战课程v3 Notebooks汉化版 https://github.com/fastai/course-v3/tree/master/zh-nbs

【libXCam:Intel的摄像头特性扩展项目,致力于图像质量改进和视频分析,在图像预处理、图像后处理和智能分析等方面提供多特性支持】

https://github.com/intel/libxcam

【如何提高技术写作技能】 https://web.archive.org/web/20190129110411/http://www.eecs.qmul.ac.uk/~norman/papers/good_writing/Technical%20writing.pdf

【如何有效管理时间、克服拖延和写作障碍、提高写作效率】 https://www.mededpublish.org/manuscripts/554

【科学家用好Twitter的十条简单建议(如何用社交媒体打造个人影响力和专业圈子)】 https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1007513

'MeEdu - 基于Laravel开发的在线教育点播收费系统' https://github.com/Qsnh/meedu

【图像分割工具箱:通用超像素分割/中心检测/区域生长】

https://github.com/Borda/pyImSegm

【ZoneMinder视频后处理】

https://github.com/pliablepixels/zmMagik

【2020计算机视觉25大项目创意】 https://data-flair.training/blogs/computer-vision-project-ideas/

【用Jupyter Notebooks写博客】 https://www.fast.ai/2020/01/20/nb2md/

AI新功能之自动剪视频 http://www.faculty.idc.ac.il/arik/site/writeVideo.asp 怎样用文字创作视频呢?第一步,用户以文本的形式提供输入。Write-A-Video会挑选出句子中的关键词。第二步,Write-A-Video会利用关键词,把素材库里与之相匹配的候选片段挑出来。第三步,就是将这些镜头组合在一起,完成视频的剪辑。

车载广告牌的新生意:数据收集——“街道和桌面、手机一样有价值。我们花了大把时间只为了巡游世界。” https://www.citylab.com/transportation/2019/11/firefly-digital-advertising-driver-pay-uber-lyft-cars-data/602077/

【超强算法:一张图让二次元妹纸活起来】只要输入一张静态的老婆,就能让她动起来,会张嘴会眨眼,还能东张西望,抬眼看天。仿佛成了3D老婆。并且,你想让妹子怎样动,姿势都可以定制。 https://mp.weixin.qq.com/s/AK199QUu7S9qBPO3HjezXQ

用单张动漫头像生成动画,可指定姿态或从真人示范视频迁移 https://github.com/pkhungurn/talking-head-anime-demo

【拍照解数独应用】’AI_Sudoku - GUI based Smart Sudoku Solver that tries to extract a sudoku puzzle from a photo and solve it' https://github.com/neeru1207/AI_Sudoku

【基于YOLOv3的交通信号违章检测系统】

https://github.com/anmspro/Traffic-Signal-Violation-Detection-System

AI技术可以一键把静态二次元妹子图转换成VTuber https://pkhungurn.github.io/talking-head-anime/

Pytorch实现的少样本视频-视频转换,可实现多种 示范-合成 任务 https://github.com/NVlabs/few-shot-vid2vid

总结报告自动生成+手写机 www.diyifanwen.com,www.xiangdang.net,www.ypppt.com

2020年程序员副业赚钱指南 https://medium.com/better-programming/side-gigs-that-will-make-you-money-as-a-programmer-in-2020-9124760f3c8

【如何把长颈鹿变成鸟】《How to change a giraffe into a bird》by Janelle Shane https://aiweirdness.com/post/613123668121419776/how-to-change-a-giraffe-into-a-bird

AnimeGAN:用GAN实现的图片动漫化 https://github.com/TachibanaYoshino/AnimeGAN https://mp.weixin.qq.com/s?__biz=MzAxOTcxNTIwNQ==&mid=310435176&idx=1&sn=9d3f5916ae5126c4e3233b26595e02cb&chksm=0cb6b8823bc13194bb38ce5eabe344e59a6881f1ae6a4ac0aa183874ec71c2586b73ce3c0f96#rd

程序员如何优雅地挣零花钱 http://r.ftqq.com/howto-make-more-money/ch00.html

将你的自拍转成二次元!照片动漫脸生成器! https://waifu.lofiu.com/index.zh.html

【目光/注视估计/检测相关工作大列表】’Awesome Work on Gaze Estimation' https://github.com/cvlab-uob/Awesome-Gaze-Estimation

【人人都是“神笔马良”:对任意涂鸦自动推断骨架并生成运动动画】 https://doodle-rig.glitch.me/

通过程序生成中国山水画 https://github.com/LingDong-/shan-shui-inf

Modeling Artistic Workflows for Image Generation and Editing https://github.com/hytseng0509/ArtEditing

ncnnRay++: A CMake / WASM integration of rayib UI and the Tencent ncnn C++ AI platform. https://github.com/QuantScientist/ncnnRay

澄清大(数学)概念的小项目,解答一些“简单/明显/愚蠢”的小问题

https://github.com/ovysotska/in_simple_english

Google 几名工程师最近整了个特别有意思的 AI 玩具:Chimera Painter,可根据你提供的涂鸦轮廓、指定的涂鸦身体部位,快速为你生成一种新生物。 https://ai.googleblog.com/2020/11/using-gans-to-create-fantastical.html https://storage.googleapis.com/chimera-painter/index.html

【用摄像头实时解数独】’Sudoku-Solver-AI - I made a real time Sudoku solver using the camera' https://github.com/1nfinityLoop/Sudoku-Solver-AI

U^2-Net 的一种有趣应用,可借助 AI 技术为人物肖像生成手绘风格的画像。 https://github.com/NathanUA/U-2-Net https://www.pythonf.cn/read/141098

完全用数学打造漂亮3D女孩动画像 https://www.bilibili.com/video/BV1Rf4y1Y7jU/ https://www.shadertoy.com/view/WsSBzh

Rhubarb Lip Sync:2D动画唇动合成,根据语音自动生成动画人物口型 https://github.com/DanielSWolf/rhubarb-lip-sync

用摄像头做动作控制涂鸦角色 https://scroobly.com/

anichart.js:轻松地制作数据可视化动画视频 https://github.com/Jannchie/anichart.js

可基于光流边缘引导的视频补全算法,对视频物品进行自动抠除、补全。

https://github.com/vt-vl-lab/FGVC

3blue1brown可视化视频生成源码 https://github.com/3b1b/videos

OpenVtuber - 虚拟爱抖露(アイドル)共享计划, 基于单目RGB摄像头的人眼与人脸特征点检测算法在实时3D面部捕捉以及模型驱动领域的应用 https://github.com/1996scarlet/OpenVtuber

(PyTorch)用Resnet101+GPT搭建一个玩王者荣耀的AI https://github.com/FengQuanLi/ResnetGPT

avatars4all:用摄像头在浏览器中实时创建虚拟化身 https://github.com/eyaler/avatars4all

视频中自动提取时尚穿搭 https://blog.gofynd.com/ai-powered-fashion-in-video-2edb08166be4

Mozart:乐谱识别系统 https://github.com/aashrafh/Mozart

杂货店货架图像识别 https://github.com/sayakpaul/Grocery-Product-Detection

Kalidoface:有摄像头就能玩的虚拟角色 https://kalidoface.com/ https://weibo.com/tv/show/1034:4595886446280709?from=old_pc_videoshow

Argos:视频监控的空-时模式检测,基于OpenCV & Tensorflow https://github.com/angadsingh/argos

DeepMosaics:基于深度学习自动为图片/视频添加或消除马赛克 https://github.com/HypoX64/DeepMosaics

mebm:基于浏览器的无依赖视频编辑器 https://github.com/bwasti/mebm

Toon-Me:基于深度学习的肖像卡通化 https://github.com/vijishmadhavan/Toon-Me

Serving Agent:用于模型服务化的轻量的中间件,能提高GPU利用率从而加速线上推理 https://github.com/HughWen/ServingAgent

SAHI: Slicing Aided Hyper Inference - A vision library for performing sliced inference on large images/small objects

https://github.com/obss/sahi

A deep neural network that directly reconstructs the motion of a 3D human skeleton from monocular video https://github.com/Shimingyi/MotioNet

用低耗电蓝牙信标、廉价ESP32探测器和机器学习定位你家猫🐱 https://github.com/filipsPL/cat-localizer

Motion Retargeting Video Subjects https://github.com/carolineec/EverybodyDanceNow

Inferring Body Pose in Egocentric Video via First and Second Person Interactions https://github.com/facebookresearch/you2me

Official Pytorch implementation of the preprint paper "Castle in the Sky: Dynamic Sky Replacement and Harmonization in Videos", in arXiv:2010.11800.

https://github.com/jiupinjia/SkyAR

SESAME: Semantic Editing of Scenes by Adding, Manipulating or Erasing Objects

https://github.com/vglsd/OpenSESAME

[ECCV 2020] "Deep Plastic Surgery: Robust and Controllable Image Editing with Human-Drawn Sketches" https://github.com/VITA-Group/DeepPS

Code of the paper entitled "Keep your Eyes on the Lane: Real-time Attention-guided Lane Detection" https://github.com/lucastabelini/LaneATT

Indoor Scene Layout Estimation from a Single Image https://github.com/leVirve/lsun-room

Face2webtoon:人脸Webtoon卡通画

https://github.com/sangyun884/Face2Webtoon

Crypko:用GAN让人人都变成动漫小画家

https://crypko.ai/

视频会议实时换脸工具。利用机器学习训练的模型,通过捕捉人脸动作并与图片相结合进行实时渲染的方式,达到实时换脸的效果。支持 OBS、Zoom、Skype、Teams、Slack 等直播和会议软件

https://github.com/alievk/avatarify-python

通过 Pytorch 实现绘制一个边界框,即可删除视频中要删除的对象。

https://github.com/zllrunning/video-object-removal

谁先眨眼谁就输了的游戏。使用 React + Flask + Dlib 技术实现的“眨眼就输了”在线游戏 https://github.com/ByronHsu/Never-Blink

AR 拷贝实物照片到 PS 软件的工具。它可以通过 iPhone 或者 Android 手机将真实物品从周围环境中抠出来,并粘贴到 Photoshop 中,未来还会支持其它软件 https://github.com/cyrildiagne/ar-cutpaste

一个微软开源的免费 Windows 操作系统的无视觉桌面访问阅读器。通过合成器语音或者盲文点字的反馈,方便盲人和低视力人群使用运行在 Windows 操作系统下运作的电脑。也能够让开发者了解微软的常见的辅助功能接口,如微软 Active Accessibility、Java Access Bridge、IAccessible2 和 UI automation。希望有更多的人了解无障碍

https://github.com/nvaccess/nvda https://www.nvdacn.com/

一个把单张静态照片转化成 3D 图片的项目。 https://github.com/vt-vl-lab/3d-photo-inpainting

一个封装了 7 种启发式算法的 Python 代码库。分别是:差分进化算法、遗传算法、粒子群算法、模拟退火算法、蚁群算法、鱼群算法、免疫优化算法

https://github.com/guofei9987/scikit-opt

将真实照片转换为卡通风格的开源项目

https://github.com/minivision-ai/photo2cartoon

《TTNet: Real-time temporal and spatial video analysis of table tennis》(CVPR 2020) github.com/maudzung/TTNet-Real-time-Analysis-System-for-Table-Tennis-Pytorch

LOHO: Latent Optimization of Hairstyles via Orthogonalization (CVPR 2021) github.com/dukebw/LOHO

《TediGAN: Text-Guided Diverse Face Image Generation and Manipulation》(2020) github.com/IIGROUP/TediGAN

WOMBO:上传大头照和歌曲自动生成歌唱视频的App https://www.wombo.ai/

SimDeblur:PyTorch图片/视频去模糊框架

github.com/ljzycmd/SimDeblur

automaton:创意编程动画引擎 github.com/FMS-Cat/automaton

如何用Python创建像3Blue1Brown一样的数学动画 towardsdatascience.com/how-to-create-mathematical-animations-like-3blue1brown-using-python-f571fb9da3d1

BMW-Anonymization-Api:视频/图像匿名化API github.com/BMW-InnovationLab/BMW-Anonymization-API

Voice Cloning App:开源语音克隆App github.com/BenAAndrew/Voice-Cloning-App

Qbr:基于摄像头的3x3x3魔方解算器(Python/OpenCV) github.com/kkoomen/qbr

程序员不知道写什么的时候,可以看看这个网站,Product Hunt 上最受欢迎的产品排行 https://pragli.com/leaderboard-for-product-hunt

Disentangled Cycle Consistency for Highly-realistic Virtual Try-On (CVPR 2021)

github.com/ChongjianGE/DCTON

Skeleton Aware Multi-modal Sign Language Recognition》(CVPRW 2021) github.com/jackyjsy/CVPR21Chal-SLR

Anime2Sketch:动画、插图的线稿抽取工具 github.com/Mukosame/Anime2Sketch

日常工作中我们需要用到时间序列预测,比如预测收入趋势、预测DAU等等,Facebook为此专门开源过一个工具prophet,支持自定义节假日、配置周期、选择拟合函数等,工具封装得很好。 github.com/facebook/prophet

Pintr:为图片生成线条艺术画 github.com/javierbyte/pintr

人人都能做动画:Adobe最新推出Character Animator(Beta),通过人体检测和追踪制作角色动画 https://pages.adobe.com/character/en/body-tracker

BabyGAN:根据父母长相预测孩子长相(基于StyleGAN) github.com/tg-bomze/BabyGAN

Fully Convolutional Line Parsing》(2021)

github.com/Delay-Xili/F-Clip

Semi-supervised Video Deraining with Dynamical Rain Generator github.com/zsyOAOA/S2VD

《Focal Inverse Distance Transform Maps for Crowd Localization and Counting in Dense Crowd》(2021) github.com/dk-liang/FIDTM

《M-LSD: Towards Light-weight and Real-time Line Segment Detection》(2021)

github.com/navervision/mlsd

Lazy, a tool for running things in idle time:充分利用机器空闲时间跑模型,不影响正常工作 github.com/nshepperd/lazy

动画脸控制变换Demo paper:《GANs N’ Roses: Stable, Controllable, Diverse Image to Image Translation (works for videos too!)》 github.com/mchong6/GANsNRoses

去看、去听、去探索:音-视联想与好奇 https://blog.ml.cmu.edu/2021/06/11/see-hear-explore-curiosity-via-audio-visual-association/

Avatarify Desktop:有摄像头就能用的肖像化身桌面版 github.com/alievk/avatarify-desktop

Fine-Tuning StyleGAN2 For Cartoon Face Generation github.com/happy-jihye/Cartoon-StyleGan2

Sketch Your Own GAN https://arxiv.org/abs/2108.02774

MoveNet + TensorFlow Lite手机端姿态估计与分类 https://blog.tensorflow.org/2021/08/pose-estimation-and-classification-on-edge-devices-with-MoveNet-and-TensorFlow-Lite.html

生成自己的Ilya Kuvshinov风格漫画头像 github.com/dobrosketchkun/NeuralKuvshinov_v2

虚拟办公室游戏。简单的说就是一个在线地图,当角色之间靠近时,就可以通过摄像头看到对方。看演示还挺好玩的。 这个系统是开源的,可以自己架设。github.com/thecodingmachine/workadventure

NARUTO-HandSignDetection,可用于识别火影忍者中的结印手势。 github.com/Kazuhito00/NARUTO-HandSignDetection

YOLOP: You Only Look Once for Panoptic Driving Perception github.com/hustvl/YOLOP

Robust Video Matting (RVM):PyTorch, TensorFlow, TensorFlow.js, ONNX, CoreML实现的稳定视频抠像 (RVM) github.com/PeterL1n/RobustVideoMatting https://arxiv.org/abs/2108.11515

MoveNet Multipose Tracking on OpenVINO:OpenVINO上实现的MoveNet多姿态跟踪

github.com/geaxgx/openvino_movenet_multipose

air-drawing:基于深度学习的摄像头”凭空”手绘

github.com/loicmagne/air-drawing

Go Motion:以Jetson Xavier NX为核心基于机器学习的定格动画拍摄平台,自动剔除包含手的视频帧 github.com/nickbild/go_motion

DyStyle: Dynamic Neural Network for Multi-Attribute-Conditioned Style Editing github.com/phycvgan/DyStyle

Python-Image-Morpher:Python图像渐变生成器

github.com/ddowd97/Python-Image-Morpher

Notion Avatar Maker:Notion风头像生成器 github.com/Mayandev/notion-avatar

logo-app:图片自动去Logo(基于深度学习)

github.com/Legacy-League/logo-app

OptaPy:Python的AI约束解算器,可用来优化车辆路径问题、员工排班、维护调度、任务分配、学校日程安排、云优化、会议调度、车间调度、装箱等许多规划问题 github.com/optapy/optapy

YoHa:实用手部跟踪引擎 ithub.com/handtracking-io/yoha

LaMa,由莫斯科三星人工智能中心开源,可快速进行图像修复、指定对象移除等操作。 github.com/saic-mdal/lama

CleanUp.pictures:从图片删除不想要部分的开源工具 github.com/initml/cleanup.pictures

Super_Mario:体控马里奥 github.com/BadagalaAdarsh/Super_Mario

视频自动抠图技术:RobustVideoMatting。 大、实时、高分辨率的人物视频抠图方法,使用循环神经网络,在处理视频流时有时间记忆,可在任意视频上做实时高清抠像。在 Nvidia GTX 1080Ti 上实现 4K 76FPS 和 HD 104FPS。 GitHub:github.com/PeterL1n/RobustVideoMatting/

AnimeGANv2 github.com/bryandlee/animegan2-pytorch

YOLOP-NCNN:基于ncnn在安卓平台运行的YOLOP

github.com/EdVince/YOLOP-NCNN

Rhubarb Lip Sync,可通过真实录音,让动漫人物的嘴唇实现音画同步。 开发者可将其应用于计算机游戏、动画卡通角色、视频 Vlog 等场景上。 GitHub:github.com/DanielSWolf/rhubarb-lip-sync ​​​​

一款人体运动模拟器:KalidoKit。 通过捕捉人体面部表情、眼睛、姿势、手部动作等元素后,便可自动映射到虚拟人物身上,打通真实世界与虚拟世界的连接。 GitHub:github.com/yeemachine/kalidokit ​​​​

开源项目SkyAI可对普通视频“换天”,让你的视频变成科幻大片,效果非常震撼 github.com/jiupinjia/SkyAR 一款开源的卡通头像生成器,可自定义发型、眼镜、肤色、衣着、嘴型等属性。 定制完成后,可将头像导出成 PNG 和 SVG 格式的图片,或把头像代码内嵌到个人网站上。 github.com/fangpenlin/avataaars-generator ​​​​

Lama-cleaner:基于LaMa的图像擦除补全工具 github.com/Sanster/lama-cleaner

Face Vid2Vid Demo:视频换脸Demo ithub.com/happy-jihye/face-vid2vid-demo

Kalidoface - 仅需要摄像头就能实现的虚拟人物

github.com/yeemachine/kalidoface

Kalidoface 3D - 面向Vtubing的人脸/全身追踪 github.com/yeemachine/kalidoface-3d

Blender虚拟人物姿态控制扩展 github.com/yanch2116/CharacterDriven-BlenderAddon

视频”套脸“Demo https://huggingface.co/spaces/abhishek/first-order-motion-model

Crop-CLIP:基于CLIP的图片内容检索/裁剪 github.com/vijishmadhavan/Crop-CLIP

ClothingTransfer-NCNN - CT-Net, OpenPose, LIP_JPPNet, DensePose running with ncnn 服装迁移/虚拟试穿(ClothingTransfer/Virtual-Try-On) github.com/EdVince/ClothingTransfer-NCNN

麻省理工大学的工作室 sizigi,发布了一款很有意思的 AI 工具:动漫肖像魔法。你可以通过选择头像、滤镜、风格、动作等 4 个步骤,来定制一个专属的二次元老婆 / 老公 [doge] https://waifulabs.com/

Text to Handwriting,可将普通文本转换为手写文本,包括中文字体。支持自定义字体大小、墨水颜色、页面大小、字体间距、纸张背景等属性。 除此之外,你还能上传自己的字体,让 AI 帮你写作业 GitHub:github.com/saurabhdaware/text-to-handwriting Demo:saurabhdaware.github.io/text-to-handwriting

SberSwap:图像/视频换脸 github.com/sberbank-ai/sber-swap

Lite.AI.ToolKit:开箱即用的C++ AI工具箱,包括70+流行的开源模型,如最新的RVM, YOLOX, YOLOP, YOLOR, YoloV5, DeepLabV3, ArcFace等模型,支持ONNXRuntime/NCNN/MNN/TNN ithub.com/DefTruth/lite.ai.toolkit

DeepFaceLive:视频电话/视频会议实时换脸

github.com/iperov/DeepFaceLive

BangBang:跟神经网络比赛“打炮”(网页版),谁先调好角度力道打中对方谁就赢了 github.com/victorqribeiro/bangBang

文言文白话文互转:文言文转白话文(现代文),白话文(现代文)转文言文

【Gaming using Computer Vision:用计算机视觉玩City Island 5的机器人】’Gaming using Computer Vision - A simple python bot (powered by computer vision) used to play a game (City Island 5)' by Paul Onteri GitHub: github.com/paulonteri/play-game-with-computer-vision

【AI工具集市】《Futurepedia - The Largest AI Tools Directory | Home》 https://www.futurepedia.io/

【StoryTeller:多模态AI叙事生成器——给出一个提示作为故事开头,用GPT写出剩下的情节,用Stable Diffusion为每个句子画出一幅图像,用TTS模型念出每一句,最后生成一个能听能看的短篇故事动画视频】’StoryTeller - Multimodal AI Story Teller, built with Stable Diffusion, GPT, and neural text-to-speech' by Jake Tae GitHub: github.com/jaketae/storyteller

【Gauss:Mac上的原生Stable Diffusion图像生成App(SwiftUI+ ml-stable-diffusion CoreML models)】’Gauss - Stable Diffusion macOS native app' by Jake Teton-Landis GitHub: github.com/justjake/Gauss

'FAY - 一个完整的数字人项目,包含Python内核及UE数字人模型,可以用于做数字助理及抖音自动直播' TheRamU GitHub: github.com/TheRamU/Fay

【DeepStrike:基于视觉的AI拳击分析】“Jabbr.ai | DeepStrike - Throwing the First Punch for the Future of Boxing” https://jabbr.ai/

【Scribble Diffusion:用 涂鸦 + 文本提示 生成图片】’Scribble Diffusion - Turn your rough sketch into a refined image using AI' Replicate GitHub: github.com/replicate/scribble-diffusion

【ChatWaifu_Mobile:Android 手机版的 ChatGPT 二次元聊天器(年轻人的第一个移动版老婆聊天器) [笑而不语]】’ChatWaifu_Mobile' by Voine GitHub: github.com/Voine/ChatWaifu_Mobile

【iOS app - 用 Stable Diffusion 生成图像并显示在 AR 里】’iOS app - AR Diffusion Museum - an iOS app that generate images using Stable Diffusion and displays them in AR.' Yasuhito Nagatomo GitHub: github.com/ynagatomo/ARDiffMuseum

【BilibiliSummary:基于 OpenAI API 的 Bilibili B站视频摘要生成插件,支持中文】’BilibiliSummary - A chrome extension helps you summary video on bilibili.' lxfater GitHub: github.com/lxfater/BilibiliSummary

【roomGPT.io:上传室内照片,生成梦幻家居】’roomGPT.io - Upload a photo of your room to generate your dream room with AI.' Hassan El Mghari 网页链接 GitHub: github.com/Nutlope/roomGPT https://www.roomgpt.io/

'Posex - Posex - Estimated Image Generator for Pose2Image' hnmr293 GitHub: github.com/hnmr293/posex

Deep Agency:AI 影楼 & 虚拟模特经纪公司,可以“雇佣”不存在的模特,用指定的姿势摆拍,完全由AI生成

BibiGPT 基于ChatGPT API的音视频内容一键总结,支持:哔哩哔哩丨YouTube丨网页丨播客丨会议丨本地文件等。 简单看了一下代码,总结的实现还是有点简单粗暴,由于OpenAI限制4096个tokens,所以对于字幕长度超过了限制,就随机删除掉一半字母,这样对结果的还是蛮大的。 🔗 github.com/JimmyLv/BibiGPT

【ChatdollKit:3D虚拟助手SDK,可以将3D模型转化为语音聊天机器人,支持面部表情控制,语音和动作同步等特性,支持多种语音识别和合成引擎】'ChatdollKit - ChatdollKit enables you to make your 3D model into a chatbot' uezo GitHub: github.com/uezo/ChatdollKit

play.ht 它可以从 20 秒的音频中快速生成克隆语音,并自动转换为英语。 也就是说,即便你不会说英语,也可以通过语音克隆的方式,立刻说出一口流利的英语。 在使用的过程中,我试了下自己的声音,确实有点震撼。 🔗 playground.play.ht 这里的技术采用了一个名为 Parrot 的模型,它能从几秒的音频克隆出声音,并基于文本,重新生成一段富有情感的语音。 目前该模型只支持英语,不过技术团队已经在开始尝试支持更多语言。 克隆声音的数据样本主要分两种:高保真(20 分钟)和零样本(20 秒),给的音频样本时间越长,其精度就更佳。 未来,该工具将被应用到各类数字内容创作(如游戏、媒体、在线教育)等平台。 微博视频中提供的两段音频示例,是基于雷总某个采访的声音样本进行克隆的。 如果你感兴趣的话,也可以用自己的声音试下。

【IEA: Image Editing Anything:Stable Diffusion + Segmentation Anything 实现图像内容编辑】’IEA: Image Editing Anything - Using stable diffusion and segmentation anything models for image editing' feizc GitHub: github.com/feizc/IEA

【Caption-Anything:Segment Anything + 视觉描述 + ChatGPT 的图片目标描述项目】’Caption-Anything - Caption Anything via Clicking' Teng Wang GitHub: github.com/ttengwang/Caption-Anything

【Semaphore:用全身肢体动作驱动的键盘[笑而不语]】’Semaphore - A full-body keyboard using gestures to type through computer vision' everythingishacked GitHub: github.com/everythingishacked/Semaphore

awesome-ai-painting AI绘画资料合集(包含国内外可使用平台、使用教程、参数教程、部署教程、业界新闻等等) stable diffusion tutorial、disco diffusion tutorial、 AI Platform 🔗 github.com/hua1995116/awesome-ai-painting ​​​

AnimatedDrawings Meta新的开源项目,可以把小孩子画的简笔画,识别出来骨骼,然后生成动画 github.com/facebookresearch/AnimatedDrawings

【OpenMMLab Playground:用于收集和展示 OpenMMLab 相关前沿和有趣应用的项目,旨在为社区搭建分享创新技术方案、玩转 OpenMMLab 的平台】'OpenMMLab Playground - A central hub for gathering and showcasing amazing projects that extend OpenMMLab with SAM and other exciting features.' OpenMMLab GitHub: github.com/open-mmlab/playground

提出一种基于扩散的方法,使用姿态和图像引导合成具有人体和面料运动的时尚视频,称为DreamPose,并在时尚视频动画方面取得了最先进的结果。 https://arxiv.org/abs/2304.06025
[CV]《DreamPose: Fashion Image-to-Video Synthesis via Stable Diffusion》J Karras, A Holynski, T Wang, I Kemelmacher-Shlizerman [University of Washington & UC Berkeley & NVIDIA] (2023)

【Count Anything:Segment Anything + CLIP 实现的零样本计数】’Count Anything - This method uses Segment Anything and CLIP to ground and count any object that matches a custom text prompt, without requiring any point or box annotation.' ylqi GitHub: github.com/ylqi/Count-Anything

根据你的草图,实时用Stable Diffusion将草图画成真实图片。 它需要后台运行Stable Diffusion web UI(github.com/AUTOMATIC1111/stable-diffusion-webui) 🔗 github.com/houseofsecrets/SdPaint

'Paint-by-Skech - Stable Diffusion-based image manipulation method with a sketch and reference image' Kangyeol Kim GitHub: github.com/kangyeolk/Paint-by-Sketch

灵瓜背单词 这个产品蛮有创意,借助GPT编故事的能力,把枯燥的背单词变成读故事 https://xlog.mekal.xyz/ling-gua-bei-dan-ci

教你打造属于自己的AI孙燕姿,AI歌手模型使用及训练保姆级课程 https://mp.weixin.qq.com/s/bXD1u6ysYkTEamt-PYI1RA https://mp.weixin.qq.com/s?__biz=MzU0MDk3NTUxMA

让AI当Tony老师给你换发型,基于Stable Diffusion的重画功能实现的。 原贴:twitter.com/shavonnewong_/status/1658096663226089473

最近做了一个无代码AI工作流+知识库的产品,顺便开源了一个本地的版本放在Github上:AndersonBY/vector-vein 即便没有代码能力的朋友也可以通过简单的拖拽连线的方式快速搭建一个你自己的AI工作流。 软件采用pywebview框架开发,前端用AntDesignVue,AI接口调用OpenAI的API,向量数据库采用Qdrant。

【Draw It:根据涂鸦自动生成图片】“Draw It | powered by Leap" https://www.drawit.art/

实时将摄像头里的大叔变成美少女,不过现在运算速度还不够,看起来一帧一帧的有点卡。 Stable Diffusion + Beautiful Realistic Asians(BRA)V4模型 模型链接:civitai.com/models/25494/brabeautiful-realistic-asians-v2🔗 原推:twitter.com/yokohara_h/status/1662653691906887685

【Refacer: 一键Deepfake多人脸替换工具,只需一次点击,即可创建多人脸Deepfake,无需训练,仅需一张照片即可使用。支持MacOSX、Windows和Linux】'Refacer: One-Click Deepfake Multi-Face Swap Tool - Refacer: One-Click Deepfake Multi-Face Swap Tool' xaviviro GitHub: github.com/xaviviro/refacer

Roop,可以一键实现 AI 换脸功能的开源项目,基于 Python 开发。 仅需一张换脸图像,无需数据集,无需训练,自带敏感图像检测功能。 GitHub:github.com/s0md3v/roop ​​​

【fashionAI:在线一键换装】’fashionAI - Take a picture of a person, then modify clothing or explore fashion using our AI.' GitHub: github.com/naklecha/fashionAI

【Stable Doodle:将涂鸦加文字描述转化为动态图像,为各行业的专业人士和爱好者提供了无限的图像创作可能性】《Clipdrop Launches Stable Doodle — Stability AI》 https://clipdrop.co/stable-doodle

RealChar,可帮助你快速创建、自定义各种 AI 角色。项目主要特性如下:

  • 易于使用:无需编码,即可创建自己的 AI 角色;
  • 可定制化:AI 角色支持个性、背景、声音等属性定制;
  • 实时通信:与 AI 角色实时交谈或发送消息;
  • 多平台:支持 Web、PC、移动端等平台;
  • 模块化:通过各种模块组装,来自定义流程。 GitHub:github.com/Shaunwei/RealChar 你可以通过该项目,来定制各种专属的 AI 角色,与名人明星进行任意的对话,交流。

【和喜欢的角色沉浸式对话(ChatGLM2-6B+声音克隆)】’ChatGLM2 Voice Cloning - Chat with any character you like: ChatGLM2-6B+Voice Cloning' Kevin Wang GitHub: github.com/KevinWang676/ChatGLM2-Voice-Cloning

【Al Zebra: 面向儿童的AI数学辅导软件,旨在提供互动学习体验,通过根据孩子之前的回答情况提出逐渐增加难度的问题,验证答案,并为正确解决方案提供逐步解释,帮孩子们学习数学,有智能递进的问题复杂性、逐步解释正确答案以及互动有趣的学习体验等特点】’Al Zebra: AI-Powered Maths Tutor for Kids - Math Tutor for kids' moreshk GitHub: github.com/moreshk/alzebra

【AI Basketball Referee v2.0:AI篮球裁判,旨在提高篮球比赛的公正性,使用经过训练的YOLO机器学习模型,在实时视频中准确识别篮球,并通过YOLO姿态估计检测球员身体的关键点】'AI Basketball Referee v2.0 - AI Basketball Referee' Ayush Pai GitHub: github.com/ayushpai/AI-Basketball-Referee

DreamGenerator:基于Stable Diffusion+ControlNet能根据预设提示“美化”拍照内容的相机,很棒的想法!

【OnnxStream:在树莓派Zero 2上运行Stable Diffusion】’OnnxStream - Running Stable Diffusion on a RPI Zero 2 (or in 260MB of RAM)' Vito Plantamura GitHub: github.com/vitoplantamura/OnnxStream

学习外语时,最好有一个对话环境,可以练习口语。现在有一个 AI 应用,解决了这个问题。 它目前提供26种语言(包括中文、日文和韩文),你在网页上选择一种,就可以与 AI 进行口语练习了。 感觉以后国内的外语培训产业,都要被 AI 取代了。 ​​​ https://www.prettypolly.app

【高质量唇形合成】'High quality Lip sync' Ajay Sainy GitHub: github.com/ajay-sainy/Wav2Lip-GFPGAN

【FaceChain:可以用来打造个人数字形象的深度学习模型工具,仅需要提供最低三张照片即可获得独属于自己的个人形象数字替身】'FaceChain - FaceChain is a deep-learning toolchain for generating your Digital-Twin.' ModelScope GitHub: github.com/modelscope/facechain

'VirtualWife - 一个虚拟主播项目,目前支持在B站进行直播,用户可以自由更换VRM人物模型,大家可以将他作为一个虚拟主播入门demo,在上面扩展自己喜欢功能。' yakami GitHub: github.com/yakami129/VirtualWife

【FaceChain:可以用来打造个人数字形象的深度学习模型工具,仅需要提供最低三张照片即可获得独属于自己的个人形象数字替身】'FaceChain - FaceChain is a deep-learning toolchain for generating your Digital-Twin.' ModelScope GitHub: github.com/modelscope/facechain Colab上可以运行的版本:github.com/camenduru/facechain-colab

【TINY DREAM: C++ 实现的Stable Diffusion无依赖嵌入式头文件库,主要关注 CPU 效率和更小的内存占用,在普通消费级硬件上运行速度相当快,仅需要 1.7 ~ 5.5 GB 的 RAM 即可执行,不强制使用 GPU】’TINY DREAM - An embedded, Header Only, Stable Diffusion C++ implementation' PixLab | Symisc Systems GitHub: github.com/symisc/tiny-dream

【EasyPhoto:一款Webui UI插件,用于生成AI肖像画,该代码可用于训练数字分身。建议使用 5 到 20 张肖像图片进行训练,最好是半身照片且不要佩戴眼镜(少量可以接受)。训练完成后,可以在推理部分生成图像。支持使用预设模板图片与上传自己的图片进行推理】'EasyPhoto | Your Smart AI Photo Generator' aigc-apps GitHub: github.com/aigc-apps/sd-webui-EasyPhoto

ProPainter 一键移除视频内的移动物体,一键移除视频水印。 代码库:github.com/sczhou/ProPainter

'Rust + candle + CLIP 实现的搜图工具' flaribbit GitHub: github.com/flaribbit/imgfind

Manga-Image-Translator:一个开源的漫画图片翻译器 能够自动翻译漫画图像中的文本,当然普通的图片也可以。翻译完成后在图像在原位置替换译文。干净简洁,速度很快。 主要支持日语,汉语、英文和韩语。 GitHub:github.com/zyddnys/manga-image-translator/blob/main/README_CN.md

Drawdata:随手涂鸦创建2D数据集 github: github.com/patchy631/machine-learning/blob/main/awesome_tools/drawdata.ipynb

【EasyPhoto:智能 AI 照片生成器,用于生成AI肖像画,代码可用于训练与您相关的数字分身】'EasyPhoto | Your Smart AI Photo Generator. Without Stable-Diffusion-Webui' aigc-apps GitHub: github.com/aigc-apps/EasyPhoto

音频输入生成口型同步视频 https://bhaasha.iiit.ac.in/lipsync/ 代码仓库:github.com/Rudrabha/Wav2Lip

【CPU上运行的快速stable diffusion,Core i7-12700上生成一张512x512图片只要21秒】’Fast stable diffusion CPU' Rupesh Sreeraman GitHub: github.com/rupeshs/fastsdcpu

【XTalker:四代 Xeon CPU 上更快的说话脸实现,基于SadTalker,利用低精度和并行将推理速度提高了 10 倍】’XTalker - Faster Talking Face Animation on 4th Gen Xeon CPU' Sihan Chen GitHub: github.com/Spycsh/xtalker

【Wunjo AI:合成和克隆英语/俄语/中文语音、实时语音识别、深度换脸和唇动合成、通过文本提示更改视频、分割和修饰】'Wunjo AI: Synthesize & clone voices in English, Russian & Chinese, real-time speech recognition, deepfake face & lips animation, face swap with one photo, change video by text prompts, segmentation, and retouching. Open-source, local & free.' Wladislav Radchenko GitHub: github.com/wladradchenko/wunjo.wladradchenko.ru

【基于LCM的SD准实时图片流生成[酷]】《Real-Time Latent Consistency Model - a Hugging Face Space by radames》 github.com/radames/Real-Time-Latent-Consistency-Model

pyvideotrans:这是一个视频翻译工具,可将一种语言的视频翻译为另一种语言和配音的视频。 地址:github.com/jianchang512/pyvideotrans 其语音识别基于 openai-whisper 离线模型、文字翻译使用google翻译接口,文字合成语音使用 Microsoft Edge tts,背景音乐去除使用 Spleeter,无需付费的商业接口

【SAM + MetaCLIP + ProPainter实现的视频自动目标掩码补全】《SAM And ProPainter - a Hugging Face Space by SkalskiP》 https://huggingface.co/spaces/SkalskiP/SAM_and_ProPainter

【Mirror:本地运行的AI镜子 Webster 应用,利用开源的 LLama.cpp 服务器和 Bakllava 多模态 AI 模型,可以实时分析来自笔记本摄像头的数据流并作出描述性响应】'Mirror - Hackable AI Powered Mirror on your laptop’ by cocktailpeanut GitHub: github.com/cocktailpeanut/mirror

这个开源项目可以实时将草图渲染成真实的图片,背后使用的是LCM(Latent Consistency Models) latent-consistency-models.github.io/ https://www.fal.ai/models/latent-consistency-sd 项目地址:github.com/tldraw/draw-fast

阿里推出的视频生成技术,只要一张图片加上骨骼动作就可以生成平滑稳定的动画视频,甚至头发都能跟着一起动! https://humanaigc.github.io/animate-anyone/