https://github.com/InstantID/InstantID
只使用一张图片,就可以提取人脸,用于个性化图像合成,并支持各种不同的风格,试用 Demo。
https://github.com/rany2/edge-tts
Edge-TTS是由微软推出的文本转语音Python库,通过微软Azure Cognitive Services转化文本为自然语音。适合需要语音功能的开发者,GitHub上超3000星。作为国内付费TTS服务的替代品,Edge-TTS支持40多种语言和300种声音,提供优质的语音输出,满足不同开发需求。
DeepFaceLive 实时直播和视频 AI 换脸程序
https://github.com/iperov/DeepFaceLive
该项目可以对摄像头和本地视频文件中的人物,进行实时 AI 换脸,可用于 PC 直播、视频等场景。
https://github.com/chrxh/alien
强大的人工生命模拟工具。该项目是基于 CUDA 的 2D 粒子引擎构建的人工生命模拟工具。它提供了图形化用户界面和粒子编辑器,能够轻松模拟软体、流体、数字生物体、遗传和进化等过程。生物行为由神经网络控制,支持实时交互和模拟百万量级的粒子。
Stable Diffusion 模型的 WebUI 界面
https://github.com/AUTOMATIC1111/stable-diffusion-webui
这是一个实现在浏览器上使用的 Stable Diffusion 模型的项目,支持通过文本/图片生成图片、嵌入文本、调整图片大小等功能。
OpenAI 的本地替代品
https://github.com/mudler/LocalAI
这是一个实现了在个人电脑上运行 LLM 模型,并集成了服务接口和在线聊天界面的项目。它可作为本地 OpenAI 接口的替代品,虽然效果无法和 GPT-4 媲美,但它开箱即用且免费,支持 Vicuna、Alpaca、GPT4ALL 等多种大模型。
Suno.ai v3 是一个令人惊叹的 AI 音乐服务,虽然官方还没有开放 API,但我们已经迫不及待的想在某些地方集成它的能力。 我们发现有一些用户也有类似需求,于是我们将这个项目开源了,希望你们喜欢。
评论区