对话大语言模型: 国外chatgpt,Gemini,bing, claude 3 国内 文心一言 密塔写作猫 星火大模型
图生视频:https://lumalabs.ai/ https://deepmind.google/ 模仿声音,文字转语音:GPT-SoVITS 同声传译:seamless_communication
语音转字幕:whisper
文生图:捏ta, stable diffusion comfyui工作流
对口型: easy_wav2lip / https://github.com/fudan-generative-vision/hallo
音乐类:suno(Ai编曲)
语音合成: chattts
情感分析: hume.AI
2024.9.8更新 编程工作站 replit 实时换脸 https://github.com/hacksider/Deep-Live-Cam
视频/图片:换脸/对口型 facefusion
本文作者:墨洺的文档
本文链接:
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!