VideoDrafter VideoDrafter,一个高质量视频生成的开放式扩散模型,相比之前的生成视频模型,VideoDrafter最大的特点是能在主体不变的基础上,一次性生成多个场景的视频。 01300 AI编程# <video# Drafter# VideoDrafter
DurableAI建站工具 Durable AI建站工具,Durable AI,专业AI建站工具,只需点击三下,在一分钟内生成一个设计完整的网站,让你的业务上线,其中包含文本、图像和表格。毫不费力地自定义你的网站。简单的编辑工具、多个页面和免费的自定义域。无需代码基础。 01300 AI编程# ai# Durable
cursor.sh cursor.sh,cursor.sh是一个以人工智能为核心的代码编辑器,专为双人编程而设计。它是未来的集成开发环境,通过AI的力量帮助开发人员更快地构建软件。 01300 AI编程# cursor.sh
1000UserGuide 1000UserGuide,一个为独立开发者提供一个丰富的获客资源渠道网站,1000UserGuide精心整理了300多个国内外渠道,专门适合独立开发者和创业者推广产品的渠道。 01290 AI编程# 1000UserGuide# 独立开发者
Media2Face Media2Face,一款革命性的语音面部动画生成工具,借助 Media2Face,现在可以从任何音频、图像或文本输入无缝生成逼真且富有表现力的面部动画。 01290 AI编程# Media2Face
LogoCreator LogoCreator,一款由开源达人Hassan打造的AI Logo设计工具,LogoCreator依托Together AI平台的Flux模型实现,为用户提供智能、高效的Logo生成功能。 01290 AI编程# Creator"# Logo"# LogoCreator
Hibiki Hibiki,Kyutai Labs开发的高保真实时语音翻译模型,可以保留原声特点并进行实时翻译,边听边翻译,像同声传译一样实时输出,同时生成语音和文字翻译。 01290 AI编程# Hibiki# Kyutai# Labs
FireRedASR FireRedASR,小红书FireRed 团队发布并开源的基于大模型的语音识别模型,它在中文普通话语音识别领域取得了新的SOTA,FireRedASR支持方言、英语及歌词识别。 01290 AI编程# FireRedASR# 小红书
MapleMono Maple Mono,一款专注于优化编码体验的开源等宽字体,它提供无限的字体粗细和手工微调的斜体字形,圆角设计使其看起来丝滑舒适,特别适合长时间编码工作。 01290 AI编程# Maple# Mono
TryOnDiffusion TryOnDiffusion,TryOnDiffusion就谷歌推出的一项新虚拟试穿功能,能够实现高度逼真的虚拟试穿,用户能够直观地看到不同体型的人穿着不同尺寸的衣服效果如何。 01290 AI编程# TryOnDiffusion# 试穿
DiffusionGPT DiffusionGPT,字节跳动开发的由LLM驱动文本生成图像多合一系统,专门设计用于为不同的输入提示生成高质量的图像。 01280 AI编程# Diffusion# DiffusionGPT# GPT
Lumiere Lumiere,谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构,能够一次性生成整个视频的时间长度,确保了生成视频的连贯性和逼真度。 01280 AI编程# Lumiere
TokenFlow TokenFlow,一个利用预训练的文本到图像扩散模型进行视频编辑的框架。它无需进一步训练或微调,即可实现一致的视频编辑效果。 01280 AI编程# flow# token# TokenFlow
JoyGen JoyGen,京东科技与香港大学合作开发的音频驱动3D说话人脸视频生成框架,提供精确的唇部与音频同步,以精确模拟说话者的唇部动作和面部表情,让生成的视频更逼真。 01280 AI编程# Gen# JoyGen
AstrBot AstrBot,一个开源的多平台 LLM 聊天机器人及开发框架,支持多个消息平台的集成,如QQ、微信,AstrBot支持多种大型语言模型(LLM)的接入。 01280 AI编程# AstrBot# bot
PiliPala PiliPala,一款基于Flutter开发的B站开源第三方客户端。支持Android和iOS平台,提供无广告的高清视频播放体验,具备倍速播放、离线缓存、稍后再看等功能。 01280 AI编程# B站# PiliPala
Copilot Copilot,Copilot 是由 人工智能公司 和 GitHub 合作开发的一个基于人工智能的代码提示工具,它可以利用机器学习技术和大量训练数据生成高质量的代码。 01280 AI编程# AI编程# copilot
SoraWebui SoraWebui,一个开源项目,允许用户使用 OpenAI Sora 模型使用文本在线生成视频,从而简化视频创建,并具有轻松的一键网站部署功能。 01270 AI编程# OpenAI# SoraSoraWebui
Awesome-Ollama-Server Awesome-Ollama-Server ,一个用于实时监控和检测 Ollama 服务可用性和性能的系统。支持多语言,能够方便用户进行服务检测和性能监控。 01270 AI编程# Awesome-Ollama-Server
IP-Adapter-FaceID IP-Adapter-FaceID,该模型利用面部识别模型的面部ID嵌入,可以更准确地捕捉和再现特定人物的面部特征。IP-Adapter-FaceID结合文本描述生成可以生成高度个性化且与原始面部特征一致的图像。 01270 AI编程# Face# IP-Adapter-FaceID
PhotoMaker PhotoMaker,PhotoMaker:利用多张照片作为身份ID,获取人物特征,然后根据描述生成一个新的、个性化的人物图像。 01270 AI编程# Maker# Photo# PhotoMaker
DeepClaude DeepClaude,一个将DeepSeek R1模型推理能力和Claude的代码生成能力的开源工具,提供统一的API和聊天界面,还可自定义配置、具有低延迟等特点。 01260 AI编程# (deep)# Claude# DeepClaude
LucidDreamer LucidDreamer,LucidDreamer,可以从单个图像的单个文本提示中生成可导航的3D场景。 单击并拖动(导航)/移动和滚动(缩放)以感受3D。 01260 AI编程# Dream# Lucid# LucidDreamer
DemoFusion DemoFusion,一个开源的 AI 图像重绘增强工具,通过使用最新的 BSR Gan技术,可以将低分辨率图像提升至高分辨率并修复和增强图像的细节。 01260 AI编程# demo# DemoFusion# Fusion"
DDColor图像上色 DDColor图像上色,一个为黑白图像上色的魔搭模型,通过双解码器实现逼真的图像着色,输入一张黑白图像,实现端到端的全图上色,返回上色处理后的彩色图像。 01260 AI编程# Color# DDColor
码多多AI数字人源码系统 码多多AI数字人源码系统,一站式AI数字人视频制作源码系统,支持真人声音克隆和真人形象克隆,只需随意上传一段真人视频,即可快速完成声音以及形象克隆。 01260 AI编程# AI数字人系统# 码多多
ProjectIDX Project IDX,谷歌推出的云端全栈开发环境,集成Gemini,支持全栈和多平台应用开发,提供智能代码补全、上下文操作、跨平台预览、一键部署到Firebase Hosting等功能。 01260 AI编程# IDE# IDX# project:
EmotePortraitAlive Emote Portrait Alive,阿里巴巴发布的EMO,一种音频驱动的AI肖像视频生成框架。通过输入单一的参考图像和语音音频,Emote Portrait Alive可以生成动态的、表情丰富的肖像视频。 01250 AI编程# Alive# Emote# Portrait
LiberSonora LiberSonora,一个基于AI的、开源有声书工具集,LiberSonora提供智能字幕提取、AI标题生成、多语言翻译等功能,并且支持 GPU 加速、批量离线处理。 01250 AI编程# LiberSonora
Step-Video-T2V Step-Video-T2V,一个由阶跃星辰与吉利汽车合作开源的先进文本到视频生成模型。支持中文与英文提示输入,应用于在如广告、影视制作、自动化内容创作等场景。 01250 AI编程# 文字转视频Step-Video-T2V
InvokeAI InvokeAI,InvokeAI 是一个开源项目,是 Stable Diffusion 模型的领先创意引擎,它为使用 Stable Diffusion 模型生成高质量图像提供了简化的过程。 01250 AI编程# InvokeAI
EarlyBird EarlyBird,一个无代码登陆页面构建器,旨在帮助早期企业验证他们的想法并快速有效地获得第一批客户,用户无需编写一行代码,只需几分钟即可轻松创建自定义登陆页面。 01250 AI编程# EarlyBird
AISmartCube AISmartCube,低代码快速搭建AI应用,图形化操作,超多官方模版,AISmartCube让你轻松实现工作场景自动化,让日常工作事半功倍。 01250 AI编程# AISmartCube# smart
Trae Trae,一款由字节跳动推出的针对中文开发者的AI编程工具。集成GPT-4o和Claude-3.5-Sonnet模型,支提供AI问答、代码自动补全和基于Agent的AI编程等功能。 01250 AI编程# AI编程# Trae
Linly-Dubbing Linly-Dubbing,一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。 01240 AI编程# Dubbing# Linly-Dubbing
Maxun.dev Maxun.dev,一个无代码网页数据提取平台,可以可靠、大规模地从网站提取和自动化数据,能将任何网站转为实时数据馈送,Maxun.dev使用简便,不用编码,几分钟就可以上手。 01240 AI编程# Maxun.dev
UIGEN-T1 UIGEN-T1,一个基于 Qwen2.5-Coder-7B 模型微调的开源 UI 设计生成工具,能够根据用户输入的提示生成结构清晰且符合标准的 HTML 和 CSS 代码 01240 AI编程# UIGEN-T1