新JoyGen JoyGen,京东科技与香港大学合作开发的音频驱动3D说话人脸视频生成框架,提供精确的唇部与音频同步,以精确模拟说话者的唇部动作和面部表情,让生成的视频更逼真。 030 AI编程# Gen# JoyGen
新Hibiki Hibiki,Kyutai Labs开发的高保真实时语音翻译模型,可以保留原声特点并进行实时翻译,边听边翻译,像同声传译一样实时输出,同时生成语音和文字翻译。 040 AI编程# Hibiki# Kyutai# Labs
新AstrBot AstrBot,一个开源的多平台 LLM 聊天机器人及开发框架,支持多个消息平台的集成,如QQ、微信,AstrBot支持多种大型语言模型(LLM)的接入。 030 AI编程# AstrBot# bot
新InspireMusic InspireMusic,阿里通义实验室开源的音乐生成技术,一款集音乐生成、歌曲生成、音频生成能力为一体的开源AIGC工具包。 030 AI编程# InspireMusic# music
新FireRedASR FireRedASR,小红书FireRed 团队发布并开源的基于大模型的语音识别模型,它在中文普通话语音识别领域取得了新的SOTA,FireRedASR支持方言、英语及歌词识别。 030 AI编程# FireRedASR# 小红书
新FlashVideo FlashVideo,字节跳动和香港大学联合推出的一种高效的高分辨率视频生成框架,适用于文本到视频的生成。 030 AI编程# <video# flash# FlashVideo
新DeepClaude DeepClaude,一个将DeepSeek R1模型推理能力和Claude的代码生成能力的开源工具,提供统一的API和聊天界面,还可自定义配置、具有低延迟等特点。 030 AI编程# (deep)# Claude# DeepClaude
新Enhance-A-Video Enhance-A-Video,新加坡国立大学、上海人工智能实验室和德克萨斯大学奥斯汀分校联合开发的视频生成增强算法。 030 AI编程# <video# enhance# Enhance-A-Video
新LangBot LangBot,一个开源大模型原生即时通信机器人平台,支持多平台(如 微信、飞书 等)和多种大语言模型(如 ChatGPT、DeepSeek等),具备多模态交互能力。 030 AI编程# bot# LangBot
新Video-Subtitle-Master Video-Subtitle-Master,一个用于批量为视频生成字幕的客户端开源工具,并支持将字幕翻译成其他语言。 030 AI编程# video-subtitle-master
新Proxy Proxy,Convergence Ai开发的基于LMLM的个人AI智能体,Proxy具备自动化浏览Web的能力,能够通过自然语言交互来帮助用户完成各种日常任务。 040 AI编程# AI智能体AI智能体# proxy
新LiberSonora LiberSonora,一个基于AI的、开源有声书工具集,LiberSonora提供智能字幕提取、AI标题生成、多语言翻译等功能,并且支持 GPU 加速、批量离线处理。 030 AI编程# LiberSonora
新Light-A-Video Light-A-Video,一个应用于逐帧图像重光照模型的简单应用,无需重新训练DiT视频模型,即可实现调整视频的光照效果,并且生成的视频帧在光源和外观上更加一致。 040 AI编程# <video# Light-A-Video
新RAGFlow RAGFlow,一种用于检索增强生成(RAG)架构的框架,适用于需要动态生成内容且依赖外部知识库的场景,如智能客服、文档生成和数据分析等。 040 AI编程# flow# RAG# RAGFlow
新Step-Audio Step-Audio,由阶跃星辰与吉利汽车集团联合研发的一个开源的集成语音识别、语义理解、对话生成、语音克隆、音频编辑和语音合成等功能的语音交互模型。 030 AI编程# audio# Step-Audio
新Step-Video-T2V Step-Video-T2V,一个由阶跃星辰与吉利汽车合作开源的先进文本到视频生成模型。支持中文与英文提示输入,应用于在如广告、影视制作、自动化内容创作等场景。 030 AI编程# 文字转视频Step-Video-T2V
新Phantom Phantom,字节跳动基于跨模态对齐的主体一致性视频生成系统,Phantomsk可以严格保持参考脸部的身份特征,同时生成生动的视频内容。 060 AI编程# Phantom# 字节跳动
新WeChatBot WeChat Bot,基于WeChaty结合OpenAI ChatGPT、Kimi、讯飞等多种AI服务实现的开源微信机器人项目,用于自动回复微信消息或管理微信群/好友。 040 AI编程# bot# WeChat
新NeuraPress NeuraPress,一款专注于微信公众号排版的Markdown编辑器,支持移动端,搭配DeepSeek和微信公众号助手,利用碎片化时间,通过手机就能编辑并发布带有排版效果的公众号文章。 030 AI编程# markdown# NeuraPress# 编辑器
新HiveChat HiveChat,一个专为中小型团队设计的开源AI聊天机器人项目,支持Deepseek、OpenAI、Claude和Gemini等多种主流AI模型。 030 AI编程# Chat# HiveChat
新Doocs Doocs,一款高度简洁的微信 Markdown 编辑器,支持 Markdown 语法、色盘取色、多图上传、一键下载文档、自定义 CSS 样式、一键重置等特性。 040 AI编程# Doocs# markdown# 编辑器
新Anda Anda,一个以Rust为基础构建的AI智能体框架,整合了ICP区块链并且支持TEE环境,Anda的目标在于构建一个能够高度组合、自主运行且拥有持续记忆能力的AI智能体网络。 030 AI编程# AI智能体Anda# AI智能体框架
新Memento Memento,一款基于mpv构建的开源视频播放器,专为学习日语设计。它巧妙地将视频播放与语言学习功能结合,支持通过影视内容进行语法分析、生词捕捉和记忆卡片制作。 030 AI编程# Memento# 播放器# 日语学习
新Arxiv-Markdown-Parser-Plugin Arxiv-Markdown-Parser-Plugin,一款能够一键将arXiv上的论文转换为Markdown格式的浏览器插件,无论该论文呈现的是摘要、PDF版本还是HTML版本。 040 AI编程# Arxiv-Markdown-Parser-Plugin
新Awesome-Ollama-Server Awesome-Ollama-Server ,一个用于实时监控和检测 Ollama 服务可用性和性能的系统。支持多语言,能够方便用户进行服务检测和性能监控。 030 AI编程# Awesome-Ollama-Server
新MagicResume Magic Resume,一个现代化的在线简历编辑器,它基于 Next.js 和 Framer Motion 构建,可以让用户能够轻松创建专业的简历。 030 AI编程# Magic# Resume
新PPTist PPTist,一款可以完全在浏览器中运行的在线PPT工具,支持在浏览器中编辑和展示 PPT和通过AI生成PPT。它还原了大部分PowerPoint 常用功能。 030 AI编程# ppt# PPTist
新MetaGPT MetaGPT,一个开源的多智能体框架,由DeepWisdom团队开发,在2023年6月正式开源。它能借助大语言模型(LLM)让多个智能体协作,为复杂任务提供自动化的解决方案。 030 AI编程# AI智能体MetaGPT# 智能体
新SwiftChat SwiftChat,一款基于React Native开发的快速、安全、跨平台聊天应用,支持实时流式聊天功能和Markdown语法,还可以生成AI图像,兼容DeepSeek、Amazon Bedrock、Ollama和OpenAI等模型。 040 AI编程# Chat# Swift# SwiftChat
新MapleMono Maple Mono,一款专注于优化编码体验的开源等宽字体,它提供无限的字体粗细和手工微调的斜体字形,圆角设计使其看起来丝滑舒适,特别适合长时间编码工作。 030 AI编程# Maple# Mono
新CozeonWeChat Coze on WeChat,一个基于微信平台开发的智能助手,主要对接 Coze 平台,支持大部分 Coze Bot 功能。它允许用户通过微信与 AI 聊天机器人进行交互,支持文本、语音等多种交互方式。 040 AI编程# coze# WeChat
新AutoGen AutoGen,微软开发的一个开源框架,用于构建和管理基于LLM的多代理系统。它允许用户创建多个Agent,这些代理可以通过对话协作完成复杂的任务。 040 AI编程# Agent# Agent框架# ai
新LangFlow LangFlow,一款低代码、可视化的AI应用构建工具,主要用于快速搭建和实验LangChain流水线。支持多代理对话管理和RAG应用,适用于构建智能聊天机器人、文档分析系统和内容生成工具等场景。 030 AI编程# Agent# Agent框架# ai
新Rasa Rasa,一个开源的AI机器学习框架,专注于构建自然语言对话系统,如聊天机器人和语音助手,Rasa广泛应用于客户服务、智能助手、企业自动化等多个领域。 050 AI编程# Agent框架# ai# Rasa
新Cradle Cradle,一个通用计算机控制的多模态AI框架,它可以使AI Agent能够像人类一样,能够直接控制键盘和鼠标,实现与任意开源代码或闭源代码软件的交互。 040 AI编程# Agent框架# ai# Cradle
新AtomicAgents Atomic Agents,一个适用于构建模块化、可扩展的AI代理开源框架,它将复杂的AI系统分解为最小的、不可分割的组件,并通过这些组件的灵活组合来构建强大的 AI 应用。 030 AI编程# agents# Agent框架# ai
新PraisonAI Praison AI,一个开源的低代码多智能体框架,可以通过简化大语言模型(LLM)的应用开发,帮助用户快速创建、管理和部署AI智能体。 030 AI编程# Agent框架# ai# Praison
新AgentTARS Agent TARS,一个字节跳动开源的多模态 AI 代理工具,Agent TARS能够通过视觉方式解释网页内容,从而实现流畅的浏览器操作。 040 AI编程# Agent# Agent框架# ai
新eeChat eeChat,简洁易用的大模型本地部署工具,支持开源模型 DeepSeek-R1, DLlama 3, Phi-4, Mistral, Gemma 3 等模型的本地化部署,专注于数据安全、隐私保护和高效的AI对话体验。 040 AI编程# Chat# eeChat
新AgentUniverse AgentUniverse,一个面向复杂业务场景设计的多智能体协作框架,它提供了快速易用的大模型智能体应用搭建能力,以及丰富的多智能体协同模式组件。 060 AI编程# AgentUniverse# Agent框架# ai
新Motia Motia,一个专为开发者设计的AI代理框架,帮助开发者快速搭建、测试和部署生产级的 AI 代理。它强调代码优先和事件驱动,支持多语言开发,并提供可视化界面,使开发者能够专注于业务逻辑。 060 AI编程# Agent框架# ai# Motia
新RuoYiAI RuoYi AI,一个全栈式AI开发平台,包含前端应用、后台管理以及小程序等全套系统,可以帮助开发者快速搭建和部署个性化的AI应用,开箱即用,简单高效。 060 AI编程# ai# RuoYi
新BotSharp BotSharp,一个基于.NET开发的开源AI多智能体应用开发框架,它可以快速将大型语言模型(LLMs)快速集成到现有业务系统中。 050 AI编程# Agent框架# ai# BotSharp
新Automa Automa,一款开源的低代码/无代码浏览器自动化工具,用户可以通过可视化界面,像搭积木一样将各种功能模块连接起来,构建自定义的自动化流程。 030 AI编程# auto# Automa