新LinkedIn_AIHawk LinkedIn_AIHawk,您的人工智能求职助手。自动化申请、LinkedIn_AIHawk让你获得个性化建议并更快地找到您梦想的工作。 010 AI编程# ai求职# LinkedIn_AIHawk# 简历
新TokenFlow TokenFlow,一个利用预训练的文本到图像扩散模型进行视频编辑的框架。它无需进一步训练或微调,即可实现一致的视频编辑效果。 010 AI编程# flow# token# TokenFlow
新EZ-Work EZ-Work,一款开源AI文档翻译助手,帮助用户使用 OpenAI 等大型语言模型API快速且经济高效地翻译文档。支持txt、word、csv、excel、pdf、ppt等多种文档格式的翻译,适用于各种需要文档翻译的场景。 010 AI编程# EZ-Work# 翻译
新Linly-Dubbing Linly-Dubbing,一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。 010 AI编程# Dubbing# Linly-Dubbing
新ChatTTS-Forge ChatTTS-Forge,一个围绕 TTS生成模型开发的项目,ChatTTS-Forge为用户提供灵活的TTS生成能力,支持多种音色、风格控制、长文本推理等功能。 010 AI编程# ChatTTS# ChatTTS-Forge# TTS
新FacePoke FacePoke,一个实时编辑脸部表情和头部位置的AI工具。用户可以通过简单的拖放界面,轻松调整面部特征和表情,使静态的肖像变得生动。 010 AI编程# Face# FacePoke
新ChatNio ChatNio,一个集合了各种流行的模型和服务的一站式平台,提供包括 OpenAI、Midjourney、Claude、讯飞星火、Stable Diffusion、DALL·E 等一站式的解决方案 010 AI编程# Chat# ChatNio
新腾讯混元3D 腾讯混元3D,全称为Hunyuan3D-1.0,是腾讯推出的一款同时支持文生和图生的3D开源模型,解决现有3D生成模型在生成速度和泛化能力的不足。 020 AI编程# 3d# Hunyuan3D# 腾讯混元
新PDFMathTranslate PDFMathTranslate,一款开源的PDF文档翻译工具,专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原文的排版,包括公式和图表,并支持双语对照,保持原有目录结构。 020 AI编程# Math# PDF# PDFMathTranslate
新RMBG-2.0 RMBG-2.0,BRIA AI开发的开源图像背景移除模型,RMBG-2.0基于创新的BiRefNet架构,能够在复杂环境和高细节图像中提供高精度的背景去除。 010 AI编程# ai抠图# RMBG-2.0# 去背景
新卡卡字幕助手|VideoCaptioner 卡卡字幕助手 | VideoCaptioner,一款基于 LLM 的智能字幕助手,无需GPU一键高质量字幕视频合成!支持生成、断句、优化、翻译全流程。卡卡字幕助手让视频字幕制作简单高效!优化、翻译,字幕视频全流程一键处理! 010 AI编程# Captioner# VideoCaptioner# 卡卡字幕助手
新MinerU MinerU,一站式开源高质量数据提取工具,支持PDF、网页、多格式电子书提取,自动识别并转换LaTeX格式、HTML格式,自动OCR,支持多语言。 010 AI编程# MinerU# 数据提取
新AnchorCrafter AnchorCrafter,一个由计算所、美团、腾讯等机构合作研发,专为电商场景设计,能够自动生成具有主播风格的AI虚拟主播带货视频神器。 010 AI编程# AI虚拟主播# anchor# AnchorCrafter
新HandyArrows手绘箭头 HandyArrows手绘箭头,一个提供手绘风格 SVG 箭头素材的网站,HandyArrows上所有素材均为免费开源,并可商用,适用于各种设计需求,如演示文稿、网页设计等。 010 AI编程# handyarrows手绘箭头
新VISIONXL VISION XL,一款专注于视频质量修复与增强的全新工具,VISION XL利用潜在扩散模型来解决高清视频的逆问题,能够在资源要求较低的环境下提供出色的修复与超分辨率能力。 020 AI编程# Vision# XL# 视频修复
新LogoCreator LogoCreator,一款由开源达人Hassan打造的AI Logo设计工具,LogoCreator依托Together AI平台的Flux模型实现,为用户提供智能、高效的Logo生成功能。 010 AI编程# Creator"# Logo"# LogoCreator
新TianliGPT TianliGPT,一个专业的文字摘要生成工具,你可以将需要提取摘要的文本内容发送给TianliGPT,稍等一会他就可以给你发送一个基于这段文本内容的摘要,可以安装在WordPress等系统上。 010 AI编程# GPT# TianliGPT# wordpress
新GzmDesign Gzm Design,一个免费开源的海报设计器,Gzm Design使用最新的Vue3,vite4,TypeScript等主流技术开发,开箱即用。 010 AI编程# design# Gzm# 海报设计
新DataRoom DataRoom,一个高度集成的、开源的大屏设计与数据可视化工具,基于SpringBoot、MyBatisPlus、Vue、ElementUI、G2Plot和Echarts等技术栈构建。 020 AI编程# data# DataRoom# Room
新CodeNameGoose CodeName Goose,一款开源代码智能体Agent,Codename Goose不仅能自动生成代码,还能安装、执行、测试。 010 AI编程# Agent# AI智能体# AI智能体CodeName
新CherryStudio Cherry Studio,一款开源的支持多种大型语言模型(LLM)桌面AI客户端,集成了多个LLM,支持Ollama本地模型部署。 010 AI编程# Cherry# Studio
新Go-with-the-Flow Go-with-the-Flow,通过结构化潜噪声采样来控制运动,Go-with-the-Flow能实现多种视频生成和编辑效果,包括:局部物体运动控制、全局相机运动控制和运动迁移。 010 AI编程# Go-with-the-Flow
新Midscene.js Midscene.js,一款基于AI的自动化浏览器助手,能够通过自然语言操作网页。你只需描述要执行的任务,Midscene.js会自动处理网页,如发推文、验证内容、搜索信息等功能。 010 AI编程# Midscene.js
新JoyGen JoyGen,京东科技与香港大学合作开发的音频驱动3D说话人脸视频生成框架,提供精确的唇部与音频同步,以精确模拟说话者的唇部动作和面部表情,让生成的视频更逼真。 010 AI编程# Gen# JoyGen
新Hibiki Hibiki,Kyutai Labs开发的高保真实时语音翻译模型,可以保留原声特点并进行实时翻译,边听边翻译,像同声传译一样实时输出,同时生成语音和文字翻译。 010 AI编程# Hibiki# Kyutai# Labs
新AstrBot AstrBot,一个开源的多平台 LLM 聊天机器人及开发框架,支持多个消息平台的集成,如QQ、微信,AstrBot支持多种大型语言模型(LLM)的接入。 010 AI编程# AstrBot# bot
新InspireMusic InspireMusic,阿里通义实验室开源的音乐生成技术,一款集音乐生成、歌曲生成、音频生成能力为一体的开源AIGC工具包。 010 AI编程# InspireMusic# music
新FireRedASR FireRedASR,小红书FireRed 团队发布并开源的基于大模型的语音识别模型,它在中文普通话语音识别领域取得了新的SOTA,FireRedASR支持方言、英语及歌词识别。 010 AI编程# FireRedASR# 小红书