排序
免费聚合热搜榜API
一个聚合热搜榜的API服务。以下是一些关键信息: 聚合热搜榜:服务覆盖了将近20个平台的热搜数据,包括哔哩哔哩、抖音、微博、知乎、百度等。 接口名称:hot,是必须的字符串参数,可以填写上述...
遇见李白:基于知识图谱的AI智能体
「遇见李白」,旨在通过构建李白的知识图谱,并结合大模型技术,训练出一个专业的AI智能体,以生成式对话应用的形式,推动李白文化的普及与推广。以下是该项目的一些关键信息: 项目背景:李白...
ProxyCat:一款基于Python开发的代理池中间件
ProxyCat 是一款高效的代理池中间件,它能够将短效IP转变为固定IP,支持多种协议,具备代理轮换、动态获取、验证及认证机制。基于Python实现,支持高并发处理和灵活配置,适用于网络安全和渗透...
Dropbase:更快构建和原型化Web应用的AI工具
在快速变化的技术领域,开发者们需要更高效地构建和迭代他们的Web应用。Dropbase 正是为了应对这一需求而生,它是一个创新的AI工具,致力于帮助开发者快速地从概念验证转向功能完备的产品。 核...
TransAgents:腾讯推出的翻译多智能体框架
腾讯推出的翻译多智能体框架。该框架可模仿人类社会中传统的翻译出版过程,含有高级编辑、初级编辑、译者、校对员等角色,每个角色都有自己独特的职责和任务,涵盖语言技能、教育背景、工作经验...
EchoMimic:基于音频驱动的肖像动画生成工具
在数字媒体和娱乐领域,逼真的音频驱动肖像动画技术正变得越来越重要。BadToBest 开发的 "EchoMimic" 项目正是这一领域的突破性进展,它通过可编辑的地标条件,实现了高度逼真的音频...
Zerox:基于gpt-4o-mini 的OCR工具
在数字化转型的浪潮中,自动化文档处理变得越来越重要。getomni-ai 推出的 "Zerox" 项目,通过零次拍摄技术,为PDF文档的光学字符识别(OCR)提供了一种创新的解决方案。 项目亮点: ...
ScreenPipe:全天候录制您的屏幕和麦克风
screen-pipe,一个用于构建个性化的人工智能,它通过用户所看到、所说或所听到的内容来驱动。它与Ollama兼容,是Rewind.ai的一个替代品。该项目强调开放性、安全性,用户拥有自己的数据,并且是...
rclip:AI驱动的命令行照片搜索工具
rclip 是一个基于命令行的照片搜索工具,利用 OpenAI 的 CLIP 神经网络,允许用户通过文本描述或相似图片来搜索照片。支持文本搜索、相似图片搜索和组合查询,适用于设计师、摄影师、研究人员和...
DETECT-2B:音频深度伪造检测工具
在人工智能飞速发展的今天,深度伪造技术也日益成熟,这就需要更先进的检测技术来确保媒体内容的真实性。Resemble AI 推出的 DETECT-2B,采用了创新的 Mamba-SSM 架构,为深度伪造检测领域带来...
SenseVoice:具有音频理解能力的音频基础模型
这是一个多语言语音理解模型,具有以下特点和功能: 简介 SenseVoice 是一个包含多种语音理解能力的语音基础模型,涵盖自动语音识别(ASR)、口语语言识别(LID)、语音情感识别(SER)和音频事...
Article Audio:将文章转化为有声读物
沉浸在文字的世界中,有时我们渴望听到它们的声音。"Article Audio" 提供了一个创新的解决方案,将您喜爱的文章转化为丰富多彩的音频体验。 服务特点: 多语言支持:从南非的阿非利卡...
CosyVoice:阿里巴巴开源的多语言大语音生成模型
CosyVoice是一个多语言的大型语音生成模型,提供推理、训练和部署的全栈能力。以下是该项目的一些关键信息: 安装:提供了克隆仓库和安装依赖的步骤,包括使用conda创建环境和安装所需的Python...
OpenUI:AI将设计图转为HTML代码,用语言描述 UI 然后实时呈现
OpenUI是一个开源工具,旨在简化用户界面构建过程。它支持多种语言描述UI并提供实时预览功能,支持OpenAI、Groq等模型,允许自定义配置,并提供了详细的安装和使用指南。适合快速原型开发、教育...
gptpdf:将PDF文件解析为Markdown
一个使用VLLM(如GPT-4o)将PDF文件解析为Markdown的方法。这个方法非常简单,仅包含293行代码,能够几乎完美地解析排版、数学公式、表格、图片、图表等。平均每页成本为$0.013。该方法使用Gene...