TEN Agent

分享

主要功能

  • 实时头像:使用Trulience的免费头像选项,需配置头像ID和token。
  • 实时语音与MCP服务器:集成MCP服务器扩展LLM能力,支持通过Playground添加MCP URL。
  • 实时硬件通信:支持Espressif ESP32-S3 Korvo V3开发板,实现硬件与LLM的实时交互。
  • 实时视觉和屏幕共享检测:集成Google Gemini Multimodal Live API,提供实时视觉和屏幕共享功能。
  • 图像生成:通过StoryTeller扩展支持实时图像生成,集成天气检查和网页搜索工具。
  • 其他LLM平台集成:支持Dify等平台,增强实时交互体验。

使用说明

  • 本地运行
    1. 前置条件:Docker/Docker Compose、Node.js v18、API密钥(Agora App ID和证书、OpenAI API密钥、Deepgram ASR、Elevenlabs TTS)。
    2. 克隆仓库,进入ai_agents目录,复制.env.example.env并配置密钥。
    3. 运行docker compose up -d启动容器,进入容器后使用task use AGENT=voice-assistant构建代理。
    4. 启动Web服务器:task buildtask run
  • TMAN Designer定制
    1. 访问http://localhost:49483。
    2. 右键STT、LLM、TTS扩展配置API。
    3. 通过Apps Manager运行应用并勾选'Run with TEN Agent'。
  • 自托管部署:支持Docker部署,创建发布镜像。

目标用户

开发者、AI研究者、企业用户,适用于构建语音助手、视觉AI代理和多模态交互系统。

核心优势

  • 开源免费:Apache 2.0许可证,无费用。
  • 多模态支持:语音、视觉、头像实时交互。
  • 高性能:低延迟、实时处理。
  • 跨平台:支持C、Python、C++、Rust、TypeScript、Go语言。
  • 社区生态:包括TEN Framework、TEN Turn Detection、TEN VAD等组件,提供Discord、Hugging Face社区支持。

典型用例

  • AI语音助手(如实时对话代理)。
  • 硬件集成(如ESP32设备通信)。
  • 视觉AI应用(如屏幕共享分析)。
  • 图像生成(如StoryTeller)。

收费模式

完全免费开源,无付费层级或订阅费用。

  • 收录时间:2025-09-16
  • 计价模式: Free

#人工智能聊天机器人 #视频生成器 #开发者工具 Free Website Open Source Hardware

评论

登录 After Sign In, you can make comments

相似AI工具推荐

Wavechat

访问量 2.91K 计价模式

Value Proposition Canvas AI

访问量 2.81K 计价模式 Paid

EPAGESTORE.AI

访问量 6.56K 计价模式