Skip to content

七牛云Hackathon 非研发赛组D议题 "摩擦成本"队 代码仓库

Notifications You must be signed in to change notification settings

Shi1xin/Qiniu-Hackathon

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

37 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

VPilot: Menubar中的语音Agent

macOS menubar中的电脑操作Agent助手,支持语音与文本输入,可在状态栏图标右键菜单中切换输入方式及语音服务(macOS 原生 / ElevenLabs),基于Agent TARS CLI

演示视频

观看视频演示

使用提示

  • 左键点击状态栏图标唤出输入窗口,默认启用语音输入
  • 右键点击状态栏图标,在“输入方式”菜单中选择“语音输入”或“文字输入”
  • 右键点击状态栏图标,在“语音服务”菜单中切换使用 macOS 原生或 ElevenLabs 语音服务
  • 首次选择 ElevenLabs 会弹窗输入 API Key,可在同一菜单中通过“配置 ElevenLabs API Key...”随时更新
  • 选择 ElevenLabs 时,语音识别与语音播报都会改为调用 ElevenLabs 的 Scribe v1 与 Eleven v3 模型
  • 在文字输入模式下,可直接键入指令并按回车或点击“发送指令”按钮

分工

  • 施一信:原型开发,User Flow设计,技术选型
  • 汪瑾:功能开发(文字输入、语音选项),文档撰写

快速开始

下载Agent TARS CLI

npm install @agent-tars/cli@latest -g

配置workspace

agent-tars workspace --init
// ~/.agent-tars-workspace/agent-tars.config.ts
import { defineConfig } from '@agent-tars/interface';

export default defineConfig({
  model: {
    provider: 'volcengine',
    id: 'doubao-1-5-thinking-vision-pro-250428',
    "apiKey": "YOUR-API-KEY"  
  }
});

安装VPilot软件

前往 Releases 下载 VPilot.dmg,打开后将应用拖入 Applications 后即可分发或安装。

调试与开发

gh repo clone Shi1xin/Qiniu-Hackathon
./Qiniu-Hackathon/run_voicebar.sh

编译为dmg

./package_dmg.sh

About

七牛云Hackathon 非研发赛组D议题 "摩擦成本"队 代码仓库

Resources

Stars

Watchers

Forks

Packages

No packages published

Contributors 2

  •  
  •