PhotoTTS - 拍照阅读

拍照阅读，让绘本更精彩

项目简介

PhotoTTS 是一款面向 3-10 岁儿童的绘本听读 iOS 应用。拍照或选择相册图片，自动识别文字并合成语音，让孩子随时重复收听喜欢的绘本故事。

核心特性

拍照识别：支持拍照和相册选图（多张），支持对已有记录重新制作
文字识别：支持豆包大模型、OpenAI 等多种 OCR 服务
语音合成：支持火山引擎、阿里通义千问等多种 TTS 服务
会话记录：保存记录以便收听和重复收听，支持导出导入备份
绘本播放：音频播放联动图片与文字，支持全屏播放器

主要功能

拍照阅读：拍照/选图 → OCR识别 → LLM分析 → TTS合成 → 记录保存 → 绘本播放

快速开始

环境要求

iOS 18.1+
macOS 12.0+
Xcode 15.0+

安装步骤

克隆项目

git clone https://github.com/niean/PhotoTTS.git
cd PhotoTTS

打开项目
```
open PhotoTTS.xcodeproj
```
配置 API 密钥
```
cp PhotoTTS/Resources/config_example.json PhotoTTS/Resources/config_local.json
```
编辑 config_local.json，填入您的 API 密钥（支持配置多种 OCR/TTS 服务商）
构建运行
- 选择目标设备或模拟器
- 按 Cmd + R 构建并运行

项目结构

PhotoTTS/
├── Sources/
│   ├── Core/
│   │   ├── Coordinators/    # 业务编排
│   │   ├── Handlers/        # OCR / TTS 服务
│   │   └── Managers/        # 会话、设置、历史、后台制作等
│   ├── Models/              # 数据模型
│   └── UI/                  # SwiftUI 视图
├── Resources/
│   └── config_local.json    # API 密钥配置（不入库）
└── Assets.xcassets/

技术规格

开发语言：Swift 5.0+
最低支持版本：iOS 18.1+
架构模式：MVVM + Coordinator
UI框架：SwiftUI
网络框架：URLSession + async/await
音频框架：AVFoundation

致谢

感谢以下服务提供商：

豆包模型 - OCR 文字识别服务
火山引擎 - TTS 语音合成服务
阿里通义 - TTS 语音合成服务

拍照阅读，让绘本更精彩

Name		Name	Last commit message	Last commit date
Latest commit History 195 Commits
.claude/commands		.claude/commands
.github/workflows		.github/workflows
.harness		.harness
PhotoTTS.xcodeproj		PhotoTTS.xcodeproj
PhotoTTS		PhotoTTS
PhotoTTSTests		PhotoTTSTests
PhotoTTSUITests		PhotoTTSUITests
docs/githubpages		docs/githubpages
scripts		scripts
.gitignore		.gitignore
AGENTS.md		AGENTS.md
CLAUDE.md		CLAUDE.md
Info.plist		Info.plist
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

PhotoTTS - 拍照阅读

拍照阅读，让绘本更精彩

项目简介

核心特性

主要功能

快速开始

环境要求

安装步骤

项目结构

技术规格

致谢

About

Uh oh!

Releases 6

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

PhotoTTS - 拍照阅读

拍照阅读，让绘本更精彩

项目简介

核心特性

主要功能

快速开始

环境要求

安装步骤

项目结构

技术规格

致谢

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases 6

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages