作品 / StoryMagic
StoryMagic
多模態 AI 故事生成——文字、插圖、語音三種模型協作出一本會說話的故事書。
- 狀態
- 線上運行
- 網址
- storymagic.eighti.app
- 形態
- Web 平台
- 技術棧
- Next.js・SQLite・Drizzle・Gemini 圖像生成・LLM 文字生成・TTS/Whisper・next-intl 多語系
- 角色
- 獨立開發(產品、多模態 pipeline、前後端、部署、維運)
這是什麼
輸入一個想法,StoryMagic 產出完整的故事體驗:LLM 寫文字、
Gemini 圖像模型生成插圖、TTS 朗讀成語音。
它是「多模型 orchestration」的實戰場:三種模態的生成要互相對齊,而不是各做各的。
技術重點
- 角色一致性:插圖生成帶角色參考(character reference),讓同一角色在不同頁的插圖中長得一樣——多模態產品最常見的破功點之一。
- 多模型 orchestration:文字、影像、語音三條生成線的排程、失敗重試與成本控制。
- 多語系:next-intl 國際化架構,介面與生成內容都支援多語言。
想做多模態 AI 產品?看合作方式
或來信 [email protected]。