This commit is contained in:
superlishunqin 2025-06-27 01:06:37 +08:00
parent 37c558dc4d
commit 848c447125

View File

@ -7,7 +7,7 @@
* **语音合成 (Text-to-Speech, TTS)**
* **情感语音合成 (Expressive TTS)**
* **语音克隆 (Voice Cloning)**
* **语音识别 (Automatic Speech Recognition, ASR)**
* **计算机辅助语言学习 (Computer-Assisted Language Learning, CALL)**
* **相关技术在教育领域的应用**
---
@ -16,6 +16,8 @@
下表记录了本仓库中已归档的论文,包含了其核心内容、阅读目的以及参考标题。
### **核心技术:语音合成与克隆**
| 文件名 | 核心主题 | 阅读笔记 / 目的 | 论文标题 (参考) | 状态 | 链接 |
| :--- | :--- | :--- | :--- | :--- | :--- |
| `2106.15561v3.pdf` | TTS技术综述 | 此综述详细介绍了基于神经网络的TTS技术用于构建对现代语音合成技术全景的理解。 | *A Survey on Neural Speech Synthesis* | 已归档 | [原文链接](https://arxiv.org/abs/2106.15561) |
@ -25,7 +27,23 @@
| `2205.04421v2.pdf` | SOTA TTS模型 | 了解如何通过设计更强大的模型如NaturalSpeech和利用大规模语料库来实现与人类相媲美的合成效果这能帮助理解当前技术的天花板在哪里。| *NaturalSpeech: End-to-End Text to Speech Synthesis with Human-Level Quality* | 已归档 | [原文链接](https://arxiv.org/abs/2205.04421) |
| `1806.04558v4.pdf` | 零样本/迁移学习TTS | 此论文讲述利用迁移学习技术构建一个能够生成任意说话人包括训练中未见过的说话人声音的文本到语音TTS系统。 | *Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis* | 已归档 | [原文链接](https://paperswithcode.com/paper/transfer-learning-from-speaker-verification) |
| `pone.0283440.pdf` | 实时语音克隆 | 此综述旨在提升语音克隆质量的实时系统。 | *A real-time voice cloning system with multiple algorithms for speech quality improvement* | 已归档 | [原文链接](https://pmc.ncbi.nlm.nih.gov/articles/PMC10069766/) |
| `OpenVoice Versatile Instant Voice Cloning.pdf` | 情感可控的语音克隆 | 研究OpenVoice如何解耦音色与情感等风格以实现对克隆声音的灵活情感控制这与论文核心“融合情感的语音克隆”高度相关。 | *OpenVoice: Versatile Instant Voice Cloning* | 已归档 | [原文链接](https://arxiv.org/abs/2312.01479) |
| `Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech.pdf` | 端到端TTS模型 (VITS) | 理解VITS模型如何结合VAE和对抗学习实现高质量的并行端到端语音合成为技术选型提供重要参考。 | *Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech* | 已归档 | [原文链接](https://arxiv.org/abs/2106.06103) |
| `Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions.pdf` | 里程碑式TTS模型 (Tacotron 2) | 学习里程碑模型Tacotron 2的两阶段架构理解其如何奠定高质量端到端语音合成的基础为本研究提供技术背景和起点。 | *Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions* | 已归档 | [原文链接](https://arxiv.org/abs/1712.05884) |
### **应用领域:计算机辅助儿童语言学习 (CALL)**
| 文件名 | 核心主题 | 阅读笔记 / 目的 | 论文标题 (参考) | 状态 | 链接 |
| :--- | :--- | :--- | :--- | :--- | :--- |
| `The impact of mobile application features on children s language and literacy learning a systematic review.pdf` | 移动学习(CALL) | 引用此综述论证传统教育应用中旁白功能的局限性(缺乏互动与情感),为本研究通过情感语音克隆与大模型交互来解决此痛点提供直接论据。 | *The impact of mobile application features on childrens language and literacy learning: a systematic review* | 已归档 | [原文链接](https://www.tandfonline.com/doi/full/10.1080/09588221.2021.1930057#abstract) |
| `Editorial-Language Development in the Digital Age.pdf` | 数字化时代的语言发展 | 引用此文强调个性化与情感反馈在语言学习技术中的重要性,为本研究的设计提供理论依据。 | *Editorial: Language Development in the Digital Age* | 已归档 | [原文链接](https://pmc.ncbi.nlm.nih.gov/articles/PMC5595122/) |
| `Exploring the impact of a CALL tool for emergent bilinguals.pdf` | CALL工具与语音识别 | 借鉴其通过集成语音识别引擎为口语练习提供即时反馈的思路,证明自动化纠正反馈的有效性。 | *Exploring the impact of a CALL tool for emergent bilinguals* | 已归档 | [原文链接](https://link.springer.com/article/10.1007/s11423-025-10462-5) |
| `Mobile-assisted and gamification-based language learning a systematic literature review.pdf` | 移动学习与游戏化 | 引用此文献指出现有研究在低龄学习者个性化教学内容上的空白,从而凸显本研究的创新方向。 | *Mobile-assisted and gamification-based language learning: a systematic literature review* | 已归档 | [原文链接](https://pmc.ncbi.nlm.nih.gov/articles/PMC8157183/) |
| `The Influence of Computer Assisted Language Learning (Call) to Improve English Speaking Skills.pdf` | CALL对口语提升的作用 | 引用该研究证明CALL系统与传统教学结合能显著提升口语能力为本研究的应用价值提供佐证。 | *The Influence of Computer Assisted Language Learning (Call) to Improve English Speaking Skills* | 已归档 | [原文链接](https://www.academia.edu/123047918/) |
| `The_Influence_of_Computer-Assisted_Language_Learning_CALL_on_Writing_Skills...pdf` | CALL对学习态度的影响 | 借鉴其研究结论即CALL不仅能提升语言技能还能培养积极的学习态度这与本研究期望达成的目标一致。 | *The Influence of Computer-Assisted Language Learning (CALL) on Writing Skills and Attitudes...* | 已归档 | [原文链接](https://ieeexplore.ieee.org/document/10989337) |
| `Using Computer Assisted Language Learning for English Language Teaching...pdf` | CALL的未来发展 | 引用此文对未来CALL系统发展的预测个性化、自适应、AI驱动以说明本研究方向符合技术发展趋势。 | *Using Computer Assisted Language Learning for English Language Teaching: An Adaptive Approach with its Current Development* | 已归档 | [原文链接](https://www.researchgate.net/publication/358942195) |
| `浅谈现代信息技术在幼儿园语言教学中的运用_刘海燕.pdf` | 国内研究现状 | 了解国内关于信息技术在幼儿园语言教学中应用的现状、方法和思考,为论文的应用部分提供本土化背景和实践参考。 | *浅谈现代信息技术在幼儿园语言教学中的运用* | 已归档 | `[待补充]` |
| `【语言】部分.pdf` | 幼儿园教育指导纲要 | 参考国家《3-6岁儿童学习与发展指南》中关于语言领域的目标和要求确保研究应用的设计符合国家教育方针和幼儿发展规律。 | *《3-6岁儿童学习与发展指南》语言领域节选* | 已归档 | `[待补充]` |
---
@ -41,4 +59,8 @@
---
## 📝 未来阅读计划
## 📝 未来阅读计划
* 持续跟进SOTAState-of-the-Art语音克隆与情感合成模型特别是低资源和高表现力的相关技术。
* 深入阅读儿童发展心理学、人机交互HCI中关于儿童与技术互动的相关文献。
* 关注大语言模型LLM在教育领域特别是对话系统和个性化辅导方面的最新研究。