C# WinForm实现语音转文字
一、视频演示
二、VS2022
三、核心代码
安装依赖NuGet 程序包 -> 搜索并安装 System.Speech
引用dll
using System;
using System.Speech.Recognition;
using System.Windows.Forms;
语音功能
namespace WinFormsApp6
{
public partial class Form1 : Form
{
private SpeechRecognitionEngine _recognizer;
public Form1()
{
InitializeComponent();
InitializeSpeechRecognizer();
}
private void InitializeSpeechRecognizer()
{
_recognizer = new SpeechRecognitionEngine(new System.Globalization.CultureInfo("zh-CN"));
_recognizer.LoadGrammar(new DictationGrammar()); // 加载默认语法库
// 识别到语音时触发
_recognizer.SpeechRecognized += (sender, e) =>
{
if (e.Result != null)
{
// 跨线程更新 UI
txtResult.BeginInvoke(new Action(() =>
{
txtResult.Text += e.Result.Text + Environment.NewLine;
}));
}
};
// 识别错误时处理
_recognizer.SpeechRecognitionRejected += (sender, e) =>
{
txtResult.BeginInvoke(new Action(() =>
{
txtResult.Text += "[识别失败,请重试]" + Environment.NewLine;
}));
};
}
private void btnStart_Click(object sender, EventArgs e)
{
if (_recognizer.AudioState == AudioState.Stopped)
{
_recognizer.SetInputToDefaultAudioDevice(); // 设置默认麦克风
_recognizer.RecognizeAsync(RecognizeMode.Multiple); // 持续监听
btnStart.Text = "停止";
}
else
{
_recognizer.RecognizeAsyncStop();
btnStart.Text = "开始说话";
}
}
// 窗体关闭时释放资源
protected override void OnFormClosing(FormClosingEventArgs e)
{
_recognizer?.Dispose();
base.OnFormClosing(e);
}
}
}
解决中文识别问题
- 安装中文语音包(必需):
- 打开 Windows 的 控制面板 -> 语言 -> 语音 -> 确保已安装 中文(简体)语音识别。
- 若未安装,需通过 Windows Update 或手动安装语音包。
- 授予麦克风权限:
- 右键项目 -> 添加 -> 新建项 -> 选择 应用程序清单文件 -> 取消注释以下内容:xmlCopy Code<requestedExecutionLevel level="asInvoker" uiAccess="false" />
<!-- 改为 -->
<requestedExecutionLevel level="requireAdministrator" uiAccess="false" />
运行效果
- 点击 开始说话 按钮,对着麦克风说话。
- 识别结果会实时显示在文本框中。
- 支持连续语音输入(如:“今天天气不错。我想去公园散步。”)。
注意事项
- 离线识别准确率较低,适合简单场景。
- 若需高精度识别,建议切换为 Azure 语音服务在线方案。
- 首次使用可能需在 Windows 设置中启用 语音识别(路径:设置 -> 隐私 -> 语音)。
System.Speech 是 .NET Framework 中用于语音合成(TTS)和语音识别的核心类库,适用于 Windows 平台的语音交互开发。以下是其主要功能及使用要点:
一、核心功能
- 语音合成 (Text-to-Speech, TTS)
- 通过 SpeechSynthesizer 类实现文本转语音输出,支持同步(Speak)和异步(SpeakAsync)播报方式。
- 可自定义语音参数(如语速、音量、性别),并支持将语音输出到音频设备或保存为 WAV 文件。
- 语音识别 (Speech Recognition)
- 通过 SpeechRecognitionEngine 类实现语音输入识别,需配置语法规则和音频输入源。
二、开发环境配置
- 依赖条件
- 操作系统:完整版 Windows(需内置语音引擎)。
- 开发框架:.NET Framework 4.0 及以上版本。
- 引用添加
- 在 Visual Studio 项目中添加 System.Speech 程序集引用(通过“项目→添加引用→框架”)。
三、核心类与用法示例
1. 语音合成(SpeechSynthesizer)
csharpCopy Code
using System.Speech.Synthesis;
// 创建语音合成器实例
SpeechSynthesizer synth = new SpeechSynthesizer();
synth.SetOutputToDefaultAudioDevice(); // 输出到默认音频设备
synth.Speak("Hello, World!"); // 同步播报
synth.SpeakAsync("Async speech"); // 异步播报
2. 扩展功能
- 保存语音为文件csharpCopy Code
synth.SetOutputToWaveFile("output.wav");
synth.Speak("保存到文件");
synth.SetOutputToNull(); // 释放资源:ml-citation{ref="4" data="citationList"} - 调整语音属性csharpCopy Code
synth.Rate = 2; // 语速(-10 到 10)
synth.Volume = 80; // 音量(0 到 100)
synth.SelectVoiceByHints(VoiceGender.Female); // 选择女声:ml-citation{ref="5,7" data="citationList"}
四、注意事项
- 系统兼容性
- 仅支持 Windows 平台,依赖系统内置语音引擎(如 Microsoft Speech Platform)。
- 异步操作处理
- 使用 SpeakAsync 时,可通过 SpeakCompleted 事件监听播报完成状态,避免阻塞主线程。
- 资源释放
- 调用 SetOutputToNull() 或 Dispose() 方法释放 SpeechSynthesizer 实例。
五、应用场景
- 信息播报:新闻阅读、天气预报、交通提示。
- 工业控制:设备状态报警、生产线异常提醒。
- 教育辅助:电子教材朗读、语言学习发音纠正。
通过灵活调用 System.Speech 的 API,开发者可快速实现语音交互功能,满足多样化的业务需求