当前位置:首页 > 技术分析 > 正文内容

C# WinForm实现语音转文字

一、视频演示


二、VS2022


三、核心代码


安装依赖NuGet 程序包 -> 搜索并安装 System.Speech


引用dll

using System;
using System.Speech.Recognition;
using System.Windows.Forms;

语音功能



namespace WinFormsApp6
{
    public partial class Form1 : Form
    {


        private SpeechRecognitionEngine _recognizer;
        public Form1()
        {
            InitializeComponent();
            InitializeSpeechRecognizer();
        }


        private void InitializeSpeechRecognizer()
        {
            _recognizer = new SpeechRecognitionEngine(new System.Globalization.CultureInfo("zh-CN"));


            _recognizer.LoadGrammar(new DictationGrammar()); // 加载默认语法库




            // 识别到语音时触发


            _recognizer.SpeechRecognized += (sender, e) =>
            {
                if (e.Result != null)
                {


                    // 跨线程更新 UI


                    txtResult.BeginInvoke(new Action(() =>


                    {


                        txtResult.Text += e.Result.Text + Environment.NewLine;


                    }));


                }
            };






            // 识别错误时处理


            _recognizer.SpeechRecognitionRejected += (sender, e) =>
            {
                txtResult.BeginInvoke(new Action(() =>
                {


                    txtResult.Text += "[识别失败,请重试]" + Environment.NewLine;


                }));
            };
        }






        private void btnStart_Click(object sender, EventArgs e)
        {


            if (_recognizer.AudioState == AudioState.Stopped)
            {


                _recognizer.SetInputToDefaultAudioDevice(); // 设置默认麦克风


                _recognizer.RecognizeAsync(RecognizeMode.Multiple); // 持续监听


                btnStart.Text = "停止";
            }
            else
            {


                _recognizer.RecognizeAsyncStop();


                btnStart.Text = "开始说话";


            }
        }






        // 窗体关闭时释放资源


        protected override void OnFormClosing(FormClosingEventArgs e)
        {


            _recognizer?.Dispose();


            base.OnFormClosing(e);


        }


    }
}

解决中文识别问题

  1. 安装中文语音包(必需):
  2. 打开 Windows 的 控制面板 -> 语言 -> 语音 -> 确保已安装 中文(简体)语音识别
  3. 若未安装,需通过 Windows Update 或手动安装语音包。
  4. 授予麦克风权限
  5. 右键项目 -> 添加 -> 新建项 -> 选择 应用程序清单文件 -> 取消注释以下内容:xmlCopy Code<requestedExecutionLevel level="asInvoker" uiAccess="false" />
    <!-- 改为 -->
    <requestedExecutionLevel level="requireAdministrator" uiAccess="false" />

运行效果

  • 点击 开始说话 按钮,对着麦克风说话。
  • 识别结果会实时显示在文本框中。
  • 支持连续语音输入(如:“今天天气不错。我想去公园散步。”)。

注意事项

  1. 离线识别准确率较低,适合简单场景。
  2. 若需高精度识别,建议切换为 Azure 语音服务在线方案。
  3. 首次使用可能需在 Windows 设置中启用 语音识别(路径:设置 -> 隐私 -> 语音)。


System.Speech 是 .NET Framework 中用于语音合成(TTS)和语音识别的核心类库,适用于 Windows 平台的语音交互开发。以下是其主要功能及使用要点:


一、核心功能

  1. 语音合成 (Text-to-Speech, TTS)
  2. 通过 SpeechSynthesizer 类实现文本转语音输出,支持同步(Speak)和异步(SpeakAsync)播报方式。
  3. 可自定义语音参数(如语速、音量、性别),并支持将语音输出到音频设备或保存为 WAV 文件。
  4. 语音识别 (Speech Recognition)
  5. 通过 SpeechRecognitionEngine 类实现语音输入识别,需配置语法规则和音频输入源。

二、开发环境配置

  • 依赖条件
    • 操作系统:完整版 Windows(需内置语音引擎)。
    • 开发框架:.NET Framework 4.0 及以上版本。
  • 引用添加
    • 在 Visual Studio 项目中添加 System.Speech 程序集引用(通过“项目→添加引用→框架”)。

三、核心类与用法示例

1. 语音合成(SpeechSynthesizer)

csharpCopy Code


using System.Speech.Synthesis;

// 创建语音合成器实例
SpeechSynthesizer synth = new SpeechSynthesizer();
synth.SetOutputToDefaultAudioDevice();
// 输出到默认音频设备
synth.Speak("Hello, World!");
// 同步播报
synth.SpeakAsync("Async speech");
// 异步播报

2. 扩展功能

  • 保存语音为文件csharpCopy Code
    synth.SetOutputToWaveFile("output.wav");
    synth.Speak("保存到文件");
    synth.SetOutputToNull();
    // 释放资源:ml-citation{ref="4" data="citationList"}
  • 调整语音属性csharpCopy Code
    synth.Rate = 2;
    // 语速(-10 到 10)
    synth.Volume = 80;
    // 音量(0 到 100)
    synth.SelectVoiceByHints(VoiceGender.Female);
    // 选择女声:ml-citation{ref="5,7" data="citationList"}

四、注意事项

  1. 系统兼容性
  2. 仅支持 Windows 平台,依赖系统内置语音引擎(如 Microsoft Speech Platform)。
  3. 异步操作处理
  4. 使用 SpeakAsync 时,可通过 SpeakCompleted 事件监听播报完成状态,避免阻塞主线程。
  5. 资源释放
  6. 调用 SetOutputToNull() 或 Dispose() 方法释放 SpeechSynthesizer 实例。

五、应用场景

  • 信息播报:新闻阅读、天气预报、交通提示。
  • 工业控制:设备状态报警、生产线异常提醒。
  • 教育辅助:电子教材朗读、语言学习发音纠正。

通过灵活调用 System.Speech 的 API,开发者可快速实现语音交互功能,满足多样化的业务需求

扫描二维码推送至手机访问。

版权声明:本文由ruisui88发布,如需转载请注明出处。

本文链接:http://www.ruisui88.com/post/4449.html

标签: c#在线
分享给朋友:

“C# WinForm实现语音转文字” 的相关文章

基于Ubuntu的Linux Lite 6.0发行版正式发布

开发者 Jerry Bezencon 今天宣布,基于 Ubuntu 的 Linux Lite 6.0 发行版正式发布。本次更新代号为“Fluorite”,基于 Ubuntu 22.04 LTS (Jammy Jellyfish) 系统,它由长期支持的 Linux 5.15 LTS 内核系列驱动。下载...

快速掌握 Git:程序员必会的版本控制技巧

在现代软件开发中,版本控制系统(VCS)是开发人员不可或缺的工具。无论是个人项目,还是多人协作的团队开发,良好的版本控制都能确保代码管理的高效性与稳定性。而在版本控制系统中,Git 凭借其分布式、灵活性和高效性,成为了最流行的工具之一。几乎所有的开发团队都在使用 Git 来管理代码版本、协作开发和追...

一文让你彻底搞懂 vue-Router

路由是网络工程里面的专业术语,就是通过互联把信息从源地址传输到目的地址的活动。本质上就是一种对应关系。分为前端路由和后端路由。后端路由:URL 的请求地址与服务器上的资源对应,根据不同的请求地址返回不同的资源。前端路由:在单页面应用中,根据用户触发的事件,改变URL在不刷新页面的前提下,改变显示内容...

微信开发整合APP的“应用号” 以整合支付宝为谎言

据最新的消息称,自从前天微信公开课PRO版的各种谣言后,微信的相关人士就对于这个话题澄清后也发表了微信公众号的最新发展趋势。腾讯微信事业群总裁张小龙透露,微信公众平台的出发点并不是要做成一个只是传播内容的平台,而是一个提供服务的平台。“但是,目前的服务号依然没有达到要求。所以,微信正在开发一个新的形...

2022年甘肃特岗、三支一扶、西部计划报名通知

报名时间2022年6月7日9:00至6月11日18:00报名网站甘肃省人力资源考试中心(http://ks.rst.gansu.gov.cn)准考证打印时间2022年6月27日9∶00至7月2日9∶00考试时间和地点2022年7月2日考试地点以准考证上指定的地点为准成绩查询时间7月22日左右点击下方...

电脑提速教程:用NVMe固态硬盘帮扶加速SATA硬盘

不知不觉当中,固态硬盘已经取代机械硬盘成为主流。越来越多的玩家已经淘汰机械盘,使用NVMe+SATA的固态硬盘高低搭配。既然是高低搭配,就一定会有性能差距,是否能从NVMe固态硬盘中划分出一小部分空间来给SATA固态硬盘加速,实现更好地整机性能呢?答案是肯定的,而且这一功能早已隐藏在英特尔Z170、...