PyTorch语音识别实战_9787302655657
出版日期:2024.2
ISBN:978-7-302-65565-7
定价:69.00
正文语种:中文
丛书名:人工智能技术丛书
版次:1
中图分类:TP18
开本或尺寸:19 * 26
装帧方式:平装
作者:王晓华, 著
出版社位置:北京
出版单位:清华大学出版社
内容摘要:本书使用PyTorch 2作为语音识别的基本框架,循序渐进地引导读者从搭建环境开始,逐步深入到语音识别基本理论、算法以及应用实践,是较好的一本语音识别技术图书。本书配套示例源码、数据集、PPT课件等资源。本书分为13章,内容包括语音识别之路、PyTorch 2.0深度学习环境搭建、音频信号处理的理论与Python实战、音频处理常用工具包librosa详解与实战、基于DNN的语音情绪分类识别、一学就会的深度学习基础算法、基于PyTorch卷积层的语音情绪分类识别、词映射与循环神经网络、基于Whisper的语音转换实战、注意力机制与注意力模型详解、鸟叫的多标签分类实战、多模态语音转换模型基础、GLM架构多模态语音文字转换实战。本书内容详尽、示例丰富,适合作为语音识别初学者、深度学习初学者、语音识别技术人员必备的参考书,同时也非常适合作为高等院校或高职高专深度学习、语音识别等课程的教材。
备注:王晓华,安徽医学院计算机专业讲师,男,46岁。研究方向为云计算、大数据与人工智能。著有《Python机器学习与可视化分析实战》《谷歌JAX深度学习从零开始学》《Spark3.0大数据分析与挖掘:基于
主题词:工学 控制科学与工程 模式识别与智能系统
版权页信息: PyTorch语音识别实战 / 王晓华著. -- 北京 : 清华
大学出版社, 2024.2
(人工智能技术丛书)
ISBN 978-7-302-65565-7
Ⅰ. ①P… Ⅱ. ①王… Ⅲ. ①人工智能-算法 Ⅳ.
①TP18
中国国家版本馆CIP数据核字(2024)第022269号
ISBN图书库
出版物清单