240 投稿
收录了6篇文章 · 6人关注
  • Resize,w 360,h 240
    Python 音频的数据扩充

    经典的深度学习网络AlexNet使用数据扩充(Data Augmentation)的方式扩大数据集,取得较好的分类效果。在深度学习的图像领域中,...

  • PCM音频数据

    目录 什么是PCM? PCM数据格式 FFmpeg支持的PCM数据格式 FFmpeg中Packed和Planar的PCM数据区别 字节序 PCM...

    3.1 smallest_one 1 32 1
  • FFmpeg常用命令

    分离视频中的音频和视频数据: 提取视频数据与源视频使用相同的编码器:ffmpeg -i input.mp4 -c:v copy -an outp...

  • Audition 用户指南——数字音频基础知识

    为了方便学习,搬运 adobe 官网教程 声波 声音始于空气中的振动,如吉他弦、人的声带或扬声器纸盆产生的振动。这些振动一起推动邻近的空气分子,...

  • SOX 常用命令

    查看音频信息 修改频率、通道数、位深 wav转为raw数据 raw转为wav,此时需要指明raw文件的bit rate encode 不然sox...

  • Resize,w 360,h 240
    FFmpeg的使用

    使用FFmepg快速切割视频 优点:速度够快缺点:如果切割的时间点不属于关键帧则会出现切割的视频开始部分停顿几秒命令如下: 其中statTime...

专题公告

语音处理