“MIR研究课题”的版本间的差异

来自人工智能助力教育知识百科
跳转至: 导航搜索
(创建页面,内容为“文件:mir.png ==音高与旋律== =音高/音调= 由声音波形的频率决定,音乐中每个音符都具有一定的音高 =音高/音调检测(Pitch De…”)
 
第1行: 第1行:
 
[[文件:mir.png]]
 
[[文件:mir.png]]
==音高与旋律==
+
=音高与旋律=
=音高/音调=
+
==音高/音调==
 
由声音波形的频率决定,音乐中每个音符都具有一定的音高
 
由声音波形的频率决定,音乐中每个音符都具有一定的音高
=音高/音调检测(Pitch Detection)=
+
==音高/音调检测(Pitch Detection)==
 
* 时域检查
 
* 时域检查
 
** 过零率法、自相关法(如YIN算法)、最大似然法、自适应滤波器法、超分辨率法
 
** 过零率法、自相关法(如YIN算法)、最大似然法、自适应滤波器法、超分辨率法
第12行: 第12行:
 
** 使用耳蜗模型对每一个通道进行独立的自相关运算
 
** 使用耳蜗模型对每一个通道进行独立的自相关运算
 
** 综合所有通道信息得到相对应的音高
 
** 综合所有通道信息得到相对应的音高
=旋律=
+
==旋律==
 
经过艺术构思按照节奏及和声形成的反映音乐主旨的音符序列
 
经过艺术构思按照节奏及和声形成的反映音乐主旨的音符序列
=旋律提取(Melody Extraction)=
+
==旋律提取(Melody Extraction)==
 
* 从多声部音乐(Polyphonic Music)信号提取单声部(Monophonic)旋律
 
* 从多声部音乐(Polyphonic Music)信号提取单声部(Monophonic)旋律
 
* 应用
 
* 应用
第22行: 第22行:
 
** 歌声分离法(Singing Separation based Melody Extraction)
 
** 歌声分离法(Singing Separation based Melody Extraction)
 
** 数据驱动的音符分类法(Data-driven Note Classification)
 
** 数据驱动的音符分类法(Data-driven Note Classification)
=音乐识谱=
+
==音乐识谱==
 
识别音乐中每个时刻发声的各个音符并形成乐谱
 
识别音乐中每个时刻发声的各个音符并形成乐谱
 
典型方法:
 
典型方法:
第32行: 第32行:
 
** 提取每个音符的基频,根据MIDI音符表转换为音符的音名
 
** 提取每个音符的基频,根据MIDI音符表转换为音符的音名
 
* 利用音乐领域知识或规则进行后处理纠错
 
* 利用音乐领域知识或规则进行后处理纠错
==音乐节奏(Music Rhythm)==
+
=音乐节奏(Music Rhythm)=
=音符起始点检测(Note Onset Detection)=
+
==音符起始点检测(Note Onset Detection)==
 
* 检测音乐中某一音符开始的时间
 
* 检测音乐中某一音符开始的时间
 
* 各种音乐节奏分析的预处理步骤
 
* 各种音乐节奏分析的预处理步骤
第43行: 第43行:
 
** Soft Onset
 
** Soft Onset
 
*** 检测和弦突变点
 
*** 检测和弦突变点
=节拍=
+
==节拍==
 
某种具有固定时长的音符,通常以四分音符或八分音符为一拍
 
某种具有固定时长的音符,通常以四分音符或八分音符为一拍
=节拍跟踪(Beat Tracking)=
+
==节拍跟踪(Beat Tracking)==
 
* 用计算机模拟人们在听音乐时无意识地踮脚或拍手的现象
 
* 用计算机模拟人们在听音乐时无意识地踮脚或拍手的现象
 
* 理解音乐节奏的基础,很多MIR任务的重要步骤
 
* 理解音乐节奏的基础,很多MIR任务的重要步骤
第51行: 第51行:
 
** 通常依赖于音符起始点检测、打击乐或其他时间局域化事件检测
 
** 通常依赖于音符起始点检测、打击乐或其他时间局域化事件检测
 
** 如果音乐偏重抒情,没有打击乐器或不明显,可采用和弦改变点作为候选节拍点
 
** 如果音乐偏重抒情,没有打击乐器或不明显,可采用和弦改变点作为候选节拍点
=速度检测(Tempo Detection)=
+
==速度检测(Tempo Detection)==
 
* 音乐进行的快慢,每分钟多少拍BMP(Beats per Minute)
 
* 音乐进行的快慢,每分钟多少拍BMP(Beats per Minute)
 
* 通常与节拍跟踪同时进行
 
* 通常与节拍跟踪同时进行
第61行: 第61行:
 
** 与一组事先定义好的梳状滤波器卷积
 
** 与一组事先定义好的梳状滤波器卷积
 
** 对所有子带上的能量求和,最高峰值对应于速度
 
** 对所有子带上的能量求和,最高峰值对应于速度
=拍子=
+
==拍子==
 
在小节线划分的相同时间间隔内,按照一定次序重复出现的有规律的强弱变化。如4/4、3/4、2/4等
 
在小节线划分的相同时间间隔内,按照一定次序重复出现的有规律的强弱变化。如4/4、3/4、2/4等
=小节=
+
==小节==
 
划分乐句、乐段、整首乐曲的基本单位,在乐谱中用小节线划分
 
划分乐句、乐段、整首乐曲的基本单位,在乐谱中用小节线划分
=拍子检测(Meter Detection)及小节线检测(Bar line/Measure Detection)=
+
==拍子检测(Meter Detection)及小节线检测(Bar line/Measure Detection)==
 
* 典型方法
 
* 典型方法
 
** 节拍相似性矩阵
 
** 节拍相似性矩阵
 
** 节拍跟踪+基于音乐知识的启发式规则
 
** 节拍跟踪+基于音乐知识的启发式规则
=节奏型检测(Music Rhythm)=
+
==节奏型检测(Music Rhythm)==
 
* 节奏型
 
* 节奏型
 
** 在歌曲中反复出现的有一定特征的节奏
 
** 在歌曲中反复出现的有一定特征的节奏
第76行: 第76行:
 
* 典型方法
 
* 典型方法
 
** 基于模板匹配
 
** 基于模板匹配
==音乐和声==
+
=音乐和声=
=多声部音乐=
+
==多声部音乐==
 
* 复调音乐(Polyphony)
 
* 复调音乐(Polyphony)
 
** 公元9世纪到18世纪前半叶,流行于欧洲
 
** 公元9世纪到18世纪前半叶,流行于欧洲
第87行: 第87行:
 
*** 主调音乐最重要的要素之一
 
*** 主调音乐最重要的要素之一
 
*** 两个或以上不同的音符按照一定规则同时发声而构成的声音组合
 
*** 两个或以上不同的音符按照一定规则同时发声而构成的声音组合
=和弦=
+
==和弦==
 
* 和声的基本素材,由三个或以上不同的音按照一定音程在纵向结合构成
 
* 和声的基本素材,由三个或以上不同的音按照一定音程在纵向结合构成
 
* 和弦的连接表示和声的横向运动
 
* 和弦的连接表示和声的横向运动
=和弦识别(Chord Detection)=
+
==和弦识别(Chord Detection)==
 
* 音频特征
 
* 音频特征
 
** PCP(Chroma):在C、#C、D、#D、E、F、#F、G、#G、A、#A、B等12个半音类上与八度无关的谱能量聚集
 
** PCP(Chroma):在C、#C、D、#D、E、F、#F、G、#G、A、#A、B等12个半音类上与八度无关的谱能量聚集
 
* 识别模型
 
* 识别模型
 
** 模式匹配、隐马尔可夫模型HMM(Hidden Markov Model)、条件随机场CRF(Conditional Random Fields)、支持向量机SVM(Support Vector Machine)、递归神经网络RNN(Recurrent Neural Network)……
 
** 模式匹配、隐马尔可夫模型HMM(Hidden Markov Model)、条件随机场CRF(Conditional Random Fields)、支持向量机SVM(Support Vector Machine)、递归神经网络RNN(Recurrent Neural Network)……
=调检测(Key Detection)=
+
==调检测(Key Detection)==
 
* 音名对应于钢琴上真实的键
 
* 音名对应于钢琴上真实的键
 
* 唱名随着音乐的调(Key)而变化
 
* 唱名随着音乐的调(Key)而变化

2022年10月31日 (一) 00:46的版本

Mir.png

音高与旋律

音高/音调

由声音波形的频率决定,音乐中每个音符都具有一定的音高

音高/音调检测(Pitch Detection)

  • 时域检查
    • 过零率法、自相关法(如YIN算法)、最大似然法、自适应滤波器法、超分辨率法
  • 频域检测
    • 基于音频帧的短时傅里叶变换(SIFT),周期性信号在基频的整数倍处得到峰值
  • 基于听觉模型检测
    • 模拟人类感知音高的生理过程
    • 使用耳蜗模型对每一个通道进行独立的自相关运算
    • 综合所有通道信息得到相对应的音高

旋律

经过艺术构思按照节奏及和声形成的反映音乐主旨的音符序列

旋律提取(Melody Extraction)

  • 从多声部音乐(Polyphonic Music)信号提取单声部(Monophonic)旋律
  • 应用
    • 音乐搜索、抄袭检测、歌唱评价、作曲家风格分析……
  • 典型方法
    • 音高重要性发(Pitch-Salience based Melody Extraction)
    • 歌声分离法(Singing Separation based Melody Extraction)
    • 数据驱动的音符分类法(Data-driven Note Classification)

音乐识谱

识别音乐中每个时刻发声的各个音符并形成乐谱 典型方法:

  • 音源分离
    • 通常基于矩阵分解技术进行歌声和各种伴奏乐器声音的分离
  • 音符分割
    • 在各个音源上进行,寻找每一个音符起始点并分割
  • 音高提取
    • 提取每个音符的基频,根据MIDI音符表转换为音符的音名
  • 利用音乐领域知识或规则进行后处理纠错

音乐节奏(Music Rhythm)

音符起始点检测(Note Onset Detection)

  • 检测音乐中某一音符开始的时间
  • 各种音乐节奏分析的预处理步骤
  • 典型方法
    • Hard Onset
      • 子带分解
      • 检测各子带能量峰值
      • 合并后挑选结果
    • Soft Onset
      • 检测和弦突变点

节拍

某种具有固定时长的音符,通常以四分音符或八分音符为一拍

节拍跟踪(Beat Tracking)

  • 用计算机模拟人们在听音乐时无意识地踮脚或拍手的现象
  • 理解音乐节奏的基础,很多MIR任务的重要步骤
  • 典型方法
    • 通常依赖于音符起始点检测、打击乐或其他时间局域化事件检测
    • 如果音乐偏重抒情,没有打击乐器或不明显,可采用和弦改变点作为候选节拍点

速度检测(Tempo Detection)

  • 音乐进行的快慢,每分钟多少拍BMP(Beats per Minute)
  • 通常与节拍跟踪同时进行
  • 应用
    • 音乐情感分析中的一个重要因素
    • 给帕金森病人播放与其走路速度一致的音乐,辅助其恢复
  • 典型方法
    • 带通滤波,对每个子带计算其幅度包络线
    • 与一组事先定义好的梳状滤波器卷积
    • 对所有子带上的能量求和,最高峰值对应于速度

拍子

在小节线划分的相同时间间隔内,按照一定次序重复出现的有规律的强弱变化。如4/4、3/4、2/4等

小节

划分乐句、乐段、整首乐曲的基本单位,在乐谱中用小节线划分

拍子检测(Meter Detection)及小节线检测(Bar line/Measure Detection)

  • 典型方法
    • 节拍相似性矩阵
    • 节拍跟踪+基于音乐知识的启发式规则

节奏型检测(Music Rhythm)

  • 节奏型
    • 在歌曲中反复出现的有一定特征的节奏
  • 应用
    • 音乐流派分析、音乐教学……
  • 典型方法
    • 基于模板匹配

音乐和声

多声部音乐

  • 复调音乐(Polyphony)
    • 公元9世纪到18世纪前半叶,流行于欧洲
    • 两条或以上的独立旋律,和谐地结合
  • 主调音乐(Homophony)
    • 18世纪后半叶到现在,逐渐取代了复调音乐
    • 某一个声部作为主旋律,其他声部以和声或节奏等手法进行陪衬和伴奏
    • 和声
      • 主调音乐最重要的要素之一
      • 两个或以上不同的音符按照一定规则同时发声而构成的声音组合

和弦

  • 和声的基本素材,由三个或以上不同的音按照一定音程在纵向结合构成
  • 和弦的连接表示和声的横向运动

和弦识别(Chord Detection)

  • 音频特征
    • PCP(Chroma):在C、#C、D、#D、E、F、#F、G、#G、A、#A、B等12个半音类上与八度无关的谱能量聚集
  • 识别模型
    • 模式匹配、隐马尔可夫模型HMM(Hidden Markov Model)、条件随机场CRF(Conditional Random Fields)、支持向量机SVM(Support Vector Machine)、递归神经网络RNN(Recurrent Neural Network)……

调检测(Key Detection)

  • 音名对应于钢琴上真实的键
  • 唱名随着音乐的调(Key)而变化
  • 应用
    • 音乐识谱、和弦检测、音乐情感计算、音乐结构分析……
  • 典型方法
    • 通过音阶分布来描述对调的感知