他のページで利用したデータを再掲するとともに、それ以外で有用と思われるデータを新規に作成した。便宜のためタブ区切りテキストとcsvフォーマットのファイルを用意したものもある。
このページ(http://yppts.adam.ne.jp/music/data.html)の2次利用について筆者は、ライセンスのページにある「出典の明示」を求めない。
C4を鳴らした場合の倍音(タブ区切りテキスト、csvフォーマット)。
倍音 | 音程 | 最初のCから見た距離 | 純正律の場合 |
1倍音 | C4 | 完全1度 | |
2倍音 | C5 | 1オクターブ上の完全1度(完全8度) | 完全1度 |
3倍音 | G5 | 1オクターブ上の完全5度 | 完全5度 |
4倍音 | C6 | 2オクターブ上の完全1度 | 完全1度 |
5倍音 | E6 | 2オクターブ上の長3度 | 長3度 |
6倍音 | G6 | 2オクターブ上の完全5度 | 完全5度 |
7倍音 | -- | 2オクターブ上のAとBbの間、Bb寄り | 短7度(よりもやや低い) |
8倍音 | C7 | 3オクターブ上の完全1度 | 完全1度 |
9倍音 | D7 | 3オクターブ上の長2度(よりもやや高い) | 長2度 |
10倍音 | E7 | 3オクターブ上の長3度(よりもやや低い) | 長3度 |
11倍音 | -- | 3オクターブ上のFとGbの間、ややGb寄り | 減5度(よりもやや低い) |
12倍音 | G7 | 3オクターブ上の完全5度 | 完全5度 |
13倍音 | -- | 3オクターブ上のG#とAの間、A寄り | 長6度(よりもやや低い) |
14倍音 | -- | 3オクターブ上のAとBbの間、Bb寄り | 短7度(よりも低い) |
15倍音 | B7 | 3オクターブ上の長7度(よりやや低い) | 長7度 |
16倍音 | C8 | 4オクターブ上の完全1度 |
17倍音以上は音量も小さく減衰も早いのであまり問題にならないだろう。
Cから半音づつ上行した場合の周波数の変化(タブ区切りテキスト、csvフォーマット)。有効桁数9桁で求めたうえで7桁目まで丸めてある。括弧内は純正律での数字(減5度は説が一定していないので仮にルート2としておく)で、コロンの後ろは平均律との差(セント単位で小数点以下3位に丸めた)。
周波数 | 英略名 | 和名 | 音名 | 距離 | root音との関係 |
1(1) | p1 | 完全1度 | C | 0 | ユニゾンという |
1.059463(16/15:+11.731) | m2 | 短2度 | Db | 1 | 長7度下行と同義 |
1.122462(9/8:+3.910) | M2 | 長2度 | D | 2 | |
1.189207(6/5:+15.641) | m3 | 短3度 | Eb | 3 | 長6度下行と同義 |
1.259921(5/4:-13.686) | M3 | 長3度 | E | 4 | |
1.334840(4/3:-1.955) | p4 | 完全4度 | F | 5 | 完全5度下行と同義 |
1.414214 | d5 | 減5度 | Gb | 6 | 三全音(トライトーン)という |
1.498307(3/2:+1.955) | p5 | 完全5度 | G | 7 | 完全4度下行と同義 |
1.587401(8/5:+13.686) | a5 | 増5度 | G# | 8 | 長3度下行と同義 |
1.681793(5/3:-15.641) | M6 | 長6度 | A | 9 | |
1.781797(16/9:-3.910) | m7 | 短7度 | Bb | 10 | 長2度下行と同義 |
1.887749(15/8:-11.732) | M7 | 長7度 | B | 11 | |
2(2) | p8 | 完全8度 | C | 12 | オクターブという |
平均律の場合、減5度(G♭)は増4度(F#)、増5度(G#)は短6度(A♭)、短2度(D♭)は増1度(C#)と異名同音。
上記の表からA4=440Hzとして平均律の周波数を求めたもの(タブ区切りテキスト、csvフォーマット)。まず440に表の数字を掛け算/割り算してC4~B4までの周波数を求め、それを2のべき乗で掛け算/割り算して、最後に有効桁数4桁に丸めてある(ので、ある音の周波数を2倍したものと、1オクターブ上の音の周波数が食い違う場合がある)。B8から下はHz、C9から上はKHzが単位。
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | |
C | 16.35 | 32.70 | 65.41 | 130.8 | 261.6 | 523.3 | 1047 | 2093 | 4186 | 8.372 | 16.74 |
C# | 17.32 | 34.65 | 69.30 | 138.6 | 277.2 | 554.4 | 1109 | 2217 | 4435 | 8.870 | 17.74 |
D | 18.35 | 36.71 | 73.42 | 146.8 | 293.7 | 587.3 | 1175 | 2349 | 4699 | 9.397 | 18.79 |
D# | 19.45 | 38.89 | 77.78 | 155.6 | 311.1 | 622.3 | 1245 | 2489 | 4978 | 9.956 | 19.91 |
E | 20.60 | 41.20 | 82.41 | 164.8 | 329.6 | 659.3 | 1319 | 2637 | 5274 | 10.55 | 21.10 |
F | 21.83 | 43.65 | 87.31 | 174.6 | 349.2 | 698.5 | 1397 | 2794 | 5588 | 11.18 | 22.35 |
F# | 23.12 | 46.25 | 92.50 | 185.0 | 367.0 | 740.0 | 1480 | 2960 | 5920 | 11.84 | 23.68 |
G | 24.50 | 49.00 | 98.00 | 196.0 | 392.0 | 784.0 | 1568 | 3136 | 6272 | 12.54 | 25.09 |
G# | 25.96 | 51.91 | 103.8 | 207.7 | 415.3 | 830.6 | 1661 | 3322 | 6645 | 13.29 | 26.58 |
A | 27.50 | 55.00 | 110.0 | 220.0 | 440.0 | 880.0 | 1760 | 3520 | 7040 | 14.08 | 28.16 |
A# | 29.14 | 58.27 | 116.5 | 233.1 | 466.2 | 932.3 | 1865 | 3729 | 7459 | 14.92 | 29.83 |
B | 30.87 | 61.74 | 123.5 | 246.9 | 493.9 | 987.8 | 1976 | 3951 | 7902 | 15.80 | 31.61 |
参考までに、四捨五入前のデータも公開しておく(タブ区切りテキスト、csvフォーマット)。ちなみに1セントは周波数にして1.00057779倍、440HzのA4と442HzのA4の差は7.85セントである。
440Hz前後のAをA4、そのすぐ下のCをC4(261.6Hz前後)、A4のすぐ上のBをB4(493.9Hz前後)として、BからCに音程が上がる際にオクターブを示す数字を変える(B3の半音上はC4、B4の半音上はC5)「国際式」を基準に説明する。一般的な88鍵のピアノでは、最低音がA0、最高音がC8、中央のドがC4に相当する。
ドイツ式では、C3~B3をc~hとして1オクターブ上がるごとに右上に数字を付け、C2~B2をC~Hとして1オクターブ下がるごとに右下に数字を付ける(hとHは国際式でいうBの音)。日本式もこれと同様で、C3~B3をハ~ロとして、1オクターブ上がるごとに点を付け、C2~B2をは~ろとして1オクターブ下がるごとに下点を付ける(ハニホヘトイロが国際式のCDEFGABに相当)。
俗用ではあるが、440HzのA4をhi-Aと称し、A4~G#5をhi、A3~G#4をmid2、A2~G#3をmid1、A1~G#2をlowとする(hiより上はhihiなど1オクターブ上がるごとにhiを増やし、lowより下はlowlowなど1オクターブ下がるごとにlowを増やす)表記もある。C~BでなくA~G#の区切り(多分、ブルース用の10穴ハーモニカのキー表示を流用したのだと思う:ブルースの場合key=Aが基準になることが多い)となっており、しかも単に「hi-A」などというと「その楽器が一般的に使用するAのうち高い方」という意味もある(たとえばエレキベースで「hi-C弦」というと「開放でC3の音が出る弦」のこと、「low-B弦」というと「開放でB1の音が出る弦」のことを指す)ため、やや紛らわしい。
MIDIのnote numberは、0がC-1なのが一般的で、そこから12ごとに、12がC0、24がC1、36がC2・・・120がC9、127がG9に相当する(鍵盤からシンセベースを操作するときなどは、適宜オクターブシフトさせる)。周波数で言うとC-1≒8.175Hz、G9≒12.54KHzで、C-1の1~2倍音は音波ではなく低周波になる。
同主は同主調、属平は属調平行調、下属平は下属調平行調、同平は同主調平行調、ハイフンは遠隔調を表す。GbとF#、EbmとD#mを別の調として扱っているが、平均律では一致する(つまりこの表はループできる)。
音程の距離 | d5 | m2 | m6 | m3 | m7 | p4 | p1 | p5 | M2 | M6 | M3 | M7 | a5 |
b/#の数 | b6 | b5 | b4 | b3 | b2 | b1 | 0 | #1 | #2 | #3 | #4 | #5 | #6 |
調の名前 | Gb Ebm | Db Bbm | Ab Fm | Eb Cm | Bb Gm | F Dm | C Am | G Em | D Bm | A F#m | E C#m | B G#m | F# D#m |
Cから見た関係 | - - | - - | - - | 同平 同主 | - - | 下属調 下属平 | 主調 平行 | 属調 属平 | - - | - - | - - | - - | - - |
Amから見た関係 | - - | - - | - - | - - | - - | 下属平 下属調 | 平行 主調 | 属平 属調 | - - | 同主 同平 | - - | - - | - - |
新たにb/#する トーン | C> Cb | G> Gb | D> Db | A> Ab | E> Eb | B> Bb | なし | F> F# | C> C# | G> G# | D> D# | A> A# | E> E# |
b/#の別解釈 | #6 | #7 | #8 | #9 | #10 | なし | なし | なし | なし | b9 | b8 | b7 | b6 |
別解釈時の調名 | F# D#m | C# A#m | G# Fm | D# Cm | A# Gm | なし | なし | なし | なし | A Gbm | E Dbm | B Abm | Gb Ebm |
表を右に1つ進むと完全5度上行(完全4度下行)、左に1つ進むと完全5度下行(完全4度上行)になる。右に2つ進むと長2度上行、左に2つ進むと長2度下行である。表には一応記入してあるがb/#の数が7を超えることはまずない(ピアノの白鍵7種類しかないし:Dbから同主調転調してDbmになったり、G#mから同主調転調してG#になったりするくらい)。理論上は、#を11書いてE#だと言い張ることが不可能ではないが、誰もが「それはFだろ」とツッコミを入れるはず。
b/#が偶数個の場合、C/Amからその個数分上下行した音名が調の名前になる。たとえば#が4つのメジャーキーであればCから半音4つ(長3度)上のEということになる。b/#が奇数個の場合、上の表で左方向になるよう1つずらして数え、5度上げればよい。たとえばbが5つのマイナーキーであれば、bが6つの調をまず考えるとAmから半音6つ(全音3つ)下のEbmで、そこから5度上がるので都合Bbmになる。Bの右側(5度上)を境にb/#のつき方が変わることを覚えておくとよい。
調性外の音を使う場合などの参考に。ナチュラルメジャーとナチュラルマイナーだけ。
メジャー | I6/M7(T) | IIm6/7(SD) | IIIm7(T) | IV6/M7(SD) | V6/7(D) | VIm7(T) | VIIφ(D) |
属調 | VM7 | VIm6 | VIIm7 | なし | II6/7 | なし | IV#φ |
下属調 | なし | Vm6/7 | なし | VIIb6/M7 | I7 | なし | IIIφ |
マイナー | Im7(T) | IIφ(D) | IIIb6/M7(T) | IVm6/7(SD) | Vm7(D) | VIb6/M7(SD) | VIIb6/7(SD) |
属調 | なし | VIφ | VIIbM7 | Im6 | IIm7 | なし | IVb6/7 |
下属調 | なし | Vφ | なし | VIIm6/7 | なし | IIb6/M7 | IIIb7 |
たとえば「メジャーの欄」「属調の行」「IIm6/7(SD)の列」に「VIm6」とあるのは、「メジャースケールにおいて」「属調のIIm6を借用すると」「主調から見たVIm6というコードになる」という意味。Key on Cに当てはめると、「Key on Cにおいて」「Key on GのIIm6(=Am6)を借用すると」「Key on Cから見たVIm6というコードになる」ということ。太字はトライアドでも調性外のコードで「IIIb6/M7」などとあるのは「IIIb6またはIIIbmaj7」の意。「なし」は調性外の音が鳴らないことを示す。
ついでに関係調と共通するコードも。
メジャー | I6/M7(T) | IIm6/7(SD) | IIIm7(T) | IV6/M7(SD) | V6/7(D) | VIm7(T) | VIIφ(D) |
属調 | V6 | VIm7 | なし | I6/M7 | なし | IIIm | なし |
下属調 | IV6/M7 | なし | VIm7 | なし | I6 | IIm7 | なし |
マイナー | Im7(T) | IIφ(D) | IIIb6/M7(T) | IVm6/7(SD) | Vm7(D) | VIb6/M7(SD) | VIIb6/7(SD) |
属調 | Vm7 | なし | VIIb6 | Im7 | なし | IIIb6/M7 | なし |
下属調 | IVm7 | なし | VIb6/M7 | なし | Im7 | なし | IIIb6 |
たとえば「マイナーの欄」「下属調の行」「Im7(T)の列」に「IVm7」とあるのは、「マイナースケールにおいて」「下属調のIm7を借用すると」「主調のIVm7に一致する」という意味。「なし」は調性内に一致するコードがないという意味。
メジャースケールでの調性外コードとして、下属調のIIm>V>Iを借りてI>Vm>I>IVとしたり、平行調からIVm(サブドミナントマイナー)を借りてIV>IVm>IorVなどとする例がよく見られる。III>VIm(1-3-6-2-5-1の一部など)の形でIIIやIII7が使われるケースも多いが、これは平行調のナチュラルマイナーがハーモニックマイナーモードまたはメロディックマイナーモードにモーダルインターチェンジした場合のV>Imを借用したと解釈できる。もちろん、裏コード(ドミナントセブンなどを三全音平行移動したコード)やセカンダリードミナント(トニック以外のダイアトニックなメジャーまたはマイナーコードに解決するドミナントセブン:ディミニッシュマイナーは解決先として想定しないのが普通)もよく使われるコードである。
各調またはモードにおけるコードのファンクションを一覧にした。T/D/SDの区別は「ドミナントの緊張感を解決してキーの安定感を出せる和音がトニック代理(T)」「強い緊張感があり解決を要求する和音がドミナント代理(D)」「強い安定感も強い緊張感もないのがサブドミナント代理(SD)」というのが基本。
キー | T | D | SD |
ナチュラルメジャー | IM7、VIm7、IIIm7 | V7、VIIφ | IVM7、IIm7 |
ナチュラルマイナー | Im7、III♭M7 | Vm7 | IVm7、VI♭M7、VII♭7、IIφ |
ハーモニックマイナー | ImM7、III♭augM7 | V7、VIIdim7 | IVm7、VI♭M7、IIφ |
メロディックマイナー | ImM7、III♭augM7 | V7、VIIφ | IV7、VIφ、IIm7 |
ただし、用法によって機能は変化し得る。たとえば、ナチュラルメジャーにおけるIIImはIVに進む場合がトニック代理(T)でIかVImに解決する場合にはドミナント代理(D)と扱う場合があるし、VImもIに解決する場合はサブドミナント代理(SD)でそれ以外はトニック代理(T)と扱う場合がある。メロディックマイナーのVIIaug7はトニック代理でよいのだろうか(ちょっと自信がない)。
解決感があるかないかに注目して分類することが多いようだが、厳密な根拠はよくわからなかった。おそらく、たとえば「IIIm>Iと進行するとIIImの緊張感が目立つ」とか「VIm>Iと進行するとVImが思ったほど安定していないのがバレる」とか、聴覚上の根拠を元にしているのだろうと思う。また、サブドミナントの不安定感はドミナントの不安定感とやや異なり、調性の揺らぎを含むことがある(ivやviのトーンが重要な役割を果たす)。
VII♭、IIφ、III♭aug、IVφあたりも前後関係や人により解釈が分かれている。II♭M7(サブドミナント代理:フリジアンモード由来でナポリ和音とも)とII♭7(ドミナント代理:いわゆる裏ドミナント)のように、セブンスのつき方でファンクションが変わる例もある(ただしテンションは考慮しないのが普通)。
More Jamの解説(その1、その2、その3、その4)(外部リンク)を読んでみたが、どうやら
機能 | 構成音 |
T | iiiを含みivを含まない |
Tm | iii♭を含みivを含まない |
SD | ivとviを含みviiを含まない |
SDm | ivとvi♭を含みviiを含まない |
D | ivとviiを含む(トライトーン) |
Dm | ivと♭viiを含む(不安定感は弱い) |
このルールで分類すると、上の表とは食い違う分類になるコードがいくつかある。あくまで「モーダルインターチェンジを中心とした解釈ではこうなる」という分類なので、他の流儀での分類と食い違うこと自体に問題はない。
他のコードをマイナーからの派生扱いする(マイナーコンバージョン)。
種類 | 変換先 | 例 | 補足例 |
メジャー | 長6度上(短3度下)のマイナー | C>Am | C6>Am7 |
マイナー | 変換不要 | なし | なし |
ディミニッシュ | 短3度上のマイナー | Bm(-5)>Dm | Bφ>Dm6 |
ドミナントセブン | 完全5度上のマイナー | G7>Dm | G7>Bφ>Dm6 |
種類 | 変換先 | 例 | 補足例 |
メジャー | 変換不要 | なし | なし |
マイナー | 短3度上のメジャー | Am>C | Am7>C6 |
ディミニッシュ | 減5度上(増4度下)のメジャー | Bm(-5)>F | Bφ>Dm6>F |
ドミナントセブン | 長2度下のメジャー | G7>F | G7>Bφ>Dm6>F |
V7の7度音ivと3度音viiがなすトライトーンがどう解決されるかの一覧。コードファンクションはivの解決を基準にすることが多い。
解決先 | ivの解決先 | viiの解決先 | 種別 | 備考 |
I | iiiに半音下行 | iに半音上行 | メジャー受け | もっとも安定 |
VIm | iiiに半音下行 | iに半音上行 | 代理受け | トライトーン自体は完全に解決 |
IIIm | iiiに半音下行 | viiに留め置かれる | 半端な代理受け | viiが解決されない |
Im | biiiに全音下行 | iに半音上行 | マイナー受け | biiiへの解決をiiに奪われることがある |
bIII | biiiに全音下行 | bviiに半音下行 | マイナー代理受け | さらに解決感が薄い |
これを反対から見て、同種の解決ができるコードを一覧にする(ナチュラルメジャー/ナチュラルマイナーに出現するもののみ)。
条件 | コード | 備考 |
iiiとiを含む | I、VIm | IV△7だとivが解決されない |
biiiとiを含む | Im、bVI | IVm7だとivが解決されない |
iiiとviiを含む | IIIm、V6 | I△7omit1もこの形 |
biiiとbviiを含む | bIII、bVIIsus4 | Im7omit1もこの形 |
プライマリードミナントおよびその派生コードを解決する進行(タブ区切りテキスト、csvフォーマット)。
コード | IまたはImへ | VImへ | IIImへ | bIIIへ | 解釈 | 備考 |
V7 | 完全4度上行 | 全音上行 | 長6度上行 | 増5度上行 | ドミナントセブン | もっとも明確なドミナントモーション |
bII7 | 半音下行 | 増5度上行 | 短3度上行 | 全音上行 | ドミナントセブンの裏コード | オルタードスケールで通常のドミナントと相互接続 |
VIIm(-5) | 半音上行 | 全音下行 | 完全4度上行 | 長3度上行 | ドミナントセブンのomit1 | 完全4度上行で解決したがるモーションも強い |
IVm(-5) | 完全5度上行 | 長3度上行 | 半音下行 | 全音下行 | 裏コードのomit1 | 半音上行や完全4度上行の引力を振り切る形になりやや弱い |
IIm6 | 全音下行 | 完全5度上行 | 全音上行 | 半音上行 | ハーフディミニッシュの第1回転形 | 5度音を半音下げてdim7の形も使える |
bVIm6 | 長3度上行 | 半音上行 | 増5度上行 | 完全5度上行 | ハーフディミニッシュの裏の第1回転形 | omit5にすると軽くなり半音下げてdim7の形も使える |
Vm7 | 完全4度上行 | 全音上行 | 長6度上行 | 増5度上行 | ドミナントマイナー | ツーファイブの一部として使える |
bIIm7 | 半音下行 | 増5度上行 | 短3度上行 | 全音上行 | ドミナントマイナーの裏 | ツーファイブの一部として使える |
IV on V | 完全4度上行 | 全音上行 | 長6度上行 | 増5度上行 | フュージョンコード | 非常に曖昧なドミナントモーション |
上記のほか、V7はbIIIaug(ハーモニックマイナーなどで出てくる:トニックマイナー代理)でも受けられるので、「bIIIへ」は「bIIIまたはbIIIaugへ」と読み替えてもよい。III(ハーモニックメジャーで副次的に出てくる:IIIsus4(-4)とは普通書かない)やVI(メロディックフリジアンなどで副次的に出てくる)、IとbIIIのdim7、IIIとVIのハーフディミニッシュもトニック扱いすることがある(前の項を参照)。
なお、上記は当然セカンダリードミナントにも応用できる。
あるコードが鳴っている場合にルートを変えずに利用可能な(モーダルインターチェンジの文脈での)モードと、コードのルートから見たモードの特徴音の度数(表記としてやや奇妙だが便宜のためテンション扱い)。括弧内は核音(nuclear tones=iとivとv)以外のコード構成音(浮動音=floating tones)。ナチュラルメジャーとナチュラルマイナーは省いて記述。
iiを含まないコードで、iiiが構成音の場合アラビア系モード、iiibが構成音の場合フリジア系モード、どちらも構成音でない場合は両方が候補になるが、追加でiiをフラットできるというだけなので一覧では省いた。括弧書きのモードは安定感や影響力が比較的弱い(どのモードにも、もっとも安定感の高いナチュラルメジャーに解決したがる傾向がいくらかある)。フリジアンモード(ナチュラルマイナーからiiだけフラットした形)以外のフリジア系とアラビア系モードは、すべて括弧書きに準じる(アラビア系モードはとくに不安定)。
ナチュラルメジャーのダイアトニックコード。
V7でハーモニックマイナーを使う場合「vから見て5度下であるiから始まる」という意味の「perfect5th below」をつけて、さらに略記にして「Hmp5↓」などと表記することがある(「はぁもにっくまいなぁぱぁふぇくとふぃふすびろぅ」と読む)が、モーダルインターチェンジの文脈でやり取りしている限り、単に「ハーモニックマイナー」と書いても不都合はあまりない(裏コードやセカンダリードミナントやコンバージョンが絡んでくると、どこを起点にしたスケールなのか確認する必要が出てくる)。
モードを変える直前のコードによっても変化のつき方が変わる。たとえばトニック系のコードはiiiまたはbiiiの存在感が大きいので、直後にメジャー/マイナーの入れ替えをやると大きな変化に感じる。メジャーキーでIImを鳴らしてから途中でメロディックマイナーに移り、そのままV7に進むような場合は変化がさりげなくなる。IV△7(iiiは含まれているが存在感は強くない)あたりからマイナー系モードに進むと中間的な感じになる。
借用/共通コードも一覧にしておく。
コードのルートを基準にモードを再構成する場合。括弧内は特徴音、「一致」とあるのは順序を無視した構成音が同じこと(「戻る」などの表現も同様)、「i~vii」は元のキーから見た相対音程、「m6」「M3」などはコードのルートから見た相対音程を指すことにする。便宜のため、元のキーを基準にしたモードには「k」を、コードのルートを基準にしたコードスケールには「c」を、名前の頭につけることにする。
ナチュラルメジャーに対する拡張
ナチュラルメジャーからの移行について、フラットする特徴音のものはモーダルインターチェンジと構成音がかぶる。
調号 | 転調先 | 特徴音 | モード | 借用可能なメジャーコード |
1 | iv | bvii | ミクソリディアン | bVII |
2 | bvii | bvii, biii | ドリアン | bVII, bIII |
3 | biii | bvii, biii, bvi | ナチュラルマイナー | bVII, bIII, bVI |
4 | bvi | bvii, biii, bvi, bii | フリジアン | bIII, bVI, bII |
5 | bii | bvii, biii, bvi, bii, bv | オルタード4 | bVI, bII, bV |
シャープ系の変化はしょっぱなで核音(iv)が動くうえ、たった2回でルートがずれてしまうため、vへの転調とリディアンへのインターチェンジがかぶるだけになる。結果的に、フラット系の変化ではモーダルインターチェンジっぽさが、シャープ系の変化では転調っぽさが出やすい。
1オクターブ以内にある三和音について、コードネーム別に「一番低い音から半音いくつ上昇するか」を一覧にした。たとえば「4-3」とあったら、最低音から半音4つ上に中間の音、中間の音から半音3つ上に最高音が来る形である。便宜上、候補はテンションのない四和音までに限定する(たとえ限定しなくても実際には、三和音に直接テンションを乗せて1stか5thが落ちた形(たとえばC(9)omit1とか)と、セブンスorシックススコード+テンション1つで1stと5thが落ちた場合(たとえばC7(9)omit1,5とか)くらいしか考慮しなくてよいはず:三和音にテンションが2つ乗ってかつコードトーン2つ省略というのはいかにも苦しい)。
いわゆる12音階から「ある音と、最初の音から1オクターブ以内の2音」を含む三和音は11C2=55通り選べるが、そのうち少なくとも上記34通りにコードネームを当てはめることができる。それ以外の21通りについては、
ちなみに二和音は、インターバルが半音3または9ならマイナー、4または8ならメジャー、5または7ならパワーコードだと解釈できる。インターバルが半音6になる二和音はドミナントセブンの一部だと考えるのが自然だろう(ディミニッシュマイナーomit3でもよいが、ディミニッシュマイナー自体をドミナントセブンのルート音省略と見るなら、結局ドミナントセブンの一部に変わりはない)。
四和音の場合、まずすべてがコードトーンだとして解釈を試みて、解決できなければ「テンションが乗ってかつコードトーンが省略された形」を考慮する。たとえばCとDとEとAの和音はAm(11)、F7(13)omit1、C6(9)omit5などの可能性がある。機械的に解釈するなら、4トーンのうち任意の3つを使って上記の一覧にあてはまるものを探し、残る1つをテンション扱いすることになるだろう。都合4通りの試行が必要で、もし五和音だと5C3で10通り試行しなければならない。六和音以上はどうとでも解釈できてしまうので、あまり気にしなくてよいだろう。
ルート音を省略したメジャーセブンもしくはマイナーセブンの下でベースをダイアトニックに動かした場合のコードネーム(タブ区切りテキスト、csvフォーマット)。アラビア数字は「ベースがコードのルート音から見て何度か」を示す。メジャーセブンがダイアトニックでないVとVIIbはドミナントセブンで代用し、ディミニッシュマイナーのセブンスコードはハーフディミニッシュにしている。なお、スペースの都合で(ハーフディミニッシュではないトライアドの)ディミニッシュマイナーをφで表記している部分がある。
メジャー | I | IIm | IIIm | IV | V | VIm | VIIm(-5) |
1 | IM7 | IIm7 | IIIm7 | IVM7 | V7 | VIm7 | VIIφ |
2 | IIIm7 V6 | IVM7 VIm(-13) | VIIφ(-13) V7 | VIm7 I6 | VIIφ IIm6 | IM7 IIIm(-13) | IIm7 IV6 |
3 | IIIm | IV | V | VIm | VIIm(-5) | I | IIm |
4 | IIIm(-9) | IV(9) Isus4(13) | V(9) IIsus4(13) | VIm(9) IIIsus4(-13) | VIIφ(-9) | I(9) Vsus4(13) | IIm(9) VIsus4(-13) |
5 | IIIm | IV | V | VIm | VIIm(-5) | I | IIm |
6 | IIIm(11) IIIsus4(+9) | IV(+11) | V(11) | VIm(11) VIsus4(+9) | VIIφ(11) | I(11) | IIm(11) IIsus4(+9) |
7 | IIIm | IV | V | VIm | VIIm(-5) | I | IIm |
マイナー | Im | IIm(-5) | bIII | IVm | Vm | bVI | bVII |
1 | Im7 | IIφ | bIIIM7 | IVm7 | Vm7 | bVIM7 | bVII7 |
2 | bIIIM7 Vm7(-13) | IVm7 bVI6 | Vm7 bVII6 | bVIM7 Im(-13) | bVIIM7 IIφ(-13) | Im7 bIII6 | IIφ IVm6 |
3 | bIII | IVm | Vm | bVI | bVII | Im | IIm(-5) |
4 | bIII(9) bVIIsus4(13) | IVm(9) Isus4(-13) | Vm(-9) | bVI(9) bIIIsus4(13) | bVII(9) IVsus4(13) | Im(9) Vsus4(-13) | IIm(-5)(-9) |
5 | bIII | IVm | Vm | bVI | bVII | Im | IIm(-5) |
6 | bIII(11) | IVm(11) IVsus4(+9) | Vm(11) Vsus4(+9) | bVI(+11) | bVII(11) | Im(11) Isus4(+9) | IIm(-5)(11) |
7 | bIII | IVm | Vm | bVI | bVII | Im | IIm(-5) |
IもしくはImの下でベースの音程をクロマチックに上げていった場合のコードネーム(タブ区切りテキスト、csvフォーマット)。
P1 | m2 | M2 | m3 | M3 | P4 | D5/A4 | P5 | m6 | M6 | m7 | M7 | |
I | IM7 | #Iφ IIIm6 | IIIm7 V6 | IIImM7 Vaug(13) | IIIm | IIIm(-9) | IIIm(9) VIIsus4(-13) | IIIm | III(+9) | IIIm(11) IIIsus4(+9) | IIIm(+11) | IIIm |
Im | Im7 | bIII7 Vm(-5)(-13) | bIIIM7 Vm7(-13) | bIII | bIII(-9) | bIII(9) bVIIsus4(13) | bIII(+9) | bIII | bIII(11) | bIII(+11) | bIII | bIII(-13) Vaug(+9) |
右手がトライアド(ルート省略せず)の場合、メジャー/マイナーコードともにベースが6度音になるとコードネームの解釈が変わる。メジャーコード on M6だと長6度上(短3度下)のマイナーセブンに、マイナーコード on m6だと短6度上(長3度下)のメジャーシックスに、マイナーコード on M6だと長6度上(短3度下)のハーフディミニッシュになる。メジャーコード on m6はあまりやらないが、短6度上(長3度下)のオーギュメントメジャーセブンという変な形になる。
ルートを省略したセブンスコードの下でベースがルート以外のコードトーンに動いた場合、主要コードは代理コードに、代理コードは主要コードに幾分歩み寄った雰囲気になる(そう大きな違和感は出にくい)。2度に持っていくと歩み寄った上でさらに回転形になる。6度は雰囲気が大きく変わる。
オマケでパワーコードの下で動かした場合(回転形を無視):P1 | m2 | M2 | m3 | M3 | P4 | D5/A4 | P5 | m6 | M6 | m7 | M7 |
PowerI | bIIm(-5)△7omit3(一応) | Vsus4またはIsus2 | Im | I | Isus4 | 該当なし | PowerI | bIV△7omit5 | VIm7omit5 | セブンスコードの3度省略(こじつけ) | セブンスコードの3度省略(こじつけ) |
ローインターバルリミットの目安は以下の通り(アコースティックピアノ前提)
完全5度 | A1とE2 |
完全4度 | D2とG2 |
長6度 | D2とBb2 |
長3度 | A2とC#3 |
長短7度 | A2とG#3またはG3 |
短3度 | C#3とE3 |
増4度/減5度 | C#3とG3 |
短6度 | C#3とA3 |
長2度 | G3とA3 |
とくにアコースティックギターのローコードやエレキギターのパワーコードでE~G(6弦からE2~G2の音が出てくる)を弾いている場合ベースの動きがかなり制限される(ベースに古めの弦を使うと倍音が減ってやや改善される:濁りだけでなく低音のダブつきの問題もあるので、ギターのハイパスもかけておいた方がよいだろう)。
1小節x秒で4/4拍子の曲のテンポn(1分間に4分音符n回)は、60/(x/4)=240/xで求められる。4分音符1拍がx秒なら素直に60/xでよい。逆に、テンポをxとすると、4/4拍子の1小節は(60/x)*4=240/xになり、n分音符の長さは240/(x*n)になる。
テンポをx(1分間に4分音符x回)とすると、n分音符の長さは{(60/x)*4}/n=240/(x*n)に、テンポをx(1分間に4分音符x回)とすると、周波数n(Hz)の繰り返しはn*((60/x)*4) = 240*n/x分音符相当になる。
4分音符=480チックス(分解能1920)を前提とした、音価チックス数の対応。完全なテヌートの場合(オマケでDominoで打ち込んだ場合のスクリーンショットその1とその2:その2は横に拡大してある)。
分数 | 小数 | チックス | 3連 | 分数 | 小数 | チックス | |
2分 | 1/2 | 0.5 | 960 | 2分 | 1/3 | 0.333333333 | 640 |
4分 | 1/4 | 0.25 | 480 | 4分 | 1/6 | 0.166666667 | 320 |
8分 | 1/8 | 0.125 | 240 | 8分 | 1/12 | 0.083333333 | 160 |
16分 | 1/16 | 0.0625 | 120 | 16分 | 1/24 | 0.041666667 | 80 |
32分 | 1/32 | 0.03125 | 60 | 32分 | 1/48 | 0.020833333 | 40 |
64分 | 1/64 | 0.015625 | 30 | 64分 | 1/96 | 0.010416667 | 20 |
128分 | 1/128 | 0.0078125 | 15 | 128分 | 1/192 | 0.005208333 | 10 |
256分 | 1/256 | 0.00390625 | 7.5 | 256分 | 1/384 | 0.002604167 | 5 |
以下、n分音符n個分(たとえば4分音符4個分)に相当する音価の「1分音符」を仮に想定して話を進める(2分の2拍子や4分の4拍子など分子と分母が揃っている拍子では全音符=1分音符と同じ長さになるが、4分の3拍子など分子と分母が揃っていない拍子では全音符と1分音符が異なる長さになる)。
附点の場合は1.5倍(=3/2倍)、複附点の場合は1.75倍(7/4倍)にして計算する。6連符と12連符は3連符と同様に計算できる(たとえば、3連8分音符と6連8分音符と12連8分音符のチックス数は同じ:それぞれ、3つで4分音符、6つで2分音符、12で1分音符)。上記に限らず、たとえば5連符と10連符の関係でも同様に、連符を倍に割ってもチックスの扱いは変わらない。
5・7・9・10・11連符については、5連8分音符(5つで2分音符分)が1分音符の1/10=192チックス、7連8分音符(7つで2分音符分)が1分音符の1/14=137.142857チックス、9連8分音符(9つで1分音符分)が1分音符の1/9=213.333333チックス、10連8分音符(10で1分音符分)が1分音符の1/10=192チックス(5連符と同じ)、11連8分音符(11で1分音符分)が1分音符の1/11=174.545455チックスだけわかれば何とかなるだろう。「連符は実際の音価より長い音符の中で一番近いものを借りて表記する」「m連n分音符について2^(n÷mを整数に切り捨てたもの)が合計の音価」などと捉えておくと便利かもしれない。
3連3連符は9連符のチックス数を半分にして考えればよく、たとえば、3連8分音符(合計で4分音符分の音価)をさらに3連にすると、子の3連符1つが3連4分音符分、全体で2分音符分、子の音符1つは9連8分音符の半分=1/18ということになる。
点音源から開放空間に出力される0db@1mの音波が、距離によってどのくらい減衰するか。
+12db@0.25m、+6db@0.5m、0db@1m、-6db@2m、-10db@3m、-12db@4m、-14db@5m、-18db@8m、-20db@10m、-26db@20m、-32db@40m、-40db@100m、-60db@1000m。
ただし、これはあくまで点音源かつ開放空間かつ環境雑音なしの場合。同じ条件で線音源だと減衰が(デシベル表記で)半分になり、面積無限大の面音源だと減衰なしになる(圧力が球状に逃げるのが点音源、円筒状にしか逃げないのが線音源、逃げ場がないのが面音源:波長に対して音源が十分大きくても、ものすごく遠距離から見ると点音源的に振る舞う)。また実際には、普通に考えられる規模の有限線音源でも、遠距離では空気による吸収が支配的になる(2.5mくらいのアレイの正面で16KHzだと30m過ぎくらいからのようだ)。
もっと正確で実用的な資料として、日本ビクターが公開しているPRO SOUND SOLUTION GUIDEというPDFの技術資料パートが詳細である(外部リンク)。またメートルオーダーでの計算例が岐阜県のウェブサイトにPDFファイルで公開されている(両方外部リンク)。
楽器やヴォーカルの最大音量は、生ドラム=120db@1m、グランドピアノ=アルトサックス=オペラ独唱=100db@1m、アコースティックギター(鉄弦)=オペラ以外の独唱=90db@1mくらい。いづれもとくに大きい音を出す楽器とプレイヤーを組み合わせた場合に「出そうと思えばこのくらい出る」という数値。アマチュアプレイヤーがここまでの音を出すのは多分難しい(ドラム除く)。たとえば暗騒音工法研究会が引用している環境省のデータ(外部リンク)だと、ピアノ正面1m付近で80dbないし80~90dbとなっている(80dbはバイエル104番を演奏したときの値らしい)。アコギも、ドレッドノートなどとくに大きなモデルに太い弦を張ってゴツいピックで思い切りストロークしないと90db@1mまでは出ないと思われる。
音波1周期は、31.25Hzで32ms[10.9m]、62.5Hzで16ms[5.44m]、125Hzで8ms[2.72m]、250Hzで4ms[1.36m]、500Hzで2ms[68cm]、1KHzで1ms[34cm]、2KHzで0.5ms(500μs)[17cm]、4KHzで0.25ms(250μs)[8.5cm]、8KHzで125μs[4.25cm]、16KHzで62.5μs[2.125cm]、の時間に相当する(角括弧内の数字は、音速を340m/sとした場合に音が1周期で進む距離)。
両耳の間隔を0.2m、両耳の中心点と点音源の距離を0.5m、2m、10mとした場合に、両耳の中心点と点音源を結んだ直線と、両耳を結ぶ直線のなす角によって、直接音の到達距離、到達時間、両耳の中心に届く(はずの)音波と比べた音量がどう変化するか(タブ区切りテキスト、csvフォーマット)。
0.5m | 2m | 10m | |||||||
条件 | 到達距離 | 到達時間 | 音量 | 到達距離 | 到達時間 | 音量 | 到達距離 | 到達時間 | 音量 |
90度両耳 | 0.501m | 1.47ms | -0.025db | 2.00m | 5.88ms | 0db | 10.0m | 29.4ms | 0db |
60度遠耳 | 0.557m | 1.64ms | -0.94db | 2.05m | 6.03ms | -0.22db | 10.05m | 29.6ms | -0.045db |
60度近耳 | 0.458m | 1.34ms | +0.76db | 1.95m | 5.74ms | +0.22db | 9.95m | 29.3ms | +0.045db |
60度差分 | 0.099m | 0.30ms | 1.70db | 0.10m | 0.29ms | 0.44db | 0.10m | 0.3ms | 0.09db |
45度遠耳 | 0.575m | 1.69ms | -1.22db | 2.07m | 6.09ms | -0.30db | 10.07m | 29.6ms | -0.06db |
45度近耳 | 0.435m | 1.28ms | +1.21db | 1.93m | 5.68ms | +0.31db | 9.93m | 29.2ms | +0.06db |
45度差分 | 0.14m | 0.41ms | 3.43db | 0.14m | 0.41ms | 0.61db | 0.14m | 0.4ms | 0.12db |
30度遠耳 | 0.589m | 1.73ms | -1.43db | 2.09m | 6.15ms | -0.38db | 10.09m | 29.7ms | -0.08db |
30度近耳 | 0.416m | 1.22ms | +1.60db | 1.91m | 5.62ms | +0.40db | 9.92m | 29.2ms | +0.07db |
30度差分 | 0.173m | 0.51ms | 3.03db | 0.18m | 0.53ms | 0.78db | 0.17m | 0.5ms | 0.15db |
すべての数字について、まず距離を有効桁数3桁(10mを超えるもののみ例外的に4桁)で求めてから、丸めた数字を元に時間と音量を計算している。顔の表面で回り込む音は、低音ほど大きく、高音ほど小さく聴こえるはずである(遠回りする分の距離の延長は無視している:耳から音源までの間を頭部が遮らない程度の角度であれば考慮しなくてよい)。また、極端な高音は正面で鳴るよりも横(耳の奥が見えるくらいの角度)で鳴った方が大きく聴こえるはずである。
人間の耳が位相差を「音色」として認識できるのは、完全な逆相(πの遅れ)の場合で1KHz以下くらいらしい。筆者1人を対象にした独自実験だが、2KHzのサイン波をヘッドフォンでステレオ再生しながら片方のチャンネルだけ位相反転を繰り返したところ、どちらが逆相の音かブラインドでの区別ができなかった(ただし、ハース効果で定位がずれるため「どちらから再生し始めたか」はわかる:ハース効果の知覚限界を仮に0.1msとすると、5KHzくらいまでは「逆相にした音の鳴り始めが耳に入ると定位感に影響が出る」ことになる)。
もう少しマトモな実験結果が見つかればかったのだが、1KHzの音波の位相がπ遅れるには0.5ms、2KHzだと0.25msくらいかかるため、上の表の値を考えても「まあ妥当」な数字ではないかと思う(追試をする人はステレオのヘッドフォン/イヤフォンを使わないと意味がないので注意)。
ちなみに、もっと低い周波数、たとえば200Hzくらいの低音が左右逆相で耳に入ると、何ともいえない不自然な感覚になる(自然界にはあり得ない現象なので当たり前)。また、普通に録音した音声を左右片方だけ位相反転させてヘッドフォンで再生すると、非常に奇妙な定位感になる(本来なら、たとえば0.5msの到達時間差で1KHzの音波にπ位相差が出た場合500Hzの音波はπ/2の遅れになるはずだが、これが全部揃ってπだけ遅れるのがキモチワルイのだと思う:もちろん低音に大きな位相差が出ていることも影響しているだろう)。
なお、ここで問題になるのは「左右の」位相「差」であって、群遅延のような現象とは関わりがないので注意して欲しい。
4分音符が480チックスの場合、8分で240、16分で120、32分で60、64分で30、128分で15、3連4分で320、3連8分で160、3連16分で80、3連32分で40、3連64分で20、3連128分で10。1チックは1920分音符で、256分は8チックス、512分は4チックスで代用する。4/4拍子だと、1拍目は0、2拍目は480、3拍目は960、4拍目は1440チックスから始まる。テンポ125で1チックス=1ms。
極端なレガートを避けるために音価を削る場合、音価の1/32~1/8くらいが無難。アクセント拍の前後移動(ずらし)は128分音符(=15チックス:ごく微妙な変化)~64分音符(=30チックス:明らかな変化)くらいを目安にする。16分刻みのハットを揺らすような場合は256分音符(=7.5チックス)くらいでもよさそう。
Timidity++とFluidを組み合わせた場合ベロシティ100の音とベロシティ50の音は音量が10db違い、SW synth だと12dbの差だった(グランドピアノのC4の音を使用)。Timidity++はデシベル基準で2倍=10db(ただしオプションで変更できる)という計算、SW synth は素の対数基準で音量2倍=音圧(2)^2倍という計算をしているのだろう。多分、ローランドのほかの音源もSW synth と同じ基準ではないかと思われる。最大音(ベロシティ127だが、端数が面倒なので128として扱う)を0dbとして計算すると:Timidity++の場合、64で-10db、32で-20db、16で-30db、8で-40db、4で-50db、2で-60db、1で-70dbになり;SW synth なら、64で-12db、32で-24db、16で-36db、8で-48db、4で-60db、2で-72db、1で-84dbになる。
以下に、48KHz/16bitのRIFF WAVEファイルをhex(16進)表記したものと、その解釈を示す(タブ区切りテキスト、csvフォーマット)。チャンク(Chunk)は英語で「塊」の意味で、イメージとしては入れ物のような感じ。以下の例では、RIFFという箱の中にfmt という箱とdataという箱が入っている様子を想像すればだいたい問題ない。ちゃんとした仕様はTSP Labというサイトに掲載されているのでそちらを参照(外部リンク)。なお、二進法はbinary(バイナリ)で接頭辞0b、八進法はoctal(オクタル)で接頭辞0o、十進法はdecimal(デシマル)で接頭辞0d、十六進法はhexadecimal(ヘックスorヘキサデシマル)で接頭辞0x、とするのが一般的(たとえば「0x2a05」は「16進数で2a05」を表す:六進法はsenaryであってhexではない)。
パート | 1 | 2 | 3 |
hex | 52494646 | 34000000 | 57415645 |
ASCII/decimal | RIFF | 52 | WAVE |
備考 | RIFFチャンクの開始 | RIFFチャンクのバイト数 | ファイルの種類を宣言 |
長さ(バイト) | 4 | 4 | 4 |
パート1とパート3は固定。パート2は4バイト=32ビットの値なので0~4294967295バイト=4GiBまでの値(必ず偶数にするのが決まりで、データが半端な場合は0で埋めるらしい)をとり、パート2以前のデータとパート2自身を含まない(以下同様)。つまり、パート2はパート3~20のバイト数を示している(反対にいえば、パート3~20がRIFFチャンクの中身である)。
4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
666D7420 | 10000000 | 0100 | 0200 | 80BB0000 | 00EE0200 | 0400 | 1000 |
fmt | 16 | 1 | 2 | 48000 | 192000 | 4 | 16 |
fmt チャンクの開始 | fmt チャンクのバイト数 | データ形式 | チャンネル数 | サンプルレート | ビットレート | クロックあたりバイト数 | ビット深度 |
4 | 4 | 2 | 2 | 4 | 4 | 2 | 2 |
パート4は固定。パート5が16の場合のみ、パート6~11が上記のようになる(この構造体をPCMWAVEFORMATという)。パート5はパート6~11のバイト数を示している(反対にいえば、パート6~11がfmt チャンクの中身である)。パート6は「1」だとリニアPCMを示し、MS ADPCMだと「2」、32bit(float)だと「3」、YAMAHA ADPCMだと「32」になる(いづれもdecimal値)。
12 | 13 | 14 | 15 | 16 | 16 | 17 | 18 | 19 | 20 |
64617461 | 10000000 | 0000 | 0000 | 0000 | FF7F | 0000 | 0080 | 0000 | 0000 |
data | 16 | 0 | 0 | 0 | 32767 | 0 | -32768 | 0 | 0 |
dataチャンクの開始 | dataチャンクのバイト数 | 1ch@1c | 2ch@1c | 1ch@2c | 2ch@2c | 1ch@3c | 2ch@3c | 1ch@4c | 2ch@4c |
4 | 4 | * | * | * | * | * | * | * | * |
*はビット深度(量子化ビット数)分のデータ長になる。「Nch@Mc」という表記は「Mクロック目におけるNチャンネルの音圧」という意味で、たとえば「2ch@3c」は「3クロック目における第2チャンネルの音圧」の意(リニアPCMなので、値「-32768」がそのまま音圧を示している)。パート13はパート14~20のバイト数を示している(反対にいえば、パート14~20がdataチャンクの中身である)。
上記のうちdataチャンク以外において、数値データはリトルエンディアン(下位の桁=小さい桁から順に書く表記法)の符号なし整数として扱われる。たとえば、パート8のリトルエンディアンhex「80 BB 00 00」をビッグエンディアン(上位の桁=大きい桁から順に書く表記法)hexに直すと「00 00 BB 80」で、これをさらにdecimal(10進)に直すと「48000」になる。普通の日本語で「にひゃく、さんじゅう、ろく」などと表現するのはビッグエンディアンで、逆順の「ろく、さんじゅう、にひゃく」にしたのがリトルエンディアン。
dataチャンクにおいて、数値データはリトルエンディアンの符号あり整数として扱われる(上記の例では2バイト符号あり整数で、WindowsではWORD、C言語ではsigned short intと呼ぶ:ただし、8bitPCMの場合のみ1バイト符号なし整数で扱うようだ)。binary(2進)での演算になるため多少面倒で、リトルエンディアンhexの「FF 7F」(つまりビッグエンディアンhexで「7FFF」=ビッグエンディアンbinaryで「01111111 11111111」)までは正の数、リトルエンディアンhexで「00 80」(つまりビッグエンディアンhexで「80 00」=ビッグエンディアンbinaryで「10000000 00000000」:最上位ビットが1になる)からは記録された値からビッグエンディアンbinaryで「1 00000000 00000000」(ビッグエンディアンhexで「01 00 00」=リトルエンディアンで「00 00 01」)を引いた値が負の数として用いられる(ペンティアム互換のCPUではこの方が計算が速いため、こういう処理になっている)。このためリトルエンディアンの符号あり整数では、「00 00」が0、「FF 7F」が最大値(decimalで「32767」)、「00 80」が最小値(decimalで「-32768」)となる。
上記から、ビット深度が8の倍数でないと非常に面倒なことになることがわかると思う(そのような処理に対応しているソフトはほとんどないはず)。また、44.1KHz>48KHz>32KHz>96KHz>192KHz>88.2KHzの順に対応ソフトが多いだろう。dataチャンクの前にfactチャンクというのを置いて、dataチャンクに含まれるサンプル数を明記する場合もあるようだが、たいていは省かれる。LISTチャンクを置いてコメントを書き込むこともできるらしい。ちなみに、RIFF WAVE形式の16bitリニアPCM(16bit符号あり整数で波形を記録)に「DCオフセットのない正弦波」を記録する場合、ダイナミックレンジは約90.31dbになる(単純に1bit=6.02dbと考えて16倍すると96.32dbだが、その条件だとDCオフセットのある波形しか作れない)。
32bit浮動小数点数(詳しくはその他のページを参照)での表現については、最小値がリトルエンディアンで「00 00 80 BF」、ビッグエンディアンに直すと「BF 80 00 00」、ビッグエンディアンからバイナリに直すと「1 01111111 00000000000000000000000」、さらにデシマルに直すと「-1」になる一方、最大値がリトルエンディアンで「00 00 80 3F」、ビッグエンディアンに直すと「3F 80 00 00」、ビッグエンディアンからバイナリに直すと「0 01111111 00000000000000000000000」、さらにデシマルに直すと「1」になっており、指数部の上位1ビットを余して記録してある(Audacity1.26の出力で確認)。ソフトウェアプロセッサで処理するときは、余った領域をヘッドルーム的に使う(プロセッサ内部では-1~1の範囲外のデータもそのまま扱う)のが普通。
すでに触れたように、RIFF、fmt 、data以外のチャンクを盛り込むことも可能で、たとえばacidized wavの場合、str2、bmrk、dtbt、acid、strc、LIST、ICRD、PAD などのチャンクが続いてからdataチャンクがくるものや、dataチャンクの後にacid、strc、bmrk、dtbtと続くもの、acidチャンクしか追加していないものなどがある(未確認だが、おそらく最初のが本家ACIDで書き出したもの)。非対応のチャンクは読み飛ばされるだけなので、普通のwavプレーヤーでもacidized wavは再生できる。
余談だが、歴史的には1985年にElectronicArtsとCommodore-Amigaが策定したIFF(Interchange File Format:ビッグエンディアンであること以外はRIFFと同じらしい)規格が大元で、1988年にAppleがAIFF(Audio Interchange File Format:ビッグエンディアン採用で、RIFF WAVEとはチャンクの宣言などもやや違うが、構造自体はRIFFとほぼ同一)を策定、1991年にMicrosoftとIBMがRIFF(Resource Interchange File Format)を策定、という流れになっている。RIFF WAVEの自由度を抑えて互換の確実性を向上させ、ラベルやCUE情報や添付ファイルの埋め込みを可能にしたBWF(Broadcast Wave Format:European Broadcasting Unionが策定)や、その日本バージョンであるBWF-Jなどもある。
代表的な実装にAES/EBU(IEC 60958-3:Audio Engineering SocietyとEuropean Broadcasting Unionの略)とS/PDIF(IEC 60958-4:Sony/Philips Digital Interconnect FormatまたはSony Philips Digital Interfaceの略らしい)がある。トライテックという会社の解説が詳しい(外部リンク)。AESは1985に策定されて1992年と2003年に改定されている。
下位層のおもな規格(IEC 60958 Type IIなど)は、
S/PDIF(コアキシャル) | AES3(アンバランス) | AES3(バランス) | |
ケーブル | コアキシャル(同軸) | コアキシャル(同軸) | シールデッドツイストペア |
特性インピーダンス | 75Ω | 75Ω | 110Ω |
最大電圧(未確認) | 0.5Vくらい | 1Vくらい | 5Vくらい |
上位層にはChannel Status Wordというヘッダのようなものがある。バーストエラーに備えてか、サブフレーム(32bit)につき1bitづつ送信する(Channel Status Wordは24byte=192bitで構成されるので、後述するように192フレームを1ブロックとして、ひとまとめにする:フレームをチャンネルごとに分けたのがサブフレームで、時系列の区切りとしてはどちらも同じ長さ、Channel Status Wordは名前どおりチャンネルごとに独立)。AES/EBUの場合、
byte0 | 0o0 | 0o1 | 0o2 | 0o3 | 0o4 | 0o5 | 0o6 | 0o7 |
役割 | フォーマット | データ | プリエンファシス | 外部同期 | サンプルレート | |||
0のとき | Consumer(S/PDIF) | PCM | 0b100でオフ | ロック | 48KHz(デフォルト)、44.1KHz、32KHz、その他を選択する模様(未確認) | |||
1のとき | Professional(AES3) | PCM以外 | アンロック |
byte1 | 0o0 | 0o1 | 0o2 | 0o3 | 0o4 | 0o5 | 0o6 | 0o7 |
役割 | チャンネル情報 | チャンネル情報を示すユーザーデータ(未確認) | ||||||
内容 | モノラル2本、ステレオ1本、差分ステレオなど | 不明 |
byte2 | 0o0 | 0o1 | 0o2 | 0o3 | 0o4 | 0o5 | 0o6 | 0o7 |
役割 | AUX BIT(time slots 4~7)の使い方 | サンプルサイズ | 未使用 | |||||
内容 | 0b000で指定なし、0b001で4bit全部オーディオデータに使う | 音声用に使わないビットを指定するようだ(未確認) | 未使用 |
byte3 | 0o0 | 0o1 | 0o2 | 0o3 | 0o4 | 0o5 | 0o6 | 0o7 |
役割 | マルチチャンネル用のデータ |
byte4 | 0o0 | 0o1 | 0o2 | 0o3 | 0o4 | 0o5 | 0o6 | 0o7 |
役割 | サンプルレート情報 | 予約 | サンプルレート | サンプルレート補正 | ||||
内容 | AES11互換用らしい(未確認) | 予約 | サンプルレートが「その他」だった場合に使う模様(未確認) | NTSC互換用にサンプルレートを1.001で割るフラグ |
byte5 | 0o0 | 0o1 | 0o2 | 0o3 | 0o4 | 0o5 | 0o6 | 0o7 |
役割 | 予約 |
byte6~9 | byte10~13 | byte14~17 | byte18~21 | byte22 | byte23 | |
役割 | ベンダ名などを示すASCII文字 | チャンネル制御用のASCII文字 | 1フレームで1つ進むカウンタ | 時刻情報 | 信頼性情報 | CRC |
S/PDIFの場合かなり内容が異なり、
byte0 | 0o0 | 0o1 | 0o2 | 0o3 | 0o4 | 0o5 | 0o6 | 0o7 |
役割 | フォーマット | データ | コピー | チャンネル数 | 未使用 | プリエンファシス | モード | |
0のとき | Consumer(S/PDIF) | PCM | 禁止 | 2 | 未使用 | なし | 常に0らしい(未確認) | |
1のとき | Professional(AES3) | 圧縮データ | 許可 | 4 | あり |
byte1 | 0o0 | 0o1 | 0o2 | 0o3 | 0o4 | 0o5 | 0o6 | 0o7 |
役割 | チャンネル情報 | コピーフラグ | ||||||
内容 | 媒体情報(CDとかDVDとか) | 媒体によって扱いが違うらしい(未確認) |
話が前後するが、データはサブフレームが最小のまとまりで、サブフレーム内の各bitをタイムスロットという。サブフレームは、同期(というかセパレータ)(0-3)、AUX(4-7)、データ(8-27)、バリディティ(28)、ユーザー(29)、チャンネルステータス(30)、パリティ(31)になっている。各チャンネルのサブフレーム(ステレオなら2つ)をまとめてフレームを作り、192フレームを1ブロックにして送信する(パリティビットがチェックサムで、バリディティビットは送信元機器からの「このブロックのデータ多分どっか間違ってる」というメッセージ)。
32bitで1サブフレーム、ステレオなら2サブフレームで1フレーム、192フレームで1オーディオブロックになり、1ブロックごとに24byteのチャンネルステータスを持つことになる。1フレームに各チャンネルの1サンプル分のオーディオデータが入っているから、48KHzサンプリングだと1ブロック=192フレーム=192サンプル=1/250秒=4msになる(ステレオだと1ブロック=1536byteだから、通信速度は384kbyte/s=3072kbps)。
音圧は、100db(コンサートホールでオーケストラを聴くときや、特に大きな音を出せる奏者のテナーサックスを1mの距離で聴いた場合の最大音量くらい)で連続2時間、115db(いわゆる「爆音」のロックコンサートくらい)だと連続15分で耳を痛める危険があり、130dbくらいで鼓膜に急性外傷が生じる。1KHzのサイン波だと最小可聴音は0dbだが、3KHz周辺だと-5dbくらいまで知覚できる。31.5Hzだと60dbくらいまで知覚できない。声量は、プロのオペラ歌手で100db@1mくらいが限界。多人数の声としては、2011年にトルコ・テレコム・アリーナというサッカー場で5万人ちょっとが絶叫した際の131.76dbというギネス記録がある(測定方法などは確認していない)。音楽の音量としては、ディープパープルが屋内で記録した117db(1973年のギネスブックに掲載)という記録があり、1976年にザ・フーが屋外で120dbを出して記録を更新、その後どんどんエスカレートしてマノウォーが139dbを記録するに至るが、あまりに危険な試みなので2008年にギネス・ワールド・レコーズが記録掲載をやめてしまった。
ちなみに、長距離音響装置LRAD(メーカーや運用者の言い分では兵器ではない)の最上位機種1000Xは30度の範囲で1km先に125dbを放射(想定時間は数秒)、スタングレネード(相手を確実に無力化できて、できれば死なないように作ってある兵器)の音が160~180db(おそらくピーク値)。窓ガラスのような硬くて脆くて平らなものが140dbくらいから壊れ始め、空気で音を伝える場合の限界は190db(理論値)くらいらしい。音響ではなく爆風の場合、適切に治療しても死人が出始めるのが190dbくらい(瞬間的な曝露で鼓膜が破裂するのもこのくらいから)、丈夫な建造物が壊れるのが210dbちょっと、確実に死亡するのが220dbくらいになる(いずれも20μPa=0dbSPLとしたときの換算値)。
ハース効果は数十μs~100μsくらいから、ほぼ同時に発音される2つの音(Fluidのスネアドラムとピックベースの音色でテスト)の時間的なずれは8msくらいから知覚できるようだ(筆者1人だけをサンプルとした実測:いづれも擬似ブラインドテストでまったく厳密でない)。ただし後者は時間的な遅れとして知覚するのではなく、音色の変化(2音が重なった音色としてのアタック感が変わる)としての知覚である。リズムの変化としては15msくらい差がないと知覚できず、筆者が試したところ、10ms以内のリズムの変化は全然判別できなかった(Fluidのドラムを使用して、表拍バスドラ裏拍スネアの裏拍をモタらせたファイルとモタらせないファイルでテスト:ただし、刻みハイハットなどであれば、10msくらいの変化でもノリの違いは知覚できる)。
可聴周波数域は下が20Hz程度まで、上が16000~20000Hzくらいまでだが、音程として捉えられるのはピアノの最低音A0(約27.5Hz)~最高音C8(約4186Hz)くらいまでらしい。ただし、20Hz以下の低周波でも、振幅が大きければ皮膚に伝わる振動や圧迫としては知覚できる。THDは0.3%くらいから知覚できる人がいるらしい。
志賀@高槻さんのオーディオの科学という記事に非直線歪みに関するデータが引用されているほか、BBSのログに位相歪みに関する基礎情報に触れたものもある(外部リンク)。
楽器の最低音は、一般的なグランドピアノが27.5Hz(一番下まで使う曲は非常にまれ)、コントラバスやエレキベースで41.2Hz(こちらは下まで使うこともけっこうある)、Low-B弦を足した5弦以上のエレキベース/コントラバスで30.87Hz、C装置つきの特殊なコントラバスで32.7Hz、ギターやバスヴォーカルで82.4Hz、チャーチオルガンで16Hz程度。音程根音の原理でもっと低い音を擬似的に作り出すことは可能だし、打楽器のアタックの瞬間などは楽器の音程と一致しない音も豊富に出る(が、実用上はどちらもあまり気にする必要がない)。
最高音は、ピッコロや一般的なグランドピアノや4オクターブ(49鍵)のチェレスタが4186Hz、ギターの1弦24フレで1320Hz、ソプラノヴォーカルで880Hz、チャーチオルガンで12.5KHz、5オクターブ(61鍵)または5オクターブ半(66鍵)のチェレスタで5.59KHzくらい(ハーモニクスやフラジオレットは無視:吹奏楽器は奏者の技量と根性次第でけっこうムリがきくものもある)。倍音があるのでこれ以上高い音が出ないというわけではない。
コンパクトカセットの音域は下が20~30Hz、上が15000~18000Hzくらい(9.6cm/s動作時)。PCMはサンプリング周波数の半分(ナイキスト周波数)まで記録できるが、アナログからの録音時にハイパスフィルタが必要なため、実際にはナイキスト周波数の9割ちょっとしか録音できない(デジタルシンセなどで直接データを生成するなら別)。44.1KHz(CD)だと20KHz、48KHz(パソコンの多くや一部のDAT)だと22KHzくらいまで。16bitリニアPCMのダイナミックレンジは98.08db、24bitだと146.24dbになる。可逆圧縮を行うと高域の情報が失われる(たとえばlameのバージョン3.96.1を使うと、192kbps時で19.5KHzくらいから上が切れる)。
アクティブピックアップの最大出力は、EMGのギター用で0.85~3Vくらい(1.75Vが中心)、ベース用だと4.5Vくらい。これが開放端電圧だとすると、1~15.5dbuくらいになる(あくまでピックアップが出力可能な最大値で、普通のセッティングで常にこの出力がなされるわけではない)。パッシブだとスパイク的なピークの上限は(アンプに制限されないため理屈上)上がるが、一般にはアクティブより出力が低い。なお、ミキサーなどのライン入力もハイヘッドルームと称するもので18dbuくらい、例外的な機種でも30dbuくらいまで。
USB1.1のFull Speedモードが12Mbps=1.5Mbyte/s、USB2.0のHigh Speedモードは480Mbps=60Mbyte/sだが、これはあくまでビットレート。ローレベルなレイヤーでは、125μsのマイクロフレーム(1秒に8000マイクロフレーム)にいくつのトランザクション(512バイトのデータを搭載する)を乗せられるかという問題で、9なら約300Mbps、10なら約330Mbps、11なら約360Mbpsになる(USB 2.0 specification section 5.5.4で20%の予約が規定されており、マイクロフレームの最大ビットレートの80%がMaximum Periodic bandwidthだとすると6000byte/マイクロフレーム、アイソクロナス転送のデータパケットは500byteを超えているから、12本乗せるのはムリ)。またHigh Speedモードでも、Audio Class 1.0の仕様に従う限り、最大帯域が12Mbpsに限定される(まったく未確認だが、もしマイクロフレームを飛ばさずに送信しているなら、転送量は1500bit/マイクロフレームで、データパケットのDataストリーム(規格上は0~1023byte)が188byteくらいになる)。バルク転送の場合、チューニングした外付けハードディスクで250~300Mbps程度らしい。
44.1KHz/16bit/2ch(CD音質)のリニアPCMが1411.2kbps(モノラルで705.6kbps)なので、USB2.0のHigh SpeedモードAudio Class 1.0の帯域を使い切れば、合計17chまで無圧縮で同時通信できる(たとえば、デジタル入出力各1系統ステレオ+アナログ入力1系統ステレオ+アナログ出力5.1chで12本)。48KHz/24bit/2ch/全二重の通信だと4.6Mbpsくらい、前述の通り48KHz/24bit/2chのAES or S/PDIFがオーバーヘッドなしで片道3Mbpsくらい。帯域制限を回避するためにBulk転送を使っている機種もあるが、Audio Class 1.0の用件を満たせないので、独自ドライバが必要になるのが普通(裏技で動かしているメーカーもある模様)。2009年5月にAudio Class 2.0が公開され、利用可能な帯域が増えた(2010年現在、一部の機器しか対応していない、というか、Windows7でのサポートが遅れているらしい:Macはさっさと対応したそうな)。
USBの仕様(リアルタイム通信はエラー垂れ流し)を考えるとエラー訂正信号の付加が必要そうだが、筆者が「Universal Serial Bus Device Class Definition for Audio Devices」と「Universal Serial Bus Device Class Definition for Audio Data Formats」を流し読みした限り、生データ(PCM、MPEGとAC-3、その他に分類されている)をそのまま送っているような雰囲気である(ちゃんと確認したわけではない)。下位レイヤーであるUSBケーブルでの通信自体、エラー率が十分低いのだという解説もあったが、具体的な実験結果などは見つからなかった(ちなみにS/PDIFもエラー訂正なし:訂正が入ると応答時間が犠牲になるのでやむを得ない部分もある)。
ビットレートで見ると、IEEE 1394(FireWire)も400Mbpsまで出せる(上位互換の拡張規格で3200kbpsまでのものもある)し、素のSCSIでも規格上は40Mbpsまで、Wide Ultra2では640Mbpsまで出る。32bit/33MHzの初代PCI(PC133)で1056Mbps、64bit/66MHzの最終規格で4224Mbpsまで、PCIeはギガ単位になるので、オーディオ用途では帯域を心配するだけ無駄である(それよりもリアルタイム転送の仕様が問題)。Ethernet用の1000BASE-Tは名前のとおり1000Mbps。
エンド・ツー・エンドのレイテンシは、PCIやInfiniBandなどで数msくらいのオーダーらしい(未確認)。
音波の伝達速度は非常に遅い。1気圧の乾燥空気では摂氏温度をtとして331.5+0.61t、正確には、比熱比をk、気体定数をR、絶対温度をTとして√kRTで表し、20℃において343.26m/s(音響インピーダンスは413.3N*s/m^3)。340m/s(1気圧20℃の場合に近い値)で近似することが多い。水蒸気を含む空気の場合、気圧をH、水蒸気圧をp、水蒸気の定圧比熱と定積比熱との比をγw、乾燥空気の定圧比熱と定積比熱との比をγとして√1-(p/H)(rw/r-0.622)分の1になる。
真空中の光速度は299792458m/sだが、媒質により伝達が遅くなる。導線の中の電気信号や光ファイバーの中の光信号は、だいたい200000000m/s(=2*10^8m/s)くらい、大気中を伝わる電磁波は3*10^8m/sくらいのオーダー(波長によるが、可視光で真空中よりも3%くらい遅い)。電気機器内部での伝達ならナノ秒前後のオーダーだろう(2*10^8m/sだと、200mで1μs、20cmで1ns、0.2mmで1ps:音波が伝達するときに「マッハの風」が吹いているわけではないのと同様、電子がこの速度で「移動」しているわけではない)。電磁波は300MHz弱(超短波=VHFと極超短波=UHFの境目くらい、どちらかといえばVHF寄り)で波長が1mになる。
銅線の表皮深さは1KHzで約2mm、周波数の1/2乗に反比例するから、20KHzで0.45mmくらいになる。
オーディオ機器のインピーダンスは600Ωのものが多い(昔の電話機に合わせて統一したらしい)。600Ω以外では、ラインの入力インピーダンスで10~25KΩ、マイクの入力インピーダンスで1~10KΩ、エレキギター直結用の入力インピーダンスで1MΩ前後、スピーカの入力インピーダンスで数Ω、ラインの出力インピーダンスで1KΩ前後、マイクの出力インピーダンスで100~1000Ω(ものにより数KΩ)、パワーアンプの出力インピーダンスで10Ω前後、ヘッドフォン用の出力インピーダンスで数十Ω(ハイインピーダンス対応品は1KΩ前後)、ギター/ベース用のマグネティックピックアップ(パッシブタイプ)の直流抵抗で5~30KΩ、数千円~1万円クラスのシールド線(バランス)で10~数十Ω/km@20℃(ちなみに静電容量は数十~100PF/m@1KHz)、Dsub25を使ったバランス伝送で110Ω、といったものが多い。
パラレル通信なら送受信装置をシンプルにできるが、同期や漏話の問題が厳しくなる(とくにクロックが高くなった場合)。パルスを使ったシリアル通信では時分割多重化(Time-division multiplexing/TDM:各チャンネルのデータストリームをフレームに区切って順に送り、またチャンネルごとに仕分けする)などの方法でシリアル区間を通している。
16bit*2ch*6sample = 192bitの実データに対して588bitのフレームを用意している(詳細についてはSpecification of Compact Disc(外部リンク)というページの説明を参照:192bit記録可能なフレームが98集まって、2352byte記録可能な1セクタを成す)。上記リンク先によると、CDが想定する平均エラーレートは10^-5で、上記の冗長性により(CIRCによる訂正だけで)10^-9程度には収まるらしい。CD-ROMではさらにエラー訂正情報(以外のものも含まれているが)を増やして、2352byteのセクタに対して実データを2048byteとしている(その場合に想定される読み取りエラーは「650MBのCD−ROM183枚に対して1ビットのエラー率」らしい)。
以下未確認情報。
電話の仕様はITU(International Telecommunication Union:国際電気通信連合)という組織のITU-T(International Telecommunication Union Telecommunication Standardization Sector:旧CCITT、Comite Consultatif International Telegraphique et Telephonique)という部門が出している勧告に従ったものが多いそうな。アナログ電話の音声は0.3~3.4KHz、ISDNは同等の帯域を8KHz/8bit=64kbpsのデジタルデータで送る。
AMラジオの占有周波数帯域幅は15kHzで音声は7.5kHzが上限だが、チャンネルセパレートが9kHzでクロストークがあるため3~5KHzで切るらしい。FMラジオとアナログテレビの音声(同方式)は15KHzが上限。アナログハイビション(BS-hiなどで採用されていたMUSE方式)は、Aモードが32KHz/12bit/4chで、Bモードが48kHz/16bit/2ch。
コンパクトカセット(アナログのカセットテープ)は、ポジションにもよるが、下が20~30Hz、上が15000~17000Hzくらい。オランダのフィリップス社が開発した。オープンリールの最低速の半分である4.75cm/s(1.875″/s)で走る。4トラックを往復で2トラックづつ、ステレオで使う。
コンパクトディスク(CD)は16bit44.1KHzのPCM方式で、最高音は22050Hzまで出る。ソニーとフィリップスの共同開発。99トラックまで、最大74分(非標準的なものでは最大94分)まで録音可能。
DAT(Digital Audio Tape)は、12bit32kHz(LPモード)/16bit32kHz/16bit44.1kHz/16bit48kHzのPCM方式で、最高音はそれぞれサンプリング周波数の半分。
なお、アナログテレビの規格であるNTSC(アメリカや日本などが採用)はちょっと面倒な事情を抱えており、カラー化の際に音声を4.5MHz帯で送る都合から映像はその整数分の1で送る必要に迫られ、水平同期は4.5/286MHz≒15.7343KHz、垂直同期は4.5/(286*525)MHz≒29.9700Hzをインターレースで使って59.9401Hzになった(286は白黒の同期周波数に近いものを探して、525は走査線数から決まった)。286 * 525=150150=150 * 1001なので、4.5/(286*525)=4.5 / (150 * 1001)=30000 / 1001=30 / 1.001と「割る1001」や「割る1.001」で表現される(実用上は59.94フレーム/秒としたり、60fr/sから0.1%割り引いたりすることが多い:60fr/sを1001で割ればちょうど正確な値になる)。ISDB(日本で採用)系の規格では、いまだにこの端数を引き摺っている。
サンプルレート44100Hzのとき、nサンプル周期の音波の周波数がいくつになるか。
2 / 22050Hz | 11 / 4009.1Hz | 20 / 2205Hz | 29 / 1520.7Hz |
3 / 14700Hz | 12 / 3675Hz | 21 / 2100Hz | 30 / 1470Hz |
4 / 11025Hz | 13 / 3392.3Hz | 22 / 2004.5Hz | 31 / 1422.6Hz |
5 / 8820Hz | 14 / 3150Hz | 23 / 1917.4Hz | 32 / 1378.1Hz |
6 / 7350Hz | 15 / 2940Hz | 24 / 1837.5Hz | 33 / 1336.4Hz |
7 / 6300Hz | 16 / 2756.3Hz | 25 / 1764Hz | 34 / 1297.1Hz |
8 / 5512.5Hz | 17 / 2594.1Hz | 26 / 1696.2Hz | 35 / 1260Hz |
9 / 4900Hz | 18 / 2450Hz | 27 / 1633.3Hz | 36 / 1225Hz |
10 / 4410Hz | 19 / 2321.1Hz | 28 / 1575Hz | 37 / 1191.9Hz |
サンプルレート48000Hzの場合。
2 / 24000Hz | 11 / 4363.6Hz | 20 / 2400Hz | 29 / 1655.2Hz |
3 / 16000Hz | 12 / 4000Hz | 21 / 2285.7Hz | 30 / 1600Hz |
4 / 12000Hz | 13 / 3692.3Hz | 22 / 2181.8Hz | 31 / 1548.4Hz |
5 / 9600Hz | 14 / 3428.6Hz | 23 / 2087.0Hz | 32 / 1500Hz |
6 / 8000Hz | 15 / 3200Hz | 24 / 2000Hz | 33 / 1454.5Hz |
7 / 6857.1Hz | 16 / 3000Hz | 25 / 1920Hz | 34 / 1411.8Hz |
8 / 6000Hz | 17 / 2823.5Hz | 26 / 1846.2Hz | 35 / 1371.4Hz |
9 / 5333.3Hz | 18 / 2666.7Hz | 27 / 1777.8Hz | 36 / 1333.3Hz |
10 / 4800Hz | 19 / 2526.3Hz | 28 / 1714.3Hz | 37 / 1297.3Hz |
式は代入の回数が減るように変形した。以下に半値幅とあるのは半値全幅のこと。
周波数a(Hz)と周波数b(Hz)の音程の違い(cent):
(log(a / b) / log(2)) * 1200 =
周波数a(Hz)の音とb(cent)音程が違う音の周波数(Hz):
a * (2^(b / 1200)) =
1200の部分は、bの単位がhalfstepなら12、octarveなら1にする。
相対速度a(m/s)におけるドップラー効果(周波数比):
(340 + a) / 340 =
相対速度a(m/s)におけるドップラー効果(cent):
(log((340 + a) / 340) / log(2)) * 1200 =
a(cent)のドップラー効果を生む相対速度:
(340 * (2^(a / 1200))) - 340 =
相対速度は、音源と観察者の直線距離が減少する方向が正。秒速1m(時速3.6km)で約5cent、秒速10m(時速36km)で約50cent(半音)の変化。音速=340(m/s)での計算。
テンポがa(BPM)(1分間に4分音符a回)のときb分音符の長さ(秒):
240 / (a * b) =
4分音符の場合は:
60 / a =
4分の4拍子なら、全音符(b=1)の長さを求めれば1小節の長さがわかる。
テンポa(BPM)で分解能b(チックス/小節)のとき、c(秒)の音価(チックス):
(a * b * c) / 240 =
テンポa(BPM)の1拍とテンポb(BPM)の1拍を合成してできる2拍の平均テンポ(BPM):
2 / ((1 / a) + (1 / b)) =
テンポa(BPM)の1拍とテンポb(BPM)の1拍を合成してできる2拍の合計音価がc(チックス)のとき、各拍の音価(チックス):
c * (b / (a + b)) =
c * (a / (b + a)) =
上の式が先の拍で下の式が後の拍だが、片方わかれば単純な引き算でも求められる。
テンポがa(BPM)でb:cのスイングをするときの分割されたテンポ:
a * ((b + c) / (2 * b)) =
a * ((b + c) / (2 * c)) =
上の式で導いたテンポと下の式で導いたテンポを同じチックス間隔(たとえば8分音符分)で繰り返すと、タイムがb:cに分割される。同じ演算を入れ子にすることもできる。
テンポがa(BPM)のときb分音符連打の周波数(Hz):
(a * b) / 240 =
テンポがa(BPM)のときb(Hz)の音価:
240 * (b / a) =
テンポ90のとき6Hzは240 * (6 / 90) = 16分音符の連打に相当。
周波数a(Hz)の音と音程がb(cent)違う音がなす音程根音(第一次差音)の周波数(Hz):
((a - (a * (2^((b) / 1200))))^2)^(1 / 2) =
bはプラスでもマイナスでもよい。やはり、1200の部分はbの単位がhalfstepなら12にする。音程根音が可聴周波数域を下回っている場合、擬似下方倍音としてではなく音量のうねり(トレモロのような効果)として知覚される(これをうなり(beat)と呼ぶ)。
周波数a(Hz)の音に対して音程根音(第一次差音)の周波数がb(Hz)となるようなaより高い音の、aから見た音程差(cent):
((log ((a + b) / a)) / log(2)) * 1200 =
周波数a(Hz)の音に対して音程根音(第一次差音)の周波数がb(Hz)となるようなaより低い音の、aから見た音程差(cent):
((log ((a - b) / a)) / log(2)) * 1200 =
ある強さの信号と、a(db)大きさが異なる信号を加算したときの大きさの変化(db)(ホワイトノイズや同周波数同位相の正弦波などを重ね合わせる場合:音波でも電気信号でも同様):
log(1 + 10^(a / 20)) * 20 =
ある強さの信号に大きさが異なる信号を加算した結果、a(db)音が大きくなっていた場合、元の信号を基準にした加算した信号の大きさ(db)(上と同じ条件):
log(10^(a / 20) -1) * 20 =
元の周波数のa倍とa分の1倍で半値になるのときのQ:
a / (a^2 - 1) =
元の周波数のa(オクターブ)上下で半値になる(半値幅2a)のときのQ:
(2^a) / ((2^a)^2 - 1) =
半値幅がaオクターブのときのQ:
(2^(a / 2)) / ((2^(a / 2))^2 - 1) =
Qがaのときの半値幅(オクターブ):
(log(((1 / a + ((1 / a^2 + 4)^(1/2))) / 2)^2) / log(2)) =
半値幅をオクターブで求めて半分にする(または上の式から最後の「^2」を削除する)と元の周波数から何オクターブ上下で半値になるかわかる。よく使うのは
Q | 半値幅(oct) | 備考 |
0.577 | 2.26 | ベッセル |
0.667 | 2 | 上下1oct(2/3) |
0.707 | 1.90 | バタワース(1/√2) |
0.920 | 1.5 | |
1 | 1.388 | 黄金比 |
1.414 | 1 | (√2) |
1.5 | 0.945 | |
2 | 0.714 | |
2.145 | 0.667 | 2/3oct |
2.871 | 0.5 | 1/2oct |
4.318 | 0.333 | 1/3oct |