データ

周波数と音程 / 調とコード / ベース / 距離と時間に関する数値と計算
/ MIDI / RIFF WAVE / IEC 60958 / 限界いろいろ / その他 // もどる

他のページで利用したデータを再掲するとともに、それ以外で有用と思われるデータを新規に作成した。便宜のためタブ区切りテキストとcsvフォーマットのファイルを用意したものもある。

このページ(http://yppts.adam.ne.jp/music/data.html)の2次利用について筆者は、ライセンスのページにある「出典の明示」を求めない。


周波数と音程

倍音

C4を鳴らした場合の倍音(タブ区切りテキストcsvフォーマット)。

倍音音程最初のCから見た距離純正律の場合
1倍音C4完全1度
2倍音C51オクターブ上の完全1度(完全8度)完全1度
3倍音G51オクターブ上の完全5度完全5度
4倍音C62オクターブ上の完全1度完全1度
5倍音E62オクターブ上の長3度長3度
6倍音G62オクターブ上の完全5度完全5度
7倍音--2オクターブ上のAとBbの間、Bb寄り短7度(よりもやや低い)
8倍音C73オクターブ上の完全1度完全1度
9倍音D73オクターブ上の長2度(よりもやや高い)長2度
10倍音E73オクターブ上の長3度(よりもやや低い)長3度
11倍音--3オクターブ上のFとGbの間、ややGb寄り減5度(よりもやや低い)
12倍音G73オクターブ上の完全5度完全5度
13倍音--3オクターブ上のG#とAの間、A寄り長6度(よりもやや低い)
14倍音--3オクターブ上のAとBbの間、Bb寄り短7度(よりも低い)
15倍音B73オクターブ上の長7度(よりやや低い)長7度
16倍音C84オクターブ上の完全1度

17倍音以上は音量も小さく減衰も早いのであまり問題にならないだろう。


度と周波数

Cから半音づつ上行した場合の周波数の変化(タブ区切りテキストcsvフォーマット)。有効桁数9桁で求めたうえで7桁目まで丸めてある。括弧内は純正律での数字(減5度は説が一定していないので仮にルート2としておく)で、コロンの後ろは平均律との差(セント単位で小数点以下3位に丸めた)。

周波数英略名和名音名距離root音との関係
1(1)p1完全1度C0ユニゾンという
1.059463(16/15:+11.731)m2短2度Db1長7度下行と同義
1.122462(9/8:+3.910)M2長2度D2
1.189207(6/5:+15.641)m3短3度Eb3長6度下行と同義
1.259921(5/4:-13.686)M3長3度E4
1.334840(4/3:-1.955)p4完全4度F5完全5度下行と同義
1.414214d5減5度Gb6三全音(トライトーン)という
1.498307(3/2:+1.955)p5完全5度G7完全4度下行と同義
1.587401(8/5:+13.686)a5増5度G#8長3度下行と同義
1.681793(5/3:-15.641)M6長6度A9
1.781797(16/9:-3.910)m7短7度Bb10長2度下行と同義
1.887749(15/8:-11.732)M7長7度B11
2(2)p8完全8度C12オクターブという

平均律の場合、減5度(G♭)は増4度(F#)、増5度(G#)は短6度(A♭)、短2度(D♭)は増1度(C#)と異名同音。


平均律

上記の表からA4=440Hzとして平均律の周波数を求めたもの(タブ区切りテキストcsvフォーマット)。まず440に表の数字を掛け算/割り算してC4〜B4までの周波数を求め、それを2のべき乗で掛け算/割り算して、最後に有効桁数4桁に丸めてある(ので、ある音の周波数を2倍したものと、1オクターブ上の音の周波数が食い違う場合がある)。B8から下はHz、C9から上はKHzが単位。

012345678910
C16.3532.7065.41130.8261.6523.31047209341868.37216.74
C#17.3234.6569.30138.6277.2554.41109221744358.87017.74
D18.3536.7173.42146.8293.7587.31175234946999.39718.79
D#19.4538.8977.78155.6311.1622.31245248949789.95619.91
E20.6041.2082.41164.8329.6659.313192637527410.5521.10
F21.8343.6587.31174.6349.2698.513972794558811.1822.35
F#23.1246.2592.50185.0367.0740.014802960592011.8423.68
G24.5049.0098.00196.0392.0784.015683136627212.5425.09
G#25.9651.91103.8207.7415.3830.616613322664513.2926.58
A27.5055.00110.0220.0440.0880.017603520704014.0828.16
A#29.1458.27116.5233.1466.2932.318653729745914.9229.83
B30.8761.74123.5246.9493.9987.819763951790215.8031.61

参考までに、四捨五入前のデータも公開しておく(タブ区切りテキストcsvフォーマット)。ちなみに1セントは周波数にして1.00057779倍、440HzのA4と442HzのA4の差は7.85セントである。


オクターブの表記

440Hz前後のAをA4、そのすぐ下のCをC4(261.6Hz前後)、A4のすぐ上のBをB4(493.9Hz前後)として、BからCに音程が上がる際にオクターブを示す数字を変える(B3の半音上はC4、B4の半音上はC5)「国際式」を基準に説明する。一般的な88鍵のピアノでは、最低音がA0、最高音がC8、中央のドがC4に相当する。

ドイツ式では、C3〜B3をc〜hとして1オクターブ上がるごとに右上に数字を付け、C2〜B2をC〜Hとして1オクターブ下がるごとに右下に数字を付ける(hとHは国際式でいうBの音)。日本式もこれと同様で、C3〜B3をハ〜ロとして、1オクターブ上がるごとに点を付け、C2〜B2をは〜ろとして1オクターブ下がるごとに下点を付ける(ハニホヘトイロが国際式のCDEFGABに相当)。

俗用ではあるが、440HzのA4をhi-Aと称し、A4〜G#5をhi、A3〜G#4をmid2、A2〜G#3をmid1、A1〜G#2をlowとする(hiより上はhihiなど1オクターブ上がるごとにhiを増やし、lowより下はlowlowなど1オクターブ下がるごとにlowを増やす)表記もある。C〜BでなくA〜G#の区切り(多分、ブルース用の10穴ハーモニカのキー表示を流用したのだと思う:ブルースの場合key=Aが基準になることが多い)となっており、しかも単に「hi-A」などというと「その楽器が一般的に使用するAのうち高い方」という意味もある(たとえばエレキベースで「hi-C弦」というと「開放でC3の音が出る弦」のこと、「low-B弦」というと「開放でB1の音が出る弦」のことを指す)ため、やや紛らわしい。

MIDIのnote numberは、0がC-1なのが一般的で、そこから12ごとに、12がC0、24がC1、36がC2・・・120がC9、127がG9に相当する(鍵盤からシンセベースを操作するときなどは、適宜オクターブシフトさせる)。周波数で言うとC-1≒8.175Hz、G9≒12.54KHzで、C-1の1〜2倍音は音波ではなく低周波になる。


調とコード

調号

同主は同主調、属平は属調平行調、下属平は下属調平行調、同平は同主調平行調、ハイフンは遠隔調を表す。GbとF#、EbmとD#mを別の調として扱っているが、平均律では一致する(つまりこの表はループできる)。

音程の距離d5m2m6m3m7p4p1p5M2M6M3M7a5
b/#の数b6b5b4b3b2b10#1#2#3#4#5#6
調の名前Gb
Ebm
Db
Bbm
Ab
Fm
Eb
Cm
Bb
Gm
F
Dm
C
Am
G
Em
D
Bm
A
F#m
E
C#m
B
G#m
F#
D#m
Cから見た関係-
-
-
-
-
-
同平
同主
-
-
下属調
下属平
主調
平行
属調
属平
-
-
-
-
-
-
-
-
-
-
Amから見た関係-
-
-
-
-
-
-
-
-
-
下属平
下属調
平行
主調
属平
属調
-
-
同主
同平
-
-
-
-
-
-
新たにb/#する
トーン
C>
Cb
G>
Gb
D>
Db
A>
Ab
E>
Eb
B>
Bb
なしF>
F#
C>
C#
G>
G#
D>
D#
A>
A#
E>
E#
b/#の別解釈#6#7#8#9#10なしなしなしなしb9b8b7b6
別解釈時の調名F#
D#m
C#
A#m
G#
Fm
D#
Cm
A#
Gm
なしなしなしなしA
Gbm
E
Dbm
B
Abm
Gb
Ebm

表を右に1つ進むと完全5度上行(完全4度下行)、左に1つ進むと完全5度下行(完全4度上行)になる。右に2つ進むと長2度上行、左に2つ進むと長2度下行である。表には一応記入してあるがb/#の数が7を超えることはまずない(ピアノの白鍵7種類しかないし:Dbから同主調転調してDbmになったり、G#mから同主調転調してG#になったりするくらい)。理論上は、#を11書いてE#だと言い張ることが不可能ではないが、誰もが「それはFだろ」とツッコミを入れるはず。

b/#が偶数個の場合、C/Amからその個数分上下行した音名が調の名前になる。たとえば#が4つのメジャーキーであればCから半音4つ(長3度)上のEということになる。b/#が奇数個の場合、上の表で左方向になるよう1つずらして数え、5度上げればよい。たとえばbが5つのマイナーキーであれば、bが6つの調をまず考えるとAmから半音6つ(全音3つ)下のEbmで、そこから5度上がるので都合Bbmになる。Bの右側(5度上)を境にb/#のつき方が変わることを覚えておくとよい。


関係調からの借用コード

調性外の音を使う場合などの参考に。ナチュラルメジャーとナチュラルマイナーだけ。

メジャーI6/M7(T)IIm6/7(SD)IIIm7(T)IV6/M7(SD)V6/7(D)VIm7(T)VIIφ(D)
属調VM7VIm6VIIm7なしII6/7なしIV#φ
下属調なしVm6/7なしVIIb6/M7I7なしIIIφ
マイナーIm7(T)IIφ(D)IIIb6/M7(T)IVm6/7(SD)Vm7(D)VIb6/M7(SD)VIIb6/7(SD)
属調なしVIφVIIbM7Im6IIm7なしIVb6/7
下属調なしなしVIIm6/7なしIIb6/M7IIIb7

たとえば「メジャーの欄」「属調の行」「IIm6/7(SD)の列」に「VIm6」とあるのは、「メジャースケールにおいて」「属調のIIm6を借用すると」「主調から見たVIm6というコードになる」という意味。Key on Cに当てはめると、「Key on Cにおいて」「Key on GのIIm6(=Am6)を借用すると」「Key on Cから見たVIm6というコードになる」ということ。太字はトライアドでも調性外のコードで「IIIb6/M7」などとあるのは「IIIb6またはIIIbmaj7」の意。「なし」は調性外の音が鳴らないことを示す。

ついでに関係調と共通するコードも。

メジャーI6/M7(T)IIm6/7(SD)IIIm7(T)IV6/M7(SD)V6/7(D)VIm7(T)VIIφ(D)
属調V6VIm7なしI6/M7なしIIImなし
下属調IV6/M7なしVIm7なしI6IIm7なし
マイナーIm7(T)IIφ(D)IIIb6/M7(T)IVm6/7(SD)Vm7(D)VIb6/M7(SD)VIIb6/7(SD)
属調Vm7なしVIIb6Im7なしIIIb6/M7なし
下属調IVm7なしVIb6/M7なしIm7なしIIIb6

たとえば「マイナーの欄」「下属調の行」「Im7(T)の列」に「IVm7」とあるのは、「マイナースケールにおいて」「下属調のIm7を借用すると」「主調のIVm7に一致する」という意味。「なし」は調性内に一致するコードがないという意味。

メジャースケールでの調性外コードとして、下属調のIIm>V>Iを借りてI>Vm>I>IVとしたり、平行調からIVm(サブドミナントマイナー)を借りてIV>IVm>IorVなどとする例がよく見られる。III>VIm(1-3-6-2-5-1の一部など)の形でIIIやIII7が使われるケースも多いが、これは平行調のナチュラルマイナーがハーモニックマイナーモードまたはメロディックマイナーモードにモーダルインターチェンジした場合のV>Imを借用したと解釈できる。もちろん、裏コード(ドミナントセブンなどを三全音平行移動したコード)やセカンダリードミナント(トニック以外のダイアトニックなメジャーまたはマイナーコードに解決するドミナントセブン:ディミニッシュマイナーは解決先として想定しないのが普通)もよく使われるコードである。


各調におけるコードの機能

各調またはモードにおけるコードのファンクションを一覧にした。T/D/SDの区別は「ドミナントの緊張感を解決してキーの安定感を出せる和音がトニック代理(T)」「強い緊張感があり解決を要求する和音がドミナント代理(D)」「強い安定感も強い緊張感もないのがサブドミナント代理(SD)」というのが基本。

キーTDSD
ナチュラルメジャーIM7、VIm7、IIIm7V7、VIIφIVM7、IIm7
ナチュラルマイナーIm7、III♭M7Vm7IVm7、VI♭M7、VII♭7、IIφ
ハーモニックマイナーImM7、III♭augM7V7、VIIdim7IVm7、VI♭M7、IIφ
メロディックマイナーImM7、III♭augM7V7、VIIφIV7、VIφ、IIm7

ただし、用法によって機能は変化し得る。たとえば、ナチュラルメジャーにおけるIIImはIVに進む場合がトニック代理(T)でIかVImに解決する場合にはドミナント代理(D)と扱う場合があるし、VImもIに解決する場合はサブドミナント代理(SD)でそれ以外はトニック代理(T)と扱う場合がある。メロディックマイナーのVIIaug7はトニック代理でよいのだろうか(ちょっと自信がない)。

解決感があるかないかに注目して分類することが多いようだが、厳密な根拠はよくわからなかった。おそらく、たとえば「IIIm>Iと進行するとIIImの緊張感が目立つ」とか「VIm>Iと進行するとVImが思ったほど安定していないのがバレる」とか、聴覚上の根拠を元にしているのだろうと思う。また、サブドミナントの不安定感はドミナントの不安定感とやや異なり、調性の揺らぎを含むことがある(ivやviのトーンが重要な役割を果たす)。

VII♭、IIφ、III♭aug、IVφあたりも前後関係や人により解釈が分かれている。II♭M7(サブドミナント代理:フリジアンモード由来でナポリ和音とも)とII♭7(ドミナント代理:いわゆる裏ドミナント)のように、セブンスのつき方でファンクションが変わる例もある(ただしテンションは考慮しないのが普通)。

More Jamの解説(その1その2その3その4)(外部リンク)を読んでみたが、どうやら
機能構成音
Tiiiを含みivを含まない
Tmiii♭を含みivを含まない
SDivとviを含みviiを含まない
SDmivとvi♭を含みviiを含まない
Divとviiを含む(トライトーン)
Dmivと♭viiを含む(不安定感は弱い)
というルールで機械的に解釈する流儀もあるようだ(D、Dm、SDmのうち複数の条件を同時に満たす場合はこの順に優先)。この文脈では、たとえば「トニックマイナー」という語は、キーにマイナー感を付与しつつ安定させるコードという意味であって、該当するコードがメジャーコードかマイナーコードかに関わりがない(たとえばIII♭はメジャーコードだがTm扱い:Iの代理ではなくImの代理であるという意味)。

このルールで分類すると、上の表とは食い違う分類になるコードがいくつかある。あくまで「モーダルインターチェンジを中心とした解釈ではこうなる」という分類なので、他の流儀での分類と食い違うこと自体に問題はない。


コンバージョン

他のコードをマイナーからの派生扱いする(マイナーコンバージョン)。
種類変換先補足例
メジャー長6度上(短3度下)のマイナーC>AmC6>Am7
マイナー変換不要なしなし
ディミニッシュ短3度上のマイナーBm(-5)>DmBφ>Dm6
ドミナントセブン完全5度上のマイナーG7>DmG7>Bφ>Dm6
他のコードをメジャーからの派生扱いする(メジャーコンバージョン)。
種類変換先補足例
メジャー変換不要なしなし
マイナー短3度上のメジャーAm>CAm7>C6
ディミニッシュ減5度上(増4度下)のメジャーBm(-5)>FBφ>Dm6>F
ドミナントセブン長2度下のメジャーG7>FG7>Bφ>Dm6>F
ナインスコードなどは扱いが変わるようだが、とりあえず上記だけおさえておけばなんとかなりそう。


トライトーンの解決

V7の7度音ivと3度音viiがなすトライトーンがどう解決されるかの一覧。コードファンクションはivの解決を基準にすることが多い。
解決先ivの解決先viiの解決先種別備考
Iiiiに半音下行iに半音上行メジャー受けもっとも安定
VImiiiに半音下行iに半音上行代理受けトライトーン自体は完全に解決
IIImiiiに半音下行viiに留め置かれる半端な代理受けviiが解決されない
Imbiiiに全音下行iに半音上行マイナー受けbiiiへの解決をiiに奪われることがある
bIIIbiiiに全音下行bviiに半音下行マイナー代理受けさらに解決感が薄い
トライトーンを作ってiに半音上行で解決するviiを上行導音、トライトーンを作ってiiiに半音下行で解決するivを下行導音と呼ぶ(クラシックでは上行導音が高い音域に、下行導音が低い音域にくる形が好まれる:導音が2つあることを前提とした言い方)。

これを反対から見て、同種の解決ができるコードを一覧にする(ナチュラルメジャー/ナチュラルマイナーに出現するもののみ)。
条件コード備考
iiiとiを含むI、VImIV△7だとivが解決されない
biiiとiを含むIm、bVIIVm7だとivが解決されない
iiiとviiを含むIIIm、V6I△7omit1もこの形
biiiとbviiを含むbIII、bVIIsus4Im7omit1もこの形
コードファンクションとしてどうなるのかは別として、トライトーンの解決だけ考えるとIIImもV6も大差ない。トニック(というかIの代理)としての機能をとくに強調する場合、VImをI6 omit5 on viと解釈することもできなくはない。


ドミナントモーションを利用した展開

プライマリードミナントおよびその派生コードを解決する進行(タブ区切りテキストcsvフォーマット)。
コードIまたはImへVImへIIImへbIIIへ解釈備考
V7完全4度上行全音上行長6度上行増5度上行ドミナントセブンもっとも明確なドミナントモーション
bII7半音下行増5度上行短3度上行全音上行ドミナントセブンの裏コードオルタードスケールで通常のドミナントと相互接続
VIIm(-5)半音上行全音下行完全4度上行長3度上行ドミナントセブンのomit1完全4度上行で解決したがるモーションも強い
IVm(-5)完全5度上行長3度上行半音下行全音下行裏コードのomit1半音上行や完全4度上行の引力を振り切る形になりやや弱い
IIm6全音下行完全5度上行全音上行半音上行ハーフディミニッシュの第1回転形5度音を半音下げてdim7の形も使える
bVIm6長3度上行半音上行増5度上行完全5度上行ハーフディミニッシュの裏の第1回転形omit5にすると軽くなり半音下げてdim7の形も使える
Vm7完全4度上行全音上行長6度上行増5度上行ドミナントマイナーツーファイブの一部として使える
bIIm7半音下行増5度上行短3度上行全音上行ドミナントマイナーの裏ツーファイブの一部として使える
IV on V完全4度上行全音上行長6度上行増5度上行フュージョンコード非常に曖昧なドミナントモーション
受けの強さはI>VIm>Im>IIIm>bIIIといったところか。

上記のほか、V7はbIIIaug(ハーモニックマイナーなどで出てくる:トニックマイナー代理)でも受けられるので、「bIIIへ」は「bIIIまたはbIIIaugへ」と読み替えてもよい。III(ハーモニックメジャーで副次的に出てくる:IIIsus4(-4)とは普通書かない)やVI(メロディックフリジアンなどで副次的に出てくる)、IとbIIIのdim7、IIIとVIのハーフディミニッシュもトニック扱いすることがある(前の項を参照)。

なお、上記は当然セカンダリードミナントにも応用できる。


コードとモーダルインターチェンジ

あるコードが鳴っている場合にルートを変えずに利用可能な(モーダルインターチェンジの文脈での)モードと、コードのルートから見たモードの特徴音の度数(表記としてやや奇妙だが便宜のためテンション扱い)。括弧内は核音(nuclear tones=iとivとv)以外のコード構成音(浮動音=floating tones)。ナチュラルメジャーとナチュラルマイナーは省いて記述。

iiを含まないコードで、iiiが構成音の場合アラビア系モード、iiibが構成音の場合フリジア系モード、どちらも構成音でない場合は両方が候補になるが、追加でiiをフラットできるというだけなので一覧では省いた。括弧書きのモードは安定感や影響力が比較的弱い(どのモードにも、もっとも安定感の高いナチュラルメジャーに解決したがる傾向がいくらかある)。フリジアンモード(ナチュラルマイナーからiiだけフラットした形)以外のフリジア系とアラビア系モードは、すべて括弧書きに準じる(アラビア系モードはとくに不安定)。

ナチュラルメジャーのダイアトニックコード。

ナチュラルマイナーのダイアトニックコード V7で使えるモードは例外が多い(5度音であるiiをフラットさせてよいなど:基本的に「ハーモニック」という名前がついたスケールは何でも使える)。また、V7をナチュラルメジャーで演奏する場合、vをルートにした視点に切り替えて「ミクソリディアンを使う」と表現することが多い(オルタードやコンディミなどルートをiに置く意味がないスケールもv視点で表記する:ナチュラルメジャーでの演奏とvルートのミクソリディアンでの演奏は(CメジャーとAマイナーなどの比較と同様)同じでないため、そのニュアンスが必要な場合は呼び分けなければならない)。それ以外、たとえば「ハーモニックマイナーを使う」と言った場合は「iから始まるハーモニックマイナー」を指すことがほとんど。

V7でハーモニックマイナーを使う場合「vから見て5度下であるiから始まる」という意味の「perfect5th below」をつけて、さらに略記にして「Hmp5↓」などと表記することがある(「はぁもにっくまいなぁぱぁふぇくとふぃふすびろぅ」と読む)が、モーダルインターチェンジの文脈でやり取りしている限り、単に「ハーモニックマイナー」と書いても不都合はあまりない(裏コードやセカンダリードミナントやコンバージョンが絡んでくると、どこを起点にしたスケールなのか確認する必要が出てくる)。

モードを変える直前のコードによっても変化のつき方が変わる。たとえばトニック系のコードはiiiまたはbiiiの存在感が大きいので、直後にメジャー/マイナーの入れ替えをやると大きな変化に感じる。メジャーキーでIImを鳴らしてから途中でメロディックマイナーに移り、そのままV7に進むような場合は変化がさりげなくなる。IV△7(iiiは含まれているが存在感は強くない)あたりからマイナー系モードに進むと中間的な感じになる。

借用/共通コードも一覧にしておく。 ナチュラルメジャーとナチュラルマイナーの間には共通コードがない。IImとIVとVが(ナチュラル)メジャーと(メロディック)マイナーの掛け橋になることは覚えておくとよいだろう(すでに触れたが、とくにメジャー系からマイナー系への移行ではIImとIVが活躍する:ファンクションもSDで無難)。

コードのルートを基準にモードを再構成する場合。括弧内は特徴音、「一致」とあるのは順序を無視した構成音が同じこと(「戻る」などの表現も同様)、「i〜vii」は元のキーから見た相対音程、「m6」「M3」などはコードのルートから見た相対音程を指すことにする。便宜のため、元のキーを基準にしたモードには「k」を、コードのルートを基準にしたコードスケールには「c」を、名前の頭につけることにする。

ナチュラルメジャーに対する拡張

ナチュラルマイナーに対する拡張 V7のところでcオルタードにするような用法は網羅していないので注意。ナチュラルマイナーの拡張ではkドリアンまたはkフリジア系への移行が主(もともと、ナチュラルとハーモニックとメロディックの移行が頻繁なのであまり目立たない)、ナチュラルメジャーの拡張ではIVとVとIImの場合が目立っている。


転調とモーダルインターチェンジ

ナチュラルメジャーからの移行について、フラットする特徴音のものはモーダルインターチェンジと構成音がかぶる。
調号転調先特徴音モード借用可能なメジャーコード
1ivbviiミクソリディアンbVII
2bviibvii, biiiドリアンbVII, bIII
3biiibvii, biii, bviナチュラルマイナーbVII, bIII, bVI
4bvibvii, biii, bvi, biiフリジアンbIII, bVI, bII
5biibvii, biii, bvi, bii, bvオルタード4bVI, bII, bV
たとえば、調号変化が2(フラットが2つ増える)の転調と、ドリアンモードへのインターチェンジは、構成音だけ見ると同じ変化である(CからBbへの転調とCナチュラルメジャーからCドリアンへのインターチェンジは、構成音だけでは区別がつかない)。

シャープ系の変化はしょっぱなで核音(iv)が動くうえ、たった2回でルートがずれてしまうため、vへの転調とリディアンへのインターチェンジがかぶるだけになる。結果的に、フラット系の変化ではモーダルインターチェンジっぽさが、シャープ系の変化では転調っぽさが出やすい。


三和音にムリヤリコードネームをつける

1オクターブ以内にある三和音について、コードネーム別に「一番低い音から半音いくつ上昇するか」を一覧にした。たとえば「4-3」とあったら、最低音から半音4つ上に中間の音、中間の音から半音3つ上に最高音が来る形である。便宜上、候補はテンションのない四和音までに限定する(たとえ限定しなくても実際には、三和音に直接テンションを乗せて1stか5thが落ちた形(たとえばC(9)omit1とか)と、セブンスorシックススコード+テンション1つで1stと5thが落ちた場合(たとえばC7(9)omit1,5とか)くらいしか考慮しなくてよいはず:三和音にテンションが2つ乗ってかつコードトーン2つ省略というのはいかにも苦しい)。

オーギュメントとディミニッシュとメジャー(-5)は5thが特徴音で、sus4も5thがないとコードネームが変わってしまうため、omit5の形を考慮していない。メジャー(-5)から3度音を省略した場合はディミニッシュの3度省略と同じ扱い。Dim7は省略の意味がない(何度を省略してもディミニッシュマイナーになるだけ)のでこれも除外。ベースがいない場合omit1の形は考慮しなくてよい。

いわゆる12音階から「ある音と、最初の音から1オクターブ以内の2音」を含む三和音は11C2=55通り選べるが、そのうち少なくとも上記34通りにコードネームを当てはめることができる。それ以外の21通りについては、

とかなりムリな解釈になる。いずれも、長短3度に相当するインターバルを手がかりに、それが「3度音と5度音」(つまりテンションを乗せてルート音を省略した形)または「ルート音と3度音」(つまりテンションを乗せて5度音を省略した形)だと推定して、あるいは完全4or5度のインターバルをもとにパワーコード、トライトーンをもとにドミナントセブンorディミニッシュの一部だと解釈して、コードネームをつけている。

ちなみに二和音は、インターバルが半音3または9ならマイナー、4または8ならメジャー、5または7ならパワーコードだと解釈できる。インターバルが半音6になる二和音はドミナントセブンの一部だと考えるのが自然だろう(ディミニッシュマイナーomit3でもよいが、ディミニッシュマイナー自体をドミナントセブンのルート音省略と見るなら、結局ドミナントセブンの一部に変わりはない)。

四和音の場合、まずすべてがコードトーンだとして解釈を試みて、解決できなければ「テンションが乗ってかつコードトーンが省略された形」を考慮する。たとえばCとDとEとAの和音はAm(11)、F7(13)omit1、C6(9)omit5などの可能性がある。機械的に解釈するなら、4トーンのうち任意の3つを使って上記の一覧にあてはまるものを探し、残る1つをテンション扱いすることになるだろう。都合4通りの試行が必要で、もし五和音だと5C3で10通り試行しなければならない。六和音以上はどうとでも解釈できてしまうので、あまり気にしなくてよいだろう。


ベース

ルート音を省略したメジャーセブンもしくはマイナーセブンの下でベースをダイアトニックに動かした場合のコードネーム(タブ区切りテキストcsvフォーマット)。アラビア数字は「ベースがコードのルート音から見て何度か」を示す。メジャーセブンがダイアトニックでないVとVIIbはドミナントセブンで代用し、ディミニッシュマイナーのセブンスコードはハーフディミニッシュにしている。なお、スペースの都合で(ハーフディミニッシュではないトライアドの)ディミニッシュマイナーをφで表記している部分がある。

メジャーIIImIIImIVVVImVIIm(-5)
1IM7IIm7IIIm7IVM7V7VIm7VIIφ
2IIIm7
V6
IVM7
VIm(-13)
VIIφ(-13)
V7
VIm7
I6
VIIφ
IIm6
IM7
IIIm(-13)
IIm7
IV6
3IIImIVVVImVIIm(-5)IIIm
4IIIm(-9)IV(9)
Isus4(13)
V(9)
IIsus4(13)
VIm(9)
IIIsus4(-13)
VIIφ(-9)I(9)
Vsus4(13)
IIm(9)
VIsus4(-13)
5IIImIVVVImVIIm(-5)IIIm
6IIIm(11)
IIIsus4(+9)
IV(+11)V(11)VIm(11)
VIsus4(+9)
VIIφ(11)I(11)IIm(11)
IIsus4(+9)
7IIImIVVVImVIIm(-5)IIIm
マイナーImIIm(-5)bIIIIVmVmbVIbVII
1Im7IIφbIIIM7IVm7Vm7bVIM7bVII7
2bIIIM7
Vm7(-13)
IVm7
bVI6
Vm7
bVII6
bVIM7
Im(-13)
bVIIM7
IIφ(-13)
Im7
bIII6
IIφ
IVm6
3bIIIIVmVmbVIbVIIImIIm(-5)
4bIII(9)
bVIIsus4(13)
IVm(9)
Isus4(-13)
Vm(-9)bVI(9)
bIIIsus4(13)
bVII(9)
IVsus4(13)
Im(9)
Vsus4(-13)
IIm(-5)(-9)
5bIIIIVmVmbVIbVIIImIIm(-5)
6bIII(11)IVm(11)
IVsus4(+9)
Vm(11)
Vsus4(+9)
bVI(+11)bVII(11)Im(11)
Isus4(+9)
IIm(-5)(11)
7bIIIIVmVmbVIbVIIImIIm(-5)

IもしくはImの下でベースの音程をクロマチックに上げていった場合のコードネーム(タブ区切りテキストcsvフォーマット)。

P1m2M2m3M3P4D5/A4P5m6M6m7M7
IIM7#Iφ
IIIm6
IIIm7
V6
IIImM7
Vaug(13)
IIImIIIm(-9)IIIm(9)
VIIsus4(-13)
IIImIII(+9)IIIm(11)
IIIsus4(+9)
IIIm(+11)IIIm
ImIm7bIII7
Vm(-5)(-13)
bIIIM7
Vm7(-13)
bIIIbIII(-9)bIII(9)
bVIIsus4(13)
bIII(+9)bIIIbIII(11)bIII(+11)bIIIbIII(-13)
Vaug(+9)

いづれも、改行の関係でcsvファイルの方が見やすいかもしれない。

右手がトライアド(ルート省略せず)の場合、メジャー/マイナーコードともにベースが6度音になるとコードネームの解釈が変わる。メジャーコード on M6だと長6度上(短3度下)のマイナーセブンに、マイナーコード on m6だと短6度上(長3度下)のメジャーシックスに、マイナーコード on M6だと長6度上(短3度下)のハーフディミニッシュになる。メジャーコード on m6はあまりやらないが、短6度上(長3度下)のオーギュメントメジャーセブンという変な形になる。

ルートを省略したセブンスコードの下でベースがルート以外のコードトーンに動いた場合、主要コードは代理コードに、代理コードは主要コードに幾分歩み寄った雰囲気になる(そう大きな違和感は出にくい)。2度に持っていくと歩み寄った上でさらに回転形になる。6度は雰囲気が大きく変わる。

オマケでパワーコードの下で動かした場合(回転形を無視):
P1m2M2m3M3P4D5/A4P5m6M6m7M7
PowerIbIIm(-5)△7omit3(一応)Vsus4またはIsus2ImIIsus4該当なしPowerIbIV△7omit5VIm7omit5セブンスコードの3度省略(こじつけ)セブンスコードの3度省略(こじつけ)
表にすると意外と動けそうに見える。実際に音を出してみると、筆者の感覚では、M2〜P5は比較的安定(その中ではD5/A4が目立ち、M2もやや目立つ)、m2とM6とm7は不安定、m6とM7はかなり不安定(どちらかといえばM7が目立つ)くらいか。D5/A4はさほど目立たず、表では該当なしにしてあるが、ムリヤリbVdim(-9)omit3omit7に取れなくはない。少なくともm3、M3、P4、P5へは比較的ムリなく動けるし、あえてベースでニュアンスを出すのも面白いかもしれない。

ローインターバルリミットの目安は以下の通り(アコースティックピアノ前提)
完全5度A1とE2
完全4度D2とG2
長6度D2とBb2
長3度A2とC#3
長短7度A2とG#3またはG3
短3度C#3とE3
増4度/減5度C#3とG3
短6度C#3とA3
長2度G3とA3
上記は一般的なグランドピアノの例だが、ピッチが甘く、倍音が豊富で、インハーモニシティ(倍音のずれ)が大きい楽器(新品の弦を張ったギターとか)は高い音でも濁りやすい。反対に、ピッチが正確で、倍音が少なく、インハーモニシティが小さい楽器(デジタルシンセのフルート系トーンとか)は低い音でも濁りにくい。

とくにアコースティックギターのローコードやエレキギターのパワーコードでE〜G(6弦からE2〜G2の音が出てくる)を弾いている場合ベースの動きがかなり制限される(ベースに古めの弦を使うと倍音が減ってやや改善される:濁りだけでなく低音のダブつきの問題もあるので、ギターのハイパスもかけておいた方がよいだろう)。


距離と時間に関する数値と計算

テンポの換算式

1小節x秒で4/4拍子の曲のテンポn(1分間に4分音符n回)は、60/(x/4)=240/xで求められる。4分音符1拍がx秒なら素直に60/xでよい。逆に、テンポをxとすると、4/4拍子の1小節は(60/x)*4=240/xになり、n分音符の長さは240/(x*n)になる。

テンポをx(1分間に4分音符x回)とすると、n分音符の長さは{(60/x)*4}/n=240/(x*n)に、テンポをx(1分間に4分音符x回)とすると、周波数n(Hz)の繰り返しはn*((60/x)*4) = 240*n/x分音符相当になる。


音価とチックス

4分音符=480チックス(分解能1920)を前提とした、音価チックス数の対応。完全なテヌートの場合(オマケでDominoで打ち込んだ場合のスクリーンショットその1その2:その2は横に拡大してある)。
分数小数チックス3連分数小数チックス
2分1/20.59602分1/30.333333333640
4分1/40.254804分1/60.166666667320
8分1/80.1252408分1/120.083333333160
16分1/160.062512016分1/240.04166666780
32分1/320.031256032分1/480.02083333340
64分1/640.0156253064分1/960.01041666720
128分1/1280.007812515128分1/1920.00520833310
256分1/2560.003906257.5256分1/3840.0026041675
音符と休符で計算方法に違いはない。

以下、n分音符n個分(たとえば4分音符4個分)に相当する音価の「1分音符」を仮に想定して話を進める(2分の2拍子や4分の4拍子など分子と分母が揃っている拍子では全音符=1分音符と同じ長さになるが、4分の3拍子など分子と分母が揃っていない拍子では全音符と1分音符が異なる長さになる)。

附点の場合は1.5倍(=3/2倍)、複附点の場合は1.75倍(7/4倍)にして計算する。6連符と12連符は3連符と同様に計算できる(たとえば、3連8分音符と6連8分音符と12連8分音符のチックス数は同じ:それぞれ、3つで4分音符、6つで2分音符、12で1分音符)。上記に限らず、たとえば5連符と10連符の関係でも同様に、連符を倍に割ってもチックスの扱いは変わらない。

5・7・9・10・11連符については、5連8分音符(5つで2分音符分)が1分音符の1/10=192チックス、7連8分音符(7つで2分音符分)が1分音符の1/14=137.142857チックス、9連8分音符(9つで1分音符分)が1分音符の1/9=213.333333チックス、10連8分音符(10で1分音符分)が1分音符の1/10=192チックス(5連符と同じ)、11連8分音符(11で1分音符分)が1分音符の1/11=174.545455チックスだけわかれば何とかなるだろう。「連符は実際の音価より長い音符の中で一番近いものを借りて表記する」「m連n分音符について2^(n÷mを整数に切り捨てたもの)が合計の音価」などと捉えておくと便利かもしれない。

3連3連符は9連符のチックス数を半分にして考えればよく、たとえば、3連8分音符(合計で4分音符分の音価)をさらに3連にすると、子の3連符1つが3連4分音符分、全体で2分音符分、子の音符1つは9連8分音符の半分=1/18ということになる。


減衰・到達時間・波長など

点音源から開放空間に出力される0db@1mの音波が、距離によってどのくらい減衰するか。

+12db@0.25m、+6db@0.5m、0db@1m、-6db@2m、-10db@3m、-12db@4m、-14db@5m、-18db@8m、-20db@10m、-26db@20m、-32db@40m、-40db@100m、-60db@1000m。

ただし、これはあくまで点音源かつ開放空間かつ環境雑音なしの場合。同じ条件で線音源だと減衰が(デシベル表記で)半分になり、面積無限大の面音源だと減衰なしになる(圧力が球状に逃げるのが点音源、円筒状にしか逃げないのが線音源、逃げ場がないのが面音源:波長に対して音源が十分大きくても、ものすごく遠距離から見ると点音源的に振る舞う)。また実際には、普通に考えられる規模の有限線音源でも、遠距離では空気による吸収が支配的になる(2.5mくらいのアレイの正面で16KHzだと30m過ぎくらいからのようだ)。

もっと正確で実用的な資料として、日本ビクターが公開しているPRO SOUND SOLUTION GUIDEというPDFの技術資料パートが詳細である(外部リンク)。またメートルオーダーでの計算例が岐阜県のウェブサイトPDFファイルで公開されている(両方外部リンク)。

楽器やヴォーカルの最大音量は、生ドラム=120db@1m、グランドピアノ=アルトサックス=オペラ独唱=100db@1m、アコースティックギター(鉄弦)=オペラ以外の独唱=90db@1mくらい。いづれもとくに大きい音を出す楽器とプレイヤーを組み合わせた場合に「出そうと思えばこのくらい出る」という数値。アマチュアプレイヤーがここまでの音を出すのは多分難しい(ドラム除く)。たとえば暗騒音工法研究会が引用している環境省のデータ(外部リンク)だと、ピアノ正面1m付近で80dbないし80〜90dbとなっている(80dbはバイエル104番を演奏したときの値らしい)。アコギも、ドレッドノートなどとくに大きなモデルに太い弦を張ってゴツいピックで思い切りストロークしないと90db@1mまでは出ないと思われる。

音波1周期は、31.25Hzで32ms[10.9m]、62.5Hzで16ms[5.44m]、125Hzで8ms[2.72m]、250Hzで4ms[1.36m]、500Hzで2ms[68cm]、1KHzで1ms[34cm]、2KHzで0.5ms(500μs)[17cm]、4KHzで0.25ms(250μs)[8.5cm]、8KHzで125μs[4.25cm]、16KHzで62.5μs[2.125cm]、の時間に相当する(角括弧内の数字は、音速を340m/sとした場合に音が1周期で進む距離)。


ハース効果と音量差

両耳の間隔を0.2m、両耳の中心点と点音源の距離を0.5m、2m、10mとした場合に、両耳の中心点と点音源を結んだ直線と、両耳を結ぶ直線のなす角によって、直接音の到達距離、到達時間、両耳の中心に届く(はずの)音波と比べた音量がどう変化するか(タブ区切りテキストcsvフォーマット)。

0.5m2m10m
条件到達距離到達時間音量到達距離到達時間音量到達距離到達時間音量
90度両耳0.501m1.47ms-0.025db2.00m5.88ms0db10.0m29.4ms0db
60度遠耳0.557m1.64ms-0.94db2.05m6.03ms-0.22db10.05m29.6ms-0.045db
60度近耳0.458m1.34ms+0.76db1.95m5.74ms+0.22db9.95m29.3ms+0.045db
60度差分0.099m0.30ms1.70db0.10m0.29ms0.44db0.10m0.3ms0.09db
45度遠耳0.575m1.69ms-1.22db2.07m6.09ms-0.30db10.07m29.6ms-0.06db
45度近耳0.435m1.28ms+1.21db1.93m5.68ms+0.31db9.93m29.2ms+0.06db
45度差分0.14m0.41ms3.43db0.14m0.41ms0.61db0.14m0.4ms0.12db
30度遠耳0.589m1.73ms-1.43db2.09m6.15ms-0.38db10.09m29.7ms-0.08db
30度近耳0.416m1.22ms+1.60db1.91m5.62ms+0.40db9.92m29.2ms+0.07db
30度差分0.173m0.51ms3.03db0.18m0.53ms0.78db0.17m0.5ms0.15db

すべての数字について、まず距離を有効桁数3桁(10mを超えるもののみ例外的に4桁)で求めてから、丸めた数字を元に時間と音量を計算している。顔の表面で回り込む音は、低音ほど大きく、高音ほど小さく聴こえるはずである(遠回りする分の距離の延長は無視している:耳から音源までの間を頭部が遮らない程度の角度であれば考慮しなくてよい)。また、極端な高音は正面で鳴るよりも横(耳の奥が見えるくらいの角度)で鳴った方が大きく聴こえるはずである。


ハース効果と位相差

人間の耳が位相差を「音色」として認識できるのは、完全な逆相(πの遅れ)の場合で1KHz以下くらいらしい。筆者1人を対象にした独自実験だが、2KHzのサイン波をヘッドフォンでステレオ再生しながら片方のチャンネルだけ位相反転を繰り返したところ、どちらが逆相の音かブラインドでの区別ができなかった(ただし、ハース効果で定位がずれるため「どちらから再生し始めたか」はわかる:ハース効果の知覚限界を仮に0.1msとすると、5KHzくらいまでは「逆相にした音の鳴り始めが耳に入ると定位感に影響が出る」ことになる)。

もう少しマトモな実験結果が見つかればかったのだが、1KHzの音波の位相がπ遅れるには0.5ms、2KHzだと0.25msくらいかかるため、上の表の値を考えても「まあ妥当」な数字ではないかと思う(追試をする人はステレオのヘッドフォン/イヤフォンを使わないと意味がないので注意)。

ちなみに、もっと低い周波数、たとえば200Hzくらいの低音が左右逆相で耳に入ると、何ともいえない不自然な感覚になる(自然界にはあり得ない現象なので当たり前)。また、普通に録音した音声を左右片方だけ位相反転させてヘッドフォンで再生すると、非常に奇妙な定位感になる(本来なら、たとえば0.5msの到達時間差で1KHzの音波にπ位相差が出た場合500Hzの音波はπ/2の遅れになるはずだが、これが全部揃ってπだけ遅れるのがキモチワルイのだと思う:もちろん低音に大きな位相差が出ていることも影響しているだろう)。

なお、ここで問題になるのは「左右の」位相「差」であって、群遅延のような現象とは関わりがないので注意して欲しい。


MIDI

4分音符が480チックスの場合、8分で240、16分で120、32分で60、64分で30、128分で15、3連4分で320、3連8分で160、3連16分で80、3連32分で40、3連64分で20、3連128分で10。1チックは1920分音符で、256分は8チックス、512分は4チックスで代用する。4/4拍子だと、1拍目は0、2拍目は480、3拍目は960、4拍目は1440チックスから始まる。テンポ125で1チックス=1ms。

極端なレガートを避けるために音価を削る場合、音価の1/32〜1/8くらいが無難。アクセント拍の前後移動(ずらし)は128分音符(=15チックス:ごく微妙な変化)〜64分音符(=30チックス:明らかな変化)くらいを目安にする。16分刻みのハットを揺らすような場合は256分音符(=7.5チックス)くらいでもよさそう。

Timidity++とFluidを組み合わせた場合ベロシティ100の音とベロシティ50の音は音量が10db違い、SW synth だと12dbの差だった(グランドピアノのC4の音を使用)。Timidity++はデシベル基準で2倍=10db(ただしオプションで変更できる)という計算、SW synth は素の対数基準で音量2倍=音圧(2)^2倍という計算をしているのだろう。多分、ローランドのほかの音源もSW synth と同じ基準ではないかと思われる。最大音(ベロシティ127だが、端数が面倒なので128として扱う)を0dbとして計算すると:Timidity++の場合、64で-10db、32で-20db、16で-30db、8で-40db、4で-50db、2で-60db、1で-70dbになり;SW synth なら、64で-12db、32で-24db、16で-36db、8で-48db、4で-60db、2で-72db、1で-84dbになる。


RIFF WAVE

以下に、48KHz/16bitのRIFF WAVEファイルをhex(16進)表記したものと、その解釈を示す(タブ区切りテキストcsvフォーマット)。チャンク(Chunk)は英語で「塊」の意味で、イメージとしては入れ物のような感じ。以下の例では、RIFFという箱の中にfmt という箱とdataという箱が入っている様子を想像すればだいたい問題ない。ちゃんとした仕様はTSP Labというサイトに掲載されているのでそちらを参照(外部リンク)。

パート123
hex524946463400000057415645
ASCII/decimalRIFF52WAVE
備考RIFFチャンクの開始RIFFチャンクのバイト数ファイルの種類を宣言
長さ(バイト)444

パート1とパート3は固定。パート2は4バイト=32ビットの値なので0〜4294967295バイト=4GiBまでの値(必ず偶数にするのが決まりで、データが半端な場合は0で埋めるらしい)をとり、パート2以前のデータとパート2自身を含まない(以下同様)。つまり、パート2はパート3〜20のバイト数を示している(反対にいえば、パート3〜20がRIFFチャンクの中身である)。

4567891011
666D7420100000000100020080BB000000EE020004001000
fmt 161248000192000416
fmt チャンクの開始fmt チャンクのバイト数データ形式チャンネル数サンプルレートビットレートクロックあたりバイト数ビット深度
44224422

パート4は固定。パート5が16の場合のみ、パート6〜11が上記のようになる(この構造体をPCMWAVEFORMATという)。パート5はパート6〜11のバイト数を示している(反対にいえば、パート6〜11がfmt チャンクの中身である)。パート6は「1」だとリニアPCMを示し、MS ADPCMだと「2」、32bit(float)だと「3」、YAMAHA ADPCMだと「32」になる(いづれもdecimal値)。

12131415161617181920
6461746110000000000000000000FF7F0000008000000000
data16000327670-3276800
dataチャンクの開始dataチャンクのバイト数1ch@1c2ch@1c1ch@2c2ch@2c1ch@3c2ch@3c1ch@4c2ch@4c
44********

*はビット深度(量子化ビット数)分のデータ長になる。「Nch@Mc」という表記は「Mクロック目におけるNチャンネルの音圧」という意味で、たとえば「2ch@3c」は「3クロック目における第2チャンネルの音圧」の意(リニアPCMなので、値「-32768」がそのまま音圧を示している)。パート13はパート14〜20のバイト数を示している(反対にいえば、パート14〜20がdataチャンクの中身である)。

上記のうちdataチャンク以外において、数値データはリトルエンディアンの符号なし整数として扱われる。たとえば、パート8のリトルエンディアンhex「80 BB 00 00」をビッグエンディアンhexに直すと「00 00 BB 80」で、これをさらにdecimal(10進)に直すと「48000」になる。

dataチャンクにおいて、数値データはリトルエンディアンの符号あり整数として扱われる(上記の例では2バイト符号あり整数で、WindowsではWORD、C言語ではsigned short intと呼ぶ:ただし、8bitPCMの場合のみ1バイト符号なし整数で扱うようだ)。binary(2進)での演算になるため多少面倒で、リトルエンディアンhexの「FF 7F」(つまりビッグエンディアンhexで「7FFF」=ビッグエンディアンbinaryで「01111111 11111111」)までは正の数、リトルエンディアンhexで「00 80」(つまりビッグエンディアンhexで「80 00」=ビッグエンディアンbinaryで「10000000 00000000」:最上位ビットが1になる)からは記録された値からビッグエンディアンbinaryで「1 00000000 00000000」(ビッグエンディアンhexで「01 00 00」=リトルエンディアンで「00 00 01」)を引いた値が負の数として用いられる(ペンティアム互換のCPUではこの方が計算が速いため、こういう処理になっている)。このためリトルエンディアンの符号あり整数では、「00 00」が0、「FF 7F」が最大値(decimalで「32767」)、「00 80」が最小値(decimalで「-32768」)となる。

上記から、ビット深度が8の倍数でないと非常に面倒なことになることがわかると思う(そのような処理に対応しているソフトはほとんどないはず)。また、44.1KHz>48KHz>32KHz>96KHz>192KHz>88.2KHzの順に対応ソフトが多いだろう。dataチャンクの前にfactチャンクというのを置いて、dataチャンクに含まれるサンプル数を明記する場合もあるようだが、たいていは省かれる。LISTチャンクを置いてコメントを書き込むこともできるらしい。ちなみに、RIFF WAVE形式の16bitリニアPCM(16bit符号あり整数で波形を記録)に「DCオフセットのない正弦波」を記録する場合、ダイナミックレンジは約90.31dbになる(単純に1bit=6.02dbと考えて16倍すると96.32dbだが、その条件だとDCオフセットのある波形しか作れない)。

32bit浮動小数点数(詳しくはその他のページを参照)での表現については、最小値がリトルエンディアンで「00 00 80 BF」、ビッグエンディアンに直すと「BF 80 00 00」、ビッグエンディアンからバイナリに直すと「1 01111111 00000000000000000000000」、さらにデシマルに直すと「-1」になる一方、最大値がリトルエンディアンで「00 00 80 3F」、ビッグエンディアンに直すと「3F 80 00 00」、ビッグエンディアンからバイナリに直すと「0 01111111 00000000000000000000000」、さらにデシマルに直すと「1」になっており、指数部の上位1ビットを余して記録してある(Audacity1.26の出力で確認)。ソフトウェアプロセッサで処理するときは、余った領域をヘッドルーム的に使う(プロセッサ内部では-1〜1の範囲外のデータもそのまま扱う)のが普通。

すでに触れたように、RIFF、fmt 、data以外のチャンクを盛り込むことも可能で、たとえばacidized wavの場合、str2、bmrk、dtbt、acid、strc、LIST、ICRD、PAD などのチャンクが続いてからdataチャンクがくるものや、dataチャンクの後にacid、strc、bmrk、dtbtと続くもの、acidチャンクしか追加していないものなどがある(未確認だが、おそらく最初のが本家ACIDで書き出したもの)。非対応のチャンクは読み飛ばされるだけなので、普通のwavプレーヤーでもacidized wavは再生できる。

余談だが、歴史的には1985年にElectronicArtsとCommodore-Amigaが策定したIFF(Interchange File Format:ビッグエンディアンであること以外はRIFFと同じらしい)規格が大元で、1988年にAppleがAIFF(Audio Interchange File Format:ビッグエンディアン採用で、RIFF WAVEとはチャンクの宣言などもやや違うが、構造自体はRIFFとほぼ同一)を策定、1991年にMicrosoftとIBMがRIFF(Resource Interchange File Format)を策定、という流れになっている。RIFF WAVEの自由度を抑えて互換の確実性を向上させ、ラベルやCUE情報や添付ファイルの埋め込みを可能にしたBWF(Broadcast Wave Format:European Broadcasting Unionが策定)や、その日本バージョンであるBWF-Jなどもある。


IEC 60958

代表的な実装にAES/EBU(IEC 60958-3:Audio Engineering SocietyとEuropean Broadcasting Unionの略)とS/PDIF(IEC 60958-4:Sony/Philips Digital Interconnect FormatまたはSony Philips Digital Interfaceの略らしい)がある。トライテックという会社の解説が詳しい(外部リンク)。AESは1985に策定されて1992年と2003年に改定されている。

下位層のおもな規格(IEC 60958 Type IIなど)は、
 S/PDIF(コアキシャル)AES3(アンバランス)AES3(バランス)
ケーブルコアキシャル(同軸)コアキシャル(同軸)シールデッドツイストペア
特性インピーダンス75Ω75Ω110Ω
最大電圧(未確認)0.5Vくらい1Vくらい5Vくらい
といった感じ。いづれの方式でもBiphase mark code(バイフェーズ符号の一種で、FM1 codeとも)で符号化される。この符号はNRZ(non-return-to-zero:プラスの電圧とマイナスの電圧で構成され、電圧ゼロの時間がない)で、1クロック時間でプラスとプラスまたはマイナスとマイナスの電圧を送ると0のビット、プラスとマイナスまたはマイナスとプラスの電圧を送ると1のビットを示す(クロックをデータに重ねて送る方式なので同期を取りやすいが、送信周波数が高くなる)。ただし、後述の同期スロットのみBiphase mark codeを用いない。

上位層にはChannel Status Wordというヘッダのようなものがある。バーストエラーに備えてか、サブフレーム(32bit)につき1bitづつ送信する(Channel Status Wordは24byte=192bitで構成されるので、後述するように192フレームを1ブロックとして、ひとまとめにする:フレームをチャンネルごとに分けたのがサブフレームで、時系列の区切りとしてはどちらも同じ長さ、Channel Status Wordは名前どおりチャンネルごとに独立)。AES/EBUの場合、
byte00o00o10o20o30o40o50o60o7
役割フォーマットデータプリエンファシス外部同期サンプルレート
0のときConsumer(S/PDIF)PCM0b100でオフロック48KHz(デフォルト)、44.1KHz、32KHz、その他を選択する模様(未確認)
1のときProfessional(AES3)PCM以外アンロック

byte10o00o10o20o30o40o50o60o7
役割チャンネル情報チャンネル情報を示すユーザーデータ(未確認)
内容モノラル2本、ステレオ1本、差分ステレオなど不明

byte20o00o10o20o30o40o50o60o7
役割AUX BIT(time slots 4〜7)の使い方サンプルサイズ未使用
内容0b000で指定なし、0b001で4bit全部オーディオデータに使う音声用に使わないビットを指定するようだ(未確認)未使用

byte30o00o10o20o30o40o50o60o7
役割マルチチャンネル用のデータ

byte40o00o10o20o30o40o50o60o7
役割サンプルレート情報予約サンプルレートサンプルレート補正
内容AES11互換用らしい(未確認)予約サンプルレートが「その他」だった場合に使う模様(未確認)NTSC互換用にサンプルレートを1.001で割るフラグ

byte50o00o10o20o30o40o50o60o7
役割予約

 byte6〜9byte10〜13byte14〜17byte18〜21byte22byte23
役割ベンダ名などを示すASCII文字チャンネル制御用のASCII文字1フレームで1つ進むカウンタ時刻情報信頼性情報CRC
となっている。サンプルレートを指定しているのはノンリニアでの読み書きのためで、実際の同期にはBiphase mark codeに重ねたクロックを使う。

S/PDIFの場合かなり内容が異なり、
byte00o00o10o20o30o40o50o60o7
役割フォーマットデータコピーチャンネル数未使用プリエンファシスモード
0のときConsumer(S/PDIF)PCM禁止2未使用なし常に0らしい(未確認)
1のときProfessional(AES3)圧縮データ許可4あり

byte10o00o10o20o30o40o50o60o7
役割チャンネル情報コピーフラグ
内容媒体情報(CDとかDVDとか)媒体によって扱いが違うらしい(未確認)
となっている。

話が前後するが、データはサブフレームが最小のまとまりで、サブフレーム内の各bitをタイムスロットという。サブフレームは、同期(というかセパレータ)(0-3)、AUX(4-7)、データ(8-27)、バリディティ(28)、ユーザー(29)、チャンネルステータス(30)、パリティ(31)になっている。各チャンネルのサブフレーム(ステレオなら2つ)をまとめてフレームを作り、192フレームを1ブロックにして送信する(パリティビットがチェックサムで、バリディティビットは送信元機器からの「このブロックのデータ多分どっか間違ってる」というメッセージ)。

32bitで1サブフレーム、ステレオなら2サブフレームで1フレーム、192フレームで1オーディオブロックになり、1ブロックごとに24byteのチャンネルステータスを持つことになる。1フレームに各チャンネルの1サンプル分のオーディオデータが入っているから、48KHzサンプリングだと1ブロック=192フレーム=192サンプル=1/250秒=4msになる(ステレオだと1ブロック=1536byteだから、通信速度は384kbyte/s=3072kbps)。


限界いろいろ

人間の限界

音圧は、100db(コンサートホールでオーケストラを聴くときや、特に大きな音を出せる奏者のテナーサックスを1mの距離で聴いた場合の最大音量くらい)で連続2時間、115db(いわゆる「爆音」のロックコンサートくらい)だと連続15分で耳を痛める危険があり、130dbくらいで鼓膜に急性外傷が生じる。1KHzのサイン波だと最小可聴音は0dbだが、3KHz周辺だと-5dbくらいまで知覚できる。31.5Hzだと60dbくらいまで知覚できない。声量は、プロのオペラ歌手で100db@1mくらいが限界。多人数の声としては、2011年にトルコ・テレコム・アリーナというサッカー場で5万人ちょっとが絶叫した際の131.76dbというギネス記録がある(測定方法などは確認していない)。音楽の音量としては、ディープパープルが屋内で記録した117db(1973年のギネスブックに掲載)という記録があり、1976年にザ・フーが屋外で120dbを出して記録を更新、その後どんどんエスカレートしてマノウォーが139dbを記録するに至るが、あまりに危険な試みなので2008年にギネス・ワールド・レコーズが記録掲載をやめてしまった。

ちなみに、長距離音響装置LRAD(メーカーや運用者の言い分では兵器ではない)の最上位機種1000Xは30度の範囲で1km先に125dbを放射(想定時間は数秒)、スタングレネード(相手を確実に無力化できて、できれば死なないように作ってある兵器)の音が160〜180db(おそらくピーク値)。窓ガラスのような硬くて脆くて平らなものが140dbくらいから壊れ始め、空気で音を伝える場合の限界は190db(理論値)くらいらしい。音響ではなく爆風の場合、適切に治療しても死人が出始めるのが190dbくらい(瞬間的な曝露で鼓膜が破裂するのもこのくらいから)、丈夫な建造物が壊れるのが210dbちょっと、確実に死亡するのが220dbくらいになる(いずれも20μPa=0dbSPLとしたときの換算値)。

ハース効果は数十μs〜100μsくらいから、ほぼ同時に発音される2つの音(Fluidのスネアドラムとピックベースの音色でテスト)の時間的なずれは8msくらいから知覚できるようだ(筆者1人だけをサンプルとした実測:いづれも擬似ブラインドテストでまったく厳密でない)。ただし後者は時間的な遅れとして知覚するのではなく、音色の変化(2音が重なった音色としてのアタック感が変わる)としての知覚である。リズムの変化としては15msくらい差がないと知覚できず、筆者が試したところ、10ms以内のリズムの変化は全然判別できなかった(Fluidのドラムを使用して、表拍バスドラ裏拍スネアの裏拍をモタらせたファイルとモタらせないファイルでテスト:ただし、刻みハイハットなどであれば、10msくらいの変化でもノリの違いは知覚できる)。

可聴周波数域は下が20Hz程度まで、上が16000〜20000Hzくらいまでだが、音程として捉えられるのはピアノの最低音A0(約27.5Hz)〜最高音C8(約4186Hz)くらいまでらしい。ただし、20Hz以下の低周波でも、振幅が大きければ皮膚に伝わる振動や圧迫としては知覚できる。THDは0.3%くらいから知覚できる人がいるらしい。

志賀@高槻さんのオーディオの科学という記事に非直線歪みに関するデータが引用されているほか、BBSのログに位相歪みに関する基礎情報に触れたものもある(外部リンク)。


楽器や機材の限界

楽器の最低音は、一般的なグランドピアノが27.5Hz(一番下まで使う曲は非常にまれ)、コントラバスやエレキベースで41.2Hz(こちらは下まで使うこともけっこうある)、Low-B弦を足した5弦以上のエレキベース/コントラバスで30.87Hz、C装置つきの特殊なコントラバスで32.7Hz、ギターやバスヴォーカルで82.4Hz、チャーチオルガンで16Hz程度。音程根音の原理でもっと低い音を擬似的に作り出すことは可能だし、打楽器のアタックの瞬間などは楽器の音程と一致しない音も豊富に出る(が、実用上はどちらもあまり気にする必要がない)。

最高音は、ピッコロや一般的なグランドピアノや4オクターブ(49鍵)のチェレスタが4186Hz、ギターの1弦24フレで1320Hz、ソプラノヴォーカルで880Hz、チャーチオルガンで12.5KHz、5オクターブ(61鍵)または5オクターブ半(66鍵)のチェレスタで5.59KHzくらい(ハーモニクスやフラジオレットは無視:吹奏楽器は奏者の技量と根性次第でけっこうムリがきくものもある)。倍音があるのでこれ以上高い音が出ないというわけではない。

コンパクトカセットの音域は下が20〜30Hz、上が15000〜18000Hzくらい(9.6cm/s動作時)。PCMはサンプリング周波数の半分(ナイキスト周波数)まで記録できるが、アナログからの録音時にハイパスフィルタが必要なため、実際にはナイキスト周波数の9割ちょっとしか録音できない(デジタルシンセなどで直接データを生成するなら別)。44.1KHz(CD)だと20KHz、48KHz(パソコンの多くや一部のDAT)だと22KHzくらいまで。16bitリニアPCMのダイナミックレンジは98.08db、24bitだと146.24dbになる。可逆圧縮を行うと高域の情報が失われる(たとえばlameのバージョン3.96.1を使うと、192kbps時で19.5KHzくらいから上が切れる)。

アクティブピックアップの最大出力は、EMGのギター用で0.85〜3Vくらい(1.75Vが中心)、ベース用だと4.5Vくらい。これが開放端電圧だとすると、1〜15.5dbuくらいになる(あくまでピックアップが出力可能な最大値で、普通のセッティングで常にこの出力がなされるわけではない)。パッシブだとスパイク的なピークの上限は(アンプに制限されないため理屈上)上がるが、一般にはアクティブより出力が低い。なお、ミキサーなどのライン入力もハイヘッドルームと称するもので18dbuくらい、例外的な機種でも30dbuくらいまで。


通信の限界

USB1.1のFull Speedモードが12Mbps=1.5Mbyte/s、USB2.0のHigh Speedモードは480Mbps=60Mbyte/sだが、これはあくまでビットレート。ローレベルなレイヤーでは、125μsのマイクロフレーム(1秒に8000マイクロフレーム)にいくつのトランザクション(512バイトのデータを搭載する)を乗せられるかという問題で、9なら約300Mbps、10なら約330Mbps、11なら約360Mbpsになる(USB 2.0 specification section 5.5.4で20%の予約が規定されており、マイクロフレームの最大ビットレートの80%がMaximum Periodic bandwidthだとすると6000byte/マイクロフレーム、アイソクロナス転送のデータパケットは500byteを超えているから、12本乗せるのはムリ)。またHigh Speedモードでも、Audio Class 1.0の仕様に従う限り、最大帯域が12Mbpsに限定される(まったく未確認だが、もしマイクロフレームを飛ばさずに送信しているなら、転送量は1500bit/マイクロフレームで、データパケットのDataストリーム(規格上は0〜1023byte)が188byteくらいになる)。バルク転送の場合、チューニングした外付けハードディスクで250〜300Mbps程度らしい。

44.1KHz/16bit/2ch(CD音質)のリニアPCMが1411.2kbps(モノラルで705.6kbps)なので、USB2.0のHigh SpeedモードAudio Class 1.0の帯域を使い切れば、合計17chまで無圧縮で同時通信できる(たとえば、デジタル入出力各1系統ステレオ+アナログ入力1系統ステレオ+アナログ出力5.1chで12本)。48KHz/24bit/2ch/全二重の通信だと4.6Mbpsくらい、前述の通り48KHz/24bit/2chのAES or S/PDIFがオーバーヘッドなしで片道3Mbpsくらい。帯域制限を回避するためにBulk転送を使っている機種もあるが、Audio Class 1.0の用件を満たせないので、独自ドライバが必要になるのが普通(裏技で動かしているメーカーもある模様)。2009年5月にAudio Class 2.0が公開され、利用可能な帯域が増えた(2010年現在、一部の機器しか対応していない、というか、Windows7でのサポートが遅れているらしい:Macはさっさと対応したそうな)。

USBの仕様(リアルタイム通信はエラー垂れ流し)を考えるとエラー訂正信号の付加が必要そうだが、筆者が「Universal Serial Bus Device Class Definition for Audio Devices」と「Universal Serial Bus Device Class Definition for Audio Data Formats」を流し読みした限り、生データ(PCM、MPEGとAC-3、その他に分類されている)をそのまま送っているような雰囲気である(ちゃんと確認したわけではない)。下位レイヤーであるUSBケーブルでの通信自体、エラー率が十分低いのだという解説もあったが、具体的な実験結果などは見つからなかった(ちなみにS/PDIFもエラー訂正なし:訂正が入ると応答時間が犠牲になるのでやむを得ない部分もある)。

ビットレートで見ると、IEEE 1394(FireWire)も400Mbpsまで出せる(上位互換の拡張規格で3200kbpsまでのものもある)し、素のSCSIでも規格上は40Mbpsまで、Wide Ultra2では640Mbpsまで出る。32bit/33MHzの初代PCI(PC133)で1056Mbps、64bit/66MHzの最終規格で4224Mbpsまで、PCIeはギガ単位になるので、オーディオ用途では帯域を心配するだけ無駄である(それよりもリアルタイム転送の仕様が問題)。Ethernet用の1000BASE-Tは名前のとおり1000Mbps。

エンド・ツー・エンドのレイテンシは、PCIやInfiniBandなどで数msくらいのオーダーらしい(未確認)。


伝達

音波の伝達速度は非常に遅い。1気圧の乾燥空気では摂氏温度をtとして331.5+0.61t、正確には、比熱比をk、気体定数をR、絶対温度をTとして√kRTで表し、20℃において343.26m/s(音響インピーダンスは413.3N*s/m^3)。340m/s(1気圧20℃の場合に近い値)で近似することが多い。水蒸気を含む空気の場合、気圧をH、水蒸気圧をp、水蒸気の定圧比熱と定積比熱との比をγw、乾燥空気の定圧比熱と定積比熱との比をγとして√1-(p/H)(rw/r-0.622)分の1になる。

真空中の光速度は299792458m/sだが、媒質により伝達が遅くなる。導線の中の電気信号や光ファイバーの中の光信号は、だいたい200000000m/s(=2*10^8m/s)くらい、大気中を伝わる電磁波は3*10^8m/sくらいのオーダー(波長によるが、可視光で真空中よりも3%くらい遅い)。電気機器内部での伝達ならナノ秒前後のオーダーだろう(2*10^8m/sだと、200mで1μs、20cmで1ns、0.2mmで1ps:音波が伝達するときに「マッハの風」が吹いているわけではないのと同様、電子がこの速度で「移動」しているわけではない)。電磁波は300MHz弱(超短波=VHFと極超短波=UHFの境目くらい、どちらかといえばVHF寄り)で波長が1mになる。

銅線の表皮深さは1KHzで約2mm、周波数の1/2乗に反比例するから、20KHzで0.45mmくらいになる。


その他

インピーダンスいろいろ

オーディオ機器のインピーダンスは600Ωのものが多い(昔の電話機に合わせて統一したらしい)。600Ω以外では、ラインの入力インピーダンスで10〜25KΩ、マイクの入力インピーダンスで1〜10KΩ、エレキギター直結用の入力インピーダンスで1MΩ前後、スピーカの入力インピーダンスで数Ω、ラインの出力インピーダンスで1KΩ前後、マイクの出力インピーダンスで100〜1000Ω(ものにより数KΩ)、パワーアンプの出力インピーダンスで10Ω前後、ヘッドフォン用の出力インピーダンスで数十Ω(ハイインピーダンス対応品は1KΩ前後)、ギター/ベース用のマグネティックピックアップ(パッシブタイプ)の直流抵抗で5〜30KΩ、数千円〜1万円クラスのシールド線(バランス)で10〜数十Ω/km@20℃(ちなみに静電容量は数十〜100PF/m@1KHz)、Dsub25を使ったバランス伝送で110Ω、といったものが多い。


通信方式いろいろ

シリアル通信を複数チャンネル束ねたハイブリット的な方法もある(PCIeなど)。また半二重と全二重の分類は明確でなく、ハードウェア層が半二重でもアプリケーション層では全二重として扱えることが多い。

パラレル通信なら送受信装置をシンプルにできるが、同期や漏話の問題が厳しくなる(とくにクロックが高くなった場合)。パルスを使ったシリアル通信では時分割多重化(Time-division multiplexing/TDM:各チャンネルのデータストリームをフレームに区切って順に送り、またチャンネルごとに仕分けする)などの方法でシリアル区間を通している。


CD-DAのエラー訂正

16bit*2ch*6sample = 192bitの実データに対して588bitのフレームを用意している(詳細についてはSpecification of Compact Disc(外部リンク)というページの説明を参照:192bit記録可能なフレームが98集まって、2352byte記録可能な1セクタを成す)。上記リンク先によると、CDが想定する平均エラーレートは10^-5で、上記の冗長性により(CIRCによる訂正だけで)10^-9程度には収まるらしい。CD-ROMではさらにエラー訂正情報(以外のものも含まれているが)を増やして、2352byteのセクタに対して実データを2048byteとしている(その場合に想定される読み取りエラーは「650MBのCD−ROM183枚に対して1ビットのエラー率」らしい)。


レガシー機器の帯域

以下未確認情報。

電話の仕様はITU(International Telecommunication Union:国際電気通信連合)という組織のITU-T(International Telecommunication Union Telecommunication Standardization Sector:旧CCITT、Comite Consultatif International Telegraphique et Telephonique)という部門が出している勧告に従ったものが多いそうな。アナログ電話の音声は0.3〜3.4KHz、ISDNは同等の帯域を8KHz/8bit=64kbpsのデジタルデータで送る。

AMラジオの占有周波数帯域幅は15kHzで音声は7.5kHzが上限だが、チャンネルセパレートが9kHzでクロストークがあるため3〜5KHzで切るらしい。FMラジオとアナログテレビの音声(同方式)は15KHzが上限。アナログハイビション(BS-hiなどで採用されていたMUSE方式)は、Aモードが32KHz/12bit/4chで、Bモードが48kHz/16bit/2ch。

コンパクトカセット(アナログのカセットテープ)は、ポジションにもよるが、下が20〜30Hz、上が15000〜17000Hzくらい。オランダのフィリップス社が開発した。オープンリールの最低速の半分である4.75cm/s(1.875″/s)で走る。4トラックを往復で2トラックづつ、ステレオで使う。

コンパクトディスク(CD)は16bit44.1KHzのPCM方式で、最高音は22050Hzまで出る。ソニーとフィリップスの共同開発。99トラックまで、最大74分(非標準的なものでは最大94分)まで録音可能。

DAT(Digital Audio Tape)は、12bit32kHz(LPモード)/16bit32kHz/16bit44.1kHz/16bit48kHzのPCM方式で、最高音はそれぞれサンプリング周波数の半分。

なお、アナログテレビの規格であるNTSC(アメリカや日本などが採用)はちょっと面倒な事情を抱えており、カラー化の際に音声を4.5MHz帯で送る都合から映像はその整数分の1で送る必要に迫られ、水平同期は4.5/286MHz≒15.7343KHz、垂直同期は4.5/(286*525)MHz≒29.9700Hzをインターレースで使って59.9401Hzになった(286は白黒の同期周波数に近いものを探して、525は走査線数から決まった)。286 * 525=150150=150 * 1001なので、4.5/(286*525)=4.5 / (150 * 1001)=30000 / 1001=30 / 1.001と「割る1001」や「割る1.001」で表現される(実用上は59.94フレーム/秒としたり、60fr/sから0.1%割り引いたりすることが多い:60fr/sを1001で割ればちょうど正確な値になる)。ISDB(日本で採用)系の規格では、いまだにこの端数を引き摺っている。


サンプルレートと周波数

サンプルレート44100Hzのとき、nサンプル周期の音波の周波数がいくつになるか。
2 / 22050Hz11 / 4009.1Hz20 / 2205Hz29 / 1520.7Hz
3 / 14700Hz12 / 3675Hz21 / 2100Hz30 / 1470Hz
4 / 11025Hz13 / 3392.3Hz22 / 2004.5Hz31 / 1422.6Hz
5 / 8820Hz14 / 3150Hz23 / 1917.4Hz32 / 1378.1Hz
6 / 7350Hz15 / 2940Hz24 / 1837.5Hz33 / 1336.4Hz
7 / 6300Hz16 / 2756.3Hz25 / 1764Hz34 / 1297.1Hz
8 / 5512.5Hz17 / 2594.1Hz26 / 1696.2Hz35 / 1260Hz
9 / 4900Hz18 / 2450Hz27 / 1633.3Hz36 / 1225Hz
10 / 4410Hz19 / 2321.1Hz28 / 1575Hz37 / 1191.9Hz
1サンプルは約22.6757μsに相当する。

サンプルレート48000Hzの場合。
2 / 24000Hz11 / 4363.6Hz20 / 2400Hz29 / 1655.2Hz
3 / 16000Hz12 / 4000Hz21 / 2285.7Hz30 / 1600Hz
4 / 12000Hz13 / 3692.3Hz22 / 2181.8Hz31 / 1548.4Hz
5 / 9600Hz14 / 3428.6Hz23 / 2087.0Hz32 / 1500Hz
6 / 8000Hz15 / 3200Hz24 / 2000Hz33 / 1454.5Hz
7 / 6857.1Hz16 / 3000Hz25 / 1920Hz34 / 1411.8Hz
8 / 6000Hz17 / 2823.5Hz26 / 1846.2Hz35 / 1371.4Hz
9 / 5333.3Hz18 / 2666.7Hz27 / 1777.8Hz36 / 1333.3Hz
10 / 4800Hz19 / 2526.3Hz28 / 1714.3Hz37 / 1297.3Hz
1サンプルは約20.833...μsに相当。3サンプルで62.5μs、6サンプルで125μs、12サンプルで250μs、24サンプルで500μs、48サンプルで1000μs=1msになるのを覚えておくと便利かもしれない。


google電卓用プリセット

式は代入の回数が減るように変形した。以下に半値幅とあるのは半値全幅のこと。

周波数a(Hz)と周波数b(Hz)の音程の違い(cent):
(log(a / b) / log(2)) * 1200 =
周波数a(Hz)の音とb(cent)音程が違う音の周波数(Hz):
a * (2^(b / 1200)) =
1200の部分は、bの単位がhalfstepなら12、octarveなら1にする。

相対速度a(m/s)におけるドップラー効果(周波数比):
(340 + a) / 340 =
相対速度a(m/s)におけるドップラー効果(cent):
(log((340 + a) / 340) / log(2)) * 1200 =
a(cent)のドップラー効果を生む相対速度:
(340 * (2^(a / 1200))) - 340 =
相対速度は、音源と観察者の直線距離が減少する方向が正。秒速1m(時速3.6km)で約5cent、秒速10m(時速36km)で約50cent(半音)の変化。音速=340(m/s)での計算。

テンポがa(BPM)(1分間に4分音符a回)のときb分音符の長さ(秒):
240 / (a * b) =
4分音符の場合は:
60 / a =
4分の4拍子なら、全音符(b=1)の長さを求めれば1小節の長さがわかる。

テンポa(BPM)で分解能b(チックス/小節)のとき、c(秒)の音価(チックス):
(a * b * c) / 240 =
テンポa(BPM)の1拍とテンポb(BPM)の1拍を合成してできる2拍の平均テンポ(BPM):
2 / ((1 / a) + (1 / b)) =
テンポa(BPM)の1拍とテンポb(BPM)の1拍を合成してできる2拍の合計音価がc(チックス)のとき、各拍の音価(チックス):
c * (b / (a + b)) =
c * (a / (b + a)) =
上の式が先の拍で下の式が後の拍だが、片方わかれば単純な引き算でも求められる。

テンポがa(BPM)でb:cのスイングをするときの分割されたテンポ:
a * ((b + c) / (2 * b)) =
a * ((b + c) / (2 * c)) =
上の式で導いたテンポと下の式で導いたテンポを同じチックス間隔(たとえば8分音符分)で繰り返すと、タイムがb:cに分割される。同じ演算を入れ子にすることもできる。

テンポがa(BPM)のときb分音符連打の周波数(Hz):
(a * b) / 240 =
テンポがa(BPM)のときb(Hz)の音価:
240 * (b / a) =
テンポ90のとき6Hzは240 * (6 / 90) = 16分音符の連打に相当。

周波数a(Hz)の音と音程がb(cent)違う音がなす音程根音(第一次差音)の周波数(Hz):
((a - (a * (2^((b) / 1200))))^2)^(1 / 2) =
bはプラスでもマイナスでもよい。やはり、1200の部分はbの単位がhalfstepなら12にする。音程根音が可聴周波数域を下回っている場合、擬似下方倍音としてではなく音量のうねり(トレモロのような効果)として知覚される(これをうなり(beat)と呼ぶ)。

周波数a(Hz)の音に対して音程根音(第一次差音)の周波数がb(Hz)となるようなaより高い音の、aから見た音程差(cent):
((log ((a + b) / a)) / log(2)) * 1200 =
周波数a(Hz)の音に対して音程根音(第一次差音)の周波数がb(Hz)となるようなaより低い音の、aから見た音程差(cent):
((log ((a - b) / a)) / log(2)) * 1200 =

ある強さの信号と、a(db)大きさが異なる信号を加算したときの大きさの変化(db)(ホワイトノイズや同周波数同位相の正弦波などを重ね合わせる場合:音波でも電気信号でも同様):
log(1 + 10^(a / 20)) * 20 =
ある強さの信号に大きさが異なる信号を加算した結果、a(db)音が大きくなっていた場合、元の信号を基準にした加算した信号の大きさ(db)(上と同じ条件):
log(10^(a / 20) -1) * 20 =

元の周波数のa倍とa分の1倍で半値になるのときのQ:
a / (a^2 - 1) =
元の周波数のa(オクターブ)上下で半値になる(半値幅2a)のときのQ:
(2^a) / ((2^a)^2 - 1) =
半値幅がaオクターブのときのQ:
(2^(a / 2)) / ((2^(a / 2))^2 - 1) =
Qがaのときの半値幅(オクターブ):
(log(((1 / a + ((1 / a^2 + 4)^(1/2))) / 2)^2) / log(2)) =
半値幅をオクターブで求めて半分にする(または上の式から最後の「^2」を削除する)と元の周波数から何オクターブ上下で半値になるかわかる。よく使うのは
Q半値幅(oct)備考
0.5772.26ベッセル
0.6672上下1oct(2/3)
0.7071.90バタワース(1/√2)
0.9201.5
11.388黄金比
1.4141(√2)
1.50.945
20.714
2.1450.6672/3oct
2.8710.51/2oct
4.3180.3331/3oct
あたりだろうか。



戻る / 自滅への道トップページ