データ

周波数と音程 / 調とコード / ベース / 距離と時間に関する数値と計算
/ MIDI / RIFF WAVE / IEC 60958 / 限界いろいろ / その他 // もどる

他のページで利用したデータを再掲するとともに、それ以外で有用と思われるデータを新規に作成した。便宜のためタブ区切りテキストとcsvフォーマットのファイルを用意したものもある。

このページ（http://yppts.adam.ne.jp/music/data.html）の2次利用について筆者は、ライセンスのページにある「出典の明示」を求めない。

周波数と音程

度と周波数

Cから半音づつ上行した場合の周波数の変化（タブ区切りテキスト、csvフォーマット）。有効桁数9桁で求めたうえで7桁目まで丸めてある。括弧内は純正律での数字（減5度は説が一定していないので仮にルート2としておく）で、コロンの後ろは平均律との差（セント単位で小数点以下3位に丸めた）。

周波数	英略名	和名	音名	距離	root音との関係
1（1）	p1	完全1度	C	0	ユニゾンという
1.059463（16/15：+11.731）	m2	短2度	Db	1	長7度下行と同義
1.122462（9/8：+3.910）	M2	長2度	D	2
1.189207（6/5：+15.641）	m3	短3度	Eb	3	長6度下行と同義
1.259921（5/4：-13.686）	M3	長3度	E	4
1.334840（4/3：-1.955）	p4	完全4度	F	5	完全5度下行と同義
1.414214	d5	減5度	Gb	6	三全音（トライトーン）という
1.498307（3/2：+1.955）	p5	完全5度	G	7	完全4度下行と同義
1.587401（8/5：+13.686）	a5	増5度	G#	8	長3度下行と同義
1.681793（5/3：-15.641）	M6	長6度	A	9
1.781797（16/9：-3.910）	m7	短7度	Bb	10	長2度下行と同義
1.887749（15/8：-11.732）	M7	長7度	B	11
2（2）	p8	完全8度	C	12	オクターブという

平均律の場合、減5度（G♭）は増4度（F#）、増5度（G#）は短6度（A♭）、短2度（D♭）は増1度（C#）と異名同音。

平均律

上記の表からA4=440Hzとして平均律の周波数を求めたもの（タブ区切りテキスト、csvフォーマット）。まず440に表の数字を掛け算/割り算してC4～B4までの周波数を求め、それを2のべき乗で掛け算/割り算して、最後に有効桁数4桁に丸めてある（ので、ある音の周波数を2倍したものと、1オクターブ上の音の周波数が食い違う場合がある）。B8から下はHz、C9から上はKHzが単位。

	0	1	2	3	4	5	6	7	8	9	10
C	16.35	32.70	65.41	130.8	261.6	523.3	1047	2093	4186	8.372	16.74
C#	17.32	34.65	69.30	138.6	277.2	554.4	1109	2217	4435	8.870	17.74
D	18.35	36.71	73.42	146.8	293.7	587.3	1175	2349	4699	9.397	18.79
D#	19.45	38.89	77.78	155.6	311.1	622.3	1245	2489	4978	9.956	19.91
E	20.60	41.20	82.41	164.8	329.6	659.3	1319	2637	5274	10.55	21.10
F	21.83	43.65	87.31	174.6	349.2	698.5	1397	2794	5588	11.18	22.35
F#	23.12	46.25	92.50	185.0	367.0	740.0	1480	2960	5920	11.84	23.68
G	24.50	49.00	98.00	196.0	392.0	784.0	1568	3136	6272	12.54	25.09
G#	25.96	51.91	103.8	207.7	415.3	830.6	1661	3322	6645	13.29	26.58
A	27.50	55.00	110.0	220.0	440.0	880.0	1760	3520	7040	14.08	28.16
A#	29.14	58.27	116.5	233.1	466.2	932.3	1865	3729	7459	14.92	29.83
B	30.87	61.74	123.5	246.9	493.9	987.8	1976	3951	7902	15.80	31.61

参考までに、四捨五入前のデータも公開しておく（タブ区切りテキスト、csvフォーマット）。ちなみに1セントは周波数にして1.00057779倍、440HzのA4と442HzのA4の差は7.85セントである。

オクターブの表記

440Hz前後のAをA4、そのすぐ下のCをC4（261.6Hz前後）、A4のすぐ上のBをB4（493.9Hz前後）として、BからCに音程が上がる際にオクターブを示す数字を変える（B3の半音上はC4、B4の半音上はC5）「国際式」を基準に説明する。一般的な88鍵のピアノでは、最低音がA0、最高音がC8、中央のドがC4に相当する。

ドイツ式では、C3～B3をc～hとして1オクターブ上がるごとに右上に数字を付け、C2～B2をC～Hとして1オクターブ下がるごとに右下に数字を付ける（hとHは国際式でいうBの音）。日本式もこれと同様で、C3～B3をハ～ロとして、1オクターブ上がるごとに点を付け、C2～B2をは～ろとして1オクターブ下がるごとに下点を付ける（ハニホヘトイロが国際式のCDEFGABに相当）。

俗用ではあるが、440HzのA4をhi-Aと称し、A4～G#5をhi、A3～G#4をmid2、A2～G#3をmid1、A1～G#2をlowとする（hiより上はhihiなど1オクターブ上がるごとにhiを増やし、lowより下はlowlowなど1オクターブ下がるごとにlowを増やす）表記もある。C～BでなくA～G#の区切り（多分、ブルース用の10穴ハーモニカのキー表示を流用したのだと思う：ブルースの場合key＝Aが基準になることが多い）となっており、しかも単に「hi-A」などというと「その楽器が一般的に使用するAのうち高い方」という意味もある（たとえばエレキベースで「hi-C弦」というと「開放でC3の音が出る弦」のこと、「low-B弦」というと「開放でB1の音が出る弦」のことを指す）ため、やや紛らわしい。

MIDIのnote numberは、0がC-1なのが一般的で、そこから12ごとに、12がC0、24がC1、36がC2・・・120がC9、127がG9に相当する（鍵盤からシンセベースを操作するときなどは、適宜オクターブシフトさせる）。周波数で言うとC-1≒8.175Hz、G9≒12.54KHzで、C-1の1～2倍音は音波ではなく低周波になる。

調とコード

調号

同主は同主調、属平は属調平行調、下属平は下属調平行調、同平は同主調平行調、ハイフンは遠隔調を表す。GbとF#、EbmとD#mを別の調として扱っているが、平均律では一致する（つまりこの表はループできる）。

音程の距離

b/#の数

調の名前

Gb
Ebm

Db
Bbm

Ab
Fm

Eb
Cm

Bb
Gm

F
Dm

C
Am

G
Em

D
Bm

A
F#m

E
C#m

B
G#m

F#
D#m

Cから見た関係

-
-

同平
同主

-
-

下属調
下属平

主調
平行

属調
属平

-
-

Amから見た関係

-
-

下属平
下属調

平行
主調

属平
属調

-
-

同主
同平

-
-

新たにb/#する
トーン

C＞
Cb

G＞
Gb

D＞
Db

A＞
Ab

E＞
Eb

B＞
Bb

なし

F＞
F#

C＞
C#

G＞
G#

D＞
D#

A＞
A#

E＞
E#

b/#の別解釈

#10

なし

別解釈時の調名

F#
D#m

C#
A#m

G#
Fm

D#
Cm

A#
Gm

なし

A
Gbm

E
Dbm

B
Abm

Gb
Ebm

表を右に1つ進むと完全5度上行（完全4度下行）、左に1つ進むと完全5度下行（完全4度上行）になる。右に2つ進むと長2度上行、左に2つ進むと長2度下行である。表には一応記入してあるがb/#の数が7を超えることはまずない（ピアノの白鍵7種類しかないし：Dbから同主調転調してDbmになったり、G#mから同主調転調してG#になったりするくらい）。理論上は、#を11書いてE#だと言い張ることが不可能ではないが、誰もが「それはFだろ」とツッコミを入れるはず。

b/#が偶数個の場合、C/Amからその個数分上下行した音名が調の名前になる。たとえば#が4つのメジャーキーであればCから半音4つ（長3度）上のEということになる。b/#が奇数個の場合、上の表で左方向になるよう1つずらして数え、5度上げればよい。たとえばbが5つのマイナーキーであれば、bが6つの調をまず考えるとAmから半音6つ（全音3つ）下のEbmで、そこから5度上がるので都合Bbmになる。Bの右側（5度上）を境にb/#のつき方が変わることを覚えておくとよい。

関係調からの借用コード

調性外の音を使う場合などの参考に。ナチュラルメジャーとナチュラルマイナーだけ。

メジャー	I6/M7(T)	IIm6/7(SD)	IIIm7(T)	IV6/M7(SD)	V6/7(D)	VIm7(T)	VIIφ(D)
属調	VM7	VIm6	VIIm7	なし	II6/7	なし	IV#φ
下属調	なし	Vm6/7	なし	VIIb6/M7	I7	なし	IIIφ
マイナー	Im7(T)	IIφ(D)	IIIb6/M7(T)	IVm6/7(SD)	Vm7(D)	VIb6/M7(SD)	VIIb6/7(SD)
属調	なし	VIφ	VIIbM7	Im6	IIm7	なし	IVb6/7
下属調	なし	Vφ	なし	VIIm6/7	なし	IIb6/M7	IIIb7

たとえば「メジャーの欄」「属調の行」「IIm6/7(SD)の列」に「VIm6」とあるのは、「メジャースケールにおいて」「属調のIIm6を借用すると」「主調から見たVIm6というコードになる」という意味。Key on Cに当てはめると、「Key on Cにおいて」「Key on GのIIm6（＝Am6）を借用すると」「Key on Cから見たVIm6というコードになる」ということ。太字はトライアドでも調性外のコードで「IIIb6/M7」などとあるのは「IIIb6またはIIIbmaj7」の意。「なし」は調性外の音が鳴らないことを示す。

ついでに関係調と共通するコードも。

メジャー	I6/M7(T)	IIm6/7(SD)	IIIm7(T)	IV6/M7(SD)	V6/7(D)	VIm7(T)	VIIφ(D)
属調	V6	VIm7	なし	I6/M7	なし	IIIm	なし
下属調	IV6/M7	なし	VIm7	なし	I6	IIm7	なし
マイナー	Im7(T)	IIφ(D)	IIIb6/M7(T)	IVm6/7(SD)	Vm7(D)	VIb6/M7(SD)	VIIb6/7(SD)
属調	Vm7	なし	VIIb6	Im7	なし	IIIb6/M7	なし
下属調	IVm7	なし	VIb6/M7	なし	Im7	なし	IIIb6

たとえば「マイナーの欄」「下属調の行」「Im7(T)の列」に「IVm7」とあるのは、「マイナースケールにおいて」「下属調のIm7を借用すると」「主調のIVm7に一致する」という意味。「なし」は調性内に一致するコードがないという意味。

メジャースケールでの調性外コードとして、下属調のIIm>V＞Iを借りてI＞Vm>I＞IVとしたり、平行調からIVm（サブドミナントマイナー）を借りてIV＞IVm＞IorVなどとする例がよく見られる。III＞VIm（1-3-6-2-5-1の一部など）の形でIIIやIII7が使われるケースも多いが、これは平行調のナチュラルマイナーがハーモニックマイナーモードまたはメロディックマイナーモードにモーダルインターチェンジした場合のV＞Imを借用したと解釈できる。もちろん、裏コード（ドミナントセブンなどを三全音平行移動したコード）やセカンダリードミナント（トニック以外のダイアトニックなメジャーまたはマイナーコードに解決するドミナントセブン：ディミニッシュマイナーは解決先として想定しないのが普通）もよく使われるコードである。

各調におけるコードの機能

各調またはモードにおけるコードのファンクションを一覧にした。T/D/SDの区別は「ドミナントの緊張感を解決してキーの安定感を出せる和音がトニック代理（T）」「強い緊張感があり解決を要求する和音がドミナント代理（D）」「強い安定感も強い緊張感もないのがサブドミナント代理（SD）」というのが基本。

キー	T	D	SD
ナチュラルメジャー	IM7、VIm7、IIIm7	V7、VIIφ	IVM7、IIm7
ナチュラルマイナー	Im7、III♭M7	Vm7	IVm7、VI♭M7、VII♭7、IIφ
ハーモニックマイナー	ImM7、III♭augM7	V7、VIIdim7	IVm7、VI♭M7、IIφ
メロディックマイナー	ImM7、III♭augM7	V7、VIIφ	IV7、VIφ、IIm7

ただし、用法によって機能は変化し得る。たとえば、ナチュラルメジャーにおけるIIImはIVに進む場合がトニック代理（T）でIかVImに解決する場合にはドミナント代理（D）と扱う場合があるし、VImもIに解決する場合はサブドミナント代理（SD）でそれ以外はトニック代理（T）と扱う場合がある。メロディックマイナーのVIIaug7はトニック代理でよいのだろうか（ちょっと自信がない）。

解決感があるかないかに注目して分類することが多いようだが、厳密な根拠はよくわからなかった。おそらく、たとえば「IIIm＞Iと進行するとIIImの緊張感が目立つ」とか「VIm＞Iと進行するとVImが思ったほど安定していないのがバレる」とか、聴覚上の根拠を元にしているのだろうと思う。また、サブドミナントの不安定感はドミナントの不安定感とやや異なり、調性の揺らぎを含むことがある（ivやviのトーンが重要な役割を果たす）。

VII♭、IIφ、III♭aug、IVφあたりも前後関係や人により解釈が分かれている。II♭M7（サブドミナント代理：フリジアンモード由来でナポリ和音とも）とII♭7（ドミナント代理：いわゆる裏ドミナント）のように、セブンスのつき方でファンクションが変わる例もある（ただしテンションは考慮しないのが普通）。

More Jamの解説（その1、その2、その3、その4）（外部リンク）を読んでみたが、どうやら

機能	構成音
T	iiiを含みivを含まない
Tm	iii♭を含みivを含まない
SD	ivとviを含みviiを含まない
SDm	ivとvi♭を含みviiを含まない
D	ivとviiを含む（トライトーン）
Dm	ivと♭viiを含む（不安定感は弱い）

というルールで機械的に解釈する流儀もあるようだ（D、Dm、SDmのうち複数の条件を同時に満たす場合はこの順に優先）。この文脈では、たとえば「トニックマイナー」という語は、キーにマイナー感を付与しつつ安定させるコードという意味であって、該当するコードがメジャーコードかマイナーコードかに関わりがない（たとえばIII♭はメジャーコードだがTm扱い：Iの代理ではなくImの代理であるという意味）。

このルールで分類すると、上の表とは食い違う分類になるコードがいくつかある。あくまで「モーダルインターチェンジを中心とした解釈ではこうなる」という分類なので、他の流儀での分類と食い違うこと自体に問題はない。

コンバージョン

他のコードをマイナーからの派生扱いする（マイナーコンバージョン）。

種類	変換先	例	補足例
メジャー	長6度上（短3度下）のマイナー	C＞Am	C6＞Am7
マイナー	変換不要	なし	なし
ディミニッシュ	短3度上のマイナー	Bm(-5)＞Dm	Bφ＞Dm6
ドミナントセブン	完全5度上のマイナー	G7＞Dm	G7＞Bφ＞Dm6

他のコードをメジャーからの派生扱いする（メジャーコンバージョン）。

種類	変換先	例	補足例
メジャー	変換不要	なし	なし
マイナー	短3度上のメジャー	Am＞C	Am7＞C6
ディミニッシュ	減5度上（増4度下）のメジャー	Bm(-5)＞F	Bφ＞Dm6＞F
ドミナントセブン	長2度下のメジャー	G7＞F	G7＞Bφ＞Dm6＞F

ナインスコードなどは扱いが変わるようだが、とりあえず上記だけおさえておけばなんとかなりそう。

トライトーンの解決

V7の7度音ivと3度音viiがなすトライトーンがどう解決されるかの一覧。コードファンクションはivの解決を基準にすることが多い。

解決先	ivの解決先	viiの解決先	種別	備考
I	iiiに半音下行	iに半音上行	メジャー受け	もっとも安定
VIm	iiiに半音下行	iに半音上行	代理受け	トライトーン自体は完全に解決
IIIm	iiiに半音下行	viiに留め置かれる	半端な代理受け	viiが解決されない
Im	biiiに全音下行	iに半音上行	マイナー受け	biiiへの解決をiiに奪われることがある
bIII	biiiに全音下行	bviiに半音下行	マイナー代理受け	さらに解決感が薄い

トライトーンを作ってiに半音上行で解決するviiを上行導音、トライトーンを作ってiiiに半音下行で解決するivを下行導音と呼ぶ（クラシックでは上行導音が高い音域に、下行導音が低い音域にくる形が好まれる：導音が2つあることを前提とした言い方）。

これを反対から見て、同種の解決ができるコードを一覧にする（ナチュラルメジャー/ナチュラルマイナーに出現するもののみ）。

条件	コード	備考
iiiとiを含む	I、VIm	IV△7だとivが解決されない
biiiとiを含む	Im、bVI	IVm7だとivが解決されない
iiiとviiを含む	IIIm、V6	I△7omit1もこの形
biiiとbviiを含む	bIII、bVIIsus4	Im7omit1もこの形

コードファンクションとしてどうなるのかは別として、トライトーンの解決だけ考えるとIIImもV6も大差ない。トニック（というかIの代理）としての機能をとくに強調する場合、VImをI6 omit5 on viと解釈することもできなくはない。

ドミナントモーションを利用した展開

プライマリードミナントおよびその派生コードを解決する進行（タブ区切りテキスト、csvフォーマット）。

コード	IまたはImへ	VImへ	IIImへ	bIIIへ	解釈	備考
V7	完全4度上行	全音上行	長6度上行	増5度上行	ドミナントセブン	もっとも明確なドミナントモーション
bII7	半音下行	増5度上行	短3度上行	全音上行	ドミナントセブンの裏コード	オルタードスケールで通常のドミナントと相互接続
VIIm(-5)	半音上行	全音下行	完全4度上行	長3度上行	ドミナントセブンのomit1	完全4度上行で解決したがるモーションも強い
IVm(-5)	完全5度上行	長3度上行	半音下行	全音下行	裏コードのomit1	半音上行や完全4度上行の引力を振り切る形になりやや弱い
IIm6	全音下行	完全5度上行	全音上行	半音上行	ハーフディミニッシュの第1回転形	5度音を半音下げてdim7の形も使える
bVIm6	長3度上行	半音上行	増5度上行	完全5度上行	ハーフディミニッシュの裏の第1回転形	omit5にすると軽くなり半音下げてdim7の形も使える
Vm7	完全4度上行	全音上行	長6度上行	増5度上行	ドミナントマイナー	ツーファイブの一部として使える
bIIm7	半音下行	増5度上行	短3度上行	全音上行	ドミナントマイナーの裏	ツーファイブの一部として使える
IV on V	完全4度上行	全音上行	長6度上行	増5度上行	フュージョンコード	非常に曖昧なドミナントモーション

受けの強さはI＞VIm＞Im＞IIIm＞bIIIといったところか。

上記のほか、V7はbIIIaug（ハーモニックマイナーなどで出てくる：トニックマイナー代理）でも受けられるので、「bIIIへ」は「bIIIまたはbIIIaugへ」と読み替えてもよい。III（ハーモニックメジャーで副次的に出てくる：IIIsus4(-4)とは普通書かない）やVI（メロディックフリジアンなどで副次的に出てくる）、IとbIIIのdim7、IIIとVIのハーフディミニッシュもトニック扱いすることがある（前の項を参照）。

なお、上記は当然セカンダリードミナントにも応用できる。

コードとモーダルインターチェンジ

あるコードが鳴っている場合にルートを変えずに利用可能な（モーダルインターチェンジの文脈での）モードと、コードのルートから見たモードの特徴音の度数（表記としてやや奇妙だが便宜のためテンション扱い）。括弧内は核音（nuclear tones＝iとivとv）以外のコード構成音（浮動音＝floating tones）。ナチュラルメジャーとナチュラルマイナーは省いて記述。

iiを含まないコードで、iiiが構成音の場合アラビア系モード、iiibが構成音の場合フリジア系モード、どちらも構成音でない場合は両方が候補になるが、追加でiiをフラットできるというだけなので一覧では省いた。括弧書きのモードは安定感や影響力が比較的弱い（どのモードにも、もっとも安定感の高いナチュラルメジャーに解決したがる傾向がいくらかある）。フリジアンモード（ナチュラルマイナーからiiだけフラットした形）以外のフリジア系とアラビア系モードは、すべて括弧書きに準じる（アラビア系モードはとくに不安定）。

ナチュラルメジャーのダイアトニックコード。

I(iii)：メジャー系モードすべて;b7,b9,b13など
I△7(iii,vii)：（ハーモニックメジャー;b13）
I7(iii,bvii)：ミクソリディアン;b7、（エオリアンメジャー;b13,b7）
IIm(ii,vi)：ミクソリディアン;b13、ドリアン;b9,b13;、メロディックマイナー;b9
IIm7(ii,vi)：同上
IIIm(iii,vii)：（ハーモニックメジャー;b11）
IIIm7(ii,iii,vii)：同上
IV(vi)：ミクソリディアン;b11、ドリアン;b7,b11、メロディックマイナー;b7
IV△7(vi,iii)：ミクソリディアン;b11
IV7(vi,biii)：ドリアン;b7,b11、メロディックマイナー;b7
V(ii,vii)：（ハーモニックメジャー;b9）、ハーモニックマイナー;b9,b13、メロディックマイナー;b13
V7(ii,vii)：同上、ただしiiをフラットさせてよいならフリジア系モードも使える
VIm(iii,vi)：ミクソリディアン;b9
VIm7(iii,vi)：同上
VIIm(-5)(ii,vii)：（ハーモニックメジャー;dim7）、ハーモニックマイナー;dim7,b11、メロディックマイナー;b11
VIIm7(-5)(ii,vii)：同上

ナチュラルマイナーのダイアトニックコード

Im(biii)：マイナー系モードすべて;6,△7,b9など
Im7(biii,bvii)：ドリアン;13
IIm(-5)(ii,bvi)：ハーモニックマイナー;dim7、メロディックマイナー;dim7,dim6、（エオリアンメジャー;9）
IIm7(-5)(ii,bvi)：同上
bIII(biii,bvii)：ドリアン:#11
bIII△7(ii,biii,bvii)：同上
bIII7(bii,biii,bvii)：フリジアン;b7（iiがフラットしているのでフリジア系になる）
IVm(bvi)：ハーモニックマイナー;#11、（ハーモニックメジャー;△7,#11）、（エオリアンメジャー;△7）
IVm7(bvi,biii)：ハーモニックマイナー;#11
Vm(ii,bvii)：ドリアン;9、ミクソリディアン;9,13、（エオリアンメジャー;13）
Vm7(ii,bvii)：同上
bVI(biii,bvi)：ハーモニックマイナー;#9
bVI△7(biii,bvi)：同上
bVI7(biii,bvi,bv)：核音とぶつかる;b7がキーから見てbvなので#13扱い
bVII(ii,bvii)：ドリアン;△7、ミクソリディアン;△7,#11、（エオリアンメジャー;#11）
bVII△7(ii,vi,bvii)：ドリアン;△7、ミクソリディアン;△7,#11
bVII7(ii,bvi,bvii)：（エオリアンメジャー;#11）

V7で使えるモードは例外が多い（5度音であるiiをフラットさせてよいなど：基本的に「ハーモニック」という名前がついたスケールは何でも使える）。また、V7をナチュラルメジャーで演奏する場合、vをルートにした視点に切り替えて「ミクソリディアンを使う」と表現することが多い（オルタードやコンディミなどルートをiに置く意味がないスケールもv視点で表記する：ナチュラルメジャーでの演奏とvルートのミクソリディアンでの演奏は（CメジャーとAマイナーなどの比較と同様）同じでないため、そのニュアンスが必要な場合は呼び分けなければならない）。それ以外、たとえば「ハーモニックマイナーを使う」と言った場合は「iから始まるハーモニックマイナー」を指すことがほとんど。

V7でハーモニックマイナーを使う場合「vから見て5度下であるiから始まる」という意味の「perfect5th below」をつけて、さらに略記にして「Hmp5↓」などと表記することがある（「はぁもにっくまいなぁぱぁふぇくとふぃふすびろぅ」と読む）が、モーダルインターチェンジの文脈でやり取りしている限り、単に「ハーモニックマイナー」と書いても不都合はあまりない（裏コードやセカンダリードミナントやコンバージョンが絡んでくると、どこを起点にしたスケールなのか確認する必要が出てくる）。

モードを変える直前のコードによっても変化のつき方が変わる。たとえばトニック系のコードはiiiまたはbiiiの存在感が大きいので、直後にメジャー/マイナーの入れ替えをやると大きな変化に感じる。メジャーキーでIImを鳴らしてから途中でメロディックマイナーに移り、そのままV7に進むような場合は変化がさりげなくなる。IV△7（iiiは含まれているが存在感は強くない）あたりからマイナー系モードに進むと中間的な感じになる。

借用/共通コードも一覧にしておく。

ナチュラルメジャーからミクソリディアン（特徴音bvii）にモーダルインターチェンジしたときの借用コード：bVII、Vm、IIIm(-5)、I7
ナチュラルメジャーからメロディックマイナー（特徴音biii）にモーダルインターチェンジしたときの借用コード：bIIIaug、Im、VIm(-5)、IV7
ナチュラルメジャーからハーモニックマイナー（特徴音biii,bvi）にモーダルインターチェンジしたときの借用コード：bIIIaug、Im、bVI、IVmとIVm7、IIm(-5)、VII(-5)とVIIaug
ナチュラルメジャーからメロディックマイナー（特徴音biii）にモーダルインターチェンジしたときの共通コード：IImとIIm6とIIm7、IV、VとV7、VII(-5)
ナチュラルメジャーからハーモニックマイナー（特徴音biii,bvi）にモーダルインターチェンジしたときの共通コード：VとV7、VIIm(-5)
ナチュラルマイナーからハーモニックマイナー（特徴音vii）にモーダルインターチェンジしたときの借用コード：VII(-5)とVIIaug、V、bIIIaug、Im△7
ナチュラルマイナーからドリアン（特徴音vi）にモーダルインターチェンジしたときの借用コード：VIm(-5)、IVとIV7、IIm、Im6、bVII△7
ナチュラルマイナーからメロディックマイナー（特徴音vi,vii）にモーダルインターチェンジしたときの借用コード：上2つの借用コードに加えてIIm6
ナチュラルマイナーからミクソリディアン（特徴音iii,vi）にモーダルインターチェンジしたときの借用コード：IIIm(-5)、I、VImとVIm7、IVとIV△7、IImとIIm7、bVII△7
ナチュラルマイナーからミクソリディアン（特徴音iii,vi）にモーダルインターチェンジしたときの共通コード：Vm、bVII

ナチュラルメジャーとナチュラルマイナーの間には共通コードがない。IImとIVとVが（ナチュラル）メジャーと（メロディック）マイナーの掛け橋になることは覚えておくとよいだろう（すでに触れたが、とくにメジャー系からマイナー系への移行ではIImとIVが活躍する：ファンクションもSDで無難）。

コードのルートを基準にモードを再構成する場合。括弧内は特徴音、「一致」とあるのは順序を無視した構成音が同じこと（「戻る」などの表現も同様）、「i～vii」は元のキーから見た相対音程、「m6」「M3」などはコードのルートから見た相対音程を指すことにする。便宜のため、元のキーを基準にしたモードには「k」を、コードのルートを基準にしたコードスケールには「c」を、名前の頭につけることにする。

ナチュラルメジャーに対する拡張

I：普通のモーダルインターチェンジのみ
IIm：cナチュラルマイナーだとkミクソリディアン（＝ivルートのナチュラルメジャー）に一致;bvii。m7＝iなので（kアラビア系の解釈ができなくはないものの）動かしにくい。m6＝bviiを半音上げてcドリアンにすると特徴音が消えてkナチュラルメジャーに戻る。M2＝iiiを半音下げてcフリジア系にすると、kマイナー系のモードになる。m3を半音上げてcイオニアンメジャーにするとkリディアンb7th、m6も上げるとkリディアンになる。
IIIm：cナチュラルマイナーだとkリディアン（＝vルートのナチュラルメジャー）に一致;#iv。m3＝v、m6＝i、m7＝iiなのでどれも動かしにくい。
IV：cナチュラルメジャーだとkミクソリディアンに一致;bvii。M7＝iiiを半音下げてcミクソリディアンにするとkマイナー系、M6＝iiを半音下げてcハーモニックメジャーにするとkアラビア/フリジア系、M3＝viを半音下げてcマイナー系にするとkハーモニックメジャー系になる。
V：cナチュラルメジャーだとkリディアンに一致;#iv。M7＝#viを半音下げてcミクソリディアンにすると特徴音が消えてkナチュラルメジャーに戻る。M6＝iiiを半音下げてcハーモニックメジャーにするとkマイナー系、M3＝viiを半音下げてcナチュラルマイナーにするとkリディアンb7thになる。
VIm：cナチュラルマイナー＝エオリアンだと特徴音がなくkナチュラルメジャーと一致。m3＝i、m6＝iv、m7＝vなのでどれも動かしにくい。
VIIm(-5)：ディミニッシュ系のスケールしか使えないので例外。

ナチュラルマイナーに対する拡張

Im：普通のモーダルインターチェンジのみ
IIm(-5)：ディミニッシュ系のスケールしか使えないので例外。
bIII：cナチュラルメジャー＝イオニアンだと特徴音がなくkナチュラルマイナーと一致。M3＝vとM6＝iは動かしにくい。M7＝iiを半音下げてcミクソリディアンにするとkフリジア系になる。
IVm：cナチュラルマイナーだとkフリジア系に一致;bii。m6＝biiを半音上げてcドリアンにすると特徴音が消えてkナチュラルマイナーに戻り、m7＝biiiを半音上げてcハーモニックマイナーにするとkメジャー系に、m3＝bviを半音上げてcメジャー系にするとkドリアン系になる。
Vm：cナチュラルマイナーだとkドリアンに一致;vi。m7＝ivは動かしにくい。m3＝bviiを半音上げてcメジャー系にするとkハーモニックマイナー系、m6＝biiiを半音上げてcドリアンにするとkメジャー系になる。
bVI：cナチュラルメジャーだとkフリジア系に一致;bii。M3＝i、M6＝iv、M7＝vなのでどれも動かしにくい。
bVII：cナチュラルメジャーだとkドリアンに一致;vi。M7＝viを半音下げると特徴音が消えてkナチュラルマイナーに戻る。M6＝vなので動かしにくく、M3＝iiを半音下げてcマイナー系にするとkフリジア系になる。

V7のところでcオルタードにするような用法は網羅していないので注意。ナチュラルマイナーの拡張ではkドリアンまたはkフリジア系への移行が主（もともと、ナチュラルとハーモニックとメロディックの移行が頻繁なのであまり目立たない）、ナチュラルメジャーの拡張ではIVとVとIImの場合が目立っている。

転調とモーダルインターチェンジ

ナチュラルメジャーからの移行について、フラットする特徴音のものはモーダルインターチェンジと構成音がかぶる。

調号	転調先	特徴音	モード	借用可能なメジャーコード
1	iv	bvii	ミクソリディアン	bVII
2	bvii	bvii, biii	ドリアン	bVII, bIII
3	biii	bvii, biii, bvi	ナチュラルマイナー	bVII, bIII, bVI
4	bvi	bvii, biii, bvi, bii	フリジアン	bIII, bVI, bII
5	bii	bvii, biii, bvi, bii, bv	オルタード4	bVI, bII, bV

たとえば、調号変化が2（フラットが2つ増える）の転調と、ドリアンモードへのインターチェンジは、構成音だけ見ると同じ変化である（CからBbへの転調とCナチュラルメジャーからCドリアンへのインターチェンジは、構成音だけでは区別がつかない）。

シャープ系の変化はしょっぱなで核音（iv）が動くうえ、たった2回でルートがずれてしまうため、vへの転調とリディアンへのインターチェンジがかぶるだけになる。結果的に、フラット系の変化ではモーダルインターチェンジっぽさが、シャープ系の変化では転調っぽさが出やすい。

三和音にムリヤリコードネームをつける

1オクターブ以内にある三和音について、コードネーム別に「一番低い音から半音いくつ上昇するか」を一覧にした。たとえば「4-3」とあったら、最低音から半音4つ上に中間の音、中間の音から半音3つ上に最高音が来る形である。便宜上、候補はテンションのない四和音までに限定する（たとえ限定しなくても実際には、三和音に直接テンションを乗せて1stか5thが落ちた形（たとえばC(9)omit1とか）と、セブンスorシックススコード＋テンション1つで1stと5thが落ちた場合（たとえばC7(9)omit1,5とか）くらいしか考慮しなくてよいはず：三和音にテンションが2つ乗ってかつコードトーン2つ省略というのはいかにも苦しい）。

メジャー：4-3、3-5、5-4
マイナーセブンomit1とオーギュメントメジャーセブンomit1も同じ
マイナー：3-4、4-5、5-3
メジャーセブンomit1とメジャーシックスomit5とハーフディミニッシュomit1も同じ
ディミニッシュマイナー：3-3、3-6、6-3
ドミナントセブンomit1とマイナーシックスomit5も同じ
オーギュメント：4-4
sus4：5-2、2-5、5-5
メジャーセブン(-5)omit1も同じ
メジャー(-5)：4-2、2-6、6-4
マイナーシックスomit1も同じ
オーギュメントマイナーセブンomit1とハーフディミニッシュomit3も一応同じ形
メジャーセブンomit5：4-7、（7-1）、（1-4）
マイナーセブンomit5：3-7、7-2、2-3
ドミナントセブンsus4omit1も同じ
メジャーシックス(-5)omit1も一応同じ形
ドミナントセブンomit5：4-6、6-2、2-4
メジャーセブンsus4omit1とドミナントセブン(-5)omit1も同じ
ディミニッシュメジャーセブンomit3（一応）：6-5、（5-1）、（1-6）
オーギュメントメジャーセブンomit3（一応）：8-3、（3-1）、（1-8）
オーギュメントマイナーセブンomit3（一応）：8-2、2-2、2-8

オーギュメントとディミニッシュとメジャー(-5)は5thが特徴音で、sus4も5thがないとコードネームが変わってしまうため、omit5の形を考慮していない。メジャー(-5)から3度音を省略した場合はディミニッシュの3度省略と同じ扱い。Dim7は省略の意味がない（何度を省略してもディミニッシュマイナーになるだけ）のでこれも除外。ベースがいない場合omit1の形は考慮しなくてよい。

いわゆる12音階から「ある音と、最初の音から1オクターブ以内の2音」を含む三和音は11C2＝55通り選べるが、そのうち少なくとも上記34通りにコードネームを当てはめることができる。それ以外の21通りについては、

1-1、1-10、10-1：半音3段重ねで、コードとして解釈するのはちょっと厳しい
1-2、2-9、9-1：メジャー add 11 omit1かマイナー add b9 omit5に取れなくもない
1-3、3-8、8-1：マイナー add b11 omit1かメジャー add b9 omit5かマイナーMaj7 omit5に取れなくもない
1-5、5-6、6-1：dom7 add13 omit1,5（＝φ add 11 omit3）かpower add #11に取れなくもないがムリヤリ
1-7、7-4、4-1：power add Maj7に取れなくもない
1-9、9-2、2-1：マイナー add 9 omit5に取れなくもない
2-7、7-3、3-2：power add 11に取れなくもないがムリヤリ

とかなりムリな解釈になる。いずれも、長短3度に相当するインターバルを手がかりに、それが「3度音と5度音」（つまりテンションを乗せてルート音を省略した形）または「ルート音と3度音」（つまりテンションを乗せて5度音を省略した形）だと推定して、あるいは完全4or5度のインターバルをもとにパワーコード、トライトーンをもとにドミナントセブンorディミニッシュの一部だと解釈して、コードネームをつけている。

ちなみに二和音は、インターバルが半音3または9ならマイナー、4または8ならメジャー、5または7ならパワーコードだと解釈できる。インターバルが半音6になる二和音はドミナントセブンの一部だと考えるのが自然だろう（ディミニッシュマイナーomit3でもよいが、ディミニッシュマイナー自体をドミナントセブンのルート音省略と見るなら、結局ドミナントセブンの一部に変わりはない）。

四和音の場合、まずすべてがコードトーンだとして解釈を試みて、解決できなければ「テンションが乗ってかつコードトーンが省略された形」を考慮する。たとえばCとDとEとAの和音はAm(11)、F7(13)omit1、C6(9)omit5などの可能性がある。機械的に解釈するなら、4トーンのうち任意の3つを使って上記の一覧にあてはまるものを探し、残る1つをテンション扱いすることになるだろう。都合4通りの試行が必要で、もし五和音だと5C3で10通り試行しなければならない。六和音以上はどうとでも解釈できてしまうので、あまり気にしなくてよいだろう。

ベース

ルート音を省略したメジャーセブンもしくはマイナーセブンの下でベースをダイアトニックに動かした場合のコードネーム（タブ区切りテキスト、csvフォーマット）。アラビア数字は「ベースがコードのルート音から見て何度か」を示す。メジャーセブンがダイアトニックでないVとVIIbはドミナントセブンで代用し、ディミニッシュマイナーのセブンスコードはハーフディミニッシュにしている。なお、スペースの都合で（ハーフディミニッシュではないトライアドの）ディミニッシュマイナーをφで表記している部分がある。

メジャー	I	IIm	IIIm	IV	V	VIm	VIIm(-5)
1	IM7	IIm7	IIIm7	IVM7	V7	VIm7	VIIφ
2	IIIm7 V6	IVM7 VIm(-13)	VIIφ(-13) V7	VIm7 I6	VIIφ IIm6	IM7 IIIm(-13)	IIm7 IV6
3	IIIm	IV	V	VIm	VIIm(-5)	I	IIm
4	IIIm(-9)	IV(9) Isus4(13)	V(9) IIsus4(13)	VIm(9) IIIsus4(-13)	VIIφ(-9)	I(9) Vsus4(13)	IIm(9) VIsus4(-13)
5	IIIm	IV	V	VIm	VIIm(-5)	I	IIm
6	IIIm(11) IIIsus4(+9)	IV(+11)	V(11)	VIm(11) VIsus4(+9)	VIIφ(11)	I(11)	IIm(11) IIsus4(+9)
7	IIIm	IV	V	VIm	VIIm(-5)	I	IIm
マイナー	Im	IIm(-5)	bIII	IVm	Vm	bVI	bVII
1	Im7	IIφ	bIIIM7	IVm7	Vm7	bVIM7	bVII7
2	bIIIM7 Vm7(-13)	IVm7 bVI6	Vm7 bVII6	bVIM7 Im(-13)	bVIIM7 IIφ(-13)	Im7 bIII6	IIφ IVm6
3	bIII	IVm	Vm	bVI	bVII	Im	IIm(-5)
4	bIII(9) bVIIsus4(13)	IVm(9) Isus4(-13)	Vm(-9)	bVI(9) bIIIsus4(13)	bVII(9) IVsus4(13)	Im(9) Vsus4(-13)	IIm(-5)(-9)
5	bIII	IVm	Vm	bVI	bVII	Im	IIm(-5)
6	bIII(11)	IVm(11) IVsus4(+9)	Vm(11) Vsus4(+9)	bVI(+11)	bVII(11)	Im(11) Isus4(+9)	IIm(-5)(11)
7	bIII	IVm	Vm	bVI	bVII	Im	IIm(-5)

IもしくはImの下でベースの音程をクロマチックに上げていった場合のコードネーム（タブ区切りテキスト、csvフォーマット）。

D5/A4

IM7

#Iφ
IIIm6

IIIm7
V6

IIImM7
Vaug(13)

IIIm

IIIm(-9)

IIIm(9)
VIIsus4(-13)

IIIm

III(+9)

IIIm(11)
IIIsus4(+9)

IIIm(+11)

IIIm

Im7

bIII7
Vm(-5)(-13)

bIIIM7
Vm7(-13)

bIII

bIII(-9)

bIII(9)
bVIIsus4(13)

bIII(+9)

bIII

bIII(11)

bIII(+11)

bIII

bIII(-13)
Vaug(+9)

いづれも、改行の関係でcsvファイルの方が見やすいかもしれない。

右手がトライアド（ルート省略せず）の場合、メジャー/マイナーコードともにベースが6度音になるとコードネームの解釈が変わる。メジャーコード on M6だと長6度上（短3度下）のマイナーセブンに、マイナーコード on m6だと短6度上（長3度下）のメジャーシックスに、マイナーコード on M6だと長6度上（短3度下）のハーフディミニッシュになる。メジャーコード on m6はあまりやらないが、短6度上（長3度下）のオーギュメントメジャーセブンという変な形になる。

ルートを省略したセブンスコードの下でベースがルート以外のコードトーンに動いた場合、主要コードは代理コードに、代理コードは主要コードに幾分歩み寄った雰囲気になる（そう大きな違和感は出にくい）。2度に持っていくと歩み寄った上でさらに回転形になる。6度は雰囲気が大きく変わる。

オマケでパワーコードの下で動かした場合（回転形を無視）：

P1	m2	M2	m3	M3	P4	D5/A4	P5	m6	M6	m7	M7
PowerI	bIIm(-5)△7omit3(一応)	Vsus4またはIsus2	Im	I	Isus4	該当なし	PowerI	bIV△7omit5	VIm7omit5	セブンスコードの3度省略(こじつけ)	セブンスコードの3度省略(こじつけ)

表にすると意外と動けそうに見える。実際に音を出してみると、筆者の感覚では、M2～P5は比較的安定（その中ではD5/A4が目立ち、M2もやや目立つ）、m2とM6とm7は不安定、m6とM7はかなり不安定（どちらかといえばM7が目立つ）くらいか。D5/A4はさほど目立たず、表では該当なしにしてあるが、ムリヤリbVdim(-9)omit3omit7に取れなくはない。少なくともm3、M3、P4、P5へは比較的ムリなく動けるし、あえてベースでニュアンスを出すのも面白いかもしれない。

ローインターバルリミットの目安は以下の通り（アコースティックピアノ前提）

完全5度	A1とE2
完全4度	D2とG2
長6度	D2とBb2
長3度	A2とC#3
長短7度	A2とG#3またはG3
短3度	C#3とE3
増4度/減5度	C#3とG3
短6度	C#3とA3
長2度	G3とA3

上記は一般的なグランドピアノの例だが、ピッチが甘く、倍音が豊富で、インハーモニシティ（倍音のずれ）が大きい楽器（新品の弦を張ったギターとか）は高い音でも濁りやすい。反対に、ピッチが正確で、倍音が少なく、インハーモニシティが小さい楽器（デジタルシンセのフルート系トーンとか）は低い音でも濁りにくい。

とくにアコースティックギターのローコードやエレキギターのパワーコードでE～G（6弦からE2～G2の音が出てくる）を弾いている場合ベースの動きがかなり制限される（ベースに古めの弦を使うと倍音が減ってやや改善される：濁りだけでなく低音のダブつきの問題もあるので、ギターのハイパスもかけておいた方がよいだろう）。

距離と時間に関する数値と計算

テンポの換算式

1小節x秒で4/4拍子の曲のテンポn（1分間に4分音符n回）は、60/(x/4)=240/xで求められる。4分音符1拍がx秒なら素直に60/xでよい。逆に、テンポをxとすると、4/4拍子の1小節は(60/x)*4=240/xになり、n分音符の長さは240/(x*n)になる。

テンポをx（1分間に4分音符x回）とすると、n分音符の長さは{(60/x)*4}/n=240/(x*n)に、テンポをx（1分間に4分音符x回）とすると、周波数n(Hz)の繰り返しはn*((60/x)*4) = 240*n/x分音符相当になる。

音価とチックス

4分音符＝480チックス（分解能1920）を前提とした、音価チックス数の対応。完全なテヌートの場合（オマケでDominoで打ち込んだ場合のスクリーンショットその1とその2：その2は横に拡大してある）。

	分数	小数	チックス	3連	分数	小数	チックス
2分	1/2	0.5	960	2分	1/3	0.333333333	640
4分	1/4	0.25	480	4分	1/6	0.166666667	320
8分	1/8	0.125	240	8分	1/12	0.083333333	160
16分	1/16	0.0625	120	16分	1/24	0.041666667	80
32分	1/32	0.03125	60	32分	1/48	0.020833333	40
64分	1/64	0.015625	30	64分	1/96	0.010416667	20
128分	1/128	0.0078125	15	128分	1/192	0.005208333	10
256分	1/256	0.00390625	7.5	256分	1/384	0.002604167	5

音符と休符で計算方法に違いはない。

以下、n分音符n個分（たとえば4分音符4個分）に相当する音価の「1分音符」を仮に想定して話を進める（2分の2拍子や4分の4拍子など分子と分母が揃っている拍子では全音符＝1分音符と同じ長さになるが、4分の3拍子など分子と分母が揃っていない拍子では全音符と1分音符が異なる長さになる）。

附点の場合は1.5倍（＝3/2倍）、複附点の場合は1.75倍（7/4倍）にして計算する。6連符と12連符は3連符と同様に計算できる（たとえば、3連8分音符と6連8分音符と12連8分音符のチックス数は同じ：それぞれ、3つで4分音符、6つで2分音符、12で1分音符）。上記に限らず、たとえば5連符と10連符の関係でも同様に、連符を倍に割ってもチックスの扱いは変わらない。

5・7・9・10・11連符については、5連8分音符（5つで2分音符分）が1分音符の1/10＝192チックス、7連8分音符（7つで2分音符分）が1分音符の1/14＝137.142857チックス、9連8分音符（9つで1分音符分）が1分音符の1/9＝213.333333チックス、10連8分音符（10で1分音符分）が1分音符の1/10＝192チックス（5連符と同じ）、11連8分音符（11で1分音符分）が1分音符の1/11＝174.545455チックスだけわかれば何とかなるだろう。「連符は実際の音価より長い音符の中で一番近いものを借りて表記する」「m連n分音符について2^(n÷mを整数に切り捨てたもの)が合計の音価」などと捉えておくと便利かもしれない。

3連3連符は9連符のチックス数を半分にして考えればよく、たとえば、3連8分音符（合計で4分音符分の音価）をさらに3連にすると、子の3連符1つが3連4分音符分、全体で2分音符分、子の音符1つは9連8分音符の半分＝1/18ということになる。

減衰・到達時間・波長など

点音源から開放空間に出力される0db@1mの音波が、距離によってどのくらい減衰するか。

+12db@0.25m、+6db@0.5m、0db@1m、-6db@2m、-10db@3m、-12db@4m、-14db@5m、-18db@8m、-20db@10m、-26db@20m、-32db@40m、-40db@100m、-60db@1000m。

ただし、これはあくまで点音源かつ開放空間かつ環境雑音なしの場合。同じ条件で線音源だと減衰が（デシベル表記で）半分になり、面積無限大の面音源だと減衰なしになる（圧力が球状に逃げるのが点音源、円筒状にしか逃げないのが線音源、逃げ場がないのが面音源：波長に対して音源が十分大きくても、ものすごく遠距離から見ると点音源的に振る舞う）。また実際には、普通に考えられる規模の有限線音源でも、遠距離では空気による吸収が支配的になる（2.5mくらいのアレイの正面で16KHzだと30m過ぎくらいからのようだ）。

もっと正確で実用的な資料として、日本ビクターが公開しているPRO SOUND SOLUTION GUIDEというPDFの技術資料パートが詳細である（外部リンク）。またメートルオーダーでの計算例が岐阜県のウェブサイトにPDFファイルで公開されている（両方外部リンク）。

楽器やヴォーカルの最大音量は、生ドラム＝120db@1m、グランドピアノ＝アルトサックス＝オペラ独唱＝100db@1m、アコースティックギター（鉄弦）＝オペラ以外の独唱＝90db@1mくらい。いづれもとくに大きい音を出す楽器とプレイヤーを組み合わせた場合に「出そうと思えばこのくらい出る」という数値。アマチュアプレイヤーがここまでの音を出すのは多分難しい（ドラム除く）。たとえば暗騒音工法研究会が引用している環境省のデータ（外部リンク）だと、ピアノ正面1m付近で80dbないし80～90dbとなっている（80dbはバイエル104番を演奏したときの値らしい）。アコギも、ドレッドノートなどとくに大きなモデルに太い弦を張ってゴツいピックで思い切りストロークしないと90db@1mまでは出ないと思われる。

音波1周期は、31.25Hzで32ms[10.9m]、62.5Hzで16ms[5.44m]、125Hzで8ms[2.72m]、250Hzで4ms[1.36m]、500Hzで2ms[68cm]、1KHzで1ms[34cm]、2KHzで0.5ms（500μs）[17cm]、4KHzで0.25ms（250μs）[8.5cm]、8KHzで125μs[4.25cm]、16KHzで62.5μs[2.125cm]、の時間に相当する（角括弧内の数字は、音速を340m/sとした場合に音が1周期で進む距離）。

ハース効果と音量差

両耳の間隔を0.2m、両耳の中心点と点音源の距離を0.5m、2m、10mとした場合に、両耳の中心点と点音源を結んだ直線と、両耳を結ぶ直線のなす角によって、直接音の到達距離、到達時間、両耳の中心に届く（はずの）音波と比べた音量がどう変化するか（タブ区切りテキスト、csvフォーマット）。

	0.5m			2m			10m
条件	到達距離	到達時間	音量	到達距離	到達時間	音量	到達距離	到達時間	音量
90度両耳	0.501m	1.47ms	-0.025db	2.00m	5.88ms	0db	10.0m	29.4ms	0db
60度遠耳	0.557m	1.64ms	-0.94db	2.05m	6.03ms	-0.22db	10.05m	29.6ms	-0.045db
60度近耳	0.458m	1.34ms	+0.76db	1.95m	5.74ms	+0.22db	9.95m	29.3ms	+0.045db
60度差分	0.099m	0.30ms	1.70db	0.10m	0.29ms	0.44db	0.10m	0.3ms	0.09db
45度遠耳	0.575m	1.69ms	-1.22db	2.07m	6.09ms	-0.30db	10.07m	29.6ms	-0.06db
45度近耳	0.435m	1.28ms	+1.21db	1.93m	5.68ms	+0.31db	9.93m	29.2ms	+0.06db
45度差分	0.14m	0.41ms	3.43db	0.14m	0.41ms	0.61db	0.14m	0.4ms	0.12db
30度遠耳	0.589m	1.73ms	-1.43db	2.09m	6.15ms	-0.38db	10.09m	29.7ms	-0.08db
30度近耳	0.416m	1.22ms	+1.60db	1.91m	5.62ms	+0.40db	9.92m	29.2ms	+0.07db
30度差分	0.173m	0.51ms	3.03db	0.18m	0.53ms	0.78db	0.17m	0.5ms	0.15db

すべての数字について、まず距離を有効桁数3桁（10mを超えるもののみ例外的に4桁）で求めてから、丸めた数字を元に時間と音量を計算している。顔の表面で回り込む音は、低音ほど大きく、高音ほど小さく聴こえるはずである（遠回りする分の距離の延長は無視している：耳から音源までの間を頭部が遮らない程度の角度であれば考慮しなくてよい）。また、極端な高音は正面で鳴るよりも横（耳の奥が見えるくらいの角度）で鳴った方が大きく聴こえるはずである。

ハース効果と位相差

人間の耳が位相差を「音色」として認識できるのは、完全な逆相（πの遅れ）の場合で1KHz以下くらいらしい。筆者1人を対象にした独自実験だが、2KHzのサイン波をヘッドフォンでステレオ再生しながら片方のチャンネルだけ位相反転を繰り返したところ、どちらが逆相の音かブラインドでの区別ができなかった（ただし、ハース効果で定位がずれるため「どちらから再生し始めたか」はわかる：ハース効果の知覚限界を仮に0.1msとすると、5KHzくらいまでは「逆相にした音の鳴り始めが耳に入ると定位感に影響が出る」ことになる）。

もう少しマトモな実験結果が見つかればかったのだが、1KHzの音波の位相がπ遅れるには0.5ms、2KHzだと0.25msくらいかかるため、上の表の値を考えても「まあ妥当」な数字ではないかと思う（追試をする人はステレオのヘッドフォン/イヤフォンを使わないと意味がないので注意）。

ちなみに、もっと低い周波数、たとえば200Hzくらいの低音が左右逆相で耳に入ると、何ともいえない不自然な感覚になる（自然界にはあり得ない現象なので当たり前）。また、普通に録音した音声を左右片方だけ位相反転させてヘッドフォンで再生すると、非常に奇妙な定位感になる（本来なら、たとえば0.5msの到達時間差で1KHzの音波にπ位相差が出た場合500Hzの音波はπ/2の遅れになるはずだが、これが全部揃ってπだけ遅れるのがキモチワルイのだと思う：もちろん低音に大きな位相差が出ていることも影響しているだろう）。

なお、ここで問題になるのは「左右の」位相「差」であって、群遅延のような現象とは関わりがないので注意して欲しい。

MIDI

4分音符が480チックスの場合、8分で240、16分で120、32分で60、64分で30、128分で15、3連4分で320、3連8分で160、3連16分で80、3連32分で40、3連64分で20、3連128分で10。1チックは1920分音符で、256分は8チックス、512分は4チックスで代用する。4/4拍子だと、1拍目は0、2拍目は480、3拍目は960、4拍目は1440チックスから始まる。テンポ125で1チックス＝1ms。

極端なレガートを避けるために音価を削る場合、音価の1/32～1/8くらいが無難。アクセント拍の前後移動（ずらし）は128分音符（＝15チックス：ごく微妙な変化）～64分音符（＝30チックス：明らかな変化）くらいを目安にする。16分刻みのハットを揺らすような場合は256分音符（＝7.5チックス）くらいでもよさそう。

Timidity++とFluidを組み合わせた場合ベロシティ100の音とベロシティ50の音は音量が10db違い、SW synth だと12dbの差だった（グランドピアノのC4の音を使用）。Timidity++はデシベル基準で2倍＝10db（ただしオプションで変更できる）という計算、SW synth は素の対数基準で音量2倍＝音圧(2)^2倍という計算をしているのだろう。多分、ローランドのほかの音源もSW synth と同じ基準ではないかと思われる。最大音（ベロシティ127だが、端数が面倒なので128として扱う）を0dbとして計算すると：Timidity++の場合、64で-10db、32で-20db、16で-30db、8で-40db、4で-50db、2で-60db、1で-70dbになり；SW synth なら、64で-12db、32で-24db、16で-36db、8で-48db、4で-60db、2で-72db、1で-84dbになる。

RIFF WAVE

以下に、48KHz/16bitのRIFF WAVEファイルをhex（16進）表記したものと、その解釈を示す（タブ区切りテキスト、csvフォーマット）。チャンク（Chunk）は英語で「塊」の意味で、イメージとしては入れ物のような感じ。以下の例では、RIFFという箱の中にfmt という箱とdataという箱が入っている様子を想像すればだいたい問題ない。ちゃんとした仕様はTSP Labというサイトに掲載されているのでそちらを参照（外部リンク）。なお、二進法はbinary（バイナリ）で接頭辞0b、八進法はoctal（オクタル）で接頭辞0o、十進法はdecimal（デシマル）で接頭辞0d、十六進法はhexadecimal（ヘックスorヘキサデシマル）で接頭辞0x、とするのが一般的（たとえば「0x2a05」は「16進数で2a05」を表す：六進法はsenaryであってhexではない）。

パート	1	2	3
hex	52494646	34000000	57415645
ASCII/decimal	RIFF	52	WAVE
備考	RIFFチャンクの開始	RIFFチャンクのバイト数	ファイルの種類を宣言
長さ(バイト)	4	4	4

パート1とパート3は固定。パート2は4バイト＝32ビットの値なので0～4294967295バイト＝4GiBまでの値（必ず偶数にするのが決まりで、データが半端な場合は0で埋めるらしい）をとり、パート2以前のデータとパート2自身を含まない（以下同様）。つまり、パート2はパート3～20のバイト数を示している（反対にいえば、パート3～20がRIFFチャンクの中身である）。

4	5	6	7	8	9	10	11
666D7420	10000000	0100	0200	80BB0000	00EE0200	0400	1000
fmt	16	1	2	48000	192000	4	16
fmt チャンクの開始	fmt チャンクのバイト数	データ形式	チャンネル数	サンプルレート	ビットレート	クロックあたりバイト数	ビット深度
4	4	2	2	4	4	2	2

パート4は固定。パート5が16の場合のみ、パート6～11が上記のようになる（この構造体をPCMWAVEFORMATという）。パート5はパート6～11のバイト数を示している（反対にいえば、パート6～11がfmt チャンクの中身である）。パート6は「1」だとリニアPCMを示し、MS ADPCMだと「2」、32bit(float)だと「3」、YAMAHA ADPCMだと「32」になる（いづれもdecimal値）。

12	13	14	15	16	16	17	18	19	20
64617461	10000000	0000	0000	0000	FF7F	0000	0080	0000	0000
data	16	0	0	0	32767	0	-32768	0	0
dataチャンクの開始	dataチャンクのバイト数	1ch@1c	2ch@1c	1ch@2c	2ch@2c	1ch@3c	2ch@3c	1ch@4c	2ch@4c
4	4	*	*	*	*	*	*	*	*

*はビット深度（量子化ビット数）分のデータ長になる。「Nch@Mc」という表記は「Mクロック目におけるNチャンネルの音圧」という意味で、たとえば「2ch@3c」は「3クロック目における第2チャンネルの音圧」の意（リニアPCMなので、値「-32768」がそのまま音圧を示している）。パート13はパート14～20のバイト数を示している（反対にいえば、パート14～20がdataチャンクの中身である）。

上記のうちdataチャンク以外において、数値データはリトルエンディアン（下位の桁＝小さい桁から順に書く表記法）の符号なし整数として扱われる。たとえば、パート8のリトルエンディアンhex「80 BB 00 00」をビッグエンディアン（上位の桁＝大きい桁から順に書く表記法）hexに直すと「00 00 BB 80」で、これをさらにdecimal（10進）に直すと「48000」になる。普通の日本語で「にひゃく、さんじゅう、ろく」などと表現するのはビッグエンディアンで、逆順の「ろく、さんじゅう、にひゃく」にしたのがリトルエンディアン。

dataチャンクにおいて、数値データはリトルエンディアンの符号あり整数として扱われる（上記の例では2バイト符号あり整数で、WindowsではWORD、C言語ではsigned short intと呼ぶ：ただし、8bitPCMの場合のみ1バイト符号なし整数で扱うようだ）。binary（2進）での演算になるため多少面倒で、リトルエンディアンhexの「FF 7F」（つまりビッグエンディアンhexで「7FFF」＝ビッグエンディアンbinaryで「01111111 11111111」）までは正の数、リトルエンディアンhexで「00 80」（つまりビッグエンディアンhexで「80 00」＝ビッグエンディアンbinaryで「10000000 00000000」：最上位ビットが1になる）からは記録された値からビッグエンディアンbinaryで「1 00000000 00000000」（ビッグエンディアンhexで「01 00 00」＝リトルエンディアンで「00 00 01」）を引いた値が負の数として用いられる（ペンティアム互換のCPUではこの方が計算が速いため、こういう処理になっている）。このためリトルエンディアンの符号あり整数では、「00 00」が0、「FF 7F」が最大値（decimalで「32767」）、「00 80」が最小値（decimalで「-32768」）となる。

上記から、ビット深度が8の倍数でないと非常に面倒なことになることがわかると思う（そのような処理に対応しているソフトはほとんどないはず）。また、44.1KHz＞48KHz＞32KHz＞96KHz＞192KHz＞88.2KHzの順に対応ソフトが多いだろう。dataチャンクの前にfactチャンクというのを置いて、dataチャンクに含まれるサンプル数を明記する場合もあるようだが、たいていは省かれる。LISTチャンクを置いてコメントを書き込むこともできるらしい。ちなみに、RIFF WAVE形式の16bitリニアPCM（16bit符号あり整数で波形を記録）に「DCオフセットのない正弦波」を記録する場合、ダイナミックレンジは約90.31dbになる（単純に1bit＝6.02dbと考えて16倍すると96.32dbだが、その条件だとDCオフセットのある波形しか作れない）。

32bit浮動小数点数（詳しくはその他のページを参照）での表現については、最小値がリトルエンディアンで「00 00 80 BF」、ビッグエンディアンに直すと「BF 80 00 00」、ビッグエンディアンからバイナリに直すと「1 01111111 00000000000000000000000」、さらにデシマルに直すと「-1」になる一方、最大値がリトルエンディアンで「00 00 80 3F」、ビッグエンディアンに直すと「3F 80 00 00」、ビッグエンディアンからバイナリに直すと「0 01111111 00000000000000000000000」、さらにデシマルに直すと「1」になっており、指数部の上位1ビットを余して記録してある（Audacity1.26の出力で確認）。ソフトウェアプロセッサで処理するときは、余った領域をヘッドルーム的に使う（プロセッサ内部では-1～1の範囲外のデータもそのまま扱う）のが普通。

すでに触れたように、RIFF、fmt 、data以外のチャンクを盛り込むことも可能で、たとえばacidized wavの場合、str2、bmrk、dtbt、acid、strc、LIST、ICRD、PAD などのチャンクが続いてからdataチャンクがくるものや、dataチャンクの後にacid、strc、bmrk、dtbtと続くもの、acidチャンクしか追加していないものなどがある（未確認だが、おそらく最初のが本家ACIDで書き出したもの）。非対応のチャンクは読み飛ばされるだけなので、普通のwavプレーヤーでもacidized wavは再生できる。

余談だが、歴史的には1985年にElectronicArtsとCommodore-Amigaが策定したIFF（Interchange File Format：ビッグエンディアンであること以外はRIFFと同じらしい）規格が大元で、1988年にAppleがAIFF（Audio Interchange File Format：ビッグエンディアン採用で、RIFF WAVEとはチャンクの宣言などもやや違うが、構造自体はRIFFとほぼ同一）を策定、1991年にMicrosoftとIBMがRIFF（Resource Interchange File Format）を策定、という流れになっている。RIFF WAVEの自由度を抑えて互換の確実性を向上させ、ラベルやCUE情報や添付ファイルの埋め込みを可能にしたBWF（Broadcast Wave Format：European Broadcasting Unionが策定）や、その日本バージョンであるBWF-Jなどもある。

IEC 60958

代表的な実装にAES/EBU（IEC 60958-3：Audio Engineering SocietyとEuropean Broadcasting Unionの略）とS/PDIF（IEC 60958-4：Sony/Philips Digital Interconnect FormatまたはSony Philips Digital Interfaceの略らしい）がある。トライテックという会社の解説が詳しい（外部リンク）。AESは1985に策定されて1992年と2003年に改定されている。

下位層のおもな規格（IEC 60958 Type IIなど）は、

	S/PDIF（コアキシャル）	AES3（アンバランス）	AES3（バランス）
ケーブル	コアキシャル（同軸）	コアキシャル（同軸）	シールデッドツイストペア
特性インピーダンス	75Ω	75Ω	110Ω
最大電圧（未確認）	0.5Vくらい	1Vくらい	5Vくらい

といった感じ。いづれの方式でもBiphase mark code（バイフェーズ符号の一種で、FM1 codeとも）で符号化される。この符号はNRZ（non-return-to-zero：プラスの電圧とマイナスの電圧で構成され、電圧ゼロの時間がない）で、1クロック時間でプラスとプラスまたはマイナスとマイナスの電圧を送ると0のビット、プラスとマイナスまたはマイナスとプラスの電圧を送ると1のビットを示す（クロックをデータに重ねて送る方式なので同期を取りやすいが、送信周波数が高くなる）。ただし、後述の同期スロットのみBiphase mark codeを用いない。

上位層にはChannel Status Wordというヘッダのようなものがある。バーストエラーに備えてか、サブフレーム（32bit）につき1bitづつ送信する（Channel Status Wordは24byte＝192bitで構成されるので、後述するように192フレームを1ブロックとして、ひとまとめにする：フレームをチャンネルごとに分けたのがサブフレームで、時系列の区切りとしてはどちらも同じ長さ、Channel Status Wordは名前どおりチャンネルごとに独立）。AES/EBUの場合、

byte0	0o0	0o1	0o2	0o3	0o4	0o5	0o6	0o7
役割	フォーマット	データ	プリエンファシス			外部同期	サンプルレート
0のとき	Consumer（S/PDIF）	PCM	0b100でオフ			ロック	48KHz（デフォルト）、44.1KHz、32KHz、その他を選択する模様（未確認）
1のとき	Professional（AES3）	PCM以外	0b100でオフ			アンロック	48KHz（デフォルト）、44.1KHz、32KHz、その他を選択する模様（未確認）

byte1	0o0	0o1	0o2	0o3	0o4	0o5	0o6	0o7
役割	チャンネル情報				チャンネル情報を示すユーザーデータ（未確認）
内容	モノラル2本、ステレオ1本、差分ステレオなど				不明

byte2	0o0	0o1	0o2	0o3	0o4	0o5	0o6	0o7
役割	AUX BIT（time slots 4～7）の使い方			サンプルサイズ			未使用
内容	0b000で指定なし、0b001で4bit全部オーディオデータに使う			音声用に使わないビットを指定するようだ（未確認）			未使用

byte3	0o0	0o1	0o2	0o3	0o4	0o5	0o6	0o7
役割	マルチチャンネル用のデータ

byte4	0o0	0o1	0o2	0o3	0o4	0o5	0o6	0o7
役割	サンプルレート情報		予約	サンプルレート				サンプルレート補正
内容	AES11互換用らしい（未確認）		予約	サンプルレートが「その他」だった場合に使う模様（未確認）				NTSC互換用にサンプルレートを1.001で割るフラグ

byte5	0o0	0o1	0o2	0o3	0o4	0o5	0o6	0o7
役割	予約

	byte6～9	byte10～13	byte14～17	byte18～21	byte22	byte23
役割	ベンダ名などを示すASCII文字	チャンネル制御用のASCII文字	1フレームで1つ進むカウンタ	時刻情報	信頼性情報	CRC

となっている。サンプルレートを指定しているのはノンリニアでの読み書きのためで、実際の同期にはBiphase mark codeに重ねたクロックを使う。

S/PDIFの場合かなり内容が異なり、

byte0	0o0	0o1	0o2	0o3	0o4	0o5	0o6	0o7
役割	フォーマット	データ	コピー	チャンネル数	未使用	プリエンファシス	モード
0のとき	Consumer（S/PDIF）	PCM	禁止	2	未使用	なし	常に0らしい（未確認）
1のとき	Professional（AES3）	圧縮データ	許可	4	未使用	あり	常に0らしい（未確認）

byte1	0o0	0o1	0o2	0o3	0o4	0o5	0o6	0o7
役割	チャンネル情報							コピーフラグ
内容	媒体情報（CDとかDVDとか）							媒体によって扱いが違うらしい（未確認）

となっている。

話が前後するが、データはサブフレームが最小のまとまりで、サブフレーム内の各bitをタイムスロットという。サブフレームは、同期（というかセパレータ）(0-3)、AUX(4-7)、データ(8-27)、バリディティ(28)、ユーザー（29）、チャンネルステータス(30)、パリティ(31)になっている。各チャンネルのサブフレーム（ステレオなら2つ）をまとめてフレームを作り、192フレームを1ブロックにして送信する（パリティビットがチェックサムで、バリディティビットは送信元機器からの「このブロックのデータ多分どっか間違ってる」というメッセージ）。

32bitで1サブフレーム、ステレオなら2サブフレームで1フレーム、192フレームで1オーディオブロックになり、1ブロックごとに24byteのチャンネルステータスを持つことになる。1フレームに各チャンネルの1サンプル分のオーディオデータが入っているから、48KHzサンプリングだと1ブロック＝192フレーム＝192サンプル＝1/250秒＝4msになる（ステレオだと1ブロック＝1536byteだから、通信速度は384kbyte/s＝3072kbps）。

限界いろいろ

人間の限界

音圧は、100db（コンサートホールでオーケストラを聴くときや、特に大きな音を出せる奏者のテナーサックスを1mの距離で聴いた場合の最大音量くらい）で連続2時間、115db（いわゆる「爆音」のロックコンサートくらい）だと連続15分で耳を痛める危険があり、130dbくらいで鼓膜に急性外傷が生じる。1KHzのサイン波だと最小可聴音は0dbだが、3KHz周辺だと-5dbくらいまで知覚できる。31.5Hzだと60dbくらいまで知覚できない。声量は、プロのオペラ歌手で100db@1mくらいが限界。多人数の声としては、2011年にトルコ・テレコム・アリーナというサッカー場で5万人ちょっとが絶叫した際の131.76dbというギネス記録がある（測定方法などは確認していない）。音楽の音量としては、ディープパープルが屋内で記録した117db（1973年のギネスブックに掲載）という記録があり、1976年にザ・フーが屋外で120dbを出して記録を更新、その後どんどんエスカレートしてマノウォーが139dbを記録するに至るが、あまりに危険な試みなので2008年にギネス・ワールド・レコーズが記録掲載をやめてしまった。

ちなみに、長距離音響装置LRAD（メーカーや運用者の言い分では兵器ではない）の最上位機種1000Xは30度の範囲で1km先に125dbを放射（想定時間は数秒）、スタングレネード（相手を確実に無力化できて、できれば死なないように作ってある兵器）の音が160～180db（おそらくピーク値）。窓ガラスのような硬くて脆くて平らなものが140dbくらいから壊れ始め、空気で音を伝える場合の限界は190db（理論値）くらいらしい。音響ではなく爆風の場合、適切に治療しても死人が出始めるのが190dbくらい（瞬間的な曝露で鼓膜が破裂するのもこのくらいから）、丈夫な建造物が壊れるのが210dbちょっと、確実に死亡するのが220dbくらいになる（いずれも20μPa＝0dbSPLとしたときの換算値）。

ハース効果は数十μs～100μsくらいから、ほぼ同時に発音される2つの音（Fluidのスネアドラムとピックベースの音色でテスト）の時間的なずれは8msくらいから知覚できるようだ（筆者1人だけをサンプルとした実測：いづれも擬似ブラインドテストでまったく厳密でない）。ただし後者は時間的な遅れとして知覚するのではなく、音色の変化（2音が重なった音色としてのアタック感が変わる）としての知覚である。リズムの変化としては15msくらい差がないと知覚できず、筆者が試したところ、10ms以内のリズムの変化は全然判別できなかった（Fluidのドラムを使用して、表拍バスドラ裏拍スネアの裏拍をモタらせたファイルとモタらせないファイルでテスト：ただし、刻みハイハットなどであれば、10msくらいの変化でもノリの違いは知覚できる）。

可聴周波数域は下が20Hz程度まで、上が16000～20000Hzくらいまでだが、音程として捉えられるのはピアノの最低音A0（約27.5Hz）～最高音C8（約4186Hz）くらいまでらしい。ただし、20Hz以下の低周波でも、振幅が大きければ皮膚に伝わる振動や圧迫としては知覚できる。THDは0.3％くらいから知覚できる人がいるらしい。

志賀＠高槻さんのオーディオの科学という記事に非直線歪みに関するデータが引用されているほか、BBSのログに位相歪みに関する基礎情報に触れたものもある（外部リンク）。

楽器や機材の限界

楽器の最低音は、一般的なグランドピアノが27.5Hz（一番下まで使う曲は非常にまれ）、コントラバスやエレキベースで41.2Hz（こちらは下まで使うこともけっこうある）、Low-B弦を足した5弦以上のエレキベース/コントラバスで30.87Hz、C装置つきの特殊なコントラバスで32.7Hz、ギターやバスヴォーカルで82.4Hz、チャーチオルガンで16Hz程度。音程根音の原理でもっと低い音を擬似的に作り出すことは可能だし、打楽器のアタックの瞬間などは楽器の音程と一致しない音も豊富に出る（が、実用上はどちらもあまり気にする必要がない）。

最高音は、ピッコロや一般的なグランドピアノや4オクターブ（49鍵）のチェレスタが4186Hz、ギターの1弦24フレで1320Hz、ソプラノヴォーカルで880Hz、チャーチオルガンで12.5KHz、5オクターブ（61鍵）または5オクターブ半（66鍵）のチェレスタで5.59KHzくらい（ハーモニクスやフラジオレットは無視：吹奏楽器は奏者の技量と根性次第でけっこうムリがきくものもある）。倍音があるのでこれ以上高い音が出ないというわけではない。

コンパクトカセットの音域は下が20～30Hz、上が15000～18000Hzくらい（9.6cm/s動作時）。PCMはサンプリング周波数の半分（ナイキスト周波数）まで記録できるが、アナログからの録音時にハイパスフィルタが必要なため、実際にはナイキスト周波数の9割ちょっとしか録音できない（デジタルシンセなどで直接データを生成するなら別）。44.1KHz（CD）だと20KHz、48KHz（パソコンの多くや一部のDAT）だと22KHzくらいまで。16bitリニアPCMのダイナミックレンジは98.08db、24bitだと146.24dbになる。可逆圧縮を行うと高域の情報が失われる（たとえばlameのバージョン3.96.1を使うと、192kbps時で19.5KHzくらいから上が切れる）。

アクティブピックアップの最大出力は、EMGのギター用で0.85～3Vくらい（1.75Vが中心）、ベース用だと4.5Vくらい。これが開放端電圧だとすると、1～15.5dbuくらいになる（あくまでピックアップが出力可能な最大値で、普通のセッティングで常にこの出力がなされるわけではない）。パッシブだとスパイク的なピークの上限は（アンプに制限されないため理屈上）上がるが、一般にはアクティブより出力が低い。なお、ミキサーなどのライン入力もハイヘッドルームと称するもので18dbuくらい、例外的な機種でも30dbuくらいまで。

通信の限界

USB1.1のFull Speedモードが12Mbps＝1.5Mbyte/s、USB2.0のHigh Speedモードは480Mbps＝60Mbyte/sだが、これはあくまでビットレート。ローレベルなレイヤーでは、125μsのマイクロフレーム（1秒に8000マイクロフレーム）にいくつのトランザクション（512バイトのデータを搭載する）を乗せられるかという問題で、9なら約300Mbps、10なら約330Mbps、11なら約360Mbpsになる（USB 2.0 specification section 5.5.4で20％の予約が規定されており、マイクロフレームの最大ビットレートの80％がMaximum Periodic bandwidthだとすると6000byte/マイクロフレーム、アイソクロナス転送のデータパケットは500byteを超えているから、12本乗せるのはムリ）。またHigh Speedモードでも、Audio Class 1.0の仕様に従う限り、最大帯域が12Mbpsに限定される（まったく未確認だが、もしマイクロフレームを飛ばさずに送信しているなら、転送量は1500bit/マイクロフレームで、データパケットのDataストリーム（規格上は0～1023byte）が188byteくらいになる）。バルク転送の場合、チューニングした外付けハードディスクで250～300Mbps程度らしい。

44.1KHz/16bit/2ch（CD音質）のリニアPCMが1411.2kbps（モノラルで705.6kbps）なので、USB2.0のHigh SpeedモードAudio Class 1.0の帯域を使い切れば、合計17chまで無圧縮で同時通信できる（たとえば、デジタル入出力各1系統ステレオ＋アナログ入力1系統ステレオ＋アナログ出力5.1chで12本）。48KHz/24bit/2ch/全二重の通信だと4.6Mbpsくらい、前述の通り48KHz/24bit/2chのAES or S/PDIFがオーバーヘッドなしで片道3Mbpsくらい。帯域制限を回避するためにBulk転送を使っている機種もあるが、Audio Class 1.0の用件を満たせないので、独自ドライバが必要になるのが普通（裏技で動かしているメーカーもある模様）。2009年5月にAudio Class 2.0が公開され、利用可能な帯域が増えた（2010年現在、一部の機器しか対応していない、というか、Windows7でのサポートが遅れているらしい：Macはさっさと対応したそうな）。

USBの仕様（リアルタイム通信はエラー垂れ流し）を考えるとエラー訂正信号の付加が必要そうだが、筆者が「Universal Serial Bus Device Class Definition for Audio Devices」と「Universal Serial Bus Device Class Definition for Audio Data Formats」を流し読みした限り、生データ（PCM、MPEGとAC-3、その他に分類されている）をそのまま送っているような雰囲気である（ちゃんと確認したわけではない）。下位レイヤーであるUSBケーブルでの通信自体、エラー率が十分低いのだという解説もあったが、具体的な実験結果などは見つからなかった（ちなみにS/PDIFもエラー訂正なし：訂正が入ると応答時間が犠牲になるのでやむを得ない部分もある）。

ビットレートで見ると、IEEE 1394（FireWire）も400Mbpsまで出せる（上位互換の拡張規格で3200kbpsまでのものもある）し、素のSCSIでも規格上は40Mbpsまで、Wide Ultra2では640Mbpsまで出る。32bit/33MHzの初代PCI（PC133）で1056Mbps、64bit/66MHzの最終規格で4224Mbpsまで、PCIeはギガ単位になるので、オーディオ用途では帯域を心配するだけ無駄である（それよりもリアルタイム転送の仕様が問題）。Ethernet用の1000BASE-Tは名前のとおり1000Mbps。

エンド・ツー・エンドのレイテンシは、PCIやInfiniBandなどで数msくらいのオーダーらしい（未確認）。

伝達

音波の伝達速度は非常に遅い。1気圧の乾燥空気では摂氏温度をtとして331.5+0.61t、正確には、比熱比をk、気体定数をR、絶対温度をTとして√kRTで表し、20℃において343.26m/s（音響インピーダンスは413.3N*s/m^3）。340m/s（1気圧20℃の場合に近い値）で近似することが多い。水蒸気を含む空気の場合、気圧をH、水蒸気圧をp、水蒸気の定圧比熱と定積比熱との比をγw、乾燥空気の定圧比熱と定積比熱との比をγとして√1-(p/H)(rw/r-0.622)分の1になる。

真空中の光速度は299792458m/sだが、媒質により伝達が遅くなる。導線の中の電気信号や光ファイバーの中の光信号は、だいたい200000000m/s（＝2*10^8m/s）くらい、大気中を伝わる電磁波は3*10^8m/sくらいのオーダー（波長によるが、可視光で真空中よりも3％くらい遅い）。電気機器内部での伝達ならナノ秒前後のオーダーだろう（2*10^8m/sだと、200mで1μs、20cmで1ns、0.2mmで1ps：音波が伝達するときに「マッハの風」が吹いているわけではないのと同様、電子がこの速度で「移動」しているわけではない）。電磁波は300MHz弱（超短波＝VHFと極超短波＝UHFの境目くらい、どちらかといえばVHF寄り）で波長が1mになる。

銅線の表皮深さは1KHzで約2mm、周波数の1/2乗に反比例するから、20KHzで0.45mmくらいになる。

その他

インピーダンスいろいろ

オーディオ機器のインピーダンスは600Ωのものが多い（昔の電話機に合わせて統一したらしい）。600Ω以外では、ラインの入力インピーダンスで10～25KΩ、マイクの入力インピーダンスで1～10KΩ、エレキギター直結用の入力インピーダンスで1MΩ前後、スピーカの入力インピーダンスで数Ω、ラインの出力インピーダンスで1KΩ前後、マイクの出力インピーダンスで100～1000Ω（ものにより数KΩ）、パワーアンプの出力インピーダンスで10Ω前後、ヘッドフォン用の出力インピーダンスで数十Ω（ハイインピーダンス対応品は1KΩ前後）、ギター/ベース用のマグネティックピックアップ（パッシブタイプ）の直流抵抗で5～30KΩ、数千円～1万円クラスのシールド線（バランス）で10～数十Ω/km@20℃（ちなみに静電容量は数十～100PF/m@1KHz）、Dsub25を使ったバランス伝送で110Ω、といったものが多い。

通信方式いろいろ

パラレル通信：ISA、ATA、SCSI、PCIなど。
片方向シリアル通信：MIDIなど。
半二重シリアル通信：FireWire、USB2.0、SATA（2ndGen）など。
全二重シリアル通信：USB3.0、PCIe、SASなど。

シリアル通信を複数チャンネル束ねたハイブリット的な方法もある（PCIeなど）。また半二重と全二重の分類は明確でなく、ハードウェア層が半二重でもアプリケーション層では全二重として扱えることが多い。

パラレル通信なら送受信装置をシンプルにできるが、同期や漏話の問題が厳しくなる（とくにクロックが高くなった場合）。パルスを使ったシリアル通信では時分割多重化（Time-division multiplexing/TDM：各チャンネルのデータストリームをフレームに区切って順に送り、またチャンネルごとに仕分けする）などの方法でシリアル区間を通している。

CD-DAのエラー訂正

16bit*2ch*6sample = 192bitの実データに対して588bitのフレームを用意している（詳細についてはSpecification of Compact Disc（外部リンク）というページの説明を参照：192bit記録可能なフレームが98集まって、2352byte記録可能な1セクタを成す）。上記リンク先によると、CDが想定する平均エラーレートは10^-5で、上記の冗長性により（CIRCによる訂正だけで）10^-9程度には収まるらしい。CD-ROMではさらにエラー訂正情報（以外のものも含まれているが）を増やして、2352byteのセクタに対して実データを2048byteとしている（その場合に想定される読み取りエラーは「６５０ＭＢのＣＤ−ＲＯＭ１８３枚に対して１ビットのエラー率」らしい）。

レガシー機器の帯域

以下未確認情報。

電話の仕様はITU（International Telecommunication Union：国際電気通信連合）という組織のITU-T（International Telecommunication Union Telecommunication Standardization Sector：旧CCITT、Comite Consultatif International Telegraphique et Telephonique）という部門が出している勧告に従ったものが多いそうな。アナログ電話の音声は0.3～3.4KHz、ISDNは同等の帯域を8KHz/8bit＝64kbpsのデジタルデータで送る。

AMラジオの占有周波数帯域幅は15kHzで音声は7.5kHzが上限だが、チャンネルセパレートが9kHzでクロストークがあるため3～5KHzで切るらしい。FMラジオとアナログテレビの音声（同方式）は15KHzが上限。アナログハイビション（BS-hiなどで採用されていたMUSE方式）は、Aモードが32KHz/12bit/4chで、Bモードが48kHz/16bit/2ch。

コンパクトカセット（アナログのカセットテープ）は、ポジションにもよるが、下が20～30Hz、上が15000～17000Hzくらい。オランダのフィリップス社が開発した。オープンリールの最低速の半分である4.75cm/s（1.875″/s）で走る。4トラックを往復で2トラックづつ、ステレオで使う。

コンパクトディスク（CD）は16bit44.1KHzのPCM方式で、最高音は22050Hzまで出る。ソニーとフィリップスの共同開発。99トラックまで、最大74分（非標準的なものでは最大94分）まで録音可能。

DAT（Digital Audio Tape）は、12bit32kHz(LPモード)/16bit32kHz/16bit44.1kHz/16bit48kHzのPCM方式で、最高音はそれぞれサンプリング周波数の半分。

なお、アナログテレビの規格であるNTSC（アメリカや日本などが採用）はちょっと面倒な事情を抱えており、カラー化の際に音声を4.5MHz帯で送る都合から映像はその整数分の1で送る必要に迫られ、水平同期は4.5/286MHz≒15.7343KHz、垂直同期は4.5/(286*525)MHz≒29.9700Hzをインターレースで使って59.9401Hzになった（286は白黒の同期周波数に近いものを探して、525は走査線数から決まった）。286 * 525＝150150＝150 * 1001なので、4.5/(286*525)＝4.5 / (150 * 1001)＝30000 / 1001＝30 / 1.001と「割る1001」や「割る1.001」で表現される（実用上は59.94フレーム/秒としたり、60fr/sから0.1％割り引いたりすることが多い：60fr/sを1001で割ればちょうど正確な値になる）。ISDB（日本で採用）系の規格では、いまだにこの端数を引き摺っている。

サンプルレートと周波数

サンプルレート44100Hzのとき、nサンプル周期の音波の周波数がいくつになるか。

2 / 22050Hz	11 / 4009.1Hz	20 / 2205Hz	29 / 1520.7Hz
3 / 14700Hz	12 / 3675Hz	21 / 2100Hz	30 / 1470Hz
4 / 11025Hz	13 / 3392.3Hz	22 / 2004.5Hz	31 / 1422.6Hz
5 / 8820Hz	14 / 3150Hz	23 / 1917.4Hz	32 / 1378.1Hz
6 / 7350Hz	15 / 2940Hz	24 / 1837.5Hz	33 / 1336.4Hz
7 / 6300Hz	16 / 2756.3Hz	25 / 1764Hz	34 / 1297.1Hz
8 / 5512.5Hz	17 / 2594.1Hz	26 / 1696.2Hz	35 / 1260Hz
9 / 4900Hz	18 / 2450Hz	27 / 1633.3Hz	36 / 1225Hz
10 / 4410Hz	19 / 2321.1Hz	28 / 1575Hz	37 / 1191.9Hz

1サンプルは約22.6757μsに相当する。

サンプルレート48000Hzの場合。

2 / 24000Hz	11 / 4363.6Hz	20 / 2400Hz	29 / 1655.2Hz
3 / 16000Hz	12 / 4000Hz	21 / 2285.7Hz	30 / 1600Hz
4 / 12000Hz	13 / 3692.3Hz	22 / 2181.8Hz	31 / 1548.4Hz
5 / 9600Hz	14 / 3428.6Hz	23 / 2087.0Hz	32 / 1500Hz
6 / 8000Hz	15 / 3200Hz	24 / 2000Hz	33 / 1454.5Hz
7 / 6857.1Hz	16 / 3000Hz	25 / 1920Hz	34 / 1411.8Hz
8 / 6000Hz	17 / 2823.5Hz	26 / 1846.2Hz	35 / 1371.4Hz
9 / 5333.3Hz	18 / 2666.7Hz	27 / 1777.8Hz	36 / 1333.3Hz
10 / 4800Hz	19 / 2526.3Hz	28 / 1714.3Hz	37 / 1297.3Hz

1サンプルは約20.833...μsに相当。3サンプルで62.5μs、6サンプルで125μs、12サンプルで250μs、24サンプルで500μs、48サンプルで1000μs＝1msになるのを覚えておくと便利かもしれない。

google電卓用プリセット

式は代入の回数が減るように変形した。以下に半値幅とあるのは半値全幅のこと。

周波数a(Hz)と周波数b(Hz)の音程の違い(cent)：
(log(a / b) / log(2)) * 1200 =
周波数a(Hz)の音とb(cent)音程が違う音の周波数(Hz)：
a * (2^(b / 1200)) =
1200の部分は、bの単位がhalfstepなら12、octarveなら1にする。

相対速度a(m/s)におけるドップラー効果(周波数比)：
(340 + a) / 340 =
相対速度a(m/s)におけるドップラー効果(cent)：
(log((340 + a) / 340) / log(2)) * 1200 =
a(cent)のドップラー効果を生む相対速度：
(340 * (2^(a / 1200))) - 340 =
相対速度は、音源と観察者の直線距離が減少する方向が正。秒速1m（時速3.6km）で約5cent、秒速10m（時速36km）で約50cent（半音）の変化。音速＝340(m/s)での計算。

テンポがa(BPM)（1分間に4分音符a回）のときb分音符の長さ(秒)：
240 / (a * b) =
4分音符の場合は：
60 / a =
4分の4拍子なら、全音符（b＝1）の長さを求めれば1小節の長さがわかる。

テンポa(BPM)で分解能b(チックス/小節)のとき、c(秒)の音価(チックス)：
(a * b * c) / 240 =
テンポa(BPM)の1拍とテンポb(BPM)の1拍を合成してできる2拍の平均テンポ(BPM)：
2 / ((1 / a) + (1 / b)) =
テンポa(BPM)の1拍とテンポb(BPM)の1拍を合成してできる2拍の合計音価がc(チックス)のとき、各拍の音価(チックス)：
c * (b / (a + b)) =
c * (a / (b + a)) =
上の式が先の拍で下の式が後の拍だが、片方わかれば単純な引き算でも求められる。

テンポがa(BPM)でb:cのスイングをするときの分割されたテンポ：
a * ((b + c) / (2 * b)) =
a * ((b + c) / (2 * c)) =
上の式で導いたテンポと下の式で導いたテンポを同じチックス間隔（たとえば8分音符分）で繰り返すと、タイムがb:cに分割される。同じ演算を入れ子にすることもできる。

テンポがa(BPM)のときb分音符連打の周波数(Hz)：
(a * b) / 240 =
テンポがa(BPM)のときb(Hz)の音価：
240 * (b / a) =
テンポ90のとき6Hzは240 * (6 / 90) = 16分音符の連打に相当。

周波数a(Hz)の音と音程がb(cent)違う音がなす音程根音（第一次差音）の周波数(Hz)：
((a - (a * (2^((b) / 1200))))^2)^(1 / 2) =
bはプラスでもマイナスでもよい。やはり、1200の部分はbの単位がhalfstepなら12にする。音程根音が可聴周波数域を下回っている場合、擬似下方倍音としてではなく音量のうねり（トレモロのような効果）として知覚される（これをうなり（beat）と呼ぶ）。

周波数a(Hz)の音に対して音程根音（第一次差音）の周波数がb(Hz)となるようなaより高い音の、aから見た音程差(cent)：
((log ((a + b) / a)) / log(2)) * 1200 =
周波数a(Hz)の音に対して音程根音（第一次差音）の周波数がb(Hz)となるようなaより低い音の、aから見た音程差(cent)：
((log ((a - b) / a)) / log(2)) * 1200 =

ある強さの信号と、a(db)大きさが異なる信号を加算したときの大きさの変化(db)（ホワイトノイズや同周波数同位相の正弦波などを重ね合わせる場合：音波でも電気信号でも同様）：
log(1 + 10^(a / 20)) * 20 =
ある強さの信号に大きさが異なる信号を加算した結果、a(db)音が大きくなっていた場合、元の信号を基準にした加算した信号の大きさ(db)（上と同じ条件）：
log(10^(a / 20) -1) * 20 =

元の周波数のa倍とa分の1倍で半値になるのときのQ：
a / (a^2 - 1) =
元の周波数のa(オクターブ)上下で半値になる（半値幅2a）のときのQ：
(2^a) / ((2^a)^2 - 1) =
半値幅がaオクターブのときのQ：
(2^(a / 2)) / ((2^(a / 2))^2 - 1) =
Qがaのときの半値幅(オクターブ)：
(log(((1 / a + ((1 / a^2 + 4)^(1/2))) / 2)^2) / log(2)) =
半値幅をオクターブで求めて半分にする（または上の式から最後の「^2」を削除する）と元の周波数から何オクターブ上下で半値になるかわかる。よく使うのは

Q	半値幅(oct)	備考
0.577	2.26	ベッセル
0.667	2	上下1oct（2/3）
0.707	1.90	バタワース（1/√2）
0.920	1.5
1	1.388	黄金比
1.414	1	（√2）
1.5	0.945
2	0.714
2.145	0.667	2/3oct
2.871	0.5	1/2oct
4.318	0.333	1/3oct

あたりだろうか。

戻る / 自滅への道トップページ

倍音	音程	最初のCから見た距離	純正律の場合
1倍音	C4	完全1度
2倍音	C5	1オクターブ上の完全1度（完全8度）	完全1度
3倍音	G5	1オクターブ上の完全5度	完全5度
4倍音	C6	2オクターブ上の完全1度	完全1度
5倍音	E6	2オクターブ上の長3度	長3度
6倍音	G6	2オクターブ上の完全5度	完全5度
7倍音	--	2オクターブ上のAとBbの間、Bb寄り	短7度(よりもやや低い)
8倍音	C7	3オクターブ上の完全1度	完全1度
9倍音	D7	3オクターブ上の長2度（よりもやや高い）	長2度
10倍音	E7	3オクターブ上の長3度（よりもやや低い）	長3度
11倍音	--	3オクターブ上のFとGbの間、ややGb寄り	減5度(よりもやや低い)
12倍音	G7	3オクターブ上の完全5度	完全5度
13倍音	--	3オクターブ上のG#とAの間、A寄り	長6度（よりもやや低い）
14倍音	--	3オクターブ上のAとBbの間、Bb寄り	短7度（よりも低い）
15倍音	B7	3オクターブ上の長7度（よりやや低い）	長7度
16倍音	C8	4オクターブ上の完全1度