ヴォーカルシンセを試してみた


もどる
<この記事はただの感想文です>

掛け値なしに感想だけで、役に立つ情報はないのであしからず。

試してみた結果

ヴォーカルシンセ(ボーカロイドなど)が普及してかなり経ち、人間のクセをヴォーカルシンセに反映する技術(2008年9月の段階で筆者が把握していたものとしては、morishシリーズとかVocaListenerとか)も出てきている。2010年1月現在、ツールの利用方法も相当簡易になり、また無料ソフトによる実装も増えて手が出しやすくなったので試してみた。

急がば回れの編曲シリーズで使ったこの演奏歌詞)のエレピを、UTAU+Luna+おまかせ調整のヴォーカルシンセに差し替えたところこんな感じになった。デフォルト音源(AquesTalkがモトだそうな)だと「アンパンマンインタビューflash」で「ジャムを持参」とか言っている声(たとえが古いな・・・)のイメージが甦るのでLunaにしたが、打ち込みのエレピ音源っぽい響きで使いやすかった。

感想

インストールしてぽちっとボタンを押すだけなので作業的には非常に簡単だし、ボーカロイドが売れはじめの頃に標榜していた「簡易な仮ウタ」という役割はこれでも果たせそうな気はするが、歌詞をイチイチ(ひらがなで)打ち込む手間を考えると自分で歌って録音した方が早い気もしないでもない。

そもそも、ヴォーカルは「打ち込みでの代替」自体にムリがある(ギターの方がまだラクなのではないだろうか)ため、どうせやるなら「機械でしかできない」なにかを盛り込まないとナンセンスな気がする(ヴォコーダーや重加工系のサンプラーに食わせてしまう手もあるが、だったらモトがなんでもぶっちゃけ関係ないわけだし)。

一応断っておくが、筆者はヴォーカルシンセ自体が嫌いなわけではないし、ボーカロイドが普及し始めた頃に見かけた「グラディウス」や「ドルアーガの塔」のBGMを歌わせたデモなんかは普通に面白かった(生ヴォーカルで「テケツクテケツク」とか「いくら丼が食べたかったなー」とかを「真面目に淡々と歌える人」はまずいないので「機械にしかできない」という意味ではその通りだろう:無機質な雰囲気を曲の質感として盛り込んでしまう方向が有望なのかなぁ)。

ボーカロイド系の製品はタ行のアタックがドギツい印象があったのだが、今回の結果を聴く限りLunaではそんな音になっておらず、最近のヴォーカルシンセに共通する傾向or流行ではないらしい。おまかせ調整は意外なくらい賢く、とりあえずおまかせでやってみて、気に入らなかったら悩む、といった使い方で十分「簡易な仮ウタ」になるのではないかと感じた。

ちょっと脱線した感想

筆者としてはUTAUの構成が面白かった。エンジン+フロントエンドでインターフェイスがバッチファイル/コマンドラインオプション的なもの、という構成はLameによく似ている。設定もASCIIまたはShift-JISコードのiniファイルで細かい指定がラク。

もともとは「断片的な音声からムリヤリ歌唱を合成する」作業(俗に「人力VOCALOID」略して「人力ボカロ」と呼ぶようだ:フレーズやセリフなどを切り取ってループシーケンサーで回すもの(ループ系)も含むようだが、たいていの人にはやっていることの違いがわからないだろうからそんなものだろう)の支援用だったらしい。

編集画面は(ボーカロイドを模した部分も多いのだろうが)90年代ごろのピアノロール式シーケンサーのような見た目で、操作フィールも近いものがある。実際にはDominoなどで打ち込んでSMFで読む人が多いだろうが、面白いデザイン。

随時追記

2010年12月追記:雪歌ユフというライブラリの評判がよいようだ。いつごろから人気が出てきたのかわからないがreadmeには「081102/二版」とある。ヴォーカルシンセに「かすれ系」のニッチがあること(機械っぽさが耳につきにくくなる効果と、曲調的な需要)には多くの人が気づいていたと思うが、個人制作の機動力が企業の開発陣を出し抜いた格好になる。2011年1月追記:クリプトンが2010年4月に初音ミク用の「追加音声ライブラリ・パック」を売り出したらしく、メーカーもメーカーで頑張っているようだ。

さらにどうやら、2009年8月にVCV規則合成(ざっくり言うと、vowel+consonant+vowel=前の母音+子音+母音の形でサンプリングすること:10子音×5母音をCV規則でサンプリングすると50音で済むが、VCV規則でサンプリングすると250音必要になるため、サンプル数は膨れる)を取り入れたらしく、下にリンクした支援Wikiで「歌詞を連続音にする」という名称のプラグインが公開されている。

リアル志向はナンセンスだろうと思っていたが、たとえばlittle birdという曲などは、ぱっと聴いただけでは重加工系のリアルヴォーカルと区別がつかないレベルだし、あえてベタ調子にした雪峰というカバー曲もある。たとえ今は技術と気合を兼ね備えた一握りの人たちの領域であっても、気づいたころには誰にでも手が届くようになっていそうで興味深い。現在のところリアル路線を真面目に追求すると調整が大変なようで、UTAUのエンジンを使わず自前でやっている人もけっこういるようだ。VCV規則合成のような計算機による力技と、手作業による力技の両方が、しばらくは共存しそうに思える。つぎの大波は音声モーフィングあたりかなぁ。

2011年8月追記:市販ライブラリユーザーも頑張っているようで、FREELY TOMORROWという曲が話題になっている模様。ここまでくると、あとは技術的コストの縮小に合わせて「ホビージャンルとしては発散(一番乗り競争が終息したのち氾濫期を経てジャンル受け狙いに縮小)、ビジネスツールとしては収束(お約束化)」の方向に向かうしかなさそうな気配だが、もうひとヤマくらいあるのだろうか。

2011年8月追記:本家サイトによると「2009/12/25 [Ver. 1.0]公開しました」だそうなのでいまさらだが、Sinsyというシステムがあるらしい。2014年5月追記:省力化の面でかなりの進歩があったようだ。ヴォーカルシンセのコモディティ化に一役買いそうに見える。

2011年12月追記:タイムマシンという曲が好例だが、一種のコラボレーションプラットフォームというか、分業でマルチメディアを作るためのコア素材としての活用もあるようだ。これらのコラボでは、ゆるやかに連携しつつ独立度の高い分業を行うデジタルドメイン(実演性の低いパート)が起点になって、アナログドメイン(実演性の高いパート)の参加は従来の自然発生的なコラボ(「お借りしました」系)に頼るところが大きい。結果的にデジタルドメインの裾野が広がり、作品自体も「使われる」ことへの柔軟性が高くなっているように思われる。デジタルドメインでもMMDのような作り込み系のパートは、アナログドメインに近いポジションかもしれない。こういった動きがヴォーカルシンセ曲に、極端な先鋭化路線(たとえば平成歌謡曲がたどったように)とは少し異なる拡がり方をもたらし得るのではないかと思える。

2015年8月追記:youtubeで面白い分析を見つけた。2013年に筆者が(ウェブ公開を意図せず)書いた分析を掘り出してみたところ、ボーカロイドのブームが末期症状を目前にしているという認識はあったようだが、こういう急激な失速は予想していなかった(分析の趣旨としては、当時のマーケットがゆるやかに消滅していく間に裾野が広い別のマーケットを開拓しないと商売が行き詰まるというもの:後知恵に過ぎないが、放ってさえおけばゆるやかな衰退は望めたと思うんだけどねぇ)。UTAUの方も動きが少なくなってきているようで、むしろこちらがカナリアなのかもしれない。まあブームが終わったなら終わったで、ブームのときとは違う「面白いこと」を見つける人が出てくるんでしょう、きっと。

2015年8月もうひとつ追記:Dr.松浦がSoundcloudで活動しているのを今更発見した。いやー、いつかこういう形態に落ち着いてくれるのだと思っていたが、少しだけ長かった。それはそうとヴォーカルシンセ(なのかヴォコーダーなのか聴いただけでは区別がついていなかったりするが)、筆者の考えるヴォーカルシンセらしいヴォーカルシンセというのはまさにこういう感じ(だと後追いで言っても恥ずかしいだけだが嬉しいので言っておきたい)。マキシマイザーの使い方も、筆者好みでは決してないが、簡易なスピーカで鳴らすと「なるほど」ど思える。2015年8月追記:また行方不明になった模様。いいよ、この人はそういう人だから。どっかでフラっとまたなんか始めるに違いない。2019年10月追記:うーん、そっかぁ。いやぁ、なるほど。さらに追記:知ってる人も知らない人も、水のマージナル(リンク先の10曲め「wandering_up & down_20171223」)だけでも聴いてみたらいいと思う。

2015年8月追記:いつのまにかボーカロイドがバージョン4になっていた(新音源の音街ウナを使った例)。リアルヴォーカルの重加工が先鋭化している(こま切れにしてガッツリ加工する傾向が強まっている)のと合わせて、合成とリアルの境界がさらに曖昧になっているようだ(合成の製作者側でも、オートチューンを使ってるっぽい雰囲気をあえて残す方針が普及しているように見える)。マーケット的には、今更スペックを上げても衰退の歯止めにはならない(カジュアル製作の需要がネタ切れと高敷居化で枯れ果て、プロユースにも技術的フィードバックないしバックポートが進んで「どうせ同じことができるならリアルボーカルでやった方が商売手広くできるじゃん」という結論に落ち着く)段階に進んでいるように思えるが、引くに引けなくなった先鋭化の果てに異形のテクノロジーが生まれるのもこんなタイミングなんじゃないかと思う。にしてもすごいなぁ、ヤマハのエンジン。

2019年10月追記:2015年の段階で「これは終わったね」みたいなことを書いてしまったのだが、パッケージソフトの「販売数のシェア」は堅調だったらしい(あくまで「調査対象範囲に対する割合」であって、売れ行き自体は不明:たとえば同じ調査の「ワープロ・エディタソフト部門」で、今ではすっかり教材屋さんになったジャストシステムが、20年以上ブッチギリの首位を取り続けている)。筆者の感覚では、2015年の時点ですでにコア層(創造的なコンテンツの作り手層)は崩壊していて、あとは狭くジャンル化された量産コンテンツが行き場のない「固定ファン」と一緒に燃え尽きるまでの「燃え尽き方の問題」だとしか思えなかったのだが。コア層の崩壊が全体に波及するまでにタイムラグがあるし、量産化の前段階には一時的な投資の増加がつきもので、ジャンルの狭隘化は総数の減少と引き換えに単価の上昇をもたらすはずではあるのだが、それでもしかし、2018年にいたってもソフトが売れているという状況は、2015年時点ではまったく想像できなかったし、2019年の筆者にとって大きな驚きだった。ブーム自体は数字の上でも終息した(ついでに音楽産業全体の売上が下げ止まる気配を見せていない)らしい調査結果も見つけたが・・・これだけ明らかにユーザーが離れていて、その一方でソフトが売れてるってのは、もし数字がこの通りなのだとしたら「需要のないところに投資がじゃんじゃん集まってる」状態なんじゃないのか。筆者の目には、市場が「穏やかな消滅」ではなく「派手な断末魔」に(完全ノーブレーキで)突き進んだ結果にしか見えない(しかしねぇ、いわゆる「市場プレーヤー」だって大半は「仕事でやってるいい大人」なわけで、我ながらちょっと現実味がない仮説だよなぁ:ということは、きっと決定的な何かを見落としているんだろうけど、それが何なのか見当がつかない)。まあおそらく、あと1年半くらい(2020年の動向が結果として出てくるまで)様子を見れば、何が起きてたのかもなんとなくはわかるんじゃなかろうか。

2019年11月追記:とかなんとか言ってたら、ドワンゴの苦境が話題になってた。そっかぁ、そういうこともあるのかぁ。注:2014年にKADOKAWA(ここも話がややこしく、株式会社KADOKAWAになったりカドカワになったり忙しいが、ようするに旧角川グループホールディングス)と経営統合して、組織が何度も(それはそれは複雑に)変わっているものの、2019年現在も「株式会社ドワンゴ」は存続している。

2020年1月追記:ここまでの話を書いていて「なんかこれどっかで聞いたような」と思えてならなかったのだが、セガが池袋でたい焼き屋を始めたというニュースを見て思い当たった。コンパイルが迷走してたときの感じとソックリだ。だから何だということはないが、モヤモヤしていた記憶がスッキリした。しかしこのたい焼き屋のニュース、「セガは反省も学習もしてないのか」が第一感だったのだが、儲かってて店舗増やす計画があるらしい(風聞)。そうか、そういう方向に反省して学習したのか、さすがだなセガ。ぷよぷよ焼きもちゃんとあるらしい。

2020年12月追記:ボーカルシンセ以外の側面として、いわゆるキャラもの、ありていに言えば「ブランド品の萌えキャラ」としての地位が(とくに初音ミクを中心に)あって、やはり緩やかに縮小していると筆者は理解していたのだが、それは視野の狭い見方だったよう(追記:複数科目で学校の教科書にも載ったらしく「公の場所に晒してもいい萌えキャラ」として無敵の地位を手に入れた模様、2019年10月の追記で筆者が見落としていた「決定的な何か」はこの地位が生む力なんだろうというのが、2021年4月に振り返ってみた印象)。それはそうと、中国でこんな動画が作られていたらしい。やっている内容がお寒いのには違いないが、映像演出の可能性がここまで広がっているのかと思うと、驚愕しかない。最後の最後で撮影場所の様子をバラしているが、できちゃうんだねぇ、こんなこと。なお内容とはまったく関係ないが、ドラムの人(菊嶋 亮一さんという方らしい)が上手い。どんなビートやサウンドの持ち主なのかは音を聴いてみないとわからないが、動作だけでわかるほどのレベルで上手い。ちょっと注目してみよう。

2021年2月追記:とかなんとか思っていたら、クリプトン(主体は産総研みたい:とくに2021年以降)がkiiteなるサイトを立ち上げていたようだ。うーむ、これは凄い(2月末時点での開発履歴が「2020/08/13 19:30更新」で止まっているが、ツイッターには2月11日の記事と2月9日の更新情報があったので、メンテナンスはされている模様)。

2022年3月追記:技術的なニュースを追いかけなくなって随分経つが、この間「NEUTRINO」(NEURAL SINGING SYNTHESIZER:2020年2月リリースらしい)というシンセを知った。本家サイトによると「楽譜から発声タイミング・音の高さ・声質・声のかすれ具合などをニューラルネットワークで推定します。上記の推定されたパラメータを元にvocoderで音声を合成」らしく、ざっくりとした理解としては「ヴォーカルシンセのパラメータ調整(いわゆる調教・調声)部分を教師あり学習で自動化した」ということのよう(ここでいう「楽譜」はSMFではなくMusicXMLを使う)。リリース直後は「東北きりたん」というライブラリを利用した俗称「AIきりたん」が先行して有名になったようだが、公開されている作品を聴いてみると男声ライブラリ「NAKUMO」との組み合わせがハマっている。またシンセのリリース直後には、Melodyneでゴリゴリにブラッシュアップした作品も公開されていた模様。もとは省力化のための技術のはずだが・・・凄いね。

2023年6月追記:なんかすごい飛び道具が飛び交ってる模様。AI Coverだってさ。そしてなぜかFreddie Mercuryがこの加工(もしくは現時点でシェアが大きいソフト)にハマるようで、YouTubeなんかにかなりの数がアップロードされている(こんなのとか:https://www.youtube.com/watch?v=vypfp4is-BI)。ざっと流してみた限り、マイコーとかレノンのバージョンにここまでフィットしたものはなかなかなさそうな感じ(なぜかトランプ元大統領の声を使ったものも大量にある:ご丁寧に画像までデッチあげてあるものも)。

2023年12月追記:Suno AIという自動作曲ソフトが人気らしい。中身が驚くほど革新的なわけではないようだが、歌詞を読ませるとヴォーカル入りの音声ファイルを出力するというキャッチーさが、一気に話題を呼んだようだ。んー、個人的には、ベースアレンジの自動化ができたら(筆者にとっては醍醐味のひとつなので、機械任せにしようとは思わないが、ツールとして)画期的じゃないかと思う。

使用ソフトに関連するリンク


一足飛びの目次に戻る / 音楽メモの目次にもどる

自滅への道トップページ