Back

自動生成音楽におけるサウンドデザインに関する考察

自動生成アルゴリズムによる音楽およびその音素材の設計には、慎重なパラメータの選択とコントロールを要します。
たとえばドローンのようなプリミティブな音の持続、ミニマル・ミュージックのような一定のパターンを記憶させたもの、あるいはイアニス・クセナキスが提唱した「確率音楽」といったものは、比較的シンプルなアルゴリズムによって実現が可能です。

対して、音楽がより「人間らしくある」ために厳密にデザインされるべきものとしては、以下が挙げられるでしょう。

  • 音色の選択
  • 音の響きのバランス
  • 音ごとのゆれ
  • 同一音の頻度、あるいはリズムの形成
  • 特定の音の生成のきっかけ (入力パラメータ)
  • 調子の変化のタイミングと方向性

これらの要素について、拙作の「絶えず流れる光: 緑」をまじえて、どのようなアプローチをとるべきかを考察したいと思います。


楽曲について

「絶えず流れる光: 緑」は、アルゴリズム音楽生成に特化したプログラミング環境であるSuperColliderを、さらにWave Field Synthesis環境に合わせて拡張したプラットフォーム「WFSCollider」を用いて制作された作品です。
SuperColliderのもともとの機能による音の生成・合成に加え、10メートル四方の空間内で自由に音像を動かす操作が可能になります。

内容は4分半程度のもので、何らかのデバイスによってリアルタイムに操作するのではなく、どのタイミングで何の音を使用するかはある程度あらかじめプログラムされています。
ただ、細かな音の再生のタイミングや音像の位置などには、確率によるランダム性が施されています。


音色の選択

コンピュータによる音楽制作では無制限とも言えるほどの種類の音色から選択することになり、それは楽曲全体の印象にも大きな影響を与えます。
今回は空間内で音を動かせるWave Field Synthesisという環境を活かすため、人工的なシンセの音というよりは、触覚や視覚によって質感を感じられるかのような音で構成することで遠近感を演出したいと考えました。

素材となる音は楽器音や環境音を元とし、それらを加工(ピッチシフト、フィルタリング、逆再生)して作成します。

  • チェロの伸ばされた単一の音
  • ピアノの伸ばされた単一の音
  • チェレスタの単一の音
  • ウィンドベルの音
  • 大太鼓の音
  • シンバルを擦る音
  • 葉擦れの環境音

音の響きのバランス

一定の音域に複数の音が集中して重なりすぎてしまうと、響きの質は落ちてしまいます。
そのため、おおまかに低音域(200Hz程度まで)、高音域(1000Hz以上)、その中間域で考えてバランスを見ます。

特に高音域は気をつけるべきであり、この域で一つの音を伸ばし続けるのは聴取体験が不快なものとなってしまう恐れがあります。

楽曲全体の音情報。上が波形、下がスペクトログラム

この図の下半分では、曲中でどの高さの音が現れているかがわかります。
重要な音は基本的に中間域にまとめながら、高音域には葉擦れやウィンドベルの音、低音域にはチェロの音をメインに据えて響きを支えています。


音ごとのゆれ

ゆれというのは、たとえば人間が楽器や声などで同じ音を繰り返すときに必ず現れる、ピッチや強さのわずかな差異です。
ゆれの無い音が繰り返されると、途端に「人間らしさ」は失われます。

この楽曲でもその嫌いは表出してしまってはいますが、強弱と音像の位置を音ごとにわずかに変えるという処理を施して機械的な印象の緩和を試みています。
他の対策としてはたとえば、一つの音を表現するためにより多くの音素材を用意したり、ピッチや発音後の音の揺らぎ(モジュレーション)を変えたりといった方法が考えられます。


同一音の頻度、あるいはリズムの形成

人間には、決まったパターンを見出す(聞き出す)精度が非常に高く、わずか3~4個の音が決まったタイミングで現れるだけでそこにリズムを感じ取ります。
ランダムに音を発生させるのは、面白い効果が得られる一方で、意図しないリズムを聴かせる恐れも同時にはらみます。先の〈音ごとのゆれ〉と合わせて、各音の発生の確率を丁寧に調整することが必要になります。


特定の音の生成のきっかけ (入力パラメータ)

今回の楽曲では、どのタイミングによってどの音を生成するかが前もって設計されていますが、よりコンピュータによる生成に任せたい場合、そのきっかけのパラメータは非常に多くの選択肢がありますし、インタラクティブなものを制作するのにも応用ができます。

入力パラメータには、以下のようなものが考えられます。

  • 人の目や手などの(場合によってはマウスやコントローラーなどのデバイスを通じた)動き
  • 一定の空間内の人の位置や密度
  • カメラに写る色
  • リアルタイムの様々なデータ: 気温、天気、湿度など

しかし私が重要だと考えるのは、この入力が人間にとって説得力のある形で音として出力されているか、特に心理的に入力と出力の関係性を感じられるかという部分です。

たとえば色を入力パラメータとして、白と同じスペクトルを持つ音としてホワイトノイズを対応させたり、高い周波数を持つ紫と可聴域限界に近い高音を対応させたりするのは、数値としては同じであるかもしれませんがそれ以上でもそれ以下でもありません。

最終的に、どの程度リスナーやパフォーマーにとってコントロールを可能にさせるかというところもデザインできるようにするために、入力と出力を丁寧につなげるのは重要なことだと考えます。


調子の変化のタイミングと方向性

その楽曲が持つ調子がどのくらい持続するべきなのか、そもそも調子は変化すべきかずっと同じものであるべきか、また変化すべきならどのタイミングなのか。
これは楽曲が聴かれるシチュエーションによって大きく変わるであろう要素だと考えられます。

今回の曲はコンサート形式で聴かれるものであったため、1分強ごとにメインでなり続ける音を大きく変えることで飽きや疲れを緩和しながら、曲の統一感を得るために「長く鳴り続ける低音付近のドローンと、ランダムにちらつく高音域付近の音」というスタイルは共通させています。
つまり、調子の変化はそのタイミングだけでなく、どのくらい遠くに(あるいは近くに)変化するかも関わってきます。
あまりに大きく変化しそのまま最初の調子に戻ることがなければ「統一感がない音楽」となり、逆にほとんど変化がわからないようなものは「退屈な音楽」となってしまうでしょう。


結び

私は器楽演奏のための音楽からアルゴリズムを用いた音楽へと、媒体こそ変えることはありましたが、制作する音は常に有機的なものを目指してきました。そのなかで、アルゴリズムによる音と音楽のデザインで核となるのは、いかにランダム性をコントロールするかではないかというのが、私の現在の答えです。

Unforgotten Dialogue (2021)

インタラクティブインスタレーション / オーディオビジュアルパフォーマンス
5’23”

私の研究における結論を実践したものの一例である。その研究の課題とは、「作品がどのような特徴を呈していれば、観賞者はその作品に対して自発的・創造的な行動を行うことができるのか」というもの。

この答えを求めようとした理由は、私自身が作品の鑑賞者であり制作者であるうえで、作品との関係性に関して考えざるを得ない問題が存在し続けていたことにある。観賞者としては、作品に対してただ何かが起こるのを待つことしかできないという感触があったこと。制作者としては、こと芸術に関する教育において、すべての要素に意味をもたせるべきであるという思想が強く根付いていたことである。

我々は作品を使って、何かを語らなければならないのだろうか。あるいは作品を理解し、読み解き、そこでやっと何かを得ることができるべきなのか。作品には必ずストーリーがなければならないのか。

私は、先の課題を解決できうるような、作品が呈すべき要素を導き出した。それは次の三つである。一つは、観賞者によるプロセス―すなわち作品の具現化のための具体的・現実的な行動―への受容性が明示的であること。次に、そのプロセスの持つ複雑性に応じた反応が返せること。そして最後に、充分な透明性をもっている―すなわち、いかに「それそのもの」であるかということ。

まず最初の要素は、言い換えれば、観賞者による具体的あるいは身体的な行動によって作品の姿や結果を変容させることができるということであり、作品がインタラクティブであるということと同義である。

二つ目について、たとえばこの作品で採用されているプロセス(作品に対して行う行動)は「声を出す」という動作である。この動作には、声のピッチとその変動、音量とその変動、リズム、言語、言葉の音要素(子音や母音)、選択した言葉の意味など、それ自体にあらゆる情報が含まれている。このようなたとえ単純で直感的な、トレーニングを必要としない行動であっても、それそのものが既に一定の複雑性を示しているために、豊かな差異をもたらす可能性を孕んでいる。誰が行っても同様の結果になるのではなく、その行動の持つ複雑性に対応して、個人個人に対して必ず異なった応答を返すことで、「その人自身がその作品に対峙している」という事実を増幅し強調する。

そして最後の、作品が透明であるという意味を明らかにするために、「透明でない」作品とは何かを説明する。透明でない作品とは、それ自身以外のなにものかを表したり暗示したりするなどして、観賞者をその作品そのものから意識をそらさせ、その外部にある「表している対象」に向けさせるものである。したがって、「透明である」作品とは、あらゆる暗示、メタファー、記号化、意味や事象の置き換えを前提としないということになる。これを実現するためには、鑑賞者が提示したプロセスが、別の意味や象徴にすり替わることなく、プロセスが含有するゆらぎや推進力を損なうこともなく、むしろ増幅して再表出することが求められるのである。

しかし、作品が表現するものがメタファーや記号であるか否かを明確に判断することは非常に困難であり、またそのための絶対的な基準が存在しているわけではない。なぜならそれを決定するのは、それを体験する観賞者であるからである。作者は、観賞者をコントロールすることはできないし、しようとするべきでもない。

絶えず流れる光: 緑 (2019)

フィクストメディア: Wave Field Synthesis

作者自身の持つ共感覚―音の高さにより、かすかではあるが異なる色が感じられる―を使うことを実験している。
この作品では緑をテーマとしており、言葉として「緑」と認識できる色が感じられる音で主に構築されている。
変化し続ける色や光の流れを、音として空間に実現することを模索した。

計画された記憶 18-DH (2018)

オーディオビジュアル: 映像、8chサウンド
6’40”

これまでオーディオビジュアル作品群の制作を通して、聴覚的要素と視覚的要素との一致や統合を模索してきた。この作品では、「人はどの瞬間に、自らの記憶と外部刺激との関連性が認識できなくなるのか」という問いに、ひとつの答えを見出そうと試みた。

外界から窓を通して入ってくる日常的な音から始まり、徐々に催眠状態に入るかのように曖昧な姿に変化する。それが飽和すると、記憶が脳内で明滅するようにあらゆる音や映像が断片的・非連続的に入れ替わる。

色―声(しき―しょう) (2018)

オーディオビジュアル: 映像、2chサウンド
5’30”


映像と音によるこの作品において、色彩と音響の関係性は私自身が音を聴くときに連想される視覚的イメージをもとにしており、両方のイベントが同時に起こることによる「色(視覚)」と「声(聴覚)」の混乱および錯覚の誘発を試みている。

色―触(しき―そく) α (2018)

オーディオビジュアル: 映像、2chサウンド
7′

映像には、暗い背景の上に人の手が現れる。その手は、指をゆっくり閉じる、ゆっくり開く、指で平面をなぞる、軽く叩くなどといった単純で直感的な動作を行う。この一つ一つの動作に同期して、無機質な物音が聞こえる。

私の全創作に通底しているコンセプトとして、「鑑賞者がただそこにあるものを、一人ひとりが持つ独自の見え方・聴こえ方によって純粋に体験できる」作品制作を目指している。そのためには、作者は作品によって「作品にあらわれているものとは全く別の何か」を表象したり演出したりすることを辞めると同時に、このような純粋な体験のためにはある程度の時間的持続が必要であり、そのための鑑賞者の興味の喚起と持続は必要であると考えた。

この作品はその第一のステップである。素材として手を選択したのは、鑑賞者の日常的・直感的な運動感覚に訴えたかったためである。またその動作は、別の言葉や感情などを表しうるサインやジェスチャーを可能な限り排したものが選択されている。一方で、手の動作と音が完全に一致したものだけで作品を構成した場合、鑑賞者はそれが作品として並べられていることについての意味や象徴を解釈しようとしてしまうだろうと考えた。そのため、飽くまでも純粋に視覚的・聴覚的情報に意識が集中し続けられる手立てを取る必要があった。そこで採用したのが、「動き」という一点によって関連付けられた、しかしわずかにズレが生じている音を同期させるという手段である。

鑑賞者は、手の動きからどのような音が鳴るかを経験的・直感的に想起する。映像には手が現れるのみであり、その他のオブジェクトは不在であるため、そもそも音が聞こえないはずの動作も多く含まれている。しかし実際に作品から聞こえるのは、たとえば指を開いた状態からゆっくりと握る動作には紙を丸めるときのくしゃくしゃという音、指でなぞる動作には石同士をゆっくりこする音などである。このように、複数の感覚間 (視覚と聴覚) の情報が限りなく近いと同時に、そこに明確なズレが生じているとき、鑑賞者は映像では不在であるはずのオブジェクトを音によって幻視したり、自身の手の運動感覚を通した触覚的な異物感やむず痒さのようなある種の不快感を錯覚しうる。

響きの庭 Ⅱ 〜 5本のファゴットのための (2017)

ファゴット五重奏
13′

拍子や秒数などのような、ひとつの基準によって定められた単位によるのではなく、5人の奏者がお互いの音を認知することにより成立するアンサンブルを目的とした。奏者は自らの音を奏する際は常に「その瞬間の音あるいは間(休止)」に依存しており、5人のなかには中心となる存在は無くなり、互いに対等となる。

曲の構成は大きく二つに分けられ、前半は〈テーマと4つのバリエーション〉、後半は〈ゆらぎと共鳴〉である。
前半の〈テーマ〉となる部分ではひとつひとつの音は独立し、前後の音との能動的なつながりは、音の発せられるタイミングという点以外にはまだ表れない。そこから〈4つのバリエーション〉を通じて、一つのパートの中での点同士のつながりから、さらに他のパートへのつながりへと発展し、有機的なメロディを形成してゆく。
打ち寄せる波のようにパターンがくり返される部分から〈ゆらぎ〉が始まる。ただし、パターンごとに、奏者はいくつかの音あるいは休止から毎回選択するように設定されており、それによって生まれるハーモニーは偶然性を帯びる。そして最後の〈共鳴〉では、断片的なメロディが複数のパートで奏されるが、このメロディの形や長さはパートごとによってわずかに異なり、その「ずれ」が音色のグラデーションを生み出す。全てのパートがA音に収束し、曲が閉じられる。

ひび割れたアラベスクⅡ (2017)

ヴァイオリン独奏
4′

素材として選ばれているのは、ガラスのような軽やかさと透明感、それが叩きつけられたときのような衝撃とその乱反射というイメージを覚えさせるもの。
そして同時に、力強いダンスのようなエネルギーを加え、もし無機物が生命をもって踊りだすとどうなるか?という面白さを表現したいというのが、この作品の根底にあるコンセプトである。

オパールの霧 (2017)

ピアノ、ライブエレクトロニクス
6’30”

音楽は通常、調性やハーモニー、リズムパターン、音色などの変化あるいは移動を聴者に観測させることで、あるセクションから別のセクションへの切り替わりを提示する。
このような、音楽の構成における「境界」をにじませることに焦点をおき、限られた音のみで構成された色彩のグラデーション、エレクトロニクスと奏者との相互の呼応から生まれる即興性、一定と不定のリズムの混合といった要素を取り入れた。

モノクローム・アイビー (2016)

フルート、ファゴット、ピアノ
8′

ファゴット、フルート、そしてピアノという編成で何ができるかを考えたとき、ピアノの硬質な音による冷たい壁の上を、二本の木管がツタのように絡み合ったり離れたりしながら伸びていくというイメージが想起された。