新:2025年3月の当サイトアクセス傾向
前: 「一発屋」を捜せ(1970年代)
次:「以心電信」YMO

NHKスペシャル「AIでよみがえる美空ひばり」視聴で思ったこと


2019/09/30  歌謡曲が好き AI美空ひばり 美空ひばり AIでよみがえる美空ひばり

目次
  1. 楽曲
  2. 歌声
  3. 映像
  4. 批判と熱望と
  5. 完成
  6. 最後に

NHKが日本のAI技術、3D映像技術の発展を誰もがわかる形で世に知らしめるにはどうしたらいいか?これを考えた時に、過去の有名人を「復活」させるという考えに至ったのは当然とも思うし、それ自体がとても難しかったのではないかとも思うのです。

AI技術に関しては、漠然と「怖いもの」だったり「人間の仕事を奪うもの」とあえて煽り報道するような媒体も珍しくないわけで、それでも実際にAI技術がどの程度浸透して、何ができるのか?を理解する人はものすごく少ないのだと思うのです。コンピュータ系の仕事をする私にとってもAI技術が関わることはほとんど無く、実際に今できる最高の技術でできることはどの程度なのか?という問いには答えられなかった部分です。

今回NHKがAI技術で再現しようとしたのは美空ひばりさん。日本の代表的な歌手であり、幼少期から数多くのヒット曲を歌い、数多くの番組に出演した「日本人なら知らない人はいない」と思うような歌手であります。そして死後30年を経過し、そのすごさを知らない世代も多くなってきています。しかし、生前の彼女の歌声を知るものは40代の私も含めてまだ多く、脳裏にそれぞれの「美空ひばり像」を持っているわけです。その美空ひばりさんに様々な技術で「新曲」を歌わせることができるか?そして現在技術ならできるはずだという信念でこれが作られたであろう事は想像に難くありません。


NHK
【AI技術】美空ひばりが現代によみがえる
NHKスペシャル「AIでよみがえる美空ひばり 」
http://www6.nhk.or.jp/nhkpr/post/original.html?i=20369

番組自体は個人的にはあまり期待しないで見始めました。民放局がいくつか過去の亡くなった歌手を「映像合成技術」で再登場させ、現実の歌手とデュエットさせるなどの企画は何度か見ていますし、それは元の映像、歌声をそのまま使用したところでもありますから、当然違和感は最小限に抑えられているからでもあります。いくらAI技術、ボーカロイド技術、3D映像技術が進んだところで、元の音声・映像を「模倣」することしかできないわけですから、一から「新曲を歌わす」のは一定のレベルには達するだろうが、まだ課題も多いだろうとも思っていたわけです。

楽曲


このプロジェクトで肝になるのは「新曲を歌わせる」です。その楽曲を依頼されたのは美空ひばりさんの生前最後に発表されたシングル作品である「川の流れのように」を作詞された秋元康氏。(ちなみに美空ひばりさんが歌唱する川の流れのようにをNHKは映像で持っていないようなので、東京ドームコンサートまたはテレビ東京「演歌の花道」の映像がよく使われます)
番組では秋元氏がコンペ的に集められた「曲」を選択する様が一部紹介されています。当然数百曲の候補の中から決めることは不可能に近く、サビの一部分だけで絞られていく様というのはなかなか作曲家としては大変だろうなとも思います。その1フレーズで秋元氏のお眼鏡にかなわなければならないのですから。
秋元氏が選んだ曲を元にニューヨークの喫茶店で詩を書き上げるのも、制作の様子を垣間見れて面白く感じました。AKBなどの楽曲もこのような手法なのではないかとも思いますし。

歌声


美空ひばりさんの歌声を担当したのはヤマハのプログラマーである大道竜之介氏。東北大学大学院工学研究科ご出身でボーカロイド、音声合成、カラオケ採点など、歌声をコンピュータで扱うことに精通した方とされます。
歌声自体は一定の基準でパターン化できるとはいえ、そのパターンの数は非常に多大。そこから「正しい」と思われる音声を抽出するということはむずかしいものであることは、素人の私が見ても理解できるところです。美空ひばりさんの過去楽曲から歌声を取り出し、その特徴をAIに覚え込ませ、新曲に最も適する音として出力する。それを繰り返して1曲の歌声を再現しようとしたわけですね。
そして、秋元氏は楽曲に「語り」を加える。その「語り」の具現化も元となるデータを1966年の「悲しい酒」の語りから作成すると、非常に寂しく、悲しいものになってしまう。曲に込められた前向きな表現を行うための「元データ」となる音声データが必要だった。美空ひばりさんの息子(養子)である加藤和也氏の手元にある氏が幼少期に母親美空ひばりが吹き込んだ「読み聞かせテープ」ここからの音声を元に愛に溢れる前向きな語りを現実化するという手法です。

ボーカロイドがどれほど完成の域といっても、まだまだ人間の声とはちょっと違うな。ホゲホゲ~というなんとなく機械的な感じがどうしても抜けないなというのは思うところです。だからこそHOYA社の音声合成ソフトウェア VoiceTextで作られる「ショウ君」の音声で、どこか緩さを感じるナレーションが番組に合っている「モヤモヤさまぁ~ず2」のような人間では出せない雰囲気を持たすことに成功している例はあるとしても、なかなか現実世界ではまだ文節録音による音声合成が消えないわけですね。昔の新幹線ホームの「ひかり 521 号 新大阪 行きが~」みたいないかにもな自動放送の感じになっちゃう。(今はかなり改善されたけどね)

今回番組途中の段階ででも、かなり機械感の抜けた、雰囲気的には「美空ひばりだな」と思えるくらいのクオリティは確保できていたように思います。そして、美空ひばりさんを生前目前で接していた後援会の皆さんの前でお披露目するのです。しかし、ダメ出しの嵐になっちゃう。ここは一つの番組の見せ場だったように思います。歌真似芸人がどれだけ似た声で歌っても、本人ではないことはわかっちゃう。そして今回、「声」は間違いなく本人のものなのに、本人じゃ無いと思わせる何かがあったわけです。番組はそれを探っていきます。

そして、そのいくつかの題材から「表現者」美空ひばりを実現するには形的にはAIによる「最適なものをチョイス」してるのですが、そこには人間の一定の関与も必要であるとも番組内では表現されたように思います。

映像


音声に比較して映像部分はあまり時間を割かなかったように思います。どちらかといえば「動き」が重視されたようにも思います。専任の振付師がいなかった美空ひばりさんはステージ上でその時々、観客に合わせたパフォーマンスを行うので、「新曲」でどのような動きをするだろうか?というのは想像でしかないのです。天童よしみさん「〜天童・美空ひばりを歌う〜」と美空ひばりさんのカバーアルバムを多数発表、そして師と仰ぐ彼女が美空ひばりさんならこう歌うであろうという振りをモーションキャプチャでデータ化、また、衣装や髪型も当時ステージ衣装や髪結いを担当した森英恵さん、美容師の白石文江さんに依頼、そのデータを取り込むことで行います。
この一旦実際の衣装や髪型を背格好の近いモデルに施してというあたりにこのプロジェクトの金銭面でも時間面でも非常に多大な資源を使ったことが伺えます。

批判と熱望と


番組では過去に行われた海外の有名人の同様な試みについても取り上げています。台湾で行われたテレサ・テン、アメリカで行われたバディ・ホリー、昨年映画で話題になったマリア・カラスなど、そしてそれを望まない人、望む人、ファンの気持ち、そこをどう折り合いを付けるのかという面。そして、CGで作られたオバマ氏のフェイク映像も紹介。将来的に「作り物」とわからなくなる時代が来ることの危惧を訴えます。

完成


最後の7分で1年の歳月をかけて出来上がった美空ひばりの「新曲」を披露したわけですが。録画をもう一度見てみても、うーん。歌は本当によくここまで造り上げたものだと感心します。例えばラジオでふと流して、この曲は誰が歌ってるでしょう?とすれば誰もが美空ひばりさんとこたえるでしょう。事前の情報がなければ「美空ひばりさんが生前に残した幻の楽曲」と言われても違和感なく聞けたような気がします。特に苦心した「語り」は映像無しで見ると本当に語ってるように聞こえるのです。歌は出だし部分など一部に「機械っぽさ」が残るようにも聞こえますが、これは聞く人の世代や可聴周波数でも変わるような気がします。若い人にはもっと機械音的な部分が聞こえるような気もします。

しかし、映像は、正直もう少し「らしい」感じになるのではないかと思ったんですが、まだまだ現実に人がしゃべり、歌う姿を「捏造」できるにはちょっと遠いなという印象を持ちました。やはり違和感半端ない。ただ、これも金銭面、時間面で曲側が完成したから、とりあえずGOしたかもしれません。

見ていた人の「素晴らしかった」というのはまた別な感情もあるのかもしれません。それが加藤和也氏の「ここまで空いた時間の隙間を埋めて貰った」という表現です。私にも今でももう一度だけ会いたい、遠い世界に行ってしまった方がいますが、この程度(失礼!)の映像技術でも目の前で現れて「あれから元気でいましたか?」と声をかけられたら、涙を抑えることはできないでしょう。

最後に


実は今回もし「川の流れのように」をこのAI技術で再現したら、1988年当時の「川の流れのように」と寸分違わぬ歌声が聞けるのか?というのはやってみてもよかったかもしれません。そして、そこでチョイスされた歌声と実際美空ひばりさんが発声してレコーディングしたその声との乖離。それがAIの限界とも言えるわけです。(それをやっちゃうと「やっぱりAIでは再現できない」という結果になるのかもしれませんが)それで現時点の真の実力が見えたかもしれません。

そして、今回私が思ったのは「語り」を一定の自然さで発生できるということは、声帯などを疾患で失った方に「元の声」で発声させるなどの、機能改善の一助としてこの技術を使えないかということです。声帯を失い「食道発声」等の方法でなんとかコミュニケートするというのは、どうしても元の声にはなりませんし、まして「歌う」事も難しい。また電動式人工喉頭も、どうしても機械的な声になってしまう。そういうものを改善する手法として声帯を失う前の「声」を活かして新しく言葉を紡ぎ出せる方法、または機器の開発に活かせるように思いました。


先日CSでやっと見ることができた「ブレードランナー2049」ではヒロインとされるジョイは「家庭用AI」なわけです。今で言う「OK!Google」ってやつです。そして彼女が人格を持ち、主人公をサポートし、触れられないにせよ姿形を持ち、主人公と一緒に移動する。このあたりが究極のAIによるコミュニケートの形のような気がします。同様にこの世界から失ってしまった人をAIで「復活」させる。これもSF映画の世界から徐々に実現化しているんだなと本当に技術の進歩を思うのです。

もう一つ「ブレードランナー2049」では前作「ブレードランナー」で現れたレプリカント「レイチェル」のクローン(?)が登場します。しかし、一瞬で彼女が別人であることを見破ったハリソン・フォード演ずるデッカードの表現を見ても、いつまで経ってもAIもクローン技術も「本物」に決してなれないのかもしれません。
なぜ「ブレードランナー2049」の話をするのかと言えば、この本編中にエルヴィス・プレスリー3Dホログラム映像が出てくるんですね。フランク・シナトラがステージで歌う姿を「再現」する未来の姿をこの映画では表現しているのです。

歌謡曲マニア的には今回の試みは本当に興味深く、もしかすると商業音楽として美空ひばりの「新曲」が出るのなら、それもまた過去には無かったことであります。もしかすると将来歴代のロックスターがこぞって新曲を発表するような世の中になるのかもしれませんね。
新:2025年3月の当サイトアクセス傾向
前: 「一発屋」を捜せ(1970年代)
次:「以心電信」YMO
このページのURL
https://www.thursdayonion.jp/article.php?article=1208
top