トップページ / コラム / テキスト一言で30秒の楽曲が完成——GeminiにAI音楽生成「Lyria 3」が本日登場、カンマン代表が実際に試してみた

テキスト一言で30秒の楽曲が完成——GeminiにAI音楽生成「Lyria 3」が本日登場、カンマン代表が実際に試してみた

貝出康

代表取締役

貝出康

こんにちは、カンマンの貝出です。

「AIの凄さを表現する曲を作ってください。」

たったこれだけのひと言を入力しただけで、30秒の楽曲が——日本語の歌詞つきで——あっという間に完成してしまった。

2026年2月19日、Google は生成音楽モデル「Lyria 3」を Gemini アプリに統合し、ベータ版として全世界に順次公開しました。テキストプロンプト・画像・動画から高品質な楽曲を自動生成できるこの機能は、AI の可能性をまた一段階引き上げるものです。本記事では、機能の概要から実際に試してみた体験レポート、そしてビジネスへの活用可能性まで、カンマン視点で詳しくお伝えします。

Lyria 3とは——Google DeepMind が開発した次世代音楽生成モデル

Lyria 3 は、Google の AI 研究部門である Google DeepMind が開発した、生成 AI による音楽モデルの最新版です。過去にも Lyria シリーズとして音楽生成 AI は存在していましたが、これまでは開発者向けの実験的ツール(MusicFX や PromptDJ など)に限定されており、一般ユーザーが日常的に使える状況ではありませんでした。

今回の Lyria 3 は、Gemini アプリ(Web・モバイル)に直接統合されたことで、特別な技術知識がなくても誰でも音楽を生成できる環境が整いました。

Lyria 3 の大きな特徴は「マルチモーダル入力」です。テキストで曲のイメージを説明するだけでなく、写真や動画をアップロードすると、その内容・雰囲気・色調・動きの速さなどを AI が分析し、それにマッチした楽曲を自動的に作り上げます。生成される楽曲には歌詞も含まれており、最終的なアウトプットはカスタムカバーアート付きの MP4動画ファイル(または MP3音声)として保存・共有できます。

生成に要する時間は、およそ1分前後。プロの音楽制作では数時間〜数日かかる作業が、ワンプロンプトで完結する時代が来ました。

実際に試してみた——「AIの凄さを表現する曲を作ってください。」

今回はカンマン代表が実際に Gemini を使って Lyria 3 を体験しました。操作の流れとともにご紹介します。

Step 1:「音楽を作成」モードを選択する

Gemini の入力欄の左下にある「+」ボタンやツールメニューをクリックすると、各種機能の一覧が表示されます。そこに「音楽を作成」という新しい選択肢が登場しています。

Gemini のツールメニュー。「Deep Research」「動画を作成(Veo 3.1)」「画像を作成」などに並んで、新たに「音楽を作成」が加わった。

「音楽を作成」を選択すると、入力欄の下部に音符アイコンとともに「音楽」モードが有効になります。あとはテキストを入力するだけです。

Step 2:プロンプトを入力する

代表が入力したプロンプトはシンプルでした。

「AIの凄さを表現する曲を作ってください。」

それ以上の詳細な指示は何もなし。ジャンルも、テンポも、歌詞の方向性も指定していません。

入力プロンプトはたったこれだけ。「音楽」モードが選択された状態で送信した。

送信後、Gemini は「思考プロセスを表示」しながらしばらく処理を行い、ほどなくして楽曲が完成しました。

Step 3:楽曲が完成——そのクオリティは?

驚いたのは、生成された楽曲のクオリティと日本語歌詞の自然さでした。

「AIの凄さを表現した曲が完成しました!ぜひ再生して、その魅力を体感してみてください。」というメッセージとともに、宇宙的な光の渦をイメージしたカスタムカバーアートが自動生成された。

カバーアートには、AIの無限の可能性を想起させるような光の渦巻き・宇宙的なビジュアルが使われており、楽曲のテーマとのマッチングも絶妙です。このカバーアートは、Google の別の AI 画像生成モデル「Nano Banana」によって自動生成されています。

楽曲の内容については、実際に mp4 ファイルとしてダウンロードしてご確認ください。日本語の歌詞がしっかりと楽曲に乗っており、テーマである「AIの凄さ」が伝わるような内容になっていました。プロンプトをわずか一文打つだけで、ここまで完成されたアウトプットが返ってくる——これが今の AI の水準です。

🎵 生成楽曲(MP4)は別添ファイルをご参照ください。

Lyria 3の3つの進化ポイント

Google 公式ブログによると、Lyria 3 は従来バージョンから主に3点が大きく進化しています。

1. リアリティと複雑性の向上

以前の Lyria シリーズで生成された楽曲は、「AI っぽさ」が残るものが多く、プロのエンジニアが手を加えないと実用に耐えないケースも少なくありませんでした。Lyria 3 では、音の質感・楽器の重なり方・リズムのノリといった点が大幅に改善されており、試聴するだけでは「AI 生成と気づかない」レベルに達しつつあります。

空間処理やミックスの完成度も向上しており、ヘッドフォンで聴いたときの立体感・奥行き感も従来モデルより明らかに上がっています。

2. クリエイティブなコントロールの強化

Lyria 3 では、ユーザーがより細かく楽曲の方向性を指定できるようになりました。スタイル(ジャンル)、ボーカルの有無・種類、テンポ(BPM)、ムードといった要素を自然言語で伝えるだけで、AI がそれに応じた楽曲を生成します。

たとえば「運命の相手に出会ったときに流れるコミカルな R&B スロージャムを作ってください」という指示でも、その雰囲気を的確に読み取って楽曲化できるとのこと。「言葉で思い描いたものが、そのまま音楽になる」という体験が、より精度高く実現されています。

3. 歌詞の自動生成

従来の Lyria では、ユーザー自身が歌詞を用意する必要がありましたが、Lyria 3 ではプロンプトをもとに歌詞も自動で生成されます。これは今回の最大のアップデートのひとつといえるでしょう。

日本語でプロンプトを入力すれば、日本語の歌詞が生成されます。カンマン代表の体験でも、日本語の歌詞が自然に楽曲に組み込まれており、「ここまで日本語でちゃんと機能するのか」という驚きがありました。

使い方——3つのアプローチ

Lyria 3 を使った楽曲生成には、主に3つのアプローチがあります。

アプローチ①:テキストから楽曲を生成(Text to Track)

最も基本的な使い方です。Gemini の入力欄で「音楽を作成」モードをオンにし、作りたい楽曲のイメージをテキストで入力します。

入力例: – 「ノスタルジックな気分です。子供の頃の素晴らしい時間や、母の手料理の思い出について、母のための曲を作ってください。楽しいアフロビートの曲にしてください。」 – 「ペットの犬が散歩を楽しんでいる様子を表現した、ほのぼのとしたポップスを作ってください。」 – 「スタートアップのピッチイベントで使えるような、エネルギッシュでモチベーションが上がるインストゥルメンタルを作ってください。」

アプローチ②:写真・動画から楽曲を生成(Image / Video to Track)

画像や動画をアップロードすると、その視覚的な内容を AI が分析し、雰囲気に合った楽曲を生成します。色調の明暗、被写体の動き、シーンの雰囲気などがそのまま音楽に変換されるイメージです。

活用シーン: – 旅行写真をアップロードして、思い出の BGM を作る – 子供の動画をアップロードして、誕生日カード用の楽曲を作る – 商品の写真をアップロードして、プロモーション用の BGM を作る

アプローチ③:YouTube Dream Track との連携

日本でも利用可能な YouTube の「Dream Track」機能とも Lyria 3 が連携しています。YouTube Shorts クリエイターは、Lyria 3 を活用してより高品質なオリジナルサウンドトラックを生成し、動画に使用できます。

生成された楽曲の出力形式

Lyria 3 で生成された楽曲は以下の形式でダウンロード・共有できます。

  • MP4(動画ファイル):Nano Banana で生成されたカスタムカバーアート付きの動画として保存。SNS や YouTube Shorts との相性が抜群
  • MP3(音声ファイル):音楽ファイルのみ。BGM や音楽プレーヤーでの再生に適している
  • 共有リンク:ダウンロードせずに URL を共有するだけで、相手に楽曲を届けられる

安全性への取り組み:SynthID 電子透かしとは

Lyria 3 で生成されたすべての楽曲には、SynthID と呼ばれる Google 独自の電子透かし技術が埋め込まれています。

SynthID は人間の可聴域外に埋め込まれる「不可聴の透かし」で、通常の再生では気づくことができません。しかし、Gemini アプリ上でこの音声ファイルをアップロードし「Google AI で生成されたものかどうか確認して」と尋ねることで、AI 生成コンテンツかどうかを検証できます。

これは、音楽だけでなく画像・動画にも広がりつつある「AI コンテンツの真正性証明」の取り組みの一環です。フェイクコンテンツや著作権侵害のリスクが高まる中、生成コンテンツに透明性を持たせるこの仕組みは、今後の AI 活用において非常に重要な役割を果たすと考えられます。

著作権への配慮

Google は Lyria 3 について、「既存のアーティストの模倣ではなく、オリジナルの表現を目的として設計されている」と明言しています。プロンプトに特定のアーティスト名が含まれる場合、Gemini はそれを「クリエイティブなインスピレーション」として広義に解釈し、そのアーティストに似たスタイルや雰囲気を持つ楽曲を生成します。完全なコピーを行う仕組みにはなっていません。

また、既存の楽曲と出力を照合するフィルターも実装されており、著作権のあるコンテンツとの類似を避ける仕組みが導入されています。

Lyria 3 のトレーニングデータについては、Google が「YouTube のパートナー契約や利用規約・法律に基づいて使用する権利のある音楽を使用している」と説明しており、2023 年に Lyria を初めて発表して以来、音楽コミュニティと連携しながら責任ある開発を進めてきたとしています。

音楽業界への影響と Google の姿勢

Lyria 3 のリリースは、当然ながら音楽業界にも大きな波紋を投げかけています。

Suno・Udio などの先行 AI 音楽サービスは、著作権者である音楽レーベルから訴訟を受けるなど、法的なグレーゾーンで運営されてきた側面がありました。これに対し Google は、「音楽コミュニティと連携しながら、著作権やパートナー契約に細心の注意を払って開発してきた」というメッセージを前面に打ち出しています。

Lyria 3 のトレーニングには、YouTube のパートナー契約および利用規約・法律のもとで「使用する権利のある音楽」のみが使われているとされており、Music AI Sandbox などの実験プログラムを通じてアーティストや音楽クリエイターとも協力関係を築いてきたといいます。

もちろん、「万全ではない」とも正直に述べており、権利侵害の可能性があるコンテンツに対する報告窓口も設置しています。AI と音楽の共存という難しい課題に対して、少なくとも Google は正面から向き合おうとしているという姿勢が伝わります。

競合サービスとの比較——Suno・Udio との違い

AI 音楽生成の先行サービスとして知名度の高い Suno や Udio と比較すると、Lyria 3 にはいくつかの特徴的な違いがあります。

比較項目Lyria 3(Gemini)SunoUdio
生成尺30秒最大数分最大数分
Google サービスとの統合××
電子透かし(SynthID)搭載済みなしなし
日本語対応◎(公式対応)
無料利用◯(回数制限あり)◯(回数制限あり)◯(回数制限あり)
YouTube 連携◎(Dream Track)××
画像→楽曲生成××
動画→楽曲生成××

最大の差別化ポイントは「Google エコシステムとのシームレスな統合」です。Gemini・YouTube・Nano Banana(画像生成)が一体となって機能するため、生成から共有までの流れが非常にスムーズです。

一方で、Suno や Udio は最大で数分の楽曲を生成できるのに対し、Lyria 3 は現状 30秒が上限となっています。BGM やショート動画向けには十分ですが、フルコーラスの楽曲を作りたい場合はまだ物足りない面もあります。今後の品質向上・機能拡張が注目されるところです。

ビジネスへの活用可能性

Lyria 3 は、企業・個人事業主・クリエイターにとって多様な活用シーンが考えられます。

マーケティング・広告

商品の写真をアップロードするだけで、そのブランドイメージに合った BGM を自動生成できます。SNS 広告・YouTube 動画・イベント用 BGM など、コンテンツ制作のコストと時間を大幅に削減できる可能性があります。

社内コミュニケーション・社内イベント

社員総会・キックオフイベント・社内表彰式などのオープニング BGM を、その場でテーマに合わせて生成するといった使い方も考えられます。「今期の目標をイメージした力強い曲を」といった指示一つで、オリジナル楽曲が生まれます。

コンテンツクリエイター・YouTuber

YouTube Shorts や TikTok 向けの動画に、動画の内容に合ったオリジナルサウンドトラックを付けることができます。著作権フリーの BGM を探す手間が省け、しかも動画専用のオリジナル楽曲が手に入る——これはクリエイターにとって非常に大きなメリットです。

教育・研修

「この概念を音楽で表現してください」という形で、学習内容を音楽化する新しい学習体験も実現できます。子ども向け教育コンテンツや、語学学習での活用も期待されます。

個人の感情表現・記念日

「母の日に、感謝の気持ちを込めたオリジナル楽曲を作る」「子供の誕生日に、その子のために楽曲を贈る」といった、個人的な感情表現ツールとしての可能性も非常に大きいです。Google 自身も「誕生日カード代わりの楽曲」を活用例として挙げています。

利用条件と料金

Lyria 3 は現在 18歳以上のすべてのユーザーを対象にベータ版として提供されており、無料の Gemini アカウントでも利用可能です。ただし、無料ユーザーは生成できる楽曲の回数に制限があります。

  • Google AI Plus・Pro・Ultra サブスクリプションユーザー:より多くの楽曲を生成可能
  • 対応言語:日本語・英語・ドイツ語・スペイン語・フランス語・ヒンディー語・韓国語・ポルトガル語(今後拡大予定)
  • アクセス方法gemini.google.com にアクセスし、「音楽を作成」ツールを選択

なお、Gemini のモバイルアプリへの対応も数日以内に順次展開される予定とのことです。

まとめ——音楽生成 AI が変える「表現の民主化」

「楽器が弾けなくても、音楽理論を知らなくても、誰でも音楽を作れる」——Lyria 3 はそんな時代の幕を正式に開けました。

今回、カンマン代表が「AIの凄さを表現する曲を作ってください」というひと言を入力して、日本語歌詞付きの 30 秒楽曲が数分で完成したという体験は、改めて AI の進化スピードを実感させるものでした。プロンプト一つで音楽が生まれ、それがカバーアート付きの動画として即座に共有できる——このシームレスさは、ビジネスの現場でもクリエイティブの現場でも、大きなインパクトをもたらすはずです。

もちろん、現状では30秒という尺の制限や、商用利用に関する規約の確認など、実務利用には注意すべき点もあります。しかし、Google DeepMind の開発スピードと、Gemini エコシステムとの統合力を考えると、今後1〜2年でこの機能が一気に実用レベルを超えてくる可能性は十分にあります。

株式会社カンマンでは、引き続き最新の AI ツール・サービスを実際に検証しながら、ビジネスへの活用可能性をお伝えしていきます。ぜひ皆さんも、Lyria 3 を試してみてください。


関連リンク – Google 公式ブログ(日本語):Gemini で音楽生成 – Google DeepMind ブログ:A new way to express yourself – Gemini アプリ:gemini.google.com


本記事は 2026年2月19日時点の情報をもとに作成しています。サービスの仕様・料金体系は予告なく変更される場合があります。


当社サイトでは他にもビジネスに役立つ情報を発信しています。ぜひ、他記事もチェックしてくださいね。

最新記事一覧を見る

無料相談受付中
AI技術の導入や活用方法について相談したい方は、株式会社カンマンにお問い合わせください。
最新のAI技術を活用した経営戦略や業務効率化について、無料でご相談を承っております。

お問い合わせ

AIの無料セミナー優先参加特典や最新情報が受け取れます

【無料】AIメルマガを受け取る

貝出康

代表取締役

貝出康

1963年徳島市生まれ。 1999年に楽天の三木谷社長の講演を聴き、イン ターネット時代の到来を悟る。翌年、ホームペ ージ制作会社カンマン設立に参画し、これまで のキャリアで培った営業や人事のスキルを活か しての顧客開拓や社内・労務管理を実践。2019 年〜代表取締役。