AI

生成AI「Suno」が作った楽曲は再利用できる? 分解して想像した、「Suno以降」の音楽制作と音楽体験(CloseBox) 画像
テクノロジー

生成AI「Suno」が作った楽曲は再利用できる? 分解して想像した、「Suno以降」の音楽制作と音楽体験(CloseBox)

Sunoで作った楽曲を音源分離し、再構築して歌ってみました。そこで、Suno以降の音楽制作と音楽体験のあり方について考えてみました。

「人のぬくもり、理解できない」AI「Suno」が作詞・作曲・演奏し、歌う美しいバラードに感動した(CloseBox) 画像
テクノロジー

「人のぬくもり、理解できない」AI「Suno」が作詞・作曲・演奏し、歌う美しいバラードに感動した(CloseBox)

感動できるボーカル曲をAIがほぼ一発で生成できるようになりました。

写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分間の高品質ビデオ作成する「Vchitect」など重要論文6本を解説(生成AIウィークリー) 画像
テクノロジー

写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分間の高品質ビデオ作成する「Vchitect」など重要論文6本を解説(生成AIウィークリー)

今週は重要論文が多くて6本です。画像の深度情報を推定する技術を大幅に進化させた「Marigold」などの生成AIの最新情報をお届けします。

Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし(Google Tales) 画像
テクノロジー

Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし(Google Tales)

動画がすごすぎると話題を呼んだGoogle Gemini Ultraですが……。

Meta、AIで写真の上下を生成して縦長にする機能・画像生成AIのウェブサービスなど公開。見えない電子透かしを追加 画像
テクノロジー

Meta、AIで写真の上下を生成して縦長にする機能・画像生成AIのウェブサービスなど公開。見えない電子透かしを追加

Metaは12月6日(現地時間)、同社の画像生成AI「Imagine」のウェブ版(imagine.meta.com)を公開しました。サイトは日本語化されていますが、残念ながらいまのところ利用できるのは米国のみとなっています。

Google Pixel向け12月Feature Drop発表。動画ブーストやっと提供、Pixel 8 Proは初のGemini Nano対応スマホに 画像
ガジェット

Google Pixel向け12月Feature Drop発表。動画ブーストやっと提供、Pixel 8 Proは初のGemini Nano対応スマホに

Googleは12月6日(現地時間)、新しいAIモデル「Gemini」を発表しました。用途に応じてUltra、Pro、Nanoという3つのバージョンが用意されており、その中でモバイル機器向けとなるGemini NanoをPixel 8 Proに展開することも発表されています。

Google、新AIモデル「Gemini」発表。動画もネイティブに理解するマルチモーダル、Pixel 8 Proにも導入へ 画像
テクノロジー

Google、新AIモデル「Gemini」発表。動画もネイティブに理解するマルチモーダル、Pixel 8 Proにも導入へ

日本時間12月7日、Googleは新開発のAIモデル「Gemini」を発表しました。モバイル機器からデータセンターまで、あらゆる用途に対応すべく、Gemini Ultra、Gemini Pro、Gemini Nanoの3種類を用意しています。

AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い 画像
テクノロジー

AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い

生成AIの出力画像を元にCGで作った新聞っぽいフェイク画像をXに投稿したところ、想像以上の反響がありました。気軽な実験のつもりで説明も雑過ぎたため、伝わりにくかったり誤解されたりした部分もあるようです。どのように、なぜ作ったのか補足します。

マイクロソフトのSeeing AIアプリ、Android向けにもリリース。スマホカメラを向けると周囲の様子を音声で説明 画像
テクノロジー

マイクロソフトのSeeing AIアプリ、Android向けにもリリース。スマホカメラを向けると周囲の様子を音声で説明

Microsoftは12月4日(現地時間)、国際障害者デー(12月3日)を記念して、スマートフォンのカメラを向けたものを音声で説明するアプリ「Seeing AI」のAndroid版をリリースしました。

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説(生成AIウィークリー)

先週大きな話題となった、画像内のキャラクターや写真内の人物を骨格動画に応じて動かせる「Animate Anyone」など5本の生成AI論文を紹介。

AI咀嚼音キャンセラー「ドリトス・サイレント」フリトレーが発表。通話音声からスナック菓子を食べる音を除去 画像
ゲーム

AI咀嚼音キャンセラー「ドリトス・サイレント」フリトレーが発表。通話音声からスナック菓子を食べる音を除去

スナック菓子「ドリトス」を製造販売するフリトレーは、ゲームのボイスチャット(VC)やZoomその他のビデオ・音声会議などの通話音声に自分の咀嚼音が乗らないようにする、モグモグ音キャンセラーアプリ「Doritos Silent」を発表しました。

アマゾン、企業向けAIチャットボット「Q」発表。様々なビジネスソフトと連携 画像
テクノロジー

アマゾン、企業向けAIチャットボット「Q」発表。様々なビジネスソフトと連携

米アマゾンは11月28日、企業向けのAIチャットボット「Q」を発表しました。AWSの機能を熟知しており、関連サービスを利用している顧客が問題に遭遇した際に、自然言語で解決策を問い合わせることが可能になります。

AI向けに改造されたGeForce RTX 4090の写真が中国で公開。米国による輸出禁止前の駆け込み需要か 画像
ガジェット

AI向けに改造されたGeForce RTX 4090の写真が中国で公開。米国による輸出禁止前の駆け込み需要か

米国政府はAIや機械学習に使われるGPUにつき、中国への輸出規制を強化しつつあります。その範囲は次第に拡大し、ついにNVIDIAの最新GPUであるRTX 4090にまで及びました。本来はゲーム用ではありますが、非常に高い演算能力を誇り、当然AI用途にも転用できるためです。

AI再現の歴代F1王者vs.現役F1ドライバーが対決する『Lap of Legends』、2024年テレビ放映公開予定 画像
テクノロジー

AI再現の歴代F1王者vs.現役F1ドライバーが対決する『Lap of Legends』、2024年テレビ放映公開予定

米国のビールメーカーMichelob ULTRAが、名門F1チームのウィリアムズ・レーシングとのコラボレーション企画として『Lap of Legends』と称するテレビ番組を製作中であることを発表しました。