AI | テクノエッジ TechnoEdge

テクノロジー 2023 Dec 13

生成AI「Suno」が作った楽曲は再利用できる？　分解して想像した、「Suno以降」の音楽制作と音楽体験（CloseBox）

Sunoで作った楽曲を音源分離し、再構築して歌ってみました。そこで、Suno以降の音楽制作と音楽体験のあり方について考えてみました。

松尾公也

テクノロジー 2023 Dec 11

「人のぬくもり、理解できない」AI「Suno」が作詞・作曲・演奏し、歌う美しいバラードに感動した（CloseBox）

感動できるボーカル曲をAIがほぼ一発で生成できるようになりました。

松尾公也

テクノロジー 2023 Dec 11

写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分間の高品質ビデオ作成する「Vchitect」など重要論文6本を解説（生成AIウィークリー）

今週は重要論文が多くて6本です。画像の深度情報を推定する技術を大幅に進化させた「Marigold」などの生成AIの最新情報をお届けします。

山下裕毅（Seamless）

テクノロジー 2023 Dec 11

Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし（Google Tales）

動画がすごすぎると話題を呼んだGoogle Gemini Ultraですが……。

佐藤由紀子

テクノロジー 2023 Dec 8

Meta、AIで写真の上下を生成して縦長にする機能・画像生成AIのウェブサービスなど公開。見えない電子透かしを追加

Metaは12月6日（現地時間）、同社の画像生成AI「Imagine」のウェブ版（imagine.meta.com）を公開しました。サイトは日本語化されていますが、残念ながらいまのところ利用できるのは米国のみとなっています。

山本竜也

ガジェット 2023 Dec 7

Google Pixel向け12月Feature Drop発表。動画ブーストやっと提供、Pixel 8 Proは初のGemini Nano対応スマホに

Googleは12月6日（現地時間）、新しいAIモデル「Gemini」を発表しました。用途に応じてUltra、Pro、Nanoという3つのバージョンが用意されており、その中でモバイル機器向けとなるGemini NanoをPixel 8 Proに展開することも発表されています。

山本竜也

テクノロジー 2023 Dec 7

Google、新AIモデル「Gemini」発表。動画もネイティブに理解するマルチモーダル、Pixel 8 Proにも導入へ

日本時間12月7日、Googleは新開発のAIモデル「Gemini」を発表しました。モバイル機器からデータセンターまで、あらゆる用途に対応すべく、Gemini Ultra、Gemini Pro、Gemini Nanoの3種類を用意しています。

Munenori Taniguchi

テクノロジー 2023 Dec 6

AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い

生成AIの出力画像を元にCGで作った新聞っぽいフェイク画像をXに投稿したところ、想像以上の反響がありました。気軽な実験のつもりで説明も雑過ぎたため、伝わりにくかったり誤解されたりした部分もあるようです。どのように、なぜ作ったのか補足します。

kogu

テクノロジー 2023 Dec 5

マイクロソフトのSeeing AIアプリ、Android向けにもリリース。スマホカメラを向けると周囲の様子を音声で説明

Microsoftは12月4日（現地時間）、国際障害者デー（12月3日）を記念して、スマートフォンのカメラを向けたものを音声で説明するアプリ「Seeing AI」のAndroid版をリリースしました。

山本竜也

テクノロジー 2023 Dec 4

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説（生成AIウィークリー）

先週大きな話題となった、画像内のキャラクターや写真内の人物を骨格動画に応じて動かせる「Animate Anyone」など5本の生成AI論文を紹介。

山下裕毅（Seamless）

ゲーム 2023 Nov 30

AI咀嚼音キャンセラー「ドリトス・サイレント」フリトレーが発表。通話音声からスナック菓子を食べる音を除去

スナック菓子「ドリトス」を製造販売するフリトレーは、ゲームのボイスチャット(VC)やZoomその他のビデオ・音声会議などの通話音声に自分の咀嚼音が乗らないようにする、モグモグ音キャンセラーアプリ「Doritos Silent」を発表しました。

Munenori Taniguchi

テクノロジー 2023 Nov 29

アマゾン、企業向けAIチャットボット「Q」発表。様々なビジネスソフトと連携

米アマゾンは11月28日、企業向けのAIチャットボット「Q」を発表しました。AWSの機能を熟知しており、関連サービスを利用している顧客が問題に遭遇した際に、自然言語で解決策を問い合わせることが可能になります。

Munenori Taniguchi

ガジェット 2023 Nov 28

AI向けに改造されたGeForce RTX 4090の写真が中国で公開。米国による輸出禁止前の駆け込み需要か

米国政府はAIや機械学習に使われるGPUにつき、中国への輸出規制を強化しつつあります。その範囲は次第に拡大し、ついにNVIDIAの最新GPUであるRTX 4090にまで及びました。本来はゲーム用ではありますが、非常に高い演算能力を誇り、当然AI用途にも転用できるためです。

Kiyoshi Tane

テクノロジー 2023 Nov 27

AI再現の歴代F1王者vs.現役F1ドライバーが対決する『Lap of Legends』、2024年テレビ放映公開予定

米国のビールメーカーMichelob ULTRAが、名門F1チームのウィリアムズ・レーシングとのコラボレーション企画として『Lap of Legends』と称するテレビ番組を製作中であることを発表しました。

Munenori Taniguchi

AI

生成AI「Suno」が作った楽曲は再利用できる？　分解して想像した、「Suno以降」の音楽制作と音楽体験（CloseBox）

「人のぬくもり、理解できない」AI「Suno」が作詞・作曲・演奏し、歌う美しいバラードに感動した（CloseBox）

写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分間の高品質ビデオ作成する「Vchitect」など重要論文6本を解説（生成AIウィークリー）

Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし（Google Tales）

Meta、AIで写真の上下を生成して縦長にする機能・画像生成AIのウェブサービスなど公開。見えない電子透かしを追加

Google Pixel向け12月Feature Drop発表。動画ブーストやっと提供、Pixel 8 Proは初のGemini Nano対応スマホに

Google、新AIモデル「Gemini」発表。動画もネイティブに理解するマルチモーダル、Pixel 8 Proにも導入へ

AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い

マイクロソフトのSeeing AIアプリ、Android向けにもリリース。スマホカメラを向けると周囲の様子を音声で説明

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説（生成AIウィークリー）

AI咀嚼音キャンセラー「ドリトス・サイレント」フリトレーが発表。通話音声からスナック菓子を食べる音を除去

アマゾン、企業向けAIチャットボット「Q」発表。様々なビジネスソフトと連携

AI向けに改造されたGeForce RTX 4090の写真が中国で公開。米国による輸出禁止前の駆け込み需要か

AI再現の歴代F1王者vs.現役F1ドライバーが対決する『Lap of Legends』、2024年テレビ放映公開予定

テクノエッジへのご寄付のお願い

会員制コミュニティ『テクノエッジアルファ』第二期会員の募集を開始します

AI普及で人間の役割は「発想力」へ。東京24時間AIハッカソン 2024イベントリポート

西川善司のバビンチョなテクノコラム（西川善司）

生成AIグラビアをグラビアカメラマンが作るとどうなる？（西川和久）

人知れず消えていったマイナーCPUを語ろう（大原雄介）

Google Tales（佐藤由紀子）

てくのじ何でも実験室（宮里圭介）

AI

生成AI「Suno」が作った楽曲は再利用できる？ 分解して想像した、「Suno以降」の音楽制作と音楽体験（CloseBox）

「人のぬくもり、理解できない」AI「Suno」が作詞・作曲・演奏し、歌う美しいバラードに感動した（CloseBox）

写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分間の高品質ビデオ作成する「Vchitect」など重要論文6本を解説（生成AIウィークリー）

Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし（Google Tales）

Meta、AIで写真の上下を生成して縦長にする機能・画像生成AIのウェブサービスなど公開。見えない電子透かしを追加

Google Pixel向け12月Feature Drop発表。動画ブーストやっと提供、Pixel 8 Proは初のGemini Nano対応スマホに

Google、新AIモデル「Gemini」発表。動画もネイティブに理解するマルチモーダル、Pixel 8 Proにも導入へ

AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い

マイクロソフトのSeeing AIアプリ、Android向けにもリリース。スマホカメラを向けると周囲の様子を音声で説明

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説（生成AIウィークリー）

AI咀嚼音キャンセラー「ドリトス・サイレント」フリトレーが発表。通話音声からスナック菓子を食べる音を除去

アマゾン、企業向けAIチャットボット「Q」発表。様々なビジネスソフトと連携

AI向けに改造されたGeForce RTX 4090の写真が中国で公開。米国による輸出禁止前の駆け込み需要か

AI再現の歴代F1王者vs.現役F1ドライバーが対決する『Lap of Legends』、2024年テレビ放映公開予定

生成AI「Suno」が作った楽曲は再利用できる？　分解して想像した、「Suno以降」の音楽制作と音楽体験（CloseBox）