AI | テクノエッジ TechnoEdge

テクノロジー 2023 Dec 13

生成AI「Suno」が作った楽曲は再利用できる？　分解して想像した、「Suno以降」の音楽制作と音楽体験（CloseBox）

Sunoで作った楽曲を音源分離し、再構築して歌ってみました。そこで、Suno以降の音楽制作と音楽体験のあり方について考えてみました。

松尾公也

テクノロジー 2023 Dec 11

「人のぬくもり、理解できない」AI「Suno」が作詞・作曲・演奏し、歌う美しいバラードに感動した（CloseBox）

感動できるボーカル曲をAIがほぼ一発で生成できるようになりました。

松尾公也

テクノロジー 2023 Dec 11

写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分間の高品質ビデオ作成する「Vchitect」など重要論文6本を解説（生成AIウィークリー）

今週は重要論文が多くて6本です。画像の深度情報を推定する技術を大幅に進化させた「Marigold」などの生成AIの最新情報をお届けします。

山下裕毅（Seamless）

テクノロジー 2023 Dec 11

Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし（Google Tales）

動画がすごすぎると話題を呼んだGoogle Gemini Ultraですが……。

佐藤由紀子

テクノロジー 2023 Dec 8

Meta、AIで写真の上下を生成して縦長にする機能・画像生成AIのウェブサービスなど公開。見えない電子透かしを追加

Metaは12月6日（現地時間）、同社の画像生成AI「Imagine」のウェブ版（imagine.meta.com）を公開しました。サイトは日本語化されていますが、残念ながらいまのところ利用できるのは米国のみとなっています。

山本竜也

ガジェット 2023 Dec 7

Google Pixel向け12月Feature Drop発表。動画ブーストやっと提供、Pixel 8 Proは初のGemini Nano対応スマホに

Googleは12月6日（現地時間）、新しいAIモデル「Gemini」を発表しました。用途に応じてUltra、Pro、Nanoという3つのバージョンが用意されており、その中でモバイル機器向けとなるGemini NanoをPixel 8 Proに展開することも発表されています。

山本竜也

テクノロジー 2023 Dec 7

Google、新AIモデル「Gemini」発表。動画もネイティブに理解するマルチモーダル、Pixel 8 Proにも導入へ

日本時間12月7日、Googleは新開発のAIモデル「Gemini」を発表しました。モバイル機器からデータセンターまで、あらゆる用途に対応すべく、Gemini Ultra、Gemini Pro、Gemini Nanoの3種類を用意しています。

Munenori Taniguchi

テクノロジー 2023 Dec 6

AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い

生成AIの出力画像を元にCGで作った新聞っぽいフェイク画像をXに投稿したところ、想像以上の反響がありました。気軽な実験のつもりで説明も雑過ぎたため、伝わりにくかったり誤解されたりした部分もあるようです。どのように、なぜ作ったのか補足します。

kogu

テクノロジー 2023 Dec 5

マイクロソフトのSeeing AIアプリ、Android向けにもリリース。スマホカメラを向けると周囲の様子を音声で説明

Microsoftは12月4日（現地時間）、国際障害者デー（12月3日）を記念して、スマートフォンのカメラを向けたものを音声で説明するアプリ「Seeing AI」のAndroid版をリリースしました。

山本竜也

テクノロジー 2023 Dec 4

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説（生成AIウィークリー）

先週大きな話題となった、画像内のキャラクターや写真内の人物を骨格動画に応じて動かせる「Animate Anyone」など5本の生成AI論文を紹介。

山下裕毅（Seamless）

ゲーム 2023 Nov 30

AI咀嚼音キャンセラー「ドリトス・サイレント」フリトレーが発表。通話音声からスナック菓子を食べる音を除去

スナック菓子「ドリトス」を製造販売するフリトレーは、ゲームのボイスチャット(VC)やZoomその他のビデオ・音声会議などの通話音声に自分の咀嚼音が乗らないようにする、モグモグ音キャンセラーアプリ「Doritos Silent」を発表しました。

Munenori Taniguchi

テクノロジー 2023 Nov 29

アマゾン、企業向けAIチャットボット「Q」発表。様々なビジネスソフトと連携

米アマゾンは11月28日、企業向けのAIチャットボット「Q」を発表しました。AWSの機能を熟知しており、関連サービスを利用している顧客が問題に遭遇した際に、自然言語で解決策を問い合わせることが可能になります。

Munenori Taniguchi

ガジェット 2023 Nov 28

AI向けに改造されたGeForce RTX 4090の写真が中国で公開。米国による輸出禁止前の駆け込み需要か

米国政府はAIや機械学習に使われるGPUにつき、中国への輸出規制を強化しつつあります。その範囲は次第に拡大し、ついにNVIDIAの最新GPUであるRTX 4090にまで及びました。本来はゲーム用ではありますが、非常に高い演算能力を誇り、当然AI用途にも転用できるためです。

Kiyoshi Tane

テクノロジー 2023 Nov 27

AI再現の歴代F1王者vs.現役F1ドライバーが対決する『Lap of Legends』、2024年テレビ放映公開予定

米国のビールメーカーMichelob ULTRAが、名門F1チームのウィリアムズ・レーシングとのコラボレーション企画として『Lap of Legends』と称するテレビ番組を製作中であることを発表しました。

Munenori Taniguchi

テクノロジー 2023 Nov 27

Humaneのバッジ型AIウェアラブル「Ai Pin」を注文してわかったこと。米国外で使える？　アクセサリは？

元アップル社員が開発し、OpenAIのサム・アルトマンも出資したと話題になっていたAIウェアラブルがついに発売（米国のみ）。これを購入できた五島正浩さんに、購入時の様子をレポートしてもらいました。

五島正浩

カルチャー 2023 Nov 27

Inter BEEとAdobe MAXに見る、映像業界の変遷とAIへの取り組み（小寺信良）

Inter BEE 2023とAdobe MAXを取材した小寺信良さんが感じた、業界の変化とAIについて。

小寺信良

テクノロジー 2023 Nov 27

AIが間違えやすい「指の数」を修正する技術、Stability AIの動画生成AI「Stable Video Diffusion」など重要論文5本を解説（生成AIウィークリー）

発表以来大きな話題となっている、Stability AIの動画生成AIモデルなど、5本の生成AI論文を解説。

山下裕毅（Seamless）

テクノロジー 2023 Nov 24

GoogleのAI「Bard」、人間の代わりにYouTubeを見て内容を回答可能に。料理動画からレシピを要約も

GoogleはAIチャットボット「Bard」をアップデートし、YouTube動画を理解できる最初の一歩を踏み出したと発表しました。

Kiyoshi Tane

テクノロジー 2023 Nov 22

スマホ版ChatGPTの音声会話機能が無料ユーザーに開放。退社したブロックマン元社長もお勧め

OpenAIは元CEOサム・アルトマン氏の去就をめぐり大変なことになっているさなか、ChatGPTモバイルアプリの音声会話機能を無料ユーザーも利用可能にしたと発表しました。

Kiyoshi Tane

テクノロジー 2023 Nov 20

生成AIグラビアをグラビアカメラマンが作るとどうなる？第13回：SDXLでのControlNet活用方法その1+α版（西川和久）

第9回にFooocus-MREを使ってControlNetをご紹介したが、一般的なAUTOMATIC1111での説明はまだだったので、改めて今回と次回で行いたい。

西川和久

テクノロジー 2023 Nov 20

入力テキストを実写アバターに話させるツールをMicrosoftが発表、擬人化キャラの外見や性格を文章で作り出す「ChatAnything」など重要論文5本を解説（生成AIウィークリー）

生成AIの最新トレンドを追いかける連載。今回は入力テキストを実写アバターに話させるツール、擬人化キャラの外見や性格を文章で作り出す技術など重要論文5本を解説します。

山下裕毅（Seamless）

テクノロジー 2023 Nov 18

OpenAIサム・アルトマンCEOが退社、事実上の追放。取締役会「意思疎通が不誠実と判断」

ChatGPTやDALL・E等の生成AIサービスで知られるOpenAI社が、CEOサム・アルトマン氏の退社を発表しました。

Ittousai

テクノロジー 2023 Nov 17

『Japanese Stable Diffusion XL』公開。日本語プロンプトで日本文化を反映した画像出力

日本の文化・アートを日本語の入力で高品質に出力できる画像生成AIが、Stability AIから公開されました。

松尾公也

テクノロジー 2023 Nov 17

ローコード開発ツール「Copilot Studio」発表。Copilotのカスタマイズ、プラグイン開発、ワークフロー設定などが可能に（Microsoft Ignite 2023）

マイクロソフトは開催中の年次イベント「Microsoft Ignite 2023」で、同社のAIサービスであるCopilotのカスタマイズやプラグイン開発、ワークフローの設定、データソースとの接続などを含むさまざまな開発を可能にするローコード開発ツール「Copilot Studio」を発表しました。

新野淳一

テクノロジー 2023 Nov 16

GoogleフォトがAI機能強化。「ほぼ同じ写真」をスタック整理、カレンダーに自動予定追加

Googleは、写真ライブラリーの中にあるほとんど同じ写真を整理するための新しいAI機能を発表しました。

Munenori Taniguchi

テクノロジー 2023 Nov 16

「Bing Chat」が「Copilot」にリブランディング。Edge以外のブラウザ、モバイルでも利用可能に（Microsoft Ignite 2023）

マイクロソフトはこれまで「Bing Chat」および企業向けに「Bing Chat Enterprise」の呼称で提供してきたAIサービスを「Copilot」にリブランディングし、同社のAIサービス全体の体験を「Microsoft Copilot」で統一します。

新野淳一

テクノロジー 2023 Nov 15

YouTube、「AI使用動画」明示をクリエーターに義務付け。選挙や紛争等は大きく目立つラベル必須、フェイク音声楽曲は元アーティストに削除要請権

最近は生成AIによる動画がさかんに作られていますが、それは一方では視聴者が本物だと誤解しかねないことも意味しています。

Kiyoshi Tane

テクノロジー 2023 Nov 15

AIで蘇る、伝説の歌手エディット・ピアフの声と姿。伝記映画「EDITH」のナレーションも

伝説的歌手であるエディット・ピアフが遺した声を元にしたAIボイスによりナレーションが行われることが発表されました。

松尾公也

テクノロジー 2023 Nov 15

Google DeepMindの気象予測AI「GraphCast」、1分で前例ない精度の10日間予報を出力

Google DeepMindの気象予測AIモデル「GraphCast」、従来の予測システムを上回る精度を獲得Google DeepMindの気象予測AI「GraphCast」、1分で前例のない精度の10日間予報を出力

Munenori Taniguchi

テクノロジー 2023 Nov 13

謎のAIデバイスメーカーHumaneとは何者か。バッジ型AIウェアラブル「Ai Pin」が生まれた背景と周到な準備

OpenAIのAI技術を胸に装着する小型デバイスで操作する「Ai Pin」が注目されています。スタートアップでありながら野心的なAIデバイスを投入したシリコンバレーのメーカーHumaneに、筆者は1年ほど前から注目していたのでした。

五島正浩

テクノロジー 2023 Nov 13

SDXLでライブ映像をリアルタイム画像生成できる高速化ツール「LCM-LoRA」、GPT-4Vより良い結果も示す画像理解モデル「CogVLM」など重要論文5本を解説（生成AIウィークリー）

今回の生成AI論文紹介では、画像の生成、理解、対話といった分野での進歩がありました。

山下裕毅（Seamless）

テクノロジー 2023 Nov 11

AIが人間を超えた2045年描く『地球外少年少女』11日24時からNHKで地上波初放送『電脳コイル』磯光雄15年ぶり監督作

『地球外少年少女』

Ittousai

テクノロジー 2023 Nov 9

「ポケトーク for Business 同時通訳」ブラウザ版発表、スマホで同時通訳を実現。HUAWEI Eyewear 2との相性が抜群（石野純也）

ソースネクストからスピンアウトしたポケトークは、新サービスの「ポケトーク for Business 同時通訳」のブラウザ版を発表しました。すでにサービスは開始されており、月額3300円/年額3万9600円で利用できます。for Businessのため、法人向けという位置づけではありますが、個人ユースにも対応。サブスクとしてはやや高めな印象はあるものの、払えないほどの金額ではない絶妙な価格設定になっています。