最低1枚の写真があれば、その人物の画像をいくらでも生成できる。そんな技術が登場したので使ってみた。
Microsoftは1月15日(現地時間)、生成AIサービス「Copilot」の個人向けサブスクリプションサービス「Copilot Pro」を発表、提供を開始しました。
今回は生成AI論文解説に加え、2つの興味深い実装も紹介しています。
生成AIにより静止画に動きを与える技術がいくつか出てきましたが、求める動きを出すのはなかなか難しいものがあります。今回紹介する「DragNUWA」は、そんな弱点を補ってくれるユーザーインタフェースを備えています。
台湾の現代アート美術館で、筆者のAI作品が展示されることになりました。
感情を含む細かい表現が可能なAIボイスクローン技術「OpenVoice」など、生成AI最新論文の概要5つをお届けします。
「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など、大規模言語モデルの返答が向上する「プロンプト26の原則」をはじめとする5つの生成AI論文を紹介します。
トランプ政権において、大統領の個人弁護士兼フィクサーとして活動したマイケル・コーエン氏が、12月はじめに裁判所に提出した公式書類に存在しない判例を記していたことを裁判所から追求され、それがAIで生成したものであることを認めました。
マイクロソフトはApp StoreでiOS/iPadOS用の「Microsoft Copilot」アプリを配信開始しました。少し前に、Android版アプリも公開されています。
2023年(のちょっと前から)の生成AIの動きというか広がり、勢いを、自分の取り組みを中心にまとめてみました。
米国第3位の発行部数を誇る新聞社New York Timesが、マイクロソフトとOpenAIに対し著作権侵害の訴訟を起こしました。
Microsoftが、Android向けのGoogle Playストアにて「Microsoft Copilot」アプリの配信を開始しました。
生成AIの重要論文5本解説する連載。今回は、毎秒100枚という画像高速生成できると話題を呼んだ「StreamDiffusion」、文章指示で複数の動く3Dキャラを生成するNVIDIAの4Dアニメーションツール「AYG」などを紹介しています。
Mozillaは、基本的な情報を入力するとAIが自動的にWebサイトのデザインを作成し、Webサイトの公開まで可能なサービス「Solo」を公開しました。
Suno AIよりさらに簡単に完成曲を作れるようになりました。Microsoft Copilotで作曲する方法とその制限事項などについて調べました。
マイクロソフトは12月20日、作詞・作曲・演奏・歌唱まで可能なAI作曲サービス「Suno」を自社のAIプラットフォームであるWindows Copilotに統合すると発表しました。
連載第13回目ではControlNetのCanny、Depth、OpenPoseをご紹介した。続きに入る前に軽くおさらいすると、ControlNetは指定した画像を使って、構図や絵柄、ポーズ、そして書かれている内容(Prompt相当)などを抽出し、生成する画像を固定する方法だ。
歌詞を与えれば作曲・演奏・歌唱と残りの全てをやってくれるAI作曲完パケサービス「Suno」ですが、音楽制作界隈では「MIDIで吐いてくれ」との声が多く上がっています。
音楽生成に新たな展開が。Music to Musicによる生成をパートごとに出せる技術が登場しています。生成AIに関する論文5つを紹介します。
AI作曲サービスSunoのUIがガラリと変わったので、使い方をまとめてみました。
Suno短期連載第3弾。Suno + ChatGPT + Stable Diffusionを連携させてAI楽曲を作る試みです。
生成AIは技術の進歩/進化が凄まじいペースで数ヶ月前はもうかなり古い話になることもあり、今回はこれまでの13回分をまとめてみたい。
Sunoで作った楽曲を音源分離し、再構築して歌ってみました。そこで、Suno以降の音楽制作と音楽体験のあり方について考えてみました。
感動できるボーカル曲をAIがほぼ一発で生成できるようになりました。
今週は重要論文が多くて6本です。画像の深度情報を推定する技術を大幅に進化させた「Marigold」などの生成AIの最新情報をお届けします。
動画がすごすぎると話題を呼んだGoogle Gemini Ultraですが……。
日本時間12月7日、Googleは新開発のAIモデル「Gemini」を発表しました。モバイル機器からデータセンターまで、あらゆる用途に対応すべく、Gemini Ultra、Gemini Pro、Gemini Nanoの3種類を用意しています。
生成AIの出力画像を元にCGで作った新聞っぽいフェイク画像をXに投稿したところ、想像以上の反響がありました。気軽な実験のつもりで説明も雑過ぎたため、伝わりにくかったり誤解されたりした部分もあるようです。どのように、なぜ作ったのか補足します。
手のひらに乗る立体視ディスプレイ「Looking Glass Go」を2台買ってしまいました。その理由は……。
先週大きな話題となった、画像内のキャラクターや写真内の人物を骨格動画に応じて動かせる「Animate Anyone」など5本の生成AI論文を紹介。
Google DeepMindや複数の大学の研究者からなるチームが、AI企業に対し、単純な攻撃がプライバシー関連の問題を起こす可能性があるとして、大規模言語モデル(LLM)をリリースする前に内部や第三者による安全性テストを実施するよう求めています。
元アップル社員が開発し、OpenAIのサム・アルトマンも出資したと話題になっていたAIウェアラブルがついに発売(米国のみ)。これを購入できた五島正浩さんに、購入時の様子をレポートしてもらいました。
Inter BEE 2023とAdobe MAXを取材した小寺信良さんが感じた、業界の変化とAIについて。
発表以来大きな話題となっている、Stability AIの動画生成AIモデルなど、5本の生成AI論文を解説。
OpenAIは元CEOサム・アルトマン氏の去就をめぐり大変なことになっているさなか、ChatGPTモバイルアプリの音声会話機能を無料ユーザーも利用可能にしたと発表しました。
第9回にFooocus-MREを使ってControlNetをご紹介したが、一般的なAUTOMATIC1111での説明はまだだったので、改めて今回と次回で行いたい。
OpenAIのCEOを追われたサム・アルトマン氏が「これ(OpenAIのゲストタグ)を着けるのはこれが最初で最後」という写真をXに投稿しました。
生成AIの最新トレンドを追いかける連載。今回は入力テキストを実写アバターに話させるツール、擬人化キャラの外見や性格を文章で作り出す技術など重要論文5本を解説します。
日本の文化・アートを日本語の入力で高品質に出力できる画像生成AIが、Stability AIから公開されました。
マイクロソフトは開催中の年次イベント「Microsoft Ignite 2023」で、同社のAIサービスであるCopilotのカスタマイズやプラグイン開発、ワークフローの設定、データソースとの接続などを含むさまざまな開発を可能にするローコード開発ツール「Copilot Studio」を発表しました。
マイクロソフトはこれまで「Bing Chat」および企業向けに「Bing Chat Enterprise」の呼称で提供してきたAIサービスを「Copilot」にリブランディングし、同社のAIサービス全体の体験を「Microsoft Copilot」で統一します。
伝説的歌手であるエディット・ピアフが遺した声を元にしたAIボイスによりナレーションが行われることが発表されました。