10秒の歌声オーディオデータがあれば、本人そっくりのリアルタイム歌唱ができるという「Vocoflex」。ベータテスターの申し込みをしていたのですが、ついに試用できたので、そのファーストインプレッションをお届けします。
ポストSunoのAI作曲サービスとして、同時期にリリースされたものの、Udioの音質の方ばかりが注目され、イマイチな評価を浴びていたSonautoですが(書いているのは筆者くらいですが)、かなりやばい機能を搭載してきました。
アドビは、4月23日(現地時間)にスタートした「Adobe Max London」にて、生成AI「Adobe Firefly」と「Adobe Photoshop」に関する複数の発表を行った。どのような変化が起きたのか? アドビ・Photoshop製品マーケティング担当シニアディレクターのエリン・ボイス氏に話を聞いた。
サンフランシスコに本社を置くスタートアップ企業、Humaneが開発するAi Pinがようやく手元に届きました。今回はこのAi Pinの第一印象についてレポートします。
米国空軍テストパイロットスクールと国防高等研究計画局は(DARPA)、昨年2月にAIによる自律飛行を実現したX-62A可変飛行安定性試験機(VISTA)を用い、有人のF-16戦闘機との模擬空中戦に成功したと発表しました。
Stability AIからStable Diffusionの新しいバージョン「Stable Diffusion 3」がAPI限定で公開されました。アプリケーションに組み込んで特徴やコストなどを確認しました。
API経由ながらStable Diffusion 3が利用可能に!
人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第2期第1回を4月24日に開催いたします。なお、今回お申し込みいただいた方は、前回分の動画アーカイブを視聴いただけます。
テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」(テクノエッジ・サイド)というチャンネルを設け、週1回のペースでお届けしています。
経済産業省は、経済安全保障推進法に基づく特定重要物資、具体的には主に生成AIに関するシステムの安定供給確保をはかるためのであるクラウドプログラムの認定を相次いで発表しました。
オープンソースLLMで大きな動き。MetaがLlama 3を発表したのと同時期に、AI同士が教え合い質を高めるMicrosoft開発オープンLLM「WizardLM-2」を公開。重要論文5本を解説します。
4月15日OpenAIの日本オフィス開設が発表された。既に報道されているようにアジアとしては初の拠点、サンフランシスコ以外の拠点としては、英国のロンドン、アイルランドのダブリンに続く3か所めとなる。
「年末のライブなんですが、今回、とりちゃんにコーラスをやってもらいたいと思っていて、リアルタイムで歌うことってできないですか?」
架空プログレッシブバンド「The Midnight Odyssey」の世界デビューから2週間余、様々な動きがありました。本稿では、そのあたりのトピックとAI楽曲の権利の問題について触れていきます。
AIスタートアップ企業の Limiteless (リミットレス)が、人の知的能力を拡張し生産性を向上すると謳うPersonalized AIサービス Limitless と、ハードウェア Limitlessペンダントを発表しました。
NAB Show 2024にあわせて、Adobeが動画編集アプリ Premiere Pro に追加予定の生成AI機能を先行公開しました。
スロベニアのスタートアップ企業PaintCamが、ユーザーの自宅への訪問者を監視するだけでなく、潜在的な侵入者にペイントボール弾または催涙弾を発射できるホームセキュリティカメラ「PaintCam Eve」を開発しました。
OpenAIが、日本語に最適化したGPT-4カスタムモデルの提供開始を発表しました。
今週の生成AI重要論文は、AIが生成した“誤ったコード”を自律修正するAI「AutoCodeRover」、iPhoneのUIを理解するAppleの言語モデル「Ferret-UI」など。
AmazonのCEOが言うプリミティブなセットとは何か、そしてそれがどのように画期的な顧客体験を実現するのか、などについて公開書簡から紹介していきましょう。
生成AIを利用したミュージックビデオ制作に知見のあるテクノロジーライター、大谷和利さんに、実例を使ってその使い方を解説してもらいました。
Udioの操作方法は今ひとつ分かりにくいところもあるようなので、筆者が実際に曲の制作過程を最初から最後まで動画でお見せします。
SonautoやUdioといった作曲AI新興勢力の登場が影響したのかどうか、Sunoが改良を加えてきました。
Googleは「消しゴムマジック」や「編集マジック」といった Googleフォトの生成AI写真編集機能を、iPhoneや他社のAndroidスマホを含む多数のデバイスに提供拡大します。
Suno対抗のAI作曲サービスとして前評判の高かったUdioがパブリックベータとして一般公開されました。
Google Cloud Next 2024イベントを前に、Googleが新しいWorkspaceアプリ『Google Vids』を発表しました。
AIスタートアップのSonautoが運営する同名のAI作曲サービス「Sonauto」がSunoを超えた?と評判です。
AIアート作品コンテスト「AIアートグランプリ」の3回目開催が決まりました。第一回は2023年3月、第二回は同年11月に結果発表が行われましたが、第三回は、2024年8月から作品のエントリーを受け付け、最終審査は11月となります。
生成AIの重要論文5本を解説する連載。今回は、GPT-4越えで直接スマホ上で処理できるオンデバイス生成AI「Octopus v2」などを取り上げます。
Microsoft Copilot版SunoのV3化を記念して、書籍向けに執筆していたCopilot版Sunoの操作マニュアルを公開します。
Amazonが、レジなし店舗向け決済技術「Just Walk Out」の廃止を進めていることが報じられています。食料品店担当上級副社長のTony Hoggett氏がJust Walk Outの廃止について発言。
Windows 11の一部ユーザーが、標準アプリ「フォト(Photos)」に生成AI機能のCopilotが利用できるようになったと報告しています。
OpenAIは4月1日(現地時間)、チャットAI「ChatGPT」をサインアップ不要で利用可能になると発表しました。「AIの機能に興味のあるすべての人がAIにアクセスできるようにすることを目的として、段階的に展開しています」とのことです。
OpenAIは15秒ほどの短い音声を元に、本人そっくりで、感情を込めたリアルな音声を生成できるAIモデル「Voice Engine」を発表しました。元音声と生成音声のサンプルがいくつか公開されています。
音楽配信をするときには、必須ではないのですが、歌詞データを用意しておくと、配信サービスが用意した歌詞表示機能が使えるようになります。Apple MusicとSpotifyにはデバイス側で使えるボーカルオフ機能があるので、手軽にカラオケができるというわけです。簡単にできると思ったのですが……。
生成AIに関する重要論文5本を解説する連載。今週は、生成AIの回答を自動でGoogle検索し事実か確認するAI「SAFE」、自律型AIをコントロールするためのOS「AIOS」など。
出荷間近となったAIデバイス「Ai Pin」。日本ではソフトバンクが取り扱うことが発表され、注目を浴びています。いち早く米国で購入した著者が、購入前の各種手続きについて解説します。
マイクロソフトが、まもなくクラウドでなく、PCのローカル環境で実行できるCopilot AIをリリースする模様です。これは、台北で開催されたイベント「Intel AI Summit」における質疑応答でインテル幹部が述べたとのことです。
ComfyUIでControlNet(Canny/Depth/OpenPose)を使うには
大規模言語モデル(LLM)でコンセプトを考えて、AI作曲サービスでボーカル入り楽曲を作り出す。そんなやり方で制作したコンセプトアルバムを音楽配信に載せるという話を、自ら音楽レーベルを主宰し、テクノロジー関連の執筆もこなしている山崎潤一郎さんに、数回にわたって執筆いただきます。
Adobeは春と秋に大きなイベントを開催する。秋は「Adobe MAX」。Adobeと言われて多くの人が思い出す、Photoshopなどのクリエイティブ・ツールのイベントだ。では春は? それが「Adobe Summit」。同社のもう1つの柱である、デジタルマーケティング関係のイベントだ。今年も同社の協力で、米・ラスベガスに取材に来ている。
Googleは次回の新機能追加アップデートPixel Feature Dropにて、Pixel 8にも「Gemini Nano」を提供すると発表しました。開発者向けオプションとしての形となります。