生成AIの重要論文5本を解説する連載。Googleが“一歩先の未来を予知”できる時系列予測AI基盤モデル「TimeFM」公開、LSTMの進化形「xLSTM」など。
アップルがニューヨーク、ロンドン、上海で開催した、iPadをメインに据えた久々の発表会。 製品の概要については、既に十分な報道がなされている上、ウェブにも大量の情報が溢れている。近いうちに実機でのテストの機会があるため、ここでは少し製品から離れて、新型iPad Proに搭載されている新しいプロセッサについて話を進めていくことにしたい。
AI作曲サービスのUdioは5月8日、有料プランを含むサブスクリプションをスタートしました。同時に、生成した楽曲の部分修正を行う「Audio Inpainting」機能を追加しています。
アップルは5月7日、音楽制作ソフトLogic Proの機能アップを発表しました。
作曲AIサービスのUdioが5月1日、新機能を搭載したとX上で発表しました。長く、一貫性のある曲を作れるようになると謳っています。この新機能を使ってプログレの長い曲を作ってみました。
AIが創造したプログレバンド「The Midnight Odyssey」が世界デビューしてから1カ月が過ぎました。バンドは勢力的に活動しているようで、リードギターのエリオット・スミスがリモートでインタビューに応じた映像が飛び込んできました。
動画生成AIにまつわる最新の話題をお届けしている、この短期連載。今回は、(おそらく)世界中のAI動画クリエイターたちが使ってみたいと考えているOpenAIのSoraによる映像制作が、そんなに簡単なものではないという裏話と、複数の人気動画生成AIに同じプロンプトで動画を生成させて比較してみます。
Googleは4月30日(現地時間)、Geminiモバイルアプリの提供地域を拡大すると発表しました。日本でもAndroidではGoogle Playストアからダウンロードが可能。iOSの場合は専用アプリはなく、Googleアプリからのアクセスとなります。
Anthropicは5月1日(現地時間)、生成AI「Claude(クロード)」のiOSアプリをリリースしました。あわせて、新プランとなる「Team」も発表されています。
グラビアカメラマンでエンジニアの西川和久氏による生成AIグラビア連載、今回は画像生成モデルStable Diffusion を使う定番インターフェースのひとつ Automatic1111の新バージョン解説と、プロンプトから高速に画像を検索できるエクステンションSearchMyPNGの使い方について。
テクノエッジのYouTubeチャンネルで、毎週水曜日のお昼に生成AI音楽に関するライブ配信することにしました。名付けて、「AIライブハウス」。いきなりですが、本日(5月1日)正午にスタートです。
生成AIの重要論文5本を解説する連載。今回は、自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIなど。
アップルは次期iOS 18の「いくつかの機能」を生成AIにより強化するため、複数の企業と交渉しているとの噂は、何度か報じられてきたことです。たとえばGoogleとは、Gemini AIの使用に関して協議している、という具合です。
10秒の歌声オーディオデータがあれば、本人そっくりのリアルタイム歌唱ができるという「Vocoflex」。ベータテスターの申し込みをしていたのですが、ついに試用できたので、そのファーストインプレッションをお届けします。