1月16日、テスラCEOのイーロン・マスク氏はX(Twitter)に同社のヒューマノイド「Optimus」が洗濯かごからTシャツを取り出し、起用にたたむ様子を収めた動画を投稿し、「Optimusがシャツをたたんでいる」と述べました。
Microsoftは1月15日(現地時間)、生成AIサービス「Copilot」の個人向けサブスクリプションサービス「Copilot Pro」を発表、提供を開始しました。
人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第4回を1月23日に開催いたします。なお、今回お申し込みいただいた方は、第3回分の動画アーカイブを視聴いただけます。
OpenAIはGPT Stoeが開設された1月10日に、ウェブサイトの利用ポリシーのページをひっそりと更新し、そのページに記述されていた、同社のAI技術を「軍事・戦争用途(Military and warfare)」に使うことを禁じるとの文言を削除しました。
今回は生成AI論文解説に加え、2つの興味深い実装も紹介しています。
年明け早々、Googleでのリストラが報じられました。なんだか不穏な2024年の幕開けです。いずれも日常的にお世話になっている製品&サービスです。ユーザーにとってのそれぞれの今後について考えてみました。
Ubisoftが1月15日(日本は18日)に発売する、新作ゲーム『プリンス・オブ・ペルシャ 失われた王冠』のなかで、一部NPC(Nom Player Character)のセリフが、テキスト読み上げソフトによる仮の音声のままリリース版に含まれてしまっていることがわかりました。
1月11日の米株式市場において、マイクロソフトは時価総額がアップルを上回り、2021年以来となる世界一の座に一時的に返り咲きました。
OpenAIが、かねてから予告していたGPT Store をようやく開設しました。
生成AIにより静止画に動きを与える技術がいくつか出てきましたが、求める動きを出すのはなかなか難しいものがあります。今回紹介する「DragNUWA」は、そんな弱点を補ってくれるユーザーインタフェースを備えています。
AIハードウェアスタートアップのrabbitが、モバイルAI端末rabbit r1を発表しました。 様々なアプリやサービスを学習したAIが、ユーザーの指示に応えてかわりに操作して用事を済ませてくれる、執事かコンシェルジュのような発想の製品です。
NVIDIAはCES 2024の開幕に合わせ、ゲーム用GPU製品のGeForce RTX 40シリーズを強化したGeForce RTX 40 SUPERシリーズを発表しました。
台湾の現代アート美術館で、筆者のAI作品が展示されることになりました。
感情を含む細かい表現が可能なAIボイスクローン技術「OpenVoice」など、生成AI最新論文の概要5つをお届けします。
周辺機器メーカーのBelkinが、360度自動トラッキング機能に対応した iPhoneスタンド「Auto-Tracking Stand Pro」を発表しました。
「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など、大規模言語モデルの返答が向上する「プロンプト26の原則」をはじめとする5つの生成AI論文を紹介します。
トランプ政権において、大統領の個人弁護士兼フィクサーとして活動したマイケル・コーエン氏が、12月はじめに裁判所に提出した公式書類に存在しない判例を記していたことを裁判所から追求され、それがAIで生成したものであることを認めました。
2023年(のちょっと前から)の生成AIの動きというか広がり、勢いを、自分の取り組みを中心にまとめてみました。
米国第3位の発行部数を誇る新聞社New York Timesが、マイクロソフトとOpenAIに対し著作権侵害の訴訟を起こしました。
Microsoftが、Android向けのGoogle Playストアにて「Microsoft Copilot」アプリの配信を開始しました。
生成AIの重要論文5本解説する連載。今回は、毎秒100枚という画像高速生成できると話題を呼んだ「StreamDiffusion」、文章指示で複数の動く3Dキャラを生成するNVIDIAの4Dアニメーションツール「AYG」などを紹介しています。
Mozillaは、基本的な情報を入力するとAIが自動的にWebサイトのデザインを作成し、Webサイトの公開まで可能なサービス「Solo」を公開しました。
アップルは表立って生成系AI競争には加わっていませんが、水面下ではAIモデルを訓練するため、ニュース報道機関に「少なくとも5000万ドル相当の複数年契約」を持ちかけたと米The New YorkTimesが報じています。
AIは、チェスのようなボードゲームではすでに人間よりも強くなっています。これはさほど驚くことではありませんが、そこに反射神経や手先の細かな操作が必要になるゲームだったらどうでしょうか。
Suno AIよりさらに簡単に完成曲を作れるようになりました。Microsoft Copilotで作曲する方法とその制限事項などについて調べました。
Googleは12月19日、試験運用中の生成AIチャット「Bard」で、GmailやGoogleドキュメント、Googleドライブ、YouTube、GoogleマップなどのGoogleサービスと連携できる「Bard拡張機能」が日本でも利用可能になったと発表しました。
マイクロソフトは12月20日、作詞・作曲・演奏・歌唱まで可能なAI作曲サービス「Suno」を自社のAIプラットフォームであるWindows Copilotに統合すると発表しました。
連載第13回目ではControlNetのCanny、Depth、OpenPoseをご紹介した。続きに入る前に軽くおさらいすると、ControlNetは指定した画像を使って、構図や絵柄、ポーズ、そして書かれている内容(Prompt相当)などを抽出し、生成する画像を固定する方法だ。
歌詞を与えれば作曲・演奏・歌唱と残りの全てをやってくれるAI作曲完パケサービス「Suno」ですが、音楽制作界隈では「MIDIで吐いてくれ」との声が多く上がっています。
音楽生成に新たな展開が。Music to Musicによる生成をパートごとに出せる技術が登場しています。生成AIに関する論文5つを紹介します。
AI作曲サービスSunoのUIがガラリと変わったので、使い方をまとめてみました。
Suno短期連載第3弾。Suno + ChatGPT + Stable Diffusionを連携させてAI楽曲を作る試みです。
生成AIは技術の進歩/進化が凄まじいペースで数ヶ月前はもうかなり古い話になることもあり、今回はこれまでの13回分をまとめてみたい。
テスラはX(Twitter)でヒト型ロボット「Optimus」の第2世代(Gen 2)となるバージョンを公開しました。紹介動画では、前世代バージョンよりも立居振舞が自然な雰囲気に近づいたように見えます。
Sunoで作った楽曲を音源分離し、再構築して歌ってみました。そこで、Suno以降の音楽制作と音楽体験のあり方について考えてみました。
Inter BEE 2023で取材した中から、未来のトレンドを読み取ってみた。
感動できるボーカル曲をAIがほぼ一発で生成できるようになりました。
今週は重要論文が多くて6本です。画像の深度情報を推定する技術を大幅に進化させた「Marigold」などの生成AIの最新情報をお届けします。
動画がすごすぎると話題を呼んだGoogle Gemini Ultraですが……。
Metaは12月6日(現地時間)、同社の画像生成AI「Imagine」のウェブ版(imagine.meta.com)を公開しました。サイトは日本語化されていますが、残念ながらいまのところ利用できるのは米国のみとなっています。
人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第3回を12月21日に開催いたします。なお、今回お申し込みいただいた方は、第2回分の動画アーカイブを視聴いただけます。
Googleは12月6日(現地時間)、新しいAIモデル「Gemini」を発表しました。用途に応じてUltra、Pro、Nanoという3つのバージョンが用意されており、その中でモバイル機器向けとなるGemini NanoをPixel 8 Proに展開することも発表されています。