AIを用いることでファイルの種類を高速かつ正確に判別できるツール「Magika」をGoogleがオープンソースで公開。
1週間分の生成AI関連論文の中から重要なものをピックアップする連載。今回は、Gemini 1.5、LoRA改良版、WindowsのAIエージェント、長時間動画にも対応するマルチモーダルAIなど5本を紹介します。
シンガポールのAIデバイス企業 Brilliant Labs が、メガネ型端末「Frame」を発表しました。
OpenAIから新しい動画生成モデル「Sora」が発表され、合わせて技術レポートも公開されました。Soraはテキストから最長1分の動画を生成できるモデルで、画像から動画の生成や動画の補完も可能。作例を見る限り、現在公開されているどの動画生成モデルよりも優れています。
Slackは2月14日(現地時間)、2023年に予告していた生成AI機能「Slack AI」の一般提供を米国と英国にて開始したと発表しました。
グラビアカメラマンでありソフトウェアエンジニアでもある西川和久氏による生成AI グラビア実践講座 第18回をお届けします
複数の同一人物を同時に量産できるNVIDIAの画像生成AI「ConsiStory」、Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」などを解説します。
Midjourneyは今後1年間、同社の人工知能ソフトウェアを使って政治的な画像を作成すること、特にジョー・バイデン氏とドナルド・トランプ氏の画像生成を禁止することを検討しています。
米Googleのスンダー・ピチャイCEOは、同社の有料クラウドストレージサービス「Google One」の加入者が1億人を突破したことを発表しました。
Googleは新開発したAIモデルの最高峰「Gemini Ultra」の提供を開始しました。また、対話型AIサービスの名前を「Bard」から「Gemini」に変更します。
アップルの研究者らが、入力した文章によって画像を編集できるAIモデル「MGIE」を発表、公開しました。MGIEとはMLLM-Guided Image Editingの略で、テキストベースのコマンドを解釈するマルチモーダル大規模言語モデル(MLLM)を使用しています。
米Amazonは2月2日(現地時間)、ショッピング向けのAIアシスタント「Rufus」を発表しました。米国でAmazonのモバイルアプリを利用する一部ユーザーに対してベータ版が提供開始されており、今後数週間のうちに米国のさらに多くのユーザーに展開されるとのことです。
iPhone 15 Proで0.2秒以内に高品質な512×512画像を生成することにGoogleが成功。生成AIに関する最新論文5本を解説します。
生成AIによりおじさんの画像を作り出すためのツールや生成のコツのようなものをご紹介します。