AI

Google、AIでファイル種類を高速正確に判別する「Magika」をオープンソース公開 画像
テクノロジー

Google、AIでファイル種類を高速正確に判別する「Magika」をオープンソース公開

AIを用いることでファイルの種類を高速かつ正確に判別できるツール「Magika」をGoogleがオープンソースで公開。

1時間超のYouTubeを解釈できるオープンなマルチモーダルAI「LWM」、Windowsをプロンプトで自動操作するMS製AI「UFO」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

1時間超のYouTubeを解釈できるオープンなマルチモーダルAI「LWM」、Windowsをプロンプトで自動操作するMS製AI「UFO」など重要論文5本を解説(生成AIウィークリー)

1週間分の生成AI関連論文の中から重要なものをピックアップする連載。今回は、Gemini 1.5、LoRA改良版、WindowsのAIエージェント、長時間動画にも対応するマルチモーダルAIなど5本を紹介します。

マルチモーダルAIメガネ『Frame』詳細。39gにOLED画面とカメラ搭載、見たものを翻訳やナビなど。4月出荷で予約受付中 画像
ガジェット

マルチモーダルAIメガネ『Frame』詳細。39gにOLED画面とカメラ搭載、見たものを翻訳やナビなど。4月出荷で予約受付中

シンガポールのAIデバイス企業 Brilliant Labs が、メガネ型端末「Frame」を発表しました。

OpenAI、文章から驚異的品質の動画を生成するモデル「Sora」発表。試せる一般公開はまだ先、世界を描ける汎用の生成AIレンダラになり得るか 画像
テクノロジー

OpenAI、文章から驚異的品質の動画を生成するモデル「Sora」発表。試せる一般公開はまだ先、世界を描ける汎用の生成AIレンダラになり得るか

OpenAIから新しい動画生成モデル「Sora」が発表され、合わせて技術レポートも公開されました。Soraはテキストから最長1分の動画を生成できるモデルで、画像から動画の生成や動画の補完も可能。作例を見る限り、現在公開されているどの動画生成モデルよりも優れています。

Slack AI提供開始、長いスレッド要約や会話で検索など。まずはEnterpriseプラン有料アドオンから、日本では4月予定 画像
テクノロジー

Slack AI提供開始、長いスレッド要約や会話で検索など。まずはEnterpriseプラン有料アドオンから、日本では4月予定

Slackは2月14日(現地時間)、2023年に予告していた生成AI機能「Slack AI」の一般提供を米国と英国にて開始したと発表しました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第18回:バレンタイン編。ComfyUIの環境を整える (西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第18回:バレンタイン編。ComfyUIの環境を整える (西川和久)

グラビアカメラマンでありソフトウェアエンジニアでもある西川和久氏による生成AI
グラビア実践講座 第18回をお届けします

複数の同一人物を同時に量産できるNVIDIAの画像生成AI「ConsiStory」、Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

複数の同一人物を同時に量産できるNVIDIAの画像生成AI「ConsiStory」、Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」など重要論文5本を解説(生成AIウィークリー)

複数の同一人物を同時に量産できるNVIDIAの画像生成AI「ConsiStory」、Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」などを解説します。

生成AIで大統領候補のフェイク画像作成、Midjourneyが禁止検討。トランプおよびバイデン両氏を含む 画像
テクノロジー

生成AIで大統領候補のフェイク画像作成、Midjourneyが禁止検討。トランプおよびバイデン両氏を含む

Midjourneyは今後1年間、同社の人工知能ソフトウェアを使って政治的な画像を作成すること、特にジョー・バイデン氏とドナルド・トランプ氏の画像生成を禁止することを検討しています。

Google One加入者数が1億人を突破、ピチャイCEOが発表。Gemini AI機能追加で加入者増を狙う 画像
テクノロジー

Google One加入者数が1億人を突破、ピチャイCEOが発表。Gemini AI機能追加で加入者増を狙う

米Googleのスンダー・ピチャイCEOは、同社の有料クラウドストレージサービス「Google One」の加入者が1億人を突破したことを発表しました。

Google最高峰AIモデル「Gemini Ultra」解禁。月額2900円のGoogle One新プラン「AIプレミアム」で提供開始 画像
テクノロジー

Google最高峰AIモデル「Gemini Ultra」解禁。月額2900円のGoogle One新プラン「AIプレミアム」で提供開始

Googleは新開発したAIモデルの最高峰「Gemini Ultra」の提供を開始しました。また、対話型AIサービスの名前を「Bard」から「Gemini」に変更します。

アップル、文章で画像を編集するAIモデル「MGIE」開発。GitHubにオープンソース公開 画像
テクノロジー

アップル、文章で画像を編集するAIモデル「MGIE」開発。GitHubにオープンソース公開

アップルの研究者らが、入力した文章によって画像を編集できるAIモデル「MGIE」を発表、公開しました。MGIEとはMLLM-Guided Image Editingの略で、テキストベースのコマンドを解釈するマルチモーダル大規模言語モデル(MLLM)を使用しています。

米Amazonがショッピング向けAIアシスタント「Rufus」発表。製品カタログやレビューなどをもとに買い物をサポート 画像
テクノロジー

米Amazonがショッピング向けAIアシスタント「Rufus」発表。製品カタログやレビューなどをもとに買い物をサポート

米Amazonは2月2日(現地時間)、ショッピング向けのAIアシスタント「Rufus」を発表しました。米国でAmazonのモバイルアプリを利用する一部ユーザーに対してベータ版が提供開始されており、今後数週間のうちに米国のさらに多くのユーザーに展開されるとのことです。

スマホ高品質画像生成、わずか0.2秒で。Google「MobileDiffusion」がiPhone 15 Proで達成。重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

スマホ高品質画像生成、わずか0.2秒で。Google「MobileDiffusion」がiPhone 15 Proで達成。重要論文5本を解説(生成AIウィークリー)

iPhone 15 Proで0.2秒以内に高品質な512×512画像を生成することにGoogleが成功。生成AIに関する最新論文5本を解説します。

生成AIおじさんをおじさん好きが作るとどうなる?(第1回) ありふれたモチーフ「おじさん」を生成するための手法 画像
テクノロジー

生成AIおじさんをおじさん好きが作るとどうなる?(第1回) ありふれたモチーフ「おじさん」を生成するための手法

生成AIによりおじさんの画像を作り出すためのツールや生成のコツのようなものをご紹介します。