AI

GoogleのAI「Bard」、人間の代わりにYouTubeを見て内容を回答可能に。料理動画からレシピを要約も 画像
テクノロジー

GoogleのAI「Bard」、人間の代わりにYouTubeを見て内容を回答可能に。料理動画からレシピを要約も

GoogleはAIチャットボット「Bard」をアップデートし、YouTube動画を理解できる最初の一歩を踏み出したと発表しました。

スマホ版ChatGPTの音声会話機能が無料ユーザーに開放。退社したブロックマン元社長もお勧め 画像
テクノロジー

スマホ版ChatGPTの音声会話機能が無料ユーザーに開放。退社したブロックマン元社長もお勧め

OpenAIは元CEOサム・アルトマン氏の去就をめぐり大変なことになっているさなか、ChatGPTモバイルアプリの音声会話機能を無料ユーザーも利用可能にしたと発表しました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第13回:SDXLでのControlNet活用方法その1+α版(西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第13回:SDXLでのControlNet活用方法その1+α版(西川和久)

第9回にFooocus-MREを使ってControlNetをご紹介したが、一般的なAUTOMATIC1111での説明はまだだったので、改めて今回と次回で行いたい。

入力テキストを実写アバターに話させるツールをMicrosoftが発表、擬人化キャラの外見や性格を文章で作り出す「ChatAnything」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

入力テキストを実写アバターに話させるツールをMicrosoftが発表、擬人化キャラの外見や性格を文章で作り出す「ChatAnything」など重要論文5本を解説(生成AIウィークリー)

生成AIの最新トレンドを追いかける連載。今回は入力テキストを実写アバターに話させるツール、擬人化キャラの外見や性格を文章で作り出す技術など重要論文5本を解説します。

OpenAIサム・アルトマンCEOが退社、事実上の追放。取締役会「意思疎通が不誠実と判断」 画像
テクノロジー

OpenAIサム・アルトマンCEOが退社、事実上の追放。取締役会「意思疎通が不誠実と判断」

ChatGPTやDALL・E等の生成AIサービスで知られるOpenAI社が、CEOサム・アルトマン氏の退社を発表しました。

『Japanese Stable Diffusion XL』公開。日本語プロンプトで日本文化を反映した画像出力 画像
テクノロジー

『Japanese Stable Diffusion XL』公開。日本語プロンプトで日本文化を反映した画像出力

日本の文化・アートを日本語の入力で高品質に出力できる画像生成AIが、Stability AIから公開されました。

ローコード開発ツール「Copilot Studio」発表。Copilotのカスタマイズ、プラグイン開発、ワークフロー設定などが可能に(Microsoft Ignite 2023) 画像
テクノロジー

ローコード開発ツール「Copilot Studio」発表。Copilotのカスタマイズ、プラグイン開発、ワークフロー設定などが可能に(Microsoft Ignite 2023)

マイクロソフトは開催中の年次イベント「Microsoft Ignite 2023」で、同社のAIサービスであるCopilotのカスタマイズやプラグイン開発、ワークフローの設定、データソースとの接続などを含むさまざまな開発を可能にするローコード開発ツール「Copilot Studio」を発表しました。

GoogleフォトがAI機能強化。「ほぼ同じ写真」をスタック整理、カレンダーに自動予定追加 画像
テクノロジー

GoogleフォトがAI機能強化。「ほぼ同じ写真」をスタック整理、カレンダーに自動予定追加

Googleは、写真ライブラリーの中にあるほとんど同じ写真を整理するための新しいAI機能を発表しました。

「Bing Chat」が「Copilot」にリブランディング。Edge以外のブラウザ、モバイルでも利用可能に(Microsoft Ignite 2023) 画像
テクノロジー

「Bing Chat」が「Copilot」にリブランディング。Edge以外のブラウザ、モバイルでも利用可能に(Microsoft Ignite 2023)

マイクロソフトはこれまで「Bing Chat」および企業向けに「Bing Chat Enterprise」の呼称で提供してきたAIサービスを「Copilot」にリブランディングし、同社のAIサービス全体の体験を「Microsoft Copilot」で統一します。

YouTube、「AI使用動画」明示をクリエーターに義務付け。選挙や紛争等は大きく目立つラベル必須、フェイク音声楽曲は元アーティストに削除要請権 画像
テクノロジー

YouTube、「AI使用動画」明示をクリエーターに義務付け。選挙や紛争等は大きく目立つラベル必須、フェイク音声楽曲は元アーティストに削除要請権

最近は生成AIによる動画がさかんに作られていますが、それは一方では視聴者が本物だと誤解しかねないことも意味しています。

AIで蘇る、伝説の歌手エディット・ピアフの声と姿。伝記映画「EDITH」のナレーションも 画像
テクノロジー

AIで蘇る、伝説の歌手エディット・ピアフの声と姿。伝記映画「EDITH」のナレーションも

伝説的歌手であるエディット・ピアフが遺した声を元にしたAIボイスによりナレーションが行われることが発表されました。

Google DeepMindの気象予測AI「GraphCast」、1分で前例ない精度の10日間予報を出力 画像
テクノロジー

Google DeepMindの気象予測AI「GraphCast」、1分で前例ない精度の10日間予報を出力

Google DeepMindの気象予測AIモデル「GraphCast」、従来の予測システムを上回る精度を獲得Google DeepMindの気象予測AI「GraphCast」、1分で前例のない精度の10日間予報を出力

謎のAIデバイスメーカーHumaneとは何者か。バッジ型AIウェアラブル「Ai Pin」が生まれた背景と周到な準備 画像
テクノロジー

謎のAIデバイスメーカーHumaneとは何者か。バッジ型AIウェアラブル「Ai Pin」が生まれた背景と周到な準備

OpenAIのAI技術を胸に装着する小型デバイスで操作する「Ai Pin」が注目されています。スタートアップでありながら野心的なAIデバイスを投入したシリコンバレーのメーカーHumaneに、筆者は1年ほど前から注目していたのでした。

SDXLでライブ映像をリアルタイム画像生成できる高速化ツール「LCM-LoRA」、GPT-4Vより良い結果も示す画像理解モデル「CogVLM」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

SDXLでライブ映像をリアルタイム画像生成できる高速化ツール「LCM-LoRA」、GPT-4Vより良い結果も示す画像理解モデル「CogVLM」など重要論文5本を解説(生成AIウィークリー)

今回の生成AI論文紹介では、画像の生成、理解、対話といった分野での進歩がありました。

AIが人間を超えた2045年描く『地球外少年少女』11日24時からNHKで地上波初放送 『電脳コイル』磯光雄15年ぶり監督作 画像
テクノロジー

AIが人間を超えた2045年描く『地球外少年少女』11日24時からNHKで地上波初放送 『電脳コイル』磯光雄15年ぶり監督作

『地球外少年少女』

「ポケトーク for Business 同時通訳」ブラウザ版発表、スマホで同時通訳を実現。HUAWEI Eyewear 2との相性が抜群(石野純也) 画像
テクノロジー

「ポケトーク for Business 同時通訳」ブラウザ版発表、スマホで同時通訳を実現。HUAWEI Eyewear 2との相性が抜群(石野純也)

ソースネクストからスピンアウトしたポケトークは、新サービスの「ポケトーク for Business 同時通訳」のブラウザ版を発表しました。すでにサービスは開始されており、月額3300円/年額3万9600円で利用できます。for Businessのため、法人向けという位置づけではありますが、個人ユースにも対応。サブスクとしてはやや高めな印象はあるものの、払えないほどの金額ではない絶妙な価格設定になっています。

マイクロソフト、Windows 10にもAIアシスタント「Copilot」を提供か。サポート終了延期も議論 画像
テクノロジー

マイクロソフト、Windows 10にもAIアシスタント「Copilot」を提供か。サポート終了延期も議論

Windows関連の情報サイトWindows Centralが、独自に得た情報としてマイクロソフトがWindows 10にWindows 11と同じAiアシスタントのCopilotを提供すると伝えています。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第12回:SDXL用ModelやLoRAをピックアップ+α版。寝転びポーズや「東京駅」で撮影など (西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第12回:SDXL用ModelやLoRAをピックアップ+α版。寝転びポーズや「東京駅」で撮影など (西川和久)

前回、連載11回目はSD 1.5用のModelとLoRAを主にご紹介した。12回目の今回は予告どおり、次世代 Stable Diffusion として表現力が格段に向上した SDXL用のModelとLoRA、そして+αをご紹介したい。

AIプログラマーは24時間耐久プログラミングが好きなの? GPT4新機能にときめいたあなたは参加したいかも(CloseBox) 画像
テクノロジー

AIプログラマーは24時間耐久プログラミングが好きなの? GPT4新機能にときめいたあなたは参加したいかも(CloseBox)

AIの24時間ハッカソンの審査会を見てきたと思ったら、次の24時間耐久GPTハッカソンが開かれるという知らせが。

YouTube、動画視聴時に使える会話型AIツールのテストを開始。質問や内容の要約が可能に 画像
テクノロジー

YouTube、動画視聴時に使える会話型AIツールのテストを開始。質問や内容の要約が可能に

YouTubeは、動画の視聴時に使える会話型AIツールのテストを実施しています。

OpenAIがGPT-4 Turbo発表、従来よりも安価で高性能に。画像入力に特化したGPT-4 Turbo with Visionも 画像
テクノロジー

OpenAIがGPT-4 Turbo発表、従来よりも安価で高性能に。画像入力に特化したGPT-4 Turbo with Visionも

OpenAIは11月6日(米時間)、同社初となる開発者会議「DevDay」にて、生成AIの新モデル「GPT-4 Turbo」を発表しました。

朝日新聞社の校正支援サービス「Typoless」を試す(西田宗千佳) 画像
テクノロジー

朝日新聞社の校正支援サービス「Typoless」を試す(西田宗千佳)

文章を生業とする人ならば避けて通れない「校正・校閲」作業。そのための新しいツールが朝日新聞社から登場したので、それを西田宗千佳さんが使ってみた。

文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで別人の声になりきる「LLVC」、感情付きプロンプトなど重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで別人の声になりきる「LLVC」、感情付きプロンプトなど重要論文5本を解説(生成AIウィークリー)

その週の重要論文5本を解説する連載。今回は、OpenAIの文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで自分の声を別人の声に即時変換するモデル「LLVC」など。

イーロン・マスク「宇宙の本質理解する」人工知能企業xAI、初のAIを公開 画像
テクノロジー

イーロン・マスク「宇宙の本質理解する」人工知能企業xAI、初のAIを公開

イーロン・マスク氏が、7月に発表した人工知能開発企業xAIの初のAIモデルを11月4日に公開するとX(Twitter)で発表しました。

ビートルズ最後の新曲「Now And Then」はどのように現代に復活したか。公式ドキュメンタリーで分かったAIの貢献(CloseBox) 画像
テクノロジー

ビートルズ最後の新曲「Now And Then」はどのように現代に復活したか。公式ドキュメンタリーで分かったAIの貢献(CloseBox)

ビートルズの「新曲」が11月3日に公開されます。その制作ドキュメンタリーが本日公開され、その曲の一部を聴くことができましたので、そこでどんなことが行われていたのかをまとめ

『グランツーリスモ 7 Spec II』アップデート配信。AIレーサーGT Sophy 2.0といつでも対戦可能に 画像
テクノロジー

『グランツーリスモ 7 Spec II』アップデート配信。AIレーサーGT Sophy 2.0といつでも対戦可能に

ソニー・インタラクティブエンタテインメント(SIE)がポリフォニー・デジタルが開発するドライビングシミュレーター『Gran Turismo 7』のメジャーアップデートとなる『Spec II』の配信を開始しました。

画像内キャラを3D変換する強力モデル「Zero123++」、文章から高品質3Dモデル生成するAI「DreamCraft3D」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

画像内キャラを3D変換する強力モデル「Zero123++」、文章から高品質3Dモデル生成するAI「DreamCraft3D」など重要論文5本を解説(生成AIウィークリー)

今回は3Dモデルで大きな躍進がありました。画像1枚から3Dモデルを高品質に生成する拡散モデル「Zero123++」をはじめとする、生成AI最新論文の概要5つをお届けします。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第11回:Stable Diffusion 1.5の注目ModelやLoRAを紹介+α版 (西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第11回:Stable Diffusion 1.5の注目ModelやLoRAを紹介+α版 (西川和久)

ここのところ、生成AI画像環境構築やアプリの使い方などで3回、顔LoRA制作…と少し重いネタが続いたので、今回は軽めの気になるModelやLoRAを作例と共にご紹介したい。

ベートーヴェンやクレオパトラなど、偉人になりきるAI「Character-LLM」、“グリグリ動かせる3Dシーン”をリアルタイム生成する「4D Gaussian Splatting」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

ベートーヴェンやクレオパトラなど、偉人になりきるAI「Character-LLM」、“グリグリ動かせる3Dシーン”をリアルタイム生成する「4D Gaussian Splatting」など重要論文5本を解説(生成AIウィークリー)

生成AIの重要論文5つを紹介する連載。今回はWeb上のサービスを言語指示でフル活用できるChrome拡張機能を用いたAI「OpenAgents」、偉人を完コピするAI「Character-LLM」など。

Python互換言語「Mojo」、Appleシリコンにネイティブ対応したMac版が公開。Pythonの9万倍、C言語に比肩する高速性 画像
テクノロジー

Python互換言語「Mojo」、Appleシリコンにネイティブ対応したMac版が公開。Pythonの9万倍、C言語に比肩する高速性

今回のAppleシリコンにネイティブ対応したMac版のリリースは、Linux版に続くもの。Windows版のリリース時期は未定です。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第十回:実在モデルからSDXL用顔LoRAを作る (西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第十回:実在モデルからSDXL用顔LoRAを作る (西川和久)

Modelに無い顔や彼女の顔を出したい!

Pythonの高速スーパーセット「Mojo」がAppleシリコン搭載Macに対応間近。Windowsより先に 画像
テクノロジー

Pythonの高速スーパーセット「Mojo」がAppleシリコン搭載Macに対応間近。Windowsより先に

Pythonのスーパーセット言語として注目されているMojoは現在Linux版のみ。次はWindows版ではなくMac版になりそうだ。

アップルがマルチモーダル大規模言語モデル「Ferret」を公開。画像内の形や場所を言葉で説明(生成AIウィークリー) 画像
テクノロジー

アップルがマルチモーダル大規模言語モデル「Ferret」を公開。画像内の形や場所を言葉で説明(生成AIウィークリー)

アップルらが開発したMultimodal Large Language Modelの「Ferret」など、5本の生成AI関連論文を紹介します。

生成AI時代の新技術てんこ盛り。Adobe MAX 2023「Sneaks」を深掘りする(西田宗千佳) 画像
テクノロジー

生成AI時代の新技術てんこ盛り。Adobe MAX 2023「Sneaks」を深掘りする(西田宗千佳)

今年も、Adobeの年次イベント「Adobe MAX 2023」の取材で米ロサンゼルスに来ている。Adobeのイベントでは多数の新技術が発表になるが、やはり「華」でありハイライトは、開発途上の技術を先出しする「Sneaks」だ。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第九回:Fooocus-MREでimage-2-imageやControlNetを試す (西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第九回:Fooocus-MREでimage-2-imageやControlNetを試す (西川和久)

■画像生成は出来たけど…何かもう一捻りしたい!

どんなに長い文章でも破綻しない生成AI「StreamingLLM」、キャラクターの性格や話し方を模倣するAIなど重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

どんなに長い文章でも破綻しない生成AI「StreamingLLM」、キャラクターの性格や話し方を模倣するAIなど重要論文5本を解説(生成AIウィークリー)

生成AIの重要論文を解説する連載。今回は、大規模言語モデルでどんなに長い文章でも破綻しない手法、キャラクターの性格や話し方を模倣するAIなど紹介します。

生成AIとクラウドで勝つイベント Google Cloud Next Tokyoは11月開催、参加無料で登録受付中 #GoogleCloudNext #PR 画像
テクノロジー

生成AIとクラウドで勝つイベント Google Cloud Next Tokyoは11月開催、参加無料で登録受付中 #GoogleCloudNext #PRPR

GoogleはクラウドサービスGoogle Cloudの最新技術と導入事例を発表するイベント Google Cloud Next Tokyo を4年ぶりに開催します。

ロビン・ウィリアムズの娘ゼルダ、AI生成で再現された父の姿や声が「個人的に不快」と非難 画像
テクノロジー

ロビン・ウィリアムズの娘ゼルダ、AI生成で再現された父の姿や声が「個人的に不快」と非難

米国の女優・監督兼プロデューサー、ゼルダ・ウィリアムズ氏は、すでに亡くなった人の遺志を考慮することなくAIで再現したり、置き換えたりする試みに対して「個人的に不快だ」と述べています。

10倍高速に3Dモデル生成可能な「DreamGaussian」、ネット記事量産できる生成AI「InternLM-XComposer」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

10倍高速に3Dモデル生成可能な「DreamGaussian」、ネット記事量産できる生成AI「InternLM-XComposer」など重要論文5本を解説(生成AIウィークリー)

生成AIの重要論文5本を解説する連載。今回は、3Dモデルを高速生成する「DreamGaussian」、ネット記事量産AI「InternLM-XComposer」などです。

マイクロソフト、アップルにBing検索の売却を打診していた?2020年に交渉 画像
テクノロジー

マイクロソフト、アップルにBing検索の売却を打診していた?2020年に交渉

マイクロソフトは2009年からGoogleのライバルとしてウェブ検索サービス「Bing」を展開してきました。今年2月にはOpenAIの大規模言語モデルを統合したBing AIを発表して、ユーザー数を増やしています。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第八回:シンプルで高機能なSDXL専用インターフェースFooocusとFooocus-MREの使いかた (西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第八回:シンプルで高機能なSDXL専用インターフェースFooocusとFooocus-MREの使いかた (西川和久)

Stable Diffusionを使う新たなインターフェース、Fooocusをご紹介したい。インストールはbat一発、起動/アップデートもbat一発、Modelも初期起動時に自動的にダウンロードと非常にシンプル。そしてなにより、出てくる絵が驚異的という優れたインターフェースなのだ。

Metaが28人の生成AIキャラクターを発表した理由。どこまでもFacebook的なAI戦略(本田雅一) 画像
テクノロジー

Metaが28人の生成AIキャラクターを発表した理由。どこまでもFacebook的なAI戦略(本田雅一)

「Meta Connect」という開発者向けイベントに参加した。なぜQuestシリーズに力を入れるのか、なぜAI技術に投資を行うのか。その答えの先には、常にSNSの存在がある。Metaにとっての生成AIとはコミュニケーションを円滑に行うための道具なのだ。