Generative AI

3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox) 画像
テクノロジー

3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox)

「使い方を誤ればティープフェイクの音声版にもなり得る」とまでマイクロソフトが危険視していた技術が別の開発者によってオープンソース公開されました。

Metaが文章と音声を翻訳するオールインワンAI「SeamlessM4T」、コード専用生成AI「Code Llama」を投入するなど重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

Metaが文章と音声を翻訳するオールインワンAI「SeamlessM4T」、コード専用生成AI「Code Llama」を投入するなど重要論文5本を解説(生成AIウィークリー)

Metaが文章と音声を翻訳するAI「SeamlessM4T」、コード専用生成AI「Code Llama」投入するなど、生成AIに関する重要論文5本を解説します。

無料で25人のAIシンガー使い放題なボーカロイド「VOCALOID β-STUDIO」はどこが画期的なのか、パラメータ1つで歌ってもらってわかったこと(CloseBox) 画像
カルチャー

無料で25人のAIシンガー使い放題なボーカロイド「VOCALOID β-STUDIO」はどこが画期的なのか、パラメータ1つで歌ってもらってわかったこと(CloseBox)

ヤマハの「VOCALOID β-STUDIO」を実際に使ってみました。まだ半日程度ですが、いくつかわかったことがあります。

期間限定・無料で25人分のAIシンガーが使える試作品ボカロの受付開始。VOCALOID β-STUDIO、始まる(CloseBox) 画像
カルチャー

期間限定・無料で25人分のAIシンガーが使える試作品ボカロの受付開始。VOCALOID β-STUDIO、始まる(CloseBox)

これまで作品を作ってきたボカロPは、ヤマハの新しいVOCALOID技術を無償で試すチャンス。「VOCALOID β-STUDIO」の参加受付が始まりました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第六回:Stable Diffusionの基本2 / LoRAの概要と6つの例を紹介 (西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第六回:Stable Diffusionの基本2 / LoRAの概要と6つの例を紹介 (西川和久)

前回はモデルの1つであるCheckpointについていろいろお話した。今回はStable Diffusionが扱えるモデルの中で次によく使われるLoRAについてがお題となる。

好きな人の声で好きな文章を読ませるMicrosoftの音声AI「SpeechX」、映像から3Dシーンを生成するNVIDIA開発「Neuralangelo」のコード公開など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

好きな人の声で好きな文章を読ませるMicrosoftの音声AI「SpeechX」、映像から3Dシーンを生成するNVIDIA開発「Neuralangelo」のコード公開など重要論文5本を解説(生成AIウィークリー)

今週の生成AI注目論文は、任意の人の音声を合成できるマイクロソフトのText-to-Speechモデルなど5本です。

Web3・NFT・メタバースが「幻滅期」入り 「日本における未来志向型インフラ・テクノロジのハイプ・サイクル:2023年」発表 画像
テクノロジー

Web3・NFT・メタバースが「幻滅期」入り 「日本における未来志向型インフラ・テクノロジのハイプ・サイクル:2023年」発表

ガートナーのハイプサイクル、日本ではWeb3、NFT、メタバースが「幻滅期」入りしました。

生成AIは「過度な期待のピーク」期に。米ガートナー「先進テクノロジーのハイプサイクル2023年」を発表 画像
テクノロジー

生成AIは「過度な期待のピーク」期に。米ガートナー「先進テクノロジーのハイプサイクル2023年」を発表

ガートナーのハイプサイクル。今年はすでに多くのITエンジニアに聞き馴染みのあるキーワードが比較的保守的といえる場所に並んでいます。

SnapchatのMy AIが謎の動画を勝手に投稿し沈黙、ユーザーを怯えさせる。Snapは「一時的な障害」と説明 画像
テクノロジー

SnapchatのMy AIが謎の動画を勝手に投稿し沈黙、ユーザーを怯えさせる。Snapは「一時的な障害」と説明

若い世代に人気の画像投稿SNS、Snapchatには今年、「My AI」と呼ばれるAIチャットボット機能が追加されました。ところが、この「My AI」が突然、勝手にユーザーのストーリーに1秒間の謎の動画を投稿し、その後押し黙ってしまうという少々気味の悪い現象が発生しています。

25体の自律AIが住む街がオープンソース化、チラつき抑えた動画合成を生成するAI「DiffSynth」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

25体の自律AIが住む街がオープンソース化、チラつき抑えた動画合成を生成するAI「DiffSynth」など重要論文5本を解説(生成AIウィークリー)

1週間分の生成AI主要論文を紹介する連載。今回は、25体の自律AIが住む町、“ちらつき”を抑えた動画合成を生成するAIなど。

AI動画が簡単に作れる「AnimateDiff」を試したらやりがい爆上がり。カスタム学習したあの子が自然に動いてるよ(CloseBox) 画像
テクノロジー

AI動画が簡単に作れる「AnimateDiff」を試したらやりがい爆上がり。カスタム学習したあの子が自然に動いてるよ(CloseBox)

最近AnimateDiffというAI動画手法がすごいと各所で注目されています。

NVIDIAがHugging Faceと提携。AIモデルを選んでそのままNVIDIA DGXクラウドで学習可能に 画像
テクノロジー

NVIDIAがHugging Faceと提携。AIモデルを選んでそのままNVIDIA DGXクラウドで学習可能に

NVIDIAが生成AIに関わる人なら必ずお世話になっているHugging Faceと提携しました。そこで提供するのはTraining Cluster as a Serviceと呼ばれるものです。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第五回:Stable Diffusionの基本1 / Checkpointとリアル系モデルの遷移 (西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第五回:Stable Diffusionの基本1 / Checkpointとリアル系モデルの遷移 (西川和久)

Checkpointとは!?

盗作を回避する音楽生成AI「MusicLDM」、AIたちが協力しゲーム開発する「MetaGPT」、など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

盗作を回避する音楽生成AI「MusicLDM」、AIたちが協力しゲーム開発する「MetaGPT」、など重要論文5本を解説(生成AIウィークリー)

盗作をできるだけ避けて音楽生成するAI、複数のLLMが協力してソフトウェア開発を行うフレームワークなど、最新のAI論文5つを紹介します。

米アマゾンは全部門が生成AIに注力「われわれの活動の中心」とCEO語る 画像
テクノロジー

米アマゾンは全部門が生成AIに注力「われわれの活動の中心」とCEO語る

米AmazonのCEO、アンディ・ジャシー氏は、2023年第2四半期の決算報告で、社内の「すべての」チームが現在、生成AIに取り組んでいると述べました。

「明日」テーマにAIを活用したアート作品を募集。第二回AIアートグランプリ、開催決定 画像
テクノロジー

「明日」テーマにAIを活用したアート作品を募集。第二回AIアートグランプリ、開催決定

「第二回AIアートグランプリ」は第一回と同じ審査員構成ですが、今回は作品テーマが「明日」と決められています。

「ラブコメのラジオドラマを書いて」で自動生成するAI「WavJourney」、複数回の対話で画像生成できる「LLM-grounded Diffusion」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

「ラブコメのラジオドラマを書いて」で自動生成するAI「WavJourney」、複数回の対話で画像生成できる「LLM-grounded Diffusion」など重要論文5本を解説(生成AIウィークリー)

ラジオドラマの番組を自動生成できる大規模言語モデルなど、最新の生成AI関連の重要論文を5本、紹介します。

高品質画像生成AI「SDXL 1.0」リリース!導入方法と作例 (連載:生成AIグラビアをグラビアカメラマンが作るとどうなる? 第四回 西川和久) 画像
テクノロジー

高品質画像生成AI「SDXL 1.0」リリース!導入方法と作例 (連載:生成AIグラビアをグラビアカメラマンが作るとどうなる? 第四回 西川和久)

SDXL 1.0リリース!

生成AIグラビアをグラビアカメラマンが作るとどうなる?第三回:実際の撮影とポーズ/構図の関係。openpose_handで指問題解決? (西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第三回:実際の撮影とポーズ/構図の関係。openpose_handで指問題解決? (西川和久)

実際の撮影と呪文の関係は似てる!?

自称Transformer後継モデル「RetNet」マイクロソフトら開発、脳活動から音楽を生成するAI「Brain2Music」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

自称Transformer後継モデル「RetNet」マイクロソフトら開発、脳活動から音楽を生成するAI「Brain2Music」など重要論文5本を解説(生成AIウィークリー)

Transformerより学習速度が速く、低遅延で、メモリ効率にも優れ、同等性能以上の精度を示すという「Transformerの後継モデル」をマイクロソフトらが発表しました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第二回:「アジア美女」最新モデルBRAV6作例とネガティブプロンプトの基礎 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第二回:「アジア美女」最新モデルBRAV6作例とネガティブプロンプトの基礎

グラビアカメラマンでありソフトウェアエンジニアでもある西川和久氏が、プロカメラマンの目線から画像生成AIによる実写風ポートレートを作成する連載の第二回をお届けします。

1枚の静止画から動画作成する「AnimateDiff」、Googleの画像学習改良版「HyperDreamBooth」など5本の重要論文を解説(生成AIウィークリー) 画像
テクノロジー

1枚の静止画から動画作成する「AnimateDiff」、Googleの画像学習改良版「HyperDreamBooth」など5本の重要論文を解説(生成AIウィークリー)

人物画像などの学習によく使われているDreamBoothを、開発元であるGoogleがさらに高速化。静止画1枚から一貫性のあるアニメーションを制作する手法など、最新論文から生成AIの重要技術5つを紹介。

チャットAIで画像入力が可能に。ChatGPTより一足早くやってきたGoogle Bardマルチモーダルの使い方(Google Tales) 画像
テクノロジー

チャットAIで画像入力が可能に。ChatGPTより一足早くやってきたGoogle Bardマルチモーダルの使い方(Google Tales)

GoogleのチャットAI「Bard」がChatGPTより先に画像入力に対応しました。日本語ではまだですが、設定方法などの使い方をまとめました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第一回:実在モデルで学習・LoRAでキャッチライト付加  (西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第一回:実在モデルで学習・LoRAでキャッチライト付加 (西川和久)

ベテランのグラビアカメラマンである西川和久氏がAIグラビア生成を始め、撮影した実在モデルの写真から本人了承のもとトレーニングまでしていると聞き、始めたきっかけやAIとの付き合い方、始めてみたい人へのTIPSをまとめてもらいました。(編集部)

生成AIをどう学習に利用するか。より具体的な議論になってきた(小寺信良) 画像
テクノロジー

生成AIをどう学習に利用するか。より具体的な議論になってきた(小寺信良)

教育界は今、生成AIの出現によって大きく動き始めようとしている。英国ではすでに教員が授業計画の作成や採点にAI技術を活用しており、機会も課題ももたらすものという認識を示した。

10億トークンを処理できるマイクロソフトの言語生成AI「LongNet」、喉のMRIからAI音声合成など5つの重要論文を解説(生成AIウィークリー) 画像
テクノロジー

10億トークンを処理できるマイクロソフトの言語生成AI「LongNet」、喉のMRIからAI音声合成など5つの重要論文を解説(生成AIウィークリー)

毎週月曜日に、前週の重要な生成AI論文をピックアップする連載。第2回は、トークン数を10億にまで拡張できるAIモデルなどをセレクトして解説します。

「英語は新しいプログラミング言語、生成的AIは新しいコンパイラ」。SDK「English SDK for Apache Spark」とは何か 画像
テクノロジー

「英語は新しいプログラミング言語、生成的AIは新しいコンパイラ」。SDK「English SDK for Apache Spark」とは何か

「英語」をApache Sparkの問い合わせ言語にできるSDK「English SDK for Apache Spark」について解説します。

Valve、AI生成画像を含むゲームを却下した理由は「訓練データの権利も確保しているか不明のため」 画像
ゲーム

Valve、AI生成画像を含むゲームを却下した理由は「訓練データの権利も確保しているか不明のため」

あるインディーゲーム開発者がPCゲームプラットフォームSteamを運営するValveに、AIが生成したアセットを含むゲームを提出したところ、配信を断られたとRedditに投稿しました。

「毎日がゲームチェンジャー」の生成AI時代を生き抜くために、1週間分の重要論文をまとめました(新連載・生成AIウィークリー) 画像
テクノロジー

「毎日がゲームチェンジャー」の生成AI時代を生き抜くために、1週間分の重要論文をまとめました(新連載・生成AIウィークリー)

1週間分の生成AIに関する重要論文をピックアップして、解説する新連載を、ここにスタートします。

妻の写真を学習させたはずなのに出てくるあなたはいったい誰なの? AI生成グラドル写真集でちょっと考えた(CloseBox) 画像
テクノロジー

妻の写真を学習させたはずなのに出てくるあなたはいったい誰なの? AI生成グラドル写真集でちょっと考えた(CloseBox)

AIグラビアアイドル写真集「さつきあい」の販売終了のことを考えていたら、AI生成で意図せず生まれてしまった美女たちの行方を考えてしまいました。

ChatGPTで裁判書類生成、嘘判例だらけと気づかず提出した弁護士に罰金5000ドル 画像
テクノロジー

ChatGPTで裁判書類生成、嘘判例だらけと気づかず提出した弁護士に罰金5000ドル

5月下旬、裁判用の書類をChatGPTで生成し、きちんと確認せずにそれを裁判所に提出した結果、記述内容が意味不明だったりウソの判例だらけであることが判明したニューヨークの弁護士が、連邦裁判所から罰金5000ドルを言い渡されました。

テレビ取材が自宅に入る。そのために散財した1メートル超縦長ディスプレイと格安デスク(CloseBox) 画像
ガジェット

テレビ取材が自宅に入る。そのために散財した1メートル超縦長ディスプレイと格安デスク(CloseBox)

短期間のうちに3度のテレビ取材を受けた筆者が、そのために購入したものを紹介します。

Opera、独自生成AI「Aria」中心に設計した「Opera One」ブラウザ配信。動的に変わるモジュラーUI採用 画像
ガジェット

Opera、独自生成AI「Aria」中心に設計した「Opera One」ブラウザ配信。動的に変わるモジュラーUI採用

ノルウェーのソフトウェア会社Operaが、Windows、Mac、Linux用デスクトップブラウザー「Opera」をゼロから再設計したと謳う「Opera One」をリリースしました。

ChatGPTに自前データを覚えさせ質問できる Azure OpenAI Service On Your Data プレビュー開始。独自チャットAIを簡単にWebアプリ公開 画像
テクノロジー

ChatGPTに自前データを覚えさせ質問できる Azure OpenAI Service On Your Data プレビュー開始。独自チャットAIを簡単にWebアプリ公開

ChatGPTとChatGPT-4に任意のドキュメントなどを読み込ませることで、そのドキュメントに基づいた回答を自然言語で得られる新サービス「Azure OpenAI Service On Your Data」プレビューで登場。

生成AIの活用事例としてテレビ報道番組に出演しました。視聴者から寄せられた最大の疑問に答えます(CloseBox) 画像
ガジェット

生成AIの活用事例としてテレビ報道番組に出演しました。視聴者から寄せられた最大の疑問に答えます(CloseBox)

筆者がテレビ出演時に、生成AIとはまったく関係のないコメントが寄せられました。その疑問に答えます。

ChatGPTは25種類のジョークを使い回すことが判明。LLMはユーモアを理解するか 画像
テクノロジー

ChatGPTは25種類のジョークを使い回すことが判明。LLMはユーモアを理解するか

ChatGPTなどAIチャットボットが基礎とするLLM(大規模言語モデル)は、特定の言葉の後に確率的に続きそうな言葉を並べてテキストを生成します。そのため、原理的には同じ質問に対して同じ回答を出力することは稀なはずです。

AIがブログを書くWordPress純正プラグイン「Jetpack AI Assistant」ベータ公開。要約や翻訳も 画像
テクノロジー

AIがブログを書くWordPress純正プラグイン「Jetpack AI Assistant」ベータ公開。要約や翻訳も

人気CMSであるWordPressの純正プラグインで、AIによるブログ自動生成が可能になった。

研究者がChatGPT発案のトマト収穫ロボットを共同開発「初めてAIが新しいシステムを考案」 画像
テクノロジー

研究者がChatGPT発案のトマト収穫ロボットを共同開発「初めてAIが新しいシステムを考案」

スイス連邦工科大学ローザンヌ校(EPFL)、オランダ・デルフト工科大学などからなる研究チームが、ChatGPTと人が共同で設計開発したというトマト収穫ロボットを開発しました。

ChatGPTに書かせた過去の判例が嘘まみれと発覚。書類提出の弁護士に制裁の可能性 画像
テクノロジー

ChatGPTに書かせた過去の判例が嘘まみれと発覚。書類提出の弁護士に制裁の可能性

ニューヨークにある法律事務所の弁護士は、先週木曜日、裁判所に提出した書類に記した引用判例の多くが人工知能のアルゴリズムによって出力されたもので、信用できない情報源であったことを自ら明らかにしました。

元Google CEOのシュミット氏、AIが人類に「実存的リスク」もたらすと警鐘 画像
テクノロジー

元Google CEOのシュミット氏、AIが人類に「実存的リスク」もたらすと警鐘

2001~2011年にかけてGoogleでCEOを務めたエリック・シュミット氏は、人工知能が人々に「危害を加えたり、殺害したり」する「実存的リスク」を孕む可能性があると述べています。

iOS版ChatGPT公式アプリ、1週間遅れで国内配信。日本語の音声入力も対応 画像
テクノロジー

iOS版ChatGPT公式アプリ、1週間遅れで国内配信。日本語の音声入力も対応

米国版から1週間遅れで日本のApp StoreでもChatGPT公式アプリがダウンロードできるようになりました。

歴史的コンピュータ「Alto」の50周年イベントなのにChatGPTのOpenAIがもう一つの主役。現地で見たGPTレトロコンピュータ「SOLAIR-E」 画像
テクノロジー

歴史的コンピュータ「Alto」の50周年イベントなのにChatGPTのOpenAIがもう一つの主役。現地で見たGPTレトロコンピュータ「SOLAIR-E」

Altoの50周年イベントなのに後半はOpenAIが主役。そこでは何がテーマだったのか、現地で参加した五島正浩さんが掘り下げます。