日本のユーザーが待ち望んでいた、Google Bardが利用可能になりました。英語のみですが、アップグレードされたPaLMを使っているようです。
テスラ、SpaceX、TwitterなどのCEOを務め、先日AI開発企業「X.AI」を設立したと報じられたイーロン・マスク氏が「最大限の真実」、「宇宙の本質を理解」すると主張する「TruthGPT」を開発中だと述べています。
クラウドをはじめとするITインフラの構成をコードで定義する、いわゆるInfrastructure as Codeツール「Pulumi」を提供するPulumi社は、自然言語からインフラ構成コードを自動生成する「Pulumi AI」を含む、AIを活用した新サービス群「Pulumi Insights」を発表しました。
中国語表記を無理矢理読む必要のあったオープンソースのAI声質変換ソフトウェア「RVC WebUI」が、日本語での表示に対応しました。
アマゾンが、GitHubのAIコーディング支援サービスGitHub Copilotに対抗する動き。
AWSでStable DiffusionやAmazon、Anthropicの大規模言語モデルを利用できる。
コンピューターはプログラムコードで動作しますが、このコードは人間が記述している以上、どうしてもエラーを含んでしまうことが避けられません。
友人の声をAIボイチェンで真似て、本人と話してみました。本人もショックを受けていたようです。
中国アリババグループ(阿里巴巴集団)のデジタル技術・クラウド部門アリババクラウドが、独自のAI言語モデル『通義千問』(Tongyi Qianwen)を発表しました。
またゲームチェンジャーです。1時間の音声を20分で学習。リアルタイムでボイチェンできる音声変換ソフトの登場です。しかも変換だけならMacで動く。
オーストラリア南部、メルボルンの北東に位置するヘップバーンシャーの市長、ブライアン・フッド氏が、OpenAIを名誉毀損で訴えるための準備をしています。もし訴訟になれば、ジェネレーティブAIが出力するコンテンツの不正確性をめぐる世界初の事例になるかもしれません。
Stable Diffusion開発元が日本企業との提携を発表しました。バーチャルヒューマンとして有名なImmaを作っているとAwwです。
Stable Diffusionの最新版「SDXL」を試してみたら、「もうこれでいいのでは」という日本の風景・人物が生成されました。
Metaがメタバース事業を止めてAIに注力するという報道があったが、実態はそうではなさそうだ。その背景を西田宗千佳さんが解説してくれます。。
マイクロソフトは、Visual StudioでGTP-4ベースの「GitHub Copilot X」を用い、プログラミングを行うデモ動画「GitHub Copilot X in Visual Studio」を公開しました。
GoogleのAI戦略について、New York Timesのポッドキャスターから厳しい質問。ピチャイCEOの回答にはBardの次バージョンについての情報も。
Insta360 がスマートフォン用ジンバル Insta360 Flow を発表しました。
ここ最近、ジェネレーティブAIに関する話題は尽きるところがありませんが、流行に敏感なファッションブランドもその流れに飛び込んでいます。
3月20日から翌21日にかけて ChatGPT サービスの緊急停止を招いた情報漏洩バグについて、OpenAI が詳細を発表しました。
Adobeが発表したジェネレーティブAIは他社と意味が異なる。それはどういうことなのか、発表を取材した西田宗千佳さんが解説。
OpenAI が、AIチャットサービスChatGPT にウェブや外部サービスとの連携機能を追加するChatGPT plugin を発表しました。
GitHubは、ChatGTP-4をベースで「GitHub Copilot」の機能を大幅に強化した「GitHub Copilot X」を発表しました。
Ubisoftが、ゲームの中のさまざまなキャラクターが発する会話を自動生成するAIツール「Ghostwriter」を発表しました。
Microsoftは3月21日(現地時間)、新しいBingとEdgeブラウザに画像生成AIサービスである「Bing Image Creator」を導入すると発表しました。OpenAIの画像生成AI「DALL-E」のより高度なバージョンを利用しているとのことです。
Adobeが、独自のジェネレーティブAIツール「Adobe Filefly」を発表しました。コマンド入力によって画像加工やさまざまな処理が可能になるこのツールはPhotoshop、Premiere Pro、After Effectsで利用可能になる予定とのこと。
マイクロソフトが WordやExcel、TeamsなどのプロダクティビティアプリにAIを統合する『Microsoft 365 Copilot』『Business Chat』を発表しました。
ソースネクストから分社化したポケトークは、14日、「ポケトーク for BUSINESS」の新たな戦略やサービスを発表しました。このポケトーク同時通訳には、OpenAIの音声認識エンジン「Whisper」が採用されています。
アメリカ合衆国著作権局は、連邦官報に掲載した新しいガイダンス文書のなかで、テキストをAI画像生成モデルに与えて出力された画像は、米国では著作権で保護できないとの判断を示しました。
OpenAI が大規模言語モデル GPT-4 を正式発表しました。従来のChatGPTのGPT-3.5比で扱えるテキスト量や知識、推論能力が大きく向上し、画像も理解できるようになりました。
米GMが、マイクロソフトとの広範な協力の一環で、OpenAIが開発する人工知能チャットボット「ChatGPT」に使われている技術の自動車への搭載を検討しています。
Googleがロボットの頭脳となる新しい言語モデルをひっそり発表しました。そのPaLM-Eとは何をするものなのでしょうか?
Googleが、2023年初となるPixel Feature Dropの配信を開始しました。Pixel 4aからPixel 7、Pixel 7 Pro、そしてPixel Watch向けで、今後数週間をかけて順次利用可能となります。
第一回AIアートグランプリに応募し、グランプリを獲得した筆者によるレポート。
ChatGPTのAPIを使って複数キャラクターのディベートを簡単に作り出せるサービスを試してみました。
Googleが毎年この時期に開催している恒例の開発者向けイベント「Google I/O」を日本時間5月11日午前2時より開催します。
オレオレ詐欺の被害は、警察や銀行窓口での周知徹底にもかかわらず、収まるところを知りませんが、米国では昨年、AIで実在する人物の声を複製し、電話してくる「なりすまし電話詐欺」の被害額が、1100万ドル(約15億円)に達したことが報じられています。
プロのライターである小寺信良さんが、Notion AIとnote AIアシスタント機能を、ライティングの実作業に使ってみました。
「毎日がゲームチェンジャー」な生成系AI。動画作成でもまたゲームチェンジャーが現れたようです。
OpenAI が会話生成AI ChatGPT と音声テキスト化Whisper のAPIを開発者向けに提供しました。 さまざまなアプリやサービスに、自然な会話でユーザーの質問に答えたり、指示したタスクを補完する機能を導入できるようになります。
Microsoftは2月28日(現地時間)、Windows 11 バージョン22H2向けに累積更新プログラム(KB5022913)の配信を開始しました。
オハイオ州クリーブランドのメディア企業Futuriが、ラジオ放送用コンテンツ自動生成AI「RadioGPT」を開発、発表しました。
今話題のジェネレーティブAI革命の大変動を巻き起こした企業、Stability AIの次の展開が、清水亮さんとの対談で今、明らかに。