9月はいろいろ個人的なイベントがあります。自分の誕生日と、その前日の結婚記念日がまずあって、まあそれはもう誰も祝う人がいないので一人でケーキを買ってきたり英国リバプールの郷土料理であるスカウスを、クックパッドに残された妻のレシピで作ったりしています。
先週発表されたAI関連論文から、50円で外注できるAIソフトウェア開発会社「ChatDEV」、人の声を理解する言語モデル「LLaSM」など5本を解説します。
待望の「Search Generative Experience」が8月30日に日本とインドでも使えるようになりました。5月から使えていた米国以外で使えるようになったのは、今のところこの2カ国のみだそうです。
Googleが2023年5月のGoogle I/Oで発表し、米国で先行して実施していた生成AIによる検索体験(SGE:Search Generative Experience)の試験運用を日本とインドでも開始しました。デスクトップのChromeブラウザとAndroidおよびiOSのGoogleアプリで利用できます。
開催中のイベント「Google Cloud Next '23」で発表されたサービス群の刷新はAI「Duet AI」を冠したものだ。
Uberは、フードデリバリーサービスのUber Eatsに注文支援用AIチャットボットの導入を計画している模様です。
「使い方を誤ればティープフェイクの音声版にもなり得る」とまでマイクロソフトが危険視していた技術が別の開発者によってオープンソース公開されました。
Metaが文章と音声を翻訳するAI「SeamlessM4T」、コード専用生成AI「Code Llama」投入するなど、生成AIに関する重要論文5本を解説します。
ヤマハの「VOCALOID β-STUDIO」を実際に使ってみました。まだ半日程度ですが、いくつかわかったことがあります。
これまで作品を作ってきたボカロPは、ヤマハの新しいVOCALOID技術を無償で試すチャンス。「VOCALOID β-STUDIO」の参加受付が始まりました。
前回はモデルの1つであるCheckpointについていろいろお話した。今回はStable Diffusionが扱えるモデルの中で次によく使われるLoRAについてがお題となる。
今週の生成AI注目論文は、任意の人の音声を合成できるマイクロソフトのText-to-Speechモデルなど5本です。
ガートナーのハイプサイクル、日本ではWeb3、NFT、メタバースが「幻滅期」入りしました。
ガートナーのハイプサイクル。今年はすでに多くのITエンジニアに聞き馴染みのあるキーワードが比較的保守的といえる場所に並んでいます。
Googleは米国にて、iOSおよびAndroid用のGoogleアプリ内で、閲覧中のサイトにある長文を箇条書きに要約してくれる「SGE while browsing(ブラウジング中のSGE)」機能の初期テストを始めました。
1週間分の生成AI主要論文を紹介する連載。今回は、25体の自律AIが住む町、“ちらつき”を抑えた動画合成を生成するAIなど。
最近AnimateDiffというAI動画手法がすごいと各所で注目されています。
ロサンゼルスの一部地域では、昨年からロボット関連のスタートアップ企業数社によって、フードデリバリーロボットを使った食品配達がテストされています。
NVIDIAが生成AIに関わる人なら必ずお世話になっているHugging Faceと提携しました。そこで提供するのはTraining Cluster as a Serviceと呼ばれるものです。
マイクロソフトはOpenAIのAI言語モデルを統合したBing Chatを、まもなくサードパーティ製Webブラウザにも提供することを発表しました。
Checkpointとは!?
盗作をできるだけ避けて音楽生成するAI、複数のLLMが協力してソフトウェア開発を行うフレームワークなど、最新のAI論文5つを紹介します。
「第二回AIアートグランプリ」は第一回と同じ審査員構成ですが、今回は作品テーマが「明日」と決められています。
ラジオドラマの番組を自動生成できる大規模言語モデルなど、最新の生成AI関連の重要論文を5本、紹介します。
イーサネットの仕様を改善し、AIやハイパフォーマンスコンピューティング(HPC)のような高速かつ大規模なデータ処理に適した、より高速なイーサネットの実現を目指す団体「Ultra Ethernetコンソーシアム」が発足しました。
SDXL 1.0リリース!
OpenAIは7月26日、ChatGPTのAndroid版をリリースしました。現在、米国、インド、バングラデシュ、ブラジルでダウンロード可能となっており、来週以降さらに多くの国への展開を予定しているとのことです。
実際の撮影と呪文の関係は似てる!?
Transformerより学習速度が速く、低遅延で、メモリ効率にも優れ、同等性能以上の精度を示すという「Transformerの後継モデル」をマイクロソフトらが発表しました。
OpenAIが、Android版のChatGPTアプリを来週リリースするとツイートしました。iOS版は5月にリリースされ、当時Android版については「まもなく」とアナウンスしていましたが、感覚的にはわりと長い間が開いてのリリースとなります。
イーロン・マスク氏は、先頃行われたテスラの決算報告において、テスラのAutopilot / Full Self-Driving(FSD)技術のライセンス供与について「大手」自動車メーカーと「初期の協議」を行っていることを明らかにしました。
マイクロソフトやGoogle等が生成系AIの市場を開拓している一方で、アップルは6月の世界開発者会議WWDC基調講演で「AI」という言葉を極力避けていた(「機械学習」や「ML」は使用)が注目を集めていました。
グラビアカメラマンでありソフトウェアエンジニアでもある西川和久氏が、プロカメラマンの目線から画像生成AIによる実写風ポートレートを作成する連載の第二回をお届けします。
人物画像などの学習によく使われているDreamBoothを、開発元であるGoogleがさらに高速化。静止画1枚から一貫性のあるアニメーションを制作する手法など、最新論文から生成AIの重要技術5つを紹介。
GoogleのチャットAI「Bard」がChatGPTより先に画像入力に対応しました。日本語ではまだですが、設定方法などの使い方をまとめました。
ベテランのグラビアカメラマンである西川和久氏がAIグラビア生成を始め、撮影した実在モデルの写真から本人了承のもとトレーニングまでしていると聞き、始めたきっかけやAIとの付き合い方、始めてみたい人へのTIPSをまとめてもらいました。(編集部)
教育界は今、生成AIの出現によって大きく動き始めようとしている。英国ではすでに教員が授業計画の作成や採点にAI技術を活用しており、機会も課題ももたらすものという認識を示した。
毎週月曜日に、前週の重要な生成AI論文をピックアップする連載。第2回は、トークン数を10億にまで拡張できるAIモデルなどをセレクトして解説します。
7月3日、AIを使ったオンライン翻訳サービスを展開する独DeepLが、日本法人「DeepL Japan 合同会社」を設立したと発表しました。
「英語」をApache Sparkの問い合わせ言語にできるSDK「English SDK for Apache Spark」について解説します。
あるインディーゲーム開発者がPCゲームプラットフォームSteamを運営するValveに、AIが生成したアセットを含むゲームを提出したところ、配信を断られたとRedditに投稿しました。
中国の研究グループが、AIによる自動化されたCPU設計と称する論文を発表しました。この論文は、わずか5時間足らずで産業グレードのRISC-V CPUを設計できたと報告しています。