ChatGPTがこれほど広く雑多な目的に適用できるのは未だ驚きです。このままいわゆるAGIに到達する道にあるのか、規制や資源の問題はどうなるのか、未来への関心は尽きませんが目の前の実用も重要です。
今週も、生成AIの重要論文5本を解説します。透明含む複数レイヤーを同時に画像生成できるAI「LayerDiffuse」、音楽を文字のように扱う音楽生成AI「ChatMusician」など。
Google CloudとStack Overflowは戦略提携を発表しました。両社は最新AIモデルのGeminiとStack Overflowのナレッジを統合したサービスをそれぞれのプラットフォームで提供する予定です。
インタビューの中で勝手に次のシングルについて語っていたので、その曲をAIに作ってもらいましたが、余計な詳細を語っていたので苦労したという話。
生涯のパートナーとなる人とはどうしたら会えるのか。現在の日本では、結婚に至った人の4分の1近くがマッチングアプリを経由したものだという統計があります。
裸眼立体視ディスプレイをコンパクトにしたLooking Glass Goがついにユーザーの元に届きます。それに備えて、単眼深度推定を行うための方法をまとめました。
アップルが、Project Titanと呼ばれた自社製電気自動車開発プロジェクトを中止し、チームはAIの開発のために再配置されていると報じられています。
前回標準のWorkflowにLoRAを追加してみたが、今回は画像が出来た後、つまり後処理用のNodeを追加してみたい。
今回は、なぜおじさんをAIで生成するのか、そこから何を得たいのか、その理由について語ります。
今週の生成AIウィークリーは、AIの“パラメータ”を生成するAI「P-diff」、過去最高精度のリアルタイム物体検出器「YOLOv9」など重要論文5本を解説します。
Googleは2月21日(現地時間)、Google WorkspaceユーザーがGmailやドキュメント、スライド、スプレッドシート、MeetでGeminiを利用できるGemini for Google Workspaceの提供を開始しました。
Googleの生成AIであるGeminiが、多様性に配慮するあまり「1943年のドイツ軍兵士の画像を作って」に対してナチスドイツ風軍装の黒人男性やアジア人女性の画像を生成してしまい、Googleは歴史的に不正確だったと認める声明を発表するできごとがありました。
マイクロソフトがWindowsやOfficeに生成AIアシスタントCopilotを組み込み、Googleも独自AIのBard改めGeminiで検索からGmail・カレンダー・マップ等々をこれまでになく使いやすくすると宣言する状況に、従来からAIに注力してきたAdobe が黙っているわけはありません。
デザイナーのマット・ウェッブ氏は先週木曜日、天の川銀河の中心を矢印で指し示す、無料のiPhone向けARアプリ『Galactic Compass』をApp Storeに公開しました。