今回の「Google Tales」は、主にPixel 9 Pro XLのAI機能を使ってみたお話です。
AIを売りにしたグーグル純正スマホ「Pixel 9」「Pixel 9 Pro XL」が、8月22日に発売されました。
SunoとUdioの2強だったボーカル付きAI作曲サービスに新たなライバル「LoudMe」が登場しました。8月15日に発表されたもののあまり話題になっていなかったサービスですが、その実力は相当なもの。実際に試してその実力を探ってみることにします。
その日はいきなりやって来た!
この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第60回)では、2万語を一度に出力するモデル「LongWriter」、Googleの画像生成AI「Imagen 3」、そして科学研究を支援する「The AI Scientist」と「OpenResearcher」などを取り上げます。
動画生成AIの老舗、Runwayが新しいモデル「Gen-3 Alpha Turbo」を公開しました。これがすごいのです。
テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」(テクノエッジ・サイド)というチャンネルを設け、2週に1回のペースでお届けしています。
人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第2期第5回を8月21日に開催いたします。なお、今回お申し込みいただいた方は、前回分の動画アーカイブを視聴いただけます。
イーロン・マスクが8月12日にほのめかしてた、Xと連動した生成AI「Grok」新バージョンGrok 2 mini(beta)の画像生成機能が、自分のアカウントでも使えるようになりました。
Made by Googleイベントで、Googleが今年のPixelスマートフォンPixel 9シリーズを正式に発表しました。
テクノエッジ編集部では、「TechnoEdge-Side」(テクノエッジ・サイド)を2週に1回のペースでお届けしています。今回は、8月14日に開催されたMade by Googleイベントで発表されたGoogleの新製品などについて語ります。
AIリップシンクにまた大きな波が訪れました。
この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第59回)では、オープンソースの動画生成AI「CogVideoX」や、動画理解でGPT-4VやClaude 3.5 Sonnetなどを精度で上回るMLLM「MiniCPM-V 2.6」を取り上げます
しばらくベータテスターをしていた、DreamtonicsのAIボイスチェンジャー「Vocoflex」。その製品版がついにリリースされたので、購入しました。
サムスンの「Galaxy Z Fold6」は薄型化が進み、後に登場したHONORの「Magic V3」とシャオミの「MIX Fold 4」はさらに薄く、折りたたみスマホの進化が顕著。3つ折りスマホの実現も視野に入り、技術開発が進んでいる。
Googleがテレビと接続するセットトップボックス端末『Google TV Streamer 4K』を米国向けに発表しました。
Google は、批判を受けていたGemini AIのコマーシャル『Google + Team USA − Dear Sydney』を放送から取り下げました。
この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第58回)では、先日OpenAIが発表した「SearchGPT」など、Webのタイムリーな情報と大規模言語モデルを組みわせた検索AIのオープンソースモデル「MindSearch」や、Stability AIが発表した、単一の入力画像から3Dメッシュを0.5秒で生成する「Stable Fast 3D」を取り上げます。
フォルダブルスマホの「Galaxy Z Fold6」「Galaxy Z Flip6」が、7月31日に発売されました。
「130mm書換形光ディスクカートリッジ」は、5.25インチ(130mm)の記録用ディスクをカートリッジに収めた光磁気ディスクメディア。MO(Magneto Optical disk)のひとつで、そのサイズから「5.25インチMO」「5インチMO」などと呼ばれることも多いです。
1枚の人物画像から動画を生成するAIモデルが4種類、揃いました。Luma AI Dream Machine、Runway Gen-3 Alpha、KLING、Vidu。これらを同じ人物写真(画像)、同じプロンプトで比較してみます。
OpenAIが、ChatGPTの延期していた新機能 Advanced Voice Mode を一部Plusユーザー向けに試験提供しました。
基本的に、アプリケーションのユーザーインターエイス(UI)は開発時に設計され実装されて、その実装通りに実行時に表示されるものです。
KLINGのサブスクリプションが開始されたばかりですが、翌日の7月31日に早くもライバルが登場しました。同じく中国の動画生成AIサービスで、「Vidu」というものです。といってもぽっと出ではなく、4月末辺りからSoraクラスの動画生成AIとして発表され、注目はされていました。このViduが一般利用可能になったのです。
7月30日、動画生成AIサービスの老舗であるRunwayが、最新モデルであるGen-3 AlphaでImage to Videoを使えるようにしました。
1つ何役?controlnet-union-sdxl-1.0
iPhoneの機能「衛星経由の緊急SOS」が日本国内でも使えるようになりました。
テクノエッジ編集部では、「TechnoEdge-Side」(テクノエッジ・サイド)を2週に1回のペースでお届けしています。その第62回放送を、本日(7月29日)正午(12時)に、YouTubeで行います。
この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第57回)では、生成AIが生成したコンテンツを生成AIが学習し続けると性能低下が見られ、モデル崩壊が起きるという研究報告を取り上げます。また、Sony AIが大型の画像生成AI(11.6億パラメータ)の訓練を8台のNVIDIA H100 GPUを使用してわずか2.6日で完了し、しかもそれが約29万円という高いコストパフォーマンスを達成した手法「MicroDiT」をご紹介します。
音質が爆上がりして長さも2分10秒と完成曲が作りやすくなったUdio。1970年代初期のバラード(ユーミンとか)を作ろうと思ってやってみたら、なぜか昭和歌謡っぽいものを連発してきました。
OpenAIが、うわさの独自検索エンジン「SearchGPT Prototype」の試験運用を開始しました。
Appleは6月11日に、年次開発者会議「WWDC24(Worldwide Developers Conference 2024)」を開催しました。
AI作曲サービスのSunoに、ステム分離機能が追加されました。翌日、Udioがステム分離を含む大幅な機能強化。
X (旧Twitter) が、独自絵文字セットの「ピストル」を一般的な水鉄砲から、実銃のグラフィックに置き換えました。
Soraに匹敵する高品質の動画生成AIとして注目を浴びながら、中国の携帯電話番号が必須だったことから世界中の羨望を集めていた、KLINGが一般ユーザーも利用可能になりました。
ポストSoraというか、ビフォーSoraというか、新世代の動画生成AIも老舗であるRunway Gen-3登場以降、目新しいニュースがなかったのですが、Luma AIのDream Machineがちょっとした新機能を追加しました。
この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第56回)では、AIとユーザーの対話内容を長期記録し、LLMの応答をそのユーザーにパーソナライズしていくメモリ機能「Mem0」や、音声の理解に優れている大規模言語モデル「Qwen2-Audio」などを取り上げます。
AI研究家の清水亮さんが面白いことをやっています。「Lispっぽい記法で書けるけど他の言語に慣れた人にも使える言語」の処理系だそうです。
Windows用エンタープライズセキュリティソフトのCrowdStrikeが原因でWindowsが世界的にブルースクリーンが多発している問題が起きているようです。
空間に閉じた音場を作るPSZ(パーソナライズド・サウンド・ゾーン)技術を引っ提げ、NTTからスピンアウトしたNTTソノリティが、新たなヘッドホンを発売しました。
人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第2期第4回を7月24日に開催いたします。なお、今回お申し込みいただいた方は、前回分の動画アーカイブを視聴いただけます。
SD3 Mediumその後