AI

動画AIが豊作。アニメ絵2枚の間の“中割り”を生成し映像化するAI「ToonCrafter」、画像内キャラを滑らかに踊らせるAI「MusePose」など重要論文5本を解説(生成AIウィークリー) 画像
AI

動画AIが豊作。アニメ絵2枚の間の“中割り”を生成し映像化するAI「ToonCrafter」、画像内キャラを滑らかに踊らせるAI「MusePose」など重要論文5本を解説(生成AIウィークリー)

生成AIの重要論文5本を解説する連載。今週は、アニメの“中割り”を生成してアニメーションに仕上げる「ToonCrafter」、1枚の画像とモーションデータからダンス動画を生成するAIモデル「MusePose」など。

Copilot+ PCについて語ったポッドキャスト第56回を配信(TechnoEdge-Side) 画像
AI

Copilot+ PCについて語ったポッドキャスト第56回を配信(TechnoEdge-Side)

テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」(テクノエッジ・サイド)というチャンネルを設け、週1回のペースでお届けしています。

AI作曲サービスは「長さ」の戦いに。Udioが2分10秒の生成に対応、Sunoは全ユーザーに4分生成を開放(CloseBox) 画像
AI

AI作曲サービスは「長さ」の戦いに。Udioが2分10秒の生成に対応、Sunoは全ユーザーに4分生成を開放(CloseBox)

AI作曲の覇権を競うSunoとUdioが相次いで機能強化を発表しました。

アップルWWDC24、基調講演は6月11日午前2時から(日本時間)。iOS 18はじめ各OSアップデート、AI関連の発表に期待 画像
AI

アップルWWDC24、基調講演は6月11日午前2時から(日本時間)。iOS 18はじめ各OSアップデート、AI関連の発表に期待

アップルは、6月10日とだけ予告していた開発者イベントWWDC24の基調講演を、6月10日午前10時(太平洋夏時間)に開催すると発表しました。日本時間では6月11日午前2時から。発表の模様はアップルのウェブページ、YouTubeなどで視聴できます。

“株”選びにGPT-4の利益予測は使えるのか? “文学作品”を翻訳する複数AIが働く出版社「TransAgents」など重要論文5本を解説(生成AIウィークリー) 画像
AI

“株”選びにGPT-4の利益予測は使えるのか? “文学作品”を翻訳する複数AIが働く出版社「TransAgents」など重要論文5本を解説(生成AIウィークリー)

生成AIに関する重要論文を解説する連載。今回は、“文学作品”を翻訳する実際の出版社を真似たAI会社「TransAgents」、GPT-4で企業の財務諸表を分析し将来の利益を予測……など5本。

AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に(CloseBox) 画像
AI

AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に(CloseBox)

このところUdioやSonautoの新機能搭載で押され気味だったAI作曲サービスの「Suno」が反撃に出ました。

マインクラフトをGPT-4oと一緒にプレイ、マイクロソフトがCopilotのAI新機能をデモ。近日中に提供 画像
AI

マインクラフトをGPT-4oと一緒にプレイ、マイクロソフトがCopilotのAI新機能をデモ。近日中に提供

Minecraftをプレイするときに、AIアシスタント「Copilot」と会話できる機能をMicrosoftが発表しました。21日にSNSで公開された映像では、プレイヤーがCopilotにアイテム制作のアドバイスを求めたり、Copilotが脅威への対処法を知らせる様子が映されています。

バッジ型AIデバイスAi PinのHumane社、早くも身売り検討中?発売から約1か月(Bloomberg報道) 画像
AI

バッジ型AIデバイスAi PinのHumane社、早くも身売り検討中?発売から約1か月(Bloomberg報道)

Humaneは2023年11月、同社の最初で唯一の製品であるAI Pinを発表、2024年4月に出荷を開始し始めたばかりでしたが、新しい報道によると現在、会社の売却を検討しているとのことです。

中国で『AI習近平』誕生。「習近平思想」記した著書十数冊や公式文書で強化 画像
AI

中国で『AI習近平』誕生。「習近平思想」記した著書十数冊や公式文書で強化

中国国家サイバースペース管理局(CAC)は、習近平国家主席の思想と政治哲学に関する著書などでトレーニングされた大規模言語モデル(LLM)を搭載するAIシステムを開発しました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第25回:三拍子揃った新Upscale手法 ControlNet 852_a_clone_xlを試す (西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第25回:三拍子揃った新Upscale手法 ControlNet 852_a_clone_xlを試す (西川和久)

現役グラビアカメラマンでありエンジニアでもある西川和久氏による生成AIグラビア連載の第25回は、画像生成と切っても切り離せないアップスケールの新技術編。

書籍「グラビアカメラマンが教える 生成AIグラビア実践ハンドブック」内容紹介。技術書典16でお待ちしています 画像
AI

書籍「グラビアカメラマンが教える 生成AIグラビア実践ハンドブック」内容紹介。技術書典16でお待ちしています

テクノエッジとして初となる紙の書籍「グラビアカメラマンが教える 生成AIグラビア実践ハンドブック」、5月26日から開催される技術書典に向けて無事入稿いたしました。

スカヨハ、ChatGPTの声提供をサム・アルトマンから繰り返し提案され断っていたと明かす。そっくりの『Sky』には衝撃と怒りを声明 画像
AI

スカヨハ、ChatGPTの声提供をサム・アルトマンから繰り返し提案され断っていたと明かす。そっくりの『Sky』には衝撃と怒りを声明

ハリウッドスターのスカーレット・ヨハンソンは、声の使用を断ったにもかかわらずOpenAIが「不気味なほど自分に似た」AI音声を発表したことに「ショックを受け、怒り」を覚えたと述べ、同社のサム・アルトマンCEOに対し「信じられない」とする声明を出しました。

Logic Proに10年前から欲しかった自動伴奏「Session Players」のキーボードとベース、そしてChromaGlowプラグインで超簡単にカバー曲を演奏してみた(CloseBox) 画像
AI

Logic Proに10年前から欲しかった自動伴奏「Session Players」のキーボードとベース、そしてChromaGlowプラグインで超簡単にカバー曲を演奏してみた(CloseBox)

Logic Pro 11の新機能として前回は1つのオーディオファイルを4つの楽器パートに分離する「Stem Splitter」を紹介しましたが、今回はその続きです。

Windows PC画面を常時記録・AIで全検索できる『Recall』(回顧)機能、マイクロソフトが発表。『Copilot+ PC』向け 画像
AI

Windows PC画面を常時記録・AIで全検索できる『Recall』(回顧)機能、マイクロソフトが発表。『Copilot+ PC』向け

Microsoftは5月20日(現地時間)、新しいPCカテゴリーとなる「Copilot+PCs」を発表。それにあわせて、Copilot+PCsで利用できる新機能としてRecall(日本語では「回顧」となっています)を発表しました。

Snapdragon X搭載『Copilot+ PC』、新型Surface Laptop(第7世代) 6月18日発売。歴代最長の22時間駆動 画像
PC

Snapdragon X搭載『Copilot+ PC』、新型Surface Laptop(第7世代) 6月18日発売。歴代最長の22時間駆動

マイクロソフトはクアルコム製のSnapdragon Xシリーズを搭載した第7世代Surface Laptopを発表しました。どちらも同社が提唱する新たなWindows PCカテゴリ「Copilot+ PC」に属します。

Pythonのように書けてGPU上で並列処理できる新プログラミング言語「Bend」、2D画像→3Dを高精度生成するGoogle「CAT3D」など重要論文5本を解説(生成AIウィークリー) 画像
AI

Pythonのように書けてGPU上で並列処理できる新プログラミング言語「Bend」、2D画像→3Dを高精度生成するGoogle「CAT3D」など重要論文5本を解説(生成AIウィークリー)

1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。今回は、GPU上でネイティブ動作する並列処理が可能な新プログラミング言語「Bend」とランタイムシステム「HVM2」、大規模言語モデルは追加学習や新知識で幻覚生成が増加。Googleなどが調査などを紹介。

Gemini Advancedで次世代AIモデルGemini 1.5 Pro解禁。音声会話Gemini Liveやカスタム版Gemsなど新機能 画像
AI

Gemini Advancedで次世代AIモデルGemini 1.5 Pro解禁。音声会話Gemini Liveやカスタム版Gemsなど新機能

Googleは5月14日~15日(現地時間)、年次開発者会会議Google I/Oを開催しました。直前にPixel 8aが発表されていたこともあり、AI一色だったGoogle I/Oですが、一般ユーザーが身近に感じられそうなのがGemini Advancedのアップデートでしょう。

技術書典16に出展『グラビアカメラマンが教える 生成AIグラビア実践ハンドブック』を制作しました 画像
AI

技術書典16に出展『グラビアカメラマンが教える 生成AIグラビア実践ハンドブック』を制作しました

テクノエッジは、5月25日から6月9日にかけてオンラインおよびオフラインで開催されるイベント「技術書典16」に出展します。

画像生成AI「Stable Diffusion」の基本から最新技術まで学べる。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第2期第2回)を5月22日開催。参加者募集します 画像
AI

画像生成AI「Stable Diffusion」の基本から最新技術まで学べる。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第2期第2回)を5月22日開催。参加者募集します

人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第2期第2回を5月22日に開催いたします。なお、今回お申し込みいただいた方は、前回分の動画アーカイブを視聴いただけます。

Google、AIが通話を聴いてサギか判定・警告する機能をデモ。Gemini Nanoでローカル動作 画像
AI

Google、AIが通話を聴いてサギか判定・警告する機能をデモ。Gemini Nanoでローカル動作

Googleは年次開発者会議「Google I/O」にて、Androidスマートフォンに掛かってきた電話が詐欺の疑いがある場合、ユーザーに警告する機能をテスト中だと発表しました。

Google、Gemini AIのビデオ検索デモで早速やらかす。カメラのフィルム巻き上げレバーが動かないなら「裏ぶたを開けてフィルムを取り出す」? 画像
AI

Google、Gemini AIのビデオ検索デモで早速やらかす。カメラのフィルム巻き上げレバーが動かないなら「裏ぶたを開けてフィルムを取り出す」?

日本時間5月15日午前2時より開催されたGoogle I/Oより。Googleは今回のイベントで、Gemini AIをさらに多様なプロダクトに組み込んでいることを大きくアピールしました。

Google、動画生成AIモデル『Veo』発表。高解像度で一分超、撮影用語などプロンプト再現性と高い一貫性、動画の一部編集も 画像
AI

Google、動画生成AIモデル『Veo』発表。高解像度で一分超、撮影用語などプロンプト再現性と高い一貫性、動画の一部編集も

5月15日の Google I/O基調講演で、Googleが新たな動画生成AIモデル『Veo』を発表しました。

Logic Pro 11の新機能を試して理解した、AI作曲と楽器パート別音源分離「Stem Splitter」の相性(CloseBox) 画像
AI

Logic Pro 11の新機能を試して理解した、AI作曲と楽器パート別音源分離「Stem Splitter」の相性(CloseBox)

Logic ProのMac版であるバージョン11とiPad版のバージョン2が、5月14日に更新されました。本当に10年待ったぜ、という感じのSession Players、AI作曲時代にぴったりのStem Splitterなど、大きな新機能が入った新版です。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第24回:照明を自由にコントロールできるIC-Light登場!(西川和久) 画像
Science

生成AIグラビアをグラビアカメラマンが作るとどうなる?第24回:照明を自由にコントロールできるIC-Light登場!(西川和久)

lllyasviel氏復活第一弾のIC-Light

OpenAI、ChatGPTのMacアプリ公開。Macのカメラやスクショ、写真ライブラリにもアクセスし音声対話可能 画像
AI

OpenAI、ChatGPTのMacアプリ公開。Macのカメラやスクショ、写真ライブラリにもアクセスし音声対話可能

OpenAIはChatGPTのGPT-4oを使えるマルチモーダルなMacアプリを公開した。

OpenAI、ChatGPTの新バージョン「GPT-4o」を発表。無料ユーザー向けにも提供、感情豊かな音声で応答、歌いながら回答も 画像
AI

OpenAI、ChatGPTの新バージョン「GPT-4o」を発表。無料ユーザー向けにも提供、感情豊かな音声で応答、歌いながら回答も

OpenAIは5月13日(米国時間)、オンラインでSpring Updateイベントを開催。その中で、フラグシップとなる大規模言語モデル「GPT-4o」を発表しました。APIでの提供も行い、現行のGPT-4 Turboと比べて2倍高速、価格は50%安価に、レートリミットは5倍に拡張されています。

Appleイベント直前、告知満載の第53回を配信(TechnoEdge-Side) 画像
AI

Appleイベント直前、告知満載の第53回を配信(TechnoEdge-Side)

テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」(テクノエッジ・サイド)というチャンネルを設け、週1回のペースでお届けしています。

アトラシアン、新AIサービス「Atlassian Rovo」発表。Googleドライブ、GitHub、Slack、Teamsなどを横断してAIが学習、ユーザーを支援 画像
AI

アトラシアン、新AIサービス「Atlassian Rovo」発表。Googleドライブ、GitHub、Slack、Teamsなどを横断してAIが学習、ユーザーを支援

アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援

Googleが“一歩先の未来を予知”できる時系列予測AI基盤モデル「TimeFM」公開、LSTMの進化形「xLSTM」など重要論文5本を解説(生成AIウィークリー) 画像
AI

Googleが“一歩先の未来を予知”できる時系列予測AI基盤モデル「TimeFM」公開、LSTMの進化形「xLSTM」など重要論文5本を解説(生成AIウィークリー)

生成AIの重要論文5本を解説する連載。Googleが“一歩先の未来を予知”できる時系列予測AI基盤モデル「TimeFM」公開、LSTMの進化形「xLSTM」など。

AI作曲のUdio、有料サービス開始。部分修正も可能に(CloseBox) 画像
AI

AI作曲のUdio、有料サービス開始。部分修正も可能に(CloseBox)

AI作曲サービスのUdioは5月8日、有料プランを含むサブスクリプションをスタートしました。同時に、生成した楽曲の部分修正を行う「Audio Inpainting」機能を追加しています。

Logic Proが無料の大幅更新、ベース・キーボードもコード進行に合わせて自動演奏。あとはギター弾いて歌うだけ(CloseBox) 画像
AI

Logic Proが無料の大幅更新、ベース・キーボードもコード進行に合わせて自動演奏。あとはギター弾いて歌うだけ(CloseBox)

アップルは5月7日、音楽制作ソフトLogic Proの機能アップを発表しました。

作曲AIはプログレッシブロックの夢を見るか? Udioが長く一貫性のある曲を作れるようになった理由(CloseBox) 画像
AI

作曲AIはプログレッシブロックの夢を見るか? Udioが長く一貫性のある曲を作れるようになった理由(CloseBox)

作曲AIサービスのUdioが5月1日、新機能を搭載したとX上で発表しました。長く、一貫性のある曲を作れるようになると謳っています。この新機能を使ってプログレの長い曲を作ってみました。

世界デビューした生成AI架空バンドの曲を人力カバー、AIが語る音楽性を人間が再現。カバーしてくれる人を募集します(AIだけで作った曲を音楽配信する 第2回) 画像
AI

世界デビューした生成AI架空バンドの曲を人力カバー、AIが語る音楽性を人間が再現。カバーしてくれる人を募集します(AIだけで作った曲を音楽配信する 第2回)

AIが創造したプログレバンド「The Midnight Odyssey」が世界デビューしてから1カ月が過ぎました。バンドは勢力的に活動しているようで、リードギターのエリオット・スミスがリモートでインタビューに応じた映像が飛び込んできました。

Pika、RunwayMLなど動画生成AIサービスを同一プロンプトで比較した結果。OpenAI Soraでも実際は膨大なガチャと後編集 画像
AI

Pika、RunwayMLなど動画生成AIサービスを同一プロンプトで比較した結果。OpenAI Soraでも実際は膨大なガチャと後編集

動画生成AIにまつわる最新の話題をお届けしている、この短期連載。今回は、(おそらく)世界中のAI動画クリエイターたちが使ってみたいと考えているOpenAIのSoraによる映像制作が、そんなに簡単なものではないという裏話と、複数の人気動画生成AIに同じプロンプトで動画を生成させて比較してみます。

AIの新星ニューラルネットワーク「KAN」とは? LLMが“カンニング”して評価を盛ってた? など重要論文5本を解説(生成AIウィークリー) 画像
AI

AIの新星ニューラルネットワーク「KAN」とは? LLMが“カンニング”して評価を盛ってた? など重要論文5本を解説(生成AIウィークリー)

最新の生成AI重要論文を紹介する連載。今回は、AIの新星ニューラルネットワーク「KAN」、LLMが“カンニング”して評価を盛っていた問題など5本。

Google、新AIアシスタント Gemini モバイルアプリを日本でも提供開始。Googleアシスタントを置き換え 画像
AI

Google、新AIアシスタント Gemini モバイルアプリを日本でも提供開始。Googleアシスタントを置き換え

Googleは4月30日(現地時間)、Geminiモバイルアプリの提供地域を拡大すると発表しました。日本でもAndroidではGoogle Playストアからダウンロードが可能。iOSの場合は専用アプリはなく、Googleアプリからのアクセスとなります。

Anthropic、生成AI『Claude』の公式 iOSアプリ配信。Teamプランも提供開始 画像
AI

Anthropic、生成AI『Claude』の公式 iOSアプリ配信。Teamプランも提供開始

Anthropicは5月1日(現地時間)、生成AI「Claude(クロード)」のiOSアプリをリリースしました。あわせて、新プランとなる「Team」も発表されています。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第23回:Stable Diffusion AUTOMATIC1111 v1.9の新機能と使い方を解説(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第23回:Stable Diffusion AUTOMATIC1111 v1.9の新機能と使い方を解説(西川和久)

グラビアカメラマンでエンジニアの西川和久氏による生成AIグラビア連載、今回は画像生成モデルStable Diffusion を使う定番インターフェースのひとつ Automatic1111の新バージョン解説と、プロンプトから高速に画像を検索できるエクステンションSearchMyPNGの使い方について。

生成AI音楽のYouTubeライブ配信「AIライブハウス」を毎週水曜お昼オープン。5月1日の第1回はリアルタイムで別の声を纏うVocoflex実演(CloseBox) 画像
AI

生成AI音楽のYouTubeライブ配信「AIライブハウス」を毎週水曜お昼オープン。5月1日の第1回はリアルタイムで別の声を纏うVocoflex実演(CloseBox)

テクノエッジのYouTubeチャンネルで、毎週水曜日のお昼に生成AI音楽に関するライブ配信することにしました。名付けて、「AIライブハウス」。いきなりですが、本日(5月1日)正午にスタートです。

5月7日のアップル「Let Loose」イベントではOLED + M4 + AIのiPad Pro登場とのうわさ 画像
タブレット

5月7日のアップル「Let Loose」イベントではOLED + M4 + AIのiPad Pro登場とのうわさ

アップルは、5月7日の「Let Loose」スペシャルイベントで発表すると見られている新型iPadにM4チップを搭載し、機能向上したNeural EngineのAI機能を大々的に宣伝するようです。

自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIを発表など重要論文5本を解説(生成AIウィークリー) 画像
AI

自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIを発表など重要論文5本を解説(生成AIウィークリー)

生成AIの重要論文5本を解説する連載。今回は、自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIなど。

アップル、iOS 18の生成AI機能でOpenAI・Google両社と交渉中?自社開発も継続 画像
スマートフォン

アップル、iOS 18の生成AI機能でOpenAI・Google両社と交渉中?自社開発も継続

アップルは次期iOS 18の「いくつかの機能」を生成AIにより強化するため、複数の企業と交渉しているとの噂は、何度か報じられてきたことです。たとえばGoogleとは、Gemini AIの使用に関して協議している、という具合です。