バッジ型AIデバイスAi PinのHumane社、早くも身売り検討中?発売から約1か月(Bloomberg報道)
Humaneは2023年11月、同社の最初で唯一の製品であるAI Pinを発表、2024年4月に出荷を開始し始めたばかりでしたが、新しい報道によると現在、会社の売却を検討しているとのことです。
中国で『AI習近平』誕生。「習近平思想」記した著書十数冊や公式文書で強化
中国国家サイバースペース管理局(CAC)は、習近平国家主席の思想と政治哲学に関する著書などでトレーニングされた大規模言語モデル(LLM)を搭載するAIシステムを開発しました。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第25回:三拍子揃った新Upscale手法 ControlNet 852_a_clone_xlを試す (西川和久)
現役グラビアカメラマンでありエンジニアでもある西川和久氏による生成AIグラビア連載の第25回は、画像生成と切っても切り離せないアップスケールの新技術編。
スカヨハ、ChatGPTの声提供をサム・アルトマンから繰り返し提案され断っていたと明かす。そっくりの『Sky』には衝撃と怒りを声明
ハリウッドスターのスカーレット・ヨハンソンは、声の使用を断ったにもかかわらずOpenAIが「不気味なほど自分に似た」AI音声を発表したことに「ショックを受け、怒り」を覚えたと述べ、同社のサム・アルトマンCEOに対し「信じられない」とする声明を出しました。
クアルコム、Snapdragon X Elite搭載のMac mini風ミニデスクトップPCを発表。ARM版Windowsアプリ開発向け
クアルコムは、マイクロソフトが発表した新しいSurfaceシリーズにも採用されているSnapdragon X Elite搭載のWindowsミニデスクトップPCを発表しました。価格は899ドル(約14万円)で、6月18日発売予定です。
Pythonのように書けてGPU上で並列処理できる新プログラミング言語「Bend」、2D画像→3Dを高精度生成するGoogle「CAT3D」など重要論文5本を解説(生成AIウィークリー)
1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。今回は、GPU上でネイティブ動作する並列処理が可能な新プログラミング言語「Bend」とランタイムシステム「HVM2」、大規模言語モデルは追加学習や新知識で幻覚生成が増加。Googleなどが調査などを紹介。
Gemini Advancedで次世代AIモデルGemini 1.5 Pro解禁。音声会話Gemini Liveやカスタム版Gemsなど新機能
Googleは5月14日~15日(現地時間)、年次開発者会会議Google I/Oを開催しました。直前にPixel 8aが発表されていたこともあり、AI一色だったGoogle I/Oですが、一般ユーザーが身近に感じられそうなのがGemini Advancedのアップデートでしょう。
技術書典16に出展『グラビアカメラマンが教える 生成AIグラビア実践ハンドブック』を制作しました
テクノエッジは、5月25日から6月9日にかけてオンラインおよびオフラインで開催されるイベント「技術書典16」に出展します。
成功させたいスタートアップの条件とは? エンジェル投資家 川崎裕一さんゲストの第54回を配信(TechnoEdge-Side)
テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」(テクノエッジ・サイド)というチャンネルを設け、週1回のペースでお届けしています。
Google、AIが通話を聴いてサギか判定・警告する機能をデモ。Gemini Nanoでローカル動作
Googleは年次開発者会議「Google I/O」にて、Androidスマートフォンに掛かってきた電話が詐欺の疑いがある場合、ユーザーに警告する機能をテスト中だと発表しました。
Google、Gemini AIのビデオ検索デモで早速やらかす。カメラのフィルム巻き上げレバーが動かないなら「裏ぶたを開けてフィルムを取り出す」?
日本時間5月15日午前2時より開催されたGoogle I/Oより。Googleは今回のイベントで、Gemini AIをさらに多様なプロダクトに組み込んでいることを大きくアピールしました。
Google、動画生成AIモデル『Veo』発表。高解像度で一分超、撮影用語などプロンプト再現性と高い一貫性、動画の一部編集も
5月15日の Google I/O基調講演で、Googleが新たな動画生成AIモデル『Veo』を発表しました。
Logic Pro 11の新機能を試して理解した、AI作曲と楽器パート別音源分離「Stem Splitter」の相性(CloseBox)
Logic ProのMac版であるバージョン11とiPad版のバージョン2が、5月14日に更新されました。本当に10年待ったぜ、という感じのSession Players、AI作曲時代にぴったりのStem Splitterなど、大きな新機能が入った新版です。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第24回:照明を自由にコントロールできるIC-Light登場!(西川和久)
lllyasviel氏復活第一弾のIC-Light
OpenAI、ChatGPTのMacアプリ公開。Macのカメラやスクショ、写真ライブラリにもアクセスし音声対話可能
OpenAIはChatGPTのGPT-4oを使えるマルチモーダルなMacアプリを公開した。
Appleイベント直前、告知満載の第53回を配信(TechnoEdge-Side)
テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」(テクノエッジ・サイド)というチャンネルを設け、週1回のペースでお届けしています。
アトラシアン、新AIサービス「Atlassian Rovo」発表。Googleドライブ、GitHub、Slack、Teamsなどを横断してAIが学習、ユーザーを支援
アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援
Googleが“一歩先の未来を予知”できる時系列予測AI基盤モデル「TimeFM」公開、LSTMの進化形「xLSTM」など重要論文5本を解説(生成AIウィークリー)
生成AIの重要論文5本を解説する連載。Googleが“一歩先の未来を予知”できる時系列予測AI基盤モデル「TimeFM」公開、LSTMの進化形「xLSTM」など。
新型 iPad Proを忘れて、純粋にSoCとしてのM4と「その先」について考えてみる(本田雅一)
アップルがニューヨーク、ロンドン、上海で開催した、iPadをメインに据えた久々の発表会。 製品の概要については、既に十分な報道がなされている上、ウェブにも大量の情報が溢れている。近いうちに実機でのテストの機会があるため、ここでは少し製品から離れて、新型iPad Proに搭載されている新しいプロセッサについて話を進めていくことにしたい。
AI作曲のUdio、有料サービス開始。部分修正も可能に(CloseBox)
AI作曲サービスのUdioは5月8日、有料プランを含むサブスクリプションをスタートしました。同時に、生成した楽曲の部分修正を行う「Audio Inpainting」機能を追加しています。
Logic Proが無料の大幅更新、ベース・キーボードもコード進行に合わせて自動演奏。あとはギター弾いて歌うだけ(CloseBox)
アップルは5月7日、音楽制作ソフトLogic Proの機能アップを発表しました。
作曲AIはプログレッシブロックの夢を見るか? Udioが長く一貫性のある曲を作れるようになった理由(CloseBox)
作曲AIサービスのUdioが5月1日、新機能を搭載したとX上で発表しました。長く、一貫性のある曲を作れるようになると謳っています。この新機能を使ってプログレの長い曲を作ってみました。
世界デビューした生成AI架空バンドの曲を人力カバー、AIが語る音楽性を人間が再現。カバーしてくれる人を募集します(AIだけで作った曲を音楽配信する 第2回)
AIが創造したプログレバンド「The Midnight Odyssey」が世界デビューしてから1カ月が過ぎました。バンドは勢力的に活動しているようで、リードギターのエリオット・スミスがリモートでインタビューに応じた映像が飛び込んできました。
Pika、RunwayMLなど動画生成AIサービスを同一プロンプトで比較した結果。OpenAI Soraでも実際は膨大なガチャと後編集
動画生成AIにまつわる最新の話題をお届けしている、この短期連載。今回は、(おそらく)世界中のAI動画クリエイターたちが使ってみたいと考えているOpenAIのSoraによる映像制作が、そんなに簡単なものではないという裏話と、複数の人気動画生成AIに同じプロンプトで動画を生成させて比較してみます。
Google、新AIアシスタント Gemini モバイルアプリを日本でも提供開始。Googleアシスタントを置き換え
Googleは4月30日(現地時間)、Geminiモバイルアプリの提供地域を拡大すると発表しました。日本でもAndroidではGoogle Playストアからダウンロードが可能。iOSの場合は専用アプリはなく、Googleアプリからのアクセスとなります。
Anthropic、生成AI『Claude』の公式 iOSアプリ配信。Teamプランも提供開始
Anthropicは5月1日(現地時間)、生成AI「Claude(クロード)」のiOSアプリをリリースしました。あわせて、新プランとなる「Team」も発表されています。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第23回:Stable Diffusion AUTOMATIC1111 v1.9の新機能と使い方を解説(西川和久)
グラビアカメラマンでエンジニアの西川和久氏による生成AIグラビア連載、今回は画像生成モデルStable Diffusion を使う定番インターフェースのひとつ Automatic1111の新バージョン解説と、プロンプトから高速に画像を検索できるエクステンションSearchMyPNGの使い方について。
生成AI音楽のYouTubeライブ配信「AIライブハウス」を毎週水曜お昼オープン。5月1日の第1回はリアルタイムで別の声を纏うVocoflex実演(CloseBox)
テクノエッジのYouTubeチャンネルで、毎週水曜日のお昼に生成AI音楽に関するライブ配信することにしました。名付けて、「AIライブハウス」。いきなりですが、本日(5月1日)正午にスタートです。
自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIを発表など重要論文5本を解説(生成AIウィークリー)
生成AIの重要論文5本を解説する連載。今回は、自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIなど。
アップル、iOS 18の生成AI機能でOpenAI・Google両社と交渉中?自社開発も継続
アップルは次期iOS 18の「いくつかの機能」を生成AIにより強化するため、複数の企業と交渉しているとの噂は、何度か報じられてきたことです。たとえばGoogleとは、Gemini AIの使用に関して協議している、という具合です。
その人の声になりきってリアルタイム歌唱できるAIボイチェン「Vocoflex」を使ってタイムトラベル体験した(CloseBox)
10秒の歌声オーディオデータがあれば、本人そっくりのリアルタイム歌唱ができるという「Vocoflex」。ベータテスターの申し込みをしていたのですが、ついに試用できたので、そのファーストインプレッションをお届けします。
ラッパーDrake、故2PACのAI生成音声でケンドリック・ラマーへのディス曲を公開。遺産管理団体が強く抗議
1996年に死去したラッパーの2PACことトゥパック・シャクールの遺産管理団体が、故人の声をAI生成し、ケンドリック・ラマーへのディス曲「Taylor Made Freestyle」に使ったドレイクに対し、早急に撤回するよう求め、さもなくば訴訟を起こすと警告しています。
Adobeの画像生成AI「Firefly Image 3」提供開始。Photoshopに「画像を生成」追加、「生成塗りつぶし」強化など新機能を解説(西田宗千佳)
アドビは、4月23日(現地時間)にスタートした「Adobe Max London」にて、生成AI「Adobe Firefly」と「Adobe Photoshop」に関する複数の発表を行った。どのような変化が起きたのか? アドビ・Photoshop製品マーケティング担当シニアディレクターのエリン・ボイス氏に話を聞いた。
手のひら投影型AIデバイス「Humane Ai Pin」で未来っぽい体験を始めた。動画付きファーストインプレッション
サンフランシスコに本社を置くスタートアップ企業、Humaneが開発するAi Pinがようやく手元に届きました。今回はこのAi Pinの第一印象についてレポートします。
米軍、AIドッグファイトに成功。AI自律飛行のX-62A VISTA試験機が有人のF-16との模擬空中戦で防御と攻撃
米国空軍テストパイロットスクールと国防高等研究計画局は(DARPA)、昨年2月にAIによる自律飛行を実現したX-62A可変飛行安定性試験機(VISTA)を用い、有人のF-16戦闘機との模擬空中戦に成功したと発表しました。
Stable Diffusionの文字がちゃんと描ける新バージョン「SD3」、APIを組み込んで検証した
Stability AIからStable Diffusionの新しいバージョン「Stable Diffusion 3」がAPI限定で公開されました。アプリケーションに組み込んで特徴やコストなどを確認しました。
生成AIグラビアをグラビアカメラマンが作るとどうなる? 第22回:Stable Diffusion 3リリース。ComfyUIを使いAPI経由で生成(西川和久)
API経由ながらStable Diffusion 3が利用可能に!
作曲AIと架空バンドのミュージックビデオを語るポッドキャスト第51回を配信(TechnoEdge-Side)
テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」(テクノエッジ・サイド)というチャンネルを設け、週1回のペースでお届けしています。
生成AIのためのGPU投資、さくらインターネットとKDDIが1000億円規模の投資を発表。経済産業省の認定プログラムを受け
経済産業省は、経済安全保障推進法に基づく特定重要物資、具体的には主に生成AIに関するシステムの安定供給確保をはかるためのであるクラウドプログラムの認定を相次いで発表しました。
AI同士が教え合い質を高めるMicrosoft開発オープンLLM「WizardLM-2」、外で撮影した動画→実世界3Dゲームに変換するAI「Video2Game」など重要論文5本を解説(生成AIウィークリー)
オープンソースLLMで大きな動き。MetaがLlama 3を発表したのと同時期に、AI同士が教え合い質を高めるMicrosoft開発オープンLLM「WizardLM-2」を公開。重要論文5本を解説します。
サムスン、生成AI『Galaxy AI』を国内版Galaxy S23やZ Fold 4 / Flip 4にも提供開始。OneUI 6.1アップデート配信
サムスン電子ジャパンは4月18日、国内版GalaxyシリーズにOneUI 6.1へのアップデートを開始しました。
OpenAI日本オフィス誕生で何が変わる?日本語最適化の本当の狙いを読み解く(本田雅一)
4月15日OpenAIの日本オフィス開設が発表された。既に報道されているようにアジアとしては初の拠点、サンフランシスコ以外の拠点としては、英国のロンドン、アイルランドのダブリンに続く3か所めとなる。
