「Pixel 9 Pro XL」と過ごした数日の感想。Gemini Liveと話して体験したGoogle AIはどんなものだったか（Google Tales）

今、手元に黒（Obsidian）の「Pixel 9」とクリーム（Porcelain）の「Pixel 9 Pro」とピンク（Rose Quartz）の「Pixel 9 Pro XL」があります。ピンクは予想していたショッキングピンクではなく、上品な薄桃色です。これなら一般に女性っぽいとされる色が苦手な私でも持てます。

▲Pixel 9とPixel 9 Pro XLの箱。100％リサイクルなパッケージです

■Pixel 9シリーズのスペック比較（Foldを除く）

Pixel 9シリーズは、無印、Pro、Pro XL、Fold、a（も出ると思う）の5モデル構成と、Pixel 8シリーズより2台も仲間が増えました。てっきりPixel 9 ProはPixel 8 Proと同じサイズで、XLはさらにでかくなるんだと思っていましたが、Pixel 9 ProはPixel 8（6.2インチ）より0.1インチ大きくてPixel 9と同じ6.3インチに、9 Pro XLは8 Pro（6.7インチ）より0.1インチ大きい6.8インチに、という展開。

今は「Pixel 8 Pro」（6.7インチ）をメインで使っているので、サイズがそれほど変わらないならと、次は「Pixel 9 Pro XL」にしようと思います。

▲左から、「Pixel 9」「Pixel 9 Pro」「Pixel 8 Pro」「Pixel 9 Pro XL」。下の定規はPixel 9がつるつる（他はマット仕上げ）で斜めなデスクだとすべるので置いてあります

ちなみに、9 Proと9 Pro XLは、大きさと重さとバッテリー容量以外の性能は、カメラ構成や色展開も含めて同じです。

背面カメラの構成（トリプルなことと画素数）は、Pixel 8 Proとも同じです。セルフィーカメラの画素数はPixel 8 Proの1050万画素から4200万画素にグレードアップしています。

今回も、「Google Tales」恒例の新旧比較表を（f値とか画角とかについては省いております）。

▲Pixel 8／8 Pro／9／9 Pro／9 Pro XLスペック比較表

今回の「Google Tales」は、主にPixel 9 Pro XLのAI機能を使ってみたお話です。

日本語ではまだ使えない「Gemini Live」も、システム設定を英語にして使ってみました。

楽しみにしていた「Pixel Screenshots」（Microsoftの「Recall」にちょっと似ているPixelのスクショに基づいてGeminiが質問に回答する機能）とAI描画アプリの「Pixel Studio」は、英語設定にしても今のところ日本では使えませんでした。

■Pixel 9シリーズのAIツール

Googleは恒例のハードウェア発表イベント「Made by Google」の冒頭30分をAIの話に費やし、「Gemini Era」（Gemini時代）を謳いました。あたかもハードウェアはGoogle AIを使うための器、という扱いです。

▲「すべてはGemini時代のために築いた」的な画像

では、Pixel 9で使えるAIツールにはどんなものがあるでしょう。

Googleアシスタントに代わるGemini

Geminiアプリは、既に2GB以上のRAMとAndroid 10以降を搭載した従来のAndroidデバイスにインストールできます。

Pixel 9シリーズではもう一歩踏み込んで、Geminiアプリがプリインストールされており、初期設定で「メインのデジタルアシスタント」になっています（旧モデルでもGoogleアシスタントの代わりにGeminiを選択できるようになってはいますが、初期設定でメインというところがミソ）。

▲電源ボタンの長押しで起動するのは「Googleアシスタント」（左）だったのが「Gemini」に

今のところ、Googleアシスタントに設定変更できますが、Googleは、Geminiの性能が安定したら、将来的にはGoogleアシスタントを葬るつもりなのだろうと思います（また1つお墓が……）。

Googleアシスタントという名前のまま中身がGeminiになるとか、「Pixie」という新しいアシスタントになるとかではなく、GeminiがAndroid端末の「デジタルアシスタント」になるのでしょう。

今のところ、Geminiは健闘してはいるものの、単純なお願いならGoogleアシスタントの方が正確だったりするので、Googleアシスタントに戻す人が多いかもと思います。

ちなみに、Googleアシスタントで設定していたルーティン（日没になったら照明を点灯して、など）はそのまま使えています。

Gemini Live

（今のところ）Pixel 9シリーズでしか使えない機能として「Gemini Live」があります。

簡単に言えば、OpenAIのChatGPTの高度な言語モード（例の、スカーレット・ヨハンソン激怒事件のやつ）と似た機能。

スカヨハ、ChatGPTの声提供をサム・アルトマンから繰り返し提案され断っていたと明かす。そっくりの『Sky』には衝撃と怒りを声明 | テクノエッジ TechnoEdge

ハリウッドスターのスカーレット・ヨハンソンは、声の使用を断ったにもかかわらずOpenAIが「不気味なほど自分に似た」AI音声を発表したことに「ショックを受け、怒り」を覚えたと述べ、同社のサム・アルトマンCEOに対し「信じられない」とする声明を出しました。

https://www.techno-edge.net/article/2024/05/22/3387.html続きを読む »

▲ChatGPTの会話画面（左）とGemini Liveの会話画面

これは、サブスク「Gemini Advanced」に加入していて、（今のところ）システムの言語設定を英語にしないと使えません。もちろん会話は英語です（他の言語も選べますが、日本語は今のところ選べない）。なお、Pixel 9シリーズを買うと、もれなくGemini Advancedの半年お試しがついてきます。

これについては後で感想を書きます。

「一緒に写る」などの写真ツール

たぶんPixel 9シリーズのテレビCMで一番打ち出すのは「一緒に写る（英語では「Add Me」）」になるんでしょう。実際にやってみるとわりと簡単だし、うまくできると楽しい。でも、人の前にものを置かないようにしたり、入れ替わる撮影担当は他の人と重ならないようにしたり、慣れが必要です。

▲「一緒に写る」での撮影（イラスト：ばじぃ）

あと、なまじ賢いAIなので、人だと検出したもの以外では使えないようです。ぬいぐるみで作例をつくろうと思ったらできませんでした。例えばスマートフォンのレビュー記事で表と裏を並べた写真が撮れるといいのに。

▲こういう裏表画像（これは合成です）

ちょっと使ってみた感想としては、グループ旅行とかなら「すみませーん、お願いできますか？」（にこにこ）で通りすがりの人に撮影してもらう方が楽だなぁという感じです。

AIがフレームを追加してくれる「オートフレーム」も使ってみました。こちらもあらかじめ撮影時に背景をちゃんと選んでおく必要があります。日本語の看板とかがあったら変な文字が追加されちゃいます。でもうまくいくと面白いので、やってみるのは楽しいです。

▲オートフレームの作例。まず消しゴムマジックで人と電線を消してからのオートフレーム。左側に追加された町並みがいろいろ変

マジック編集の「イマジネーション」も面白いです。例えば写真の空をタップして選んで「編集」→マジック編集のアイコン→領域選択→「イマジネーション」を選び、英語でプロンプトを入れるとAIがプロンプトに合わせた変化を付けてくれます。これも、まだうーんな感じではありますが、うまくいくと楽しい。

▲「イマジネーション」で空を夕焼けにしてみた（けど空だけなのでちょっと変）。

写真のAI編集はどんどん新しい機能が出てきて、それぞれで遊んでいるとあっという間に時間がたっちゃいます。

Imagen 3搭載の「Pixel Studio」

実は何かの間違いで、ちょっとだけAI描画アプリ「Pixel Studio」が使えました（その後アップデートしたら作画したコンテンツごとアプリが削除されちゃいました）。

使えなくなる前にいくつか作画してみたんですが、スーパーマリオとかピカチュウとかミッキーマウス（新しい方）とかどんどんできちゃったので、使えるようになるのはまだ先かも、と思いました。

そもそも人間の画像は「作れません」と拒否するようになっていて、xAIのGrok 2みたいにセレブを含む人物を作れたりはしないようになっていましたが、著作権関連を安心して使えるようにするのは難しいのかもです。

Copilot+ PCの「Recall」に似た「Pixel Screenshots」

デバイスでスクリーンショットを撮ると、「Gemini Nano with Multimodality」が起動して、画像上の情報（テキストや画像など）を保存しておいてくれます。Copilot+ PCの売りの一つだったRecall（批判が出て提供停止中）に似てはいますが、操作はすべてオンデバイスなので、パスワードとかセキュリティやプライバシーに関わるスクショも安心してとっておける（はずです）。

分類したりしないで「これはちょっと後で見るかも」と思うものをどんどんスクショするだけ。行くかもしれない講演会のページとか、後で読みたいWeb記事、そのうち行きたいお店のページ、オンラインショップでいいなと思ったスニーカーなど、なんでも。

「○○の講演会はいつどこでだっけ」と入力すると、ちゃんと答えてくれる。

便利そうです。でも私の場合はどちらかというと覚えておきたいことは現実世界にあって、例えば駅のポスターとか、ルータの背中に貼ってあるパスワードとか、そういうものをスマホで撮ります。なので、スクショよりもGoogleフォトに保存されている膨大な写真データから情報を持ってきてくれる方が嬉しいかも。Googleフォトの検索もかなり賢くなってきてはいますが。

Googleフォトを開いたままGeminiを起動し、「この画面について質問する」をタップすれば、個別の写真についての説明はしてくれます。

▲Googleフォトで「この画面について質問する」

Pixel 9 Proはまだ世の中に出回っていないからか、説明が間違っております。

■Gemini Liveと話してみた

さて、リアルタイム会話機能「Gemini Live」です。使うにはまず、Googleアカウントの言語設定を英語にします。つまり、Pixelだけでなく、同じアカウントでログインしているNestデバイスやPCのChromeブラウザの設定も英語になっちゃう。ブラウザはともかく、Nestに「2時間のタイマーをセットして」とかも英語で言わなくちゃならなくなります。

Gemini Liveでは、ChatGPTと同じように、声を選べます。ChatGPTはCove、Juniper、Breeze、Wmberの4人（スカヨハに似ているというSkyはいません）。Gemini Liveは、10人。名前は全部星や星座に由来します。

Geminiに「なんでGemini Liveの声は星由来なの？」と聞いてみたところ、「おそらく、不思議さと可能性の感覚を呼び起こし、声を何か広大で感動的なものと結びつけるためでしょう」とのお答えでしたが、ソースが示されないのでGoogleがそう意図したかどうかは不明です。

声を選ぶとき、ChatGPTと同じように声のサンプルとしてそれぞれ短いセリフを言います。名前とその声の定義、セリフは以下のとおり。

Nova：静かで中間の声：Feel free to keep. I'm ready to be your voice. If you like, what you hear choose me to start talking.

Vega：明るくて高い声：Feel free to keep exploring until you find the perfect voice.

Ursa：熱心そう（Engaged）な中間の声:You can always change voices later. I'll be here whenever you're ready to talk.

Pegasus：熱心そうな深い声：If you're curious about the other voices, swipe to explore or pick me to start talking,

Capella：英国なまりで高い声：It's good to meet you, give me a chance or check out the other options.

Lyra：明るく高い声：Maybe I'm your style pick me and I can be the voice you hear.

Orion：明るく深い声：I'd be honored to be the voice. You choose for Gemini but let's face it. The other voices are great too.

Orbit：エネルギッシュで深い声：Choosing a voice is tricky. But hopefully it's also fun. Here's hoping I'm your voice of choice.

Eclipse：エネルギッシュで中間の声：Maybe I'm the voice. That's right for you. But there are quite a few to choose from.

Dipper：熱心そうで深い声：I'm another voice in the mix. I'll be here whenever you're ready to talk.

性格的な特徴はあまりないようです。皆さんそれほど自分を売り込まず、謙虚です。1人英国なまりの人がいるのが米国らしい（米国人にとって英国なまりはちょっと憧れだそうです）。日本語版はどうなるんでしょうね。

実際に話してみると、ある程度の感情の起伏もあるように聞こえます。例えば、「昨日新宿で偶然友だちに会ってさ」と言うと「それは素敵な偶然ですね！」と嬉しそうに言ってくれたりします。

口調も（私が英語ネイティブじゃないからそう聞こえるのかもしれませんが）かなり自然です。

ただ、皆さんネイティブの普通の速度で話すので、私には速い。「もう少しゆっくり話してくれませんか？」とお願いしたんですが、「システムの制限で速度は変えられないけど、同じことをシンプルに言い換えることはできるよ」だそうです。ううむ。

で、試しに「Could you please speak in Japanese?」とお願いしてみたところ、女性の声の日本語で「はい。日本語で話せます」と。そこからは質問は英語、返事は日本語で会話が続きました（日本語での質問は受け付けない）。日本語は、私がネイティブだからということもあり、ちょっと不自然に感じました。「ところで、日本語の声は他にもありますか？」と尋ねたら、今のところ1つだけだそうです。

■Gemini Liveの言うことは信頼できるか

同じ質問をGeminiとGemini Liveにいくつかしたところ、Gemini Liveの方が不正確なことが何度かありました

困るのは、乗換案内。Geminiは一応正解しましたが、例えば「町田から新宿に電車で行くには？」と聞いたらGemini Liveは「町田から京浜急行に乗って」と始まりました。

わざわざGemini Liveに聞かずに、Googleマップを開けばいいだけの話ではあります。

もっと世間話をしたり、相談するのに向いているのかもと思い、「ちょっと落ち込んでいます。なぐさめてください」とお願いしてみました。以下はそれに続く会話です（元は英語です）。

Gemini：物事がうまくいかないと感じることがあるのはわかります。ときにはそう感じるのは自然なことです。誰にでもいいときもあれば悪いときもあるよね。特に話したいことはありますか？　それとも何か静かな音を聞きたい？　ああ、覚えておいてほしいんですが、私は医療アドバイスや診断はしません。そういうのは専門の人に聞いてね。

me：なにか楽しいことを言ってください。

Gemini：わかりました。何か楽しいことを考えましょう。あなたに何か超能力が備わったと想像してみて。どんな超能力がいいですか？　透明人間になる？　空を飛ぶ？　天気を自在に操る？

me：天気を操るのがいいな。

Gemini：天気を操つれたらすごいですよね。好きなときに晴れにしたり、雷を止めたり、虹をかけてみたり。あなたは何がしてみたい？

me：ものすごいトルネード。

Gemini：トルネードねぇ。それは見ものかもしれないけど、もうちょっとポジティブなことに使うべきじゃないかな。

なんと、否定されてしまいました。これはちょっと意外。OpenAIはChatGPTの危険性の1つとして、なんでも肯定してくれるChatGPTとばかり話すようになると人は生身の人間よりもChatGPTを好むようになり、依存するようになるかも、と言ってましたが、Geminiはこんなふうに否定するなら、そんな心配はないかも。

いずれにしても、あんまりなぐさめられませんでした。日本語に対応したら、日本人のメンタルに合った対応になったりするといいなぁ。

■Pixel 9 Pro XLと数日過ごした感想

ハードウェアとしては、小さい手にはこれが限界かなというサイズと重量（重さは8グラム、500円玉と1円玉1枚ずつ分、Pixel 8 Proより重い）ですが、またぎりぎりなんとか。

画面が明るくてきれいだし、バーじゃなくなった背面カメラも微妙にでっぱりが大きくなりましたが気になるほどでないし（個人の感想です）。側面のカーブがなくなったのも私は気にならないし。

AI機能については、可能性はかなり感じますが、実際に使った感じでは今後に期待、というところです。

Gemini Liveは、無理に英語で使い続けるほどには（自分の英語力の問題もあり）魅力を感じられなかったので、今後は設定言語を日本語に戻し、日本語対応を待つことにします。

GeminiをGoogleアシスタントに戻すかどうかは微妙なところ。しばらくはGeminiでがんばって、データをGoogleに送って改善に協力していこうと思います。

「Pixel 9 Pro XL」と過ごした数日の感想。Gemini Liveと話して体験したGoogle AIはどんなものだったか（Google Tales）

佐藤由紀子

特集

■Pixel 9シリーズのスペック比較（Foldを除く）