Metaが文章と音声を翻訳するAI「SeamlessM4T」、コード専用生成AI「Code Llama」投入するなど、生成AIに関する重要論文5本を解説します。
ヤマハの「VOCALOID β-STUDIO」を実際に使ってみました。まだ半日程度ですが、いくつかわかったことがあります。
これまで作品を作ってきたボカロPは、ヤマハの新しいVOCALOID技術を無償で試すチャンス。「VOCALOID β-STUDIO」の参加受付が始まりました。
前回はモデルの1つであるCheckpointについていろいろお話した。今回はStable Diffusionが扱えるモデルの中で次によく使われるLoRAについてがお題となる。
今週の生成AI注目論文は、任意の人の音声を合成できるマイクロソフトのText-to-Speechモデルなど5本です。
ガートナーのハイプサイクル、日本ではWeb3、NFT、メタバースが「幻滅期」入りしました。
ガートナーのハイプサイクル。今年はすでに多くのITエンジニアに聞き馴染みのあるキーワードが比較的保守的といえる場所に並んでいます。
若い世代に人気の画像投稿SNS、Snapchatには今年、「My AI」と呼ばれるAIチャットボット機能が追加されました。ところが、この「My AI」が突然、勝手にユーザーのストーリーに1秒間の謎の動画を投稿し、その後押し黙ってしまうという少々気味の悪い現象が発生しています。
1週間分の生成AI主要論文を紹介する連載。今回は、25体の自律AIが住む町、“ちらつき”を抑えた動画合成を生成するAIなど。
最近AnimateDiffというAI動画手法がすごいと各所で注目されています。
NVIDIAが生成AIに関わる人なら必ずお世話になっているHugging Faceと提携しました。そこで提供するのはTraining Cluster as a Serviceと呼ばれるものです。
Checkpointとは!?
盗作をできるだけ避けて音楽生成するAI、複数のLLMが協力してソフトウェア開発を行うフレームワークなど、最新のAI論文5つを紹介します。
米AmazonのCEO、アンディ・ジャシー氏は、2023年第2四半期の決算報告で、社内の「すべての」チームが現在、生成AIに取り組んでいると述べました。