最新情報




Stability AI、アーティストPeter Gabrielとパートナーシップを組み、#DiffuseTogether と題したAIアニメーションチャレンジのシリーズを開始
Stability AI, together with music legend Peter Gabriel, announces the debut of its Stability AI DiffuseTogether Challenge. This groundbreaking initiative combines the power of generative AI imaging with the talents of a Rock & Roll Hall-of-Famer and is the first in a series of AI animation challenges that will feature other popular musicians from different genres.

日本語特化の言語モデル「Japanese Stable LM 2 1.6B」をリリースしました
日本語大規模言語モデル「Japanese Stable LM 2 1.6B」をリリースしました
Japanese Stable LM 2 1.6B(JSLM2 1.6B)は16億パラメータで学習した日本語の小型言語モデルです。
ベースモデルとしてJapanese Stable LM 2 Base 1.6Bと、指示応答学習(Instruction tuning)済みのJapanese Stable LM 2 Instruct 1.6Bを提供します。両モデルともStability AI メンバーシップで商用利用が可能です。

Stable Diffusion 3 API のご紹介
Stability AI Developer Platform APIでStable Diffusion 3およびStable Diffusion 3 Turboをご利用いただけるようになりました。

Stable Audio 2.0 のご紹介
Stable Audio 2.0をご紹介します。このモデルは、1つの自然言語プロンプトから44.1KHzステレオで最大3分の首尾一貫した音楽構造を持つ高品質なフルトラックを可能にします。
この新しいモデルは、テキストからオーディオへの変換にとどまらず、オーディオからオーディオへの変換機能も備えています。ユーザーはオーディオサンプルをアップロードし、自然言語によるプロンプトを通じて、これらのサンプルをさまざまなサウンドに変換できます。このアップデートでは、サウンドエフェクトの生成とスタイルの転送も拡張され、アーティストやミュージシャンに柔軟性とコントロール性を提供し、クリエイティブなプロセスを向上させます。

滝澤琢人がStability AI Japan にHead of Japan Sales & Partnershipsとして参加
滝澤琢人がStability AI Japan にHead of Japan Sales & Partnershipsとして参加

Stable Code Instruct 3B のご紹介
Stable Code Instruct 3Bは、Stable Code 3Bの上に構築された、最新の指示学習済み大規模言語モデルです。このモデルは、コード補完を強化し、自然言語インタラクションをサポートすることで、プログラミングやソフトウェア開発に関連するタスクの効率性と直感性を向上させることを目的としています。私たちの分析によると、Stable Code Instruct 3Bは、様々なコーディング関連タスクにおいて、Codellama 7B InstructやDeepSeek-Coder Instruct 1.3Bなどの同等のモデルを凌駕しています。

Stability AI Developer Platform のイメージサービス
メディア制作を強化するため、Stability AI Developer Platform API上の強力な画像サービスを紹介します。最先端の画像モデルを活用したこれらのサービスは、画像生成、エンハンス、アウトペインティング、編集のための包括的なツールを開発者やビルダーに提供し、ユーザー重視のソリューション開発を合理化し、複雑なプロンプトエンジニアリングなしで高品質の画像制作を簡素化します。

Stable Video 3Dのご紹介:単一画像からの高品質な新しいビュー合成と3D生成
Stable Video Diffusionをリリースしたとき、私たちは様々なアプリケーションにおけるビデオモデルの汎用性を強調しました。この基盤の上に、Stable Video 3Dをリリースできることを嬉しく思います。この新しいモデルは、3D技術の分野を発展させ、以前にリリースされたStable Zero123と比較して、品質とマルチビューが大幅に改善され、Zero123-XLなどの他のオープンソースの代替製品よりも優れています。

Stability AI Japan x NVIDIA #GTC24 開催記念。NVIDIA GeForce RTX 4090 GPUプレゼントキャンペーンを行っています
この度 Stability AI Japan はこの世界的に注目の集まるイベントの開催に合わせ、 NVIDIA とコラボレーションし、日本で Stable Diffusionをはじめ、Stability AI の生成AIモデルをご利用いただいているユーザーのみなさんに向けて抽選で1名様に『NVIDIA CEO ジェンスン フアン サイン入りNVIDIA GeForce RTX 4090 GPU が当たるキャンペーン』を実施しています。

TripoSRのご紹介:単一画像からの高速3Dオブジェクト生成
Tripo AIと提携し、LRM: Large Reconstruction Model For Single Image to 3D にインスパイアされた高速3Dオブジェクト再構築モデルTripoSRを開発しました。この新しい画像から3Dへのモデルは、詳細な3Dオブジェクトを視覚化するための応答性の高い出力で、エンターテインメント、ゲーム、工業デザイン、建築の専門家の高まる需要に応えるように設計されています。

Stable Diffusion 3
先行プレビュー中のStable Diffusion 3を発表します。このモデルは、私たちの最も高性能なテキスト画像変換モデルで、複数主題のプロンプト、画質、スペル入力の能力が大幅に向上しています。

Stable Cascade のご紹介
Stable Cascade の研究プレビューが開始されました。この革新的なテキストから画像へのモデルは、品質、柔軟性、微調整、効率性の新しいベンチマークを設定し、ハードウェアの障壁をさらに排除することに重点を置いた、興味深い3段階のアプローチを導入しています。

Stable LM 2 1.6B のご紹介
新しいStable LM 2シリーズから、16億パラメータのベースモデルとインストラクションチューニングバージョンの、私たちの最初の言語モデルを紹介します。Stable LM 2 1.6B は、英語、スペイン語、ドイツ語、イタリア語、フランス語、ポルトガル語、オランダ語の多言語データで学習された、最新の16億パラメータ小型言語モデルです。

Stable Code 3B - エッジでのコーディング
Stable Code Alpha 3BからのアップグレードであるStable Codeは、コード補完に特化し、効率性と多言語サポートにおいて先行製品を凌駕しています。非GPUモデルを含む標準的なノートパソコンと互換性があり、FIMや拡張コンテキストサイズなどの機能を備えています。複数のプログラミング言語に対応し、コーディング効率と汎用性において新たなベンチマークを打ち立てます。


Stability AI の日本語言語モデルおよび、日本語画像モデルがAPI経由でも利用できるようになりました
Fireworks AI は Stability AIと提携をし、Fireworks.ai のプラットフォーム上で Stability AI の日本語言語モデルおよび画像モデルが利用できるようになりました。現在、Japanese SDXL, Japanese Stable VLM, Japanese Stable LM Gamma 7B Beta 70B が利用可能です。

Stability AI Developer Platform APIでStable Video Diffusionが利用可能になりました
Stable Diffusion Video APIは、画像を2秒間の高品質ビデオに変換します。企業や研究者、カスタマイズ、広告、テレビ、ゲームなど様々な業界での競争力に最適です。カスタマイズ可能な機能を備えた他にはない動画生成技術です。

Stable Zero123 のご紹介: 単一画像からの高品質3Dオブジェクト生成
Stable Zero123は、3Dオブジェクトの新しいビューを高品質に生成するためのAI搭載モデルです。非商用および研究目的でリリースされ、より高品質な予測のために改良されたデータセットと標高コンディショニングを使用しています。改良されたオープンソースコードを使用することで、研究者はこのモデルを使用して画像から3Dオブジェクトを作成することができます。

StableLM Zephyr 3B のご紹介:StableLMに新たな機能を追加し、エッジデバイスに強力な LLM アシスタントを提供
StableLM Zephyr 3B のリリースをお知らせします。これは、軽量 LLM シリーズの最新版であり、インストラクション・フォローや Q&A タイプのタスク向けに調整された新しいチャットモデルです。このモデルは、既存の StableLM 3B-4e1t モデルを拡張したもので、HuggingFace の Zephyr 7B モデルにインスパイアされたものです。StableLM Zephyr の30億パラメータにより、このモデルは、単純なクエリからエッジデバイス上の複雑なインストラクションコンテキストまで、幅広いテキスト生成ニーズに効率よく対応します。

リアルタイムテキスト画像生成モデル、SDXL Turboのご紹介
新しいテキスト画像合成モードであるSDXL Turboをリリースします。SDXL Turboは、Adversarial Diffusion Distillation(ADD)と呼ばれる新しい蒸留技術に基づいています。この技術により、私たちのモデルは1つのステップで画像出力を合成し、高いサンプリング忠実度を維持しながらリアルタイムでテキストから画像への出力を生成することができます。SDXL Turboはまだ商用利用を目的としていないことにご留意ください。


Stable Video Diffusion のご紹介
本日、私たちはStable Video Diffusionを公開しました。これは、画像モデルStable Diffusionに基づく最初の基盤モデルで、動画生成用です。
現在、研究プレビューとして公開されているこの最先端のAI動画生成モデルは、あらゆるタイプの人々のためのモデルを作成するための私たちの旅の重要な一歩を表しています。

日本特化の商用利用可能 text-to-image モデル「Japanese Stable Diffusion XL」をリリースしました
Stability AI は日本に特化した text-to-image モデル「Japanese Stable Diffusion XL(JSDXL)」をリリースしました。商用利用可能な「JSDXL」は、日本語入力の対応に加え、日本スタイルや日本を題材とした画像を生成することができます。

最高性能の、日本語画像言語特徴抽出モデル「Japanese Stable CLIP」をリリースしました
Stability AIは商用利用可能な日本語画像言語特徴抽出モデル「Japanese Stable CLIP」をリリースしました。モデル単体では、ゼロショット画像分類(事前にクラス情報を学習せずに画像分類)や任意のテキストから画像を検索する画像検索などの用いることができます。また、他のモデルと組み合わせることで、text-to-image や image-to-text といった生成タスクに拡張することが可能です。

商用利用可能な日本語画像言語モデル「Japanese Stable VLM」をリリースしました
Stability AIは商用利用可能な日本語画像言語モデル「Japanese Stable VLM」をリリースしました。

公開より1週間(10月25日-10月31日)で13,000個以上の「夢の設計図」を生成!~「JAPAN MOBILITY SHOW 2023」でのStable Image API の活用~
Stability AI Japanは「JAPAN MOBILITY SHOW 2023」において、Hondaとのコラボレーションを実現し、Stable Diffusionをフィーチャーした注目の企画を展開しました。

日本語大規模言語モデル「Japanese Stable LM Beta」シリーズをリリースしました
Stability AI Japanは、オープンな日本語大規模言語モデルの中で最高性能のものを含む「Japanese Stable LM Beta (JSLM Beta)」シリーズをリリースしました。 各モデルはLlama-2をベースとしており、追加の学習を行うことで日本語の能力や日本に関する知識等を追加し、日本における用途に特化させています。特に、最大サイズの指示応答言語モデルであるJSLM Beta 70Bは、700億パラメータの商用利用可能な日本語言語モデルです。