Stability AI API スタートガイド
1. Stability AI API とは?
Stability AI API は、最先端の画像生成AI技術「Stable Diffusion」を用いた画像生成・編集サービスへのアクセスを提供するインターフェースです。この API は、開発者やクリエイターが高度な画像処理機能をご自身のプロジェクトに簡単に組み込むことを可能にします。
Stable Diffusion を利用した画像生成といえば、高価な端末を購入してご自身でセルフホストするイメージをお持ちの方もおられるのではないでしょうか。API を利用すれば、高価な端末やライセンスの契約が不要で、一枚当たりの課金からすぐに画像生成をはじめることが可能です。
Stability AI API では、テキストから画像を生成したり、既存の画像を編集したりするための一連のツールを提供します。これにより、高価な端末や技術を取得することなく、高品質な画像生成・編集機能を利用できます。
API の役割とメリット
Stability AI API は、業務アプリケーションや自社サービスにAI画像生成技術を取り入れる役割を果たします。
開発時間の短縮
セルフホストであれば構築や運用の手間がかかる画像生成AIの API 実装を、面倒なライセンス契約も行う必要がなく、安定した基盤上ですぐにご利用いただけます。料金は画像生成時のみ発生するため、使用しない期間に料金が発生することはありません。
高品質な画像生成
Stability AIは常に最新の高性能なAIモデルを提供しています。API では、まだ HuggingFace で公開されていない最先端のモデルを利用することが可能です。加えて、Stability AI がモデルの性能を最大化するように実装したワークフローが搭載されており、その出力はセルフホスティング時よりも向上しています。
柔軟な統合
Stability API は、シンプルで使いやすい API をホストしています。リクエストを実行するためのサンプルコードも充実しており、ドキュメントには Python、JavaScript、cURL の実装例が掲載されています。それだけでなく、実際に動作させて挙動を確認できる Google Colaboratory も提供されています。これにより、アプリケーションに迅速に機能を組み込むことが可能です。
2. 会員登録手順
Stability AI API を利用するための最初のステップである、会員登録の手順をご紹介します。Stability AI API では、メールアドレス/パスワードか、Google によるサインアップが可能です。
stability.ai | Developer Platform にアクセスし、右上の [Login] をクリック。
ページ下部の [Don't have an account? Sign up] より、Sign up をクリックします。 [Continue with Google]、もしくはメールアドレスとパスワードを入力して登録できます。画面の誘導通りに進めていけば、登録完了します。登録が完了すると、Stability AI API のトップページに遷移します。
右上にご自身のアイコンが表示されていれば、登録完了です。
3. ユーザーページ
ユーザーページのご利用方法を紹介します。Stability AI API のトップページ右上のアイコンをクリックすると、ユーザーページに遷移します。ユーザーページでは、APIキーの確認や、クレジットの購入を行います。
API Keys
APIキーに関する情報の管理・閲覧が可能です。
https://platform.stability.ai/account/keys
Account
アカウント情報を確認できます。
https://platform.stability.ai/account/overview
Billing
クレジットの購入や確認、支払い履歴の確認が可能です。
4. APIの機能と価格について
Stability AI APIは、ビジネスニーズに応じた柔軟な価格設定を提供しています。
機能は随時追加されておりますので、最新の情報は以下のページをご覧ください。
https://platform.stability.ai/pricing
APIで利用できる機能は以下の通りです。
画像生成
最高のテキストから画像への生成サービスです。これらのサービスは、Stability AI の最新の Stable Diffusion モデルを活用し、専門家による微調整とワークフローに組み込まれたマイクロサービスを備えています。これらのうち、Stable Image Core は、迅速なエンジニアリングを必要とせず、さまざまなスタイルの高品質の画像を取得できる主力サービスです。
Stable Image Ultra:Stable Diffusion 3のような最新モデルを活用した、最も強力で柔軟なワークフロー
Stable Image Core:高品質な画像を迅速に生成するための高度なワークフロー
Stable Diffusion 3 Medium:最新のベースモデルである、20億パラメーターのStable Diffusion 3バリアント
Stable Diffusion 3 Large:最新のベースモデルである、80億パラメーターのStable Diffusion 3バリアント
Stable Diffusion 3 Large Turbo:Stable Diffusion 3 Largeのターボバリアント
Upscale (アップスケール)
標準的な控えめなアップスケールから、画像を4Kの傑作に変えるクリエイティブ モードまで、クラス最高の画像アップスケールです。これらのうち、クリエイティブ アップスケールは、低品質の入力からフォトリアリスティックな画像を作成するためのフラッグシップです。
編集
マスク (生成塗りつぶし) や文字によるインペインティングを含む、最も効果的な AI ベースの画像編集サービス。背景削除などの基本的なツールだけでなく、商品の配置や広告用のニッチなツールも含まれています。
コントロールモード
画像を用いて、プロンプト、マップ、その他のガイドを利用することができます。これらのサービスは、安定した拡散モデルに基づいて構築された ControlNet および同様のテクノロジを活用します。
ここからは Stability AI API のドキュメントのご紹介と、それを利用して実際に画像生成を行う基本的な実装サンプルをご紹介します。
APIドキュメント
APIのドキュメントは、以下のページから参照できます。
https://platform.stability.ai/docs/api-reference
画面の左側ツリーの [API Reference] では、[API] - [機能] - [モデルバージョン] と、ドキュメントが階層構造となっています。例えば画像生成であれば、[STABLE IMAGE] - [Generate] - [Stable Image Ultra]と参照することで、Stable Image Ultraを用いた画像生成のAPIドキュメントを参照できます。
各ページでは、該当の関数の説明や、各言語における実際のリクエスト例、およびレスポンスサンプルが提供されています。これにより、開発者の方は迅速にシステムへの実装を実現し、エラーハンドリングの制御を行うことが可能です。
また、各ページの [Grab your API key and head over to Google Colab] 欄には、APIをすぐに試せるGoogle Colaboratoryファイルが準備されているため、実際にコードを動かしながらの動作確認も可能です。
URLの構成
URLは、基本的に以下のように構成されています。
目的に合わせて、URLとリクエストヘッダー/リクエストボディを切り替えてください。
https://api.stability.ai/v2beta/ {①API名称} / {②機能名称} / {③関数名称}
①API名称:stable-imageや、stable-fast-3d、image-to-videoなど
②機能名称:stable-image(画像生成)の場合、generateやupscale、editなど
③関数名称:ultraなどのモデル名や、fast、inpaintなど
サンプルコード
ドキュメントのリクエスト例に従ってリクエストを構築してみます。
以下はPythonによる実装例です。
一般的なAPI呼び出しの形式と変わらない形で、リクエストヘッダとリクエストボディを構成します。ここで、プロンプトを始めとする各種パラメータが設定できます。
レスポンス
リクエストを実行すると、生成された画像を含むレスポンスが返却されます。
各種エラーコードはドキュメントに解説がありますので、実装時の参考にしてください。
Google Colaboratoryを用いた動作確認
ここで、Google Colaboratoryの公式サンプルを用いて、実際に画像生成を試してみましょう。今回はPythonのコードをGoogle Colaboratoryで動作させていますが、実装時にはお手元の環境で動作させることが可能です。
なお、各種機能のGoogle Colaboratoryファイルは以下のページからアクセスできます。
https://platform.stability.ai/docs/getting-started/stable-image
随時、追記予定。