モデル・デプロイメント

モデル・デプロイメントをトラブルシューティングします。

モデル・デプロイメントの失敗のデバッグ

新しいデプロイメントを作成したり、既存のデプロイメントを更新すると、失敗することがあります。次のステップでは、問題をデバッグする方法を示します:

  1. プロジェクトのホームページで、「モデル・デプロイメント」をクリックします。
  2. モデル・デプロイメント名をクリックするか、モデル・デプロイメントの「アクション」メニューをクリックし、「詳細の表示」を選択します。次に、作業リクエストを確認します
  3. 「リソース」で、「作業リクエスト」をクリックします。

    作業リクエストはページの下部に表示されます。

  4. 「作業リクエスト情報」ページで、「ログ・メッセージ」をクリックします。
  5. 作成ステップでエラーが発生した場合は、「リソース」「エラー・メッセージ」をクリックします。
  6. 作業リクエストが成功を示す場合は、OCI予測ログを確認してエラーを特定します。

    ログは、作成時にモデル・デプロイメントにアタッチされます。

  7. ログがアタッチされている場合は、予測ログ名をクリックしてログを表示します。
  8. 「ログ検索で探索」をクリックします。
  9. フィルタ時間を変更して期間を長くします。

Conda環境パスにアクセスできません

conda環境パスが有効であり、公開されたconda環境に適切なポリシーを構成していることを確認します。デプロイ済モデルの可用性と適切な機能を確保するには、モデル・デプロイメントのライフサイクル全体を通じて、conda環境パスが有効でアクセス可能である必要があります。

Webサーバーの起動中にエラーが発生しました

モデル・デプロイメントの予測ログを有効にして、エラーのデバッグに役立てます。通常、これはコードに問題があるか、必要な依存関係がない場合に発生します。

モデル・デプロイメントの呼出しの失敗

モデル・デプロイメントがアクティブなlifecycleStateの場合、予測エンドポイントを呼び出すことができます。予測レスポンスは、複数の理由で失敗を返すことがあります。次の推奨事項を使用して、これらのエラーを解決します:

  1. リクエストで渡された入力が有効なJSON形式であり、モデルで予想される入力と一致していることを確認します。

  2. アタッチされているアクセス・ログでエラーを確認します。

  3. ユーザーに正しいアクセス権があることを確認します。

  4. score.pyファイルにエラーが含まれていないことを確認します。

  5. 予測が同じ入力に対してコールされるたびに異なる結果(成功、失敗)を返す場合、割り当てられたリソースがモデル予測を提供するには十分でない可能性があります。ロード・バランサ帯域幅を編集してその帯域幅を増やし、コンピュート・コア数を編集して、より多くのリクエストを並行して処理できます。

要求が多すぎます(ステータス429)

予測エンドポイントのコール時にこのエラーが表示された場合、リクエストがスロットルされていることを意味します。このエラーに対処するには、モデル・デプロイメントのロード・バランサ帯域幅を増やします。帯域幅は、予想される1秒当たりのリクエスト数、およびリクエスト当たりのリクエストとレスポンスのペイロードの合計サイズを使用して見積ることができます。