> ## Documentation Index
> Fetch the complete documentation index at: https://factory-docs-cli-sandbox-mcp-whole-process.mintlify.site/llms.txt
> Use this file to discover all available pages before exploring further.

# DeepInfra

> 幅広いオープンソースモデル向けの費用対効果の高い推論

DeepInfraの最適化されたインフラストラクチャで、幅広いオープンソースモデルに対するコスト効率的な推論にアクセスできます。

## 設定

`~/.factory/settings.json`に追加してください：

```json theme={null}
{
  "customModels": [
    {
      "model": "zai-org/GLM-4.7",
      "displayName": "GLM-4.7 [DeepInfra]",
      "baseUrl": "https://api.deepinfra.com/v1/openai",
      "apiKey": "YOUR_DEEPINFRA_TOKEN",
      "provider": "generic-chat-completion-api",
      "maxOutputTokens": 16384
    },
    {
      "model": "deepseek-ai/DeepSeek-V3.1-Terminus",
      "displayName": "DeepSeek V3.1 Terminus [DeepInfra]",
      "baseUrl": "https://api.deepinfra.com/v1/openai",
      "apiKey": "YOUR_DEEPINFRA_TOKEN",
      "provider": "generic-chat-completion-api",
      "maxOutputTokens": 16384
    },
    {
      "model": "moonshotai/Kimi-K2-Instruct-0905",
      "displayName": "Kimi K2 Instruct [DeepInfra]",
      "baseUrl": "https://api.deepinfra.com/v1/openai",
      "apiKey": "YOUR_DEEPINFRA_TOKEN",
      "provider": "generic-chat-completion-api",
      "maxOutputTokens": 32768
    },
    {
      "model": "Qwen/Qwen3-Coder-480B-A35B-Instruct-Turbo",
      "displayName": "Qwen3 Coder 480B [DeepInfra]",
      "baseUrl": "https://api.deepinfra.com/v1/openai",
      "apiKey": "YOUR_DEEPINFRA_TOKEN",
      "provider": "generic-chat-completion-api",
      "maxOutputTokens": 32768
    }
  ]
}
```

## はじめに

1. [deepinfra.com](https://deepinfra.com)でサインアップしてください
2. ダッシュボードからAPI tokenを取得してください
3. [model list](https://deepinfra.com/models)で利用可能なモデルを確認してください
4. 希望するモデルを設定に追加してください

## 注意事項

* Base URLの形式：`https://api.deepinfra.com/v1/openai`
* モデル名はHugging Faceのリポジトリ形式に一致します
* OpenAI互換のAPIをサポートしています
* 新しいバージョンがリリースされた際の自動モデル更新
