AI 图像生成 API 入门:DALL-E 3、Midjourney 和 Stable Diffusion 实战教程
AI API Playbook · · 3 分钟阅读
教程内容概述
AI 图像生成已成为现代应用的关键能力。本教程将带你集成三个最流行的图像生成 API,并提供可以直接使用的实际代码示例。
前置条件
- Python 3.9+ 或 Node.js 18+
- 相应服务的 API 密钥
- REST API 基础知识
DALL-E 3 集成
如果你已经在使用 OpenAI 的 API,DALL-E 3 是最简单的集成方式。
基本图像生成
from openai import OpenAI
client = OpenAI(api_key="your-key")
response = client.images.generate(
model="dall-e-3",
prompt="夕阳下的未来城市天际线,赛博朋克风格,精细的建筑设计",
size="1024x1024",
quality="hd",
n=1
)
image_url = response.data[0].url
print(f"生成的图像: {image_url}")
关键参数
| 参数 | 选项 | 说明 |
|---|---|---|
size | 1024x1024, 1792x1024, 1024x1792 | 图像尺寸 |
quality | standard, hd | 图像质量级别 |
style | vivid, natural | 生成风格 |
Stable Diffusion API
Stable Diffusion 提供更多的生成控制选项,且可以自托管。
使用 Stability AI 的 API
import requests
import base64
response = requests.post(
"https://api.stability.ai/v2beta/stable-image/generate/sd3",
headers={
"Authorization": "Bearer your-key",
"Accept": "image/*"
},
files={"none": ""},
data={
"prompt": "宁静的山景与清澈的湖泊",
"output_format": "png",
"aspect_ratio": "16:9"
}
)
if response.status_code == 200:
with open("output.png", "wb") as f:
f.write(response.content)
最佳实践
1. 提示词工程
编写描述性的提示词,包含:
- 主题:你想要生成的内容
- 风格:艺术风格或美学
- 细节:灯光、颜色、构图
- 质量修饰词:“detailed”、“high quality”、“professional”
2. 错误处理
import time
def generate_with_retry(prompt, max_retries=3):
for attempt in range(max_retries):
try:
response = client.images.generate(
model="dall-e-3",
prompt=prompt,
size="1024x1024"
)
return response.data[0].url
except Exception as e:
if attempt < max_retries - 1:
time.sleep(2 ** attempt)
else:
raise e
3. 成本优化
- 缓存已生成的图像,避免重复生成
- 预览时使用较低质量设置
- 尽可能批量处理请求
价格对比
| 服务 | 分辨率 | 每张图价格 |
|---|---|---|
| DALL-E 3 HD | 1024x1024 | $0.080 |
| DALL-E 3 Standard | 1024x1024 | $0.040 |
| Stable Diffusion 3 | 1024x1024 | $0.065 |
| Midjourney | 1024x1024 | ~$0.01-0.02(订阅制) |
通过 AtlasCloud 使用多个 API
无需管理多个 API 密钥和集成方案,你可以通过 AtlasCloud 统一平台 访问所有主流图像生成 API。在不同模型间对比结果,优化你的图像生成管线。
总结
每个图像生成 API 都有其优势。DALL-E 3 在提示词跟随方面表现出色,Stable Diffusion 提供最大的灵活性,Midjourney 则能生成最具美感的结果。根据你的具体需求进行选择,或者通过 AtlasCloud 等聚合平台同时使用三者。
在 AtlasCloud 上试用此 API
AtlasCloud常见问题
哪个 AI 图像生成 API 最便宜?
Midjourney 通过订阅制提供最低的单张图像成本,约 $0.01-0.02 每张。按使用量付费的方案中,DALL-E 3 Standard 以每张 $0.040 成为最实惠的选择。
可以自己部署 AI 图像生成模型吗?
可以,Stable Diffusion 是完全开源的,可以在你自己的 GPU 服务器上自托管部署。这样可以省去按张计费的 API 费用,但需要自行管理基础设施。DALL-E 3 和 Midjourney 仅以云端 API 形式提供。
DALL-E 3 支持哪些图片尺寸?
DALL-E 3 支持三种尺寸:1024x1024(正方形)、1792x1024(横版)和 1024x1792(竖版)。所有尺寸均支持 standard 和 hd 两种质量模式。
标签
图像生成 DALL-E 3 Stable Diffusion API 教程 AI 绘画