«در مقاله قبلی — نانو بنانا پرو گوگل تصاویر هوش مصنوعی را واضحتر، تمیزتر و بسیار واقعیتر میکند — به معرفی اولیه Nano Banana Pro و امکانات عمومی آن پرداختیم. در این مطلب قصد داریم نگاهی عمیقتر به نحوه استفاده حرفهای، API و قیمت آن بیندازیم.»
نسخه حرفهای مدل تولید تصویر گوگل با نام Nano Banana Pro عرضه شد و بسیاری از محدودیتهای نسخههای قبلی را برطرف کرده است. در این مقاله، با امکانات این مدل، روش دسترسی، آموزش استفاده و مزایای آن نسبت به نسخه پایه آشنا خواهید شد.
Nano Banana Pro چیست و چه قابلیتهایی دارد؟
Nano Banana Pro (شناسه: gemini-3-pro-image-preview) نسخه ارتقا یافته Gemini 2.5 Flash Image است و بهبودهای چشمگیری ارائه میدهد.
این مدل چهار ویژگی کلیدی دارد که آن را از نسخههای پیشین متمایز میکند:
نمایش متن واضح و خوانا: تولید متن در چند زبان و فونت بدون حروف نامفهوم
کنترل استودیو: تنظیم نور، زاویه دوربین و عمق میدان همانند یک استودیو حرفهای
ثبات شخصیتها: حفظ یک شخصیت یا عنصر در صحنههای مختلف
دانش واقعی: اتصال به Google Search برای صحت اطلاعات در محتواهای آموزشی و فنی
Nano Banana Pro تصاویر را با وضوح 1K، 2K و 4K و نسبتهای تصویر ۱:۱، ۱۶:۹، ۹:۱۶ و ۲۱:۹ تولید میکند و هر تصویر با واترمارک نامرئی SynthID محافظت میشود.
چگونه به Nano Banana Pro دسترسی پیدا کنیم؟
۱. نسخه رایگان
میتوانید از طریق Gemini با حساب گوگل خود وارد شوید و به صورت محدود تصاویر بسازید.
۲. دسترسی API
برای تولید تصاویر بیشتر یا ساخت اپلیکیشنهای حرفهای، از Google AI Studio یا Vertex AI استفاده کنید.
مراحل فعالسازی API:
وارد Google AI Studio شوید و پروژه خود را ایجاد یا متصل کنید
صورتحساب فعال کرده و کارت اعتباری معرفی کنید
کلید API را بسازید و در فایل
.envذخیره کنید:
GEMINI_API_KEY=your_key_here
توجه: این فایل را در گیت کامیت نکنید و به
.gitignoreاضافه کنید.
هزینهها
نسخه استاندارد: ۰.۱۳۴ دلار برای هر تصویر 1K/2K و ۰.۲۴ دلار برای 4K
نسخه Batch: ۰.۰۶۷ دلار برای 1K/2K و ۰.۱۲ دلار برای 4K (پردازش غیرهمزمان)
آموزش تولید اولین تصویر با Nano Banana Pro
ابتدا بستههای مورد نیاز را نصب کنید:
pip install google-genai python-dotenv pillow
سپس با استفاده از پرامپتهای دقیق، تصاویر حرفهای بسازید. نمونه پرامپتها شامل موارد زیر است:
جزئیات سوژه (اشیا، رنگها، ترکیبها)
نورپردازی (نور طبیعی، ساعت طلایی، نور جانبی)
زاویه و مشخصات دوربین
سبک و طراحی (سینمایی، مینیمال، عکاسی حرفهای)
نمونه کد تولید تصویر:
from google import genai
from google.genai import types
from dotenv import load_dotenv
from PIL import Image
import os
load_dotenv()
client = genai.Client(api_key=os.getenv(“GOOGLE_API_KEY”))
response = client.models.generate_content(
model=”gemini-3-pro-image-preview”,
contents=”تصویر کهکشان کیهانی با ابرهای گازی بنفش و آبی و خوشههای ستارهای. نور افسانهای. سینمایی. نسبت تصویر 16:9.”,
config=types.GenerateContentConfig(
response_modalities=[“TEXT”, “IMAGE”],
image_config=types.ImageConfig(aspect_ratio=”16:9″, image_size=”1K”)
)
)
for part in response.parts:
if image := part.as_image():
image.save(“cosmic_base.png”)
ویرایش گفتگویی (Conversational Editing)
Nano Banana Pro امکان ویرایش تصاویر بدون تولید دوباره را فراهم میکند. مثال:
base_image = Image.open(“cosmic_base.png”)
chat = client.chats.create(
model=”gemini-3-pro-image-preview”,
config=types.GenerateContentConfig(
response_modalities=[“TEXT”, “IMAGE”],
image_config=types.ImageConfig(aspect_ratio=”16:9″, image_size=”1K”)
)
)
response = chat.send_message([
base_image,
“تغییر رنگ این سحابی به طیفهای نارنجی و قرمز بدون تغییر ساختار.”
])
for part in response.parts:
if image := part.as_image():
image.save(“cosmic_orange.png”)
ترکیب چند تصویر با Nano Banana Pro
این مدل قادر است تا ۱۴ تصویر مرجع را با هم ترکیب کرده و صحنههای پیچیده ایجاد کند:
تولید تصاویر مرجع (مثلاً دنبالهدار یا سنگ فضایی)
ترکیب با تصویر اصلی برای یک صحنه حماسی
چهار ویژگی برجسته Nano Banana Pro
نمایش متن خوانا: مناسب برای پوستر، وبسایت و UI/UX
کنترل استودیو: نور، زاویه دوربین و عمق میدان قابل تغییر
ثبات شخصیتها: حفظ هویت برند در صحنههای مختلف
دانش واقعی با Google Search: دقت اطلاعات در محتوای آموزشی و فنی
مقایسه Nano Banana Pro با نسخه پایه
دقت متن و هندسه: در پوسترها، لوگوها و تصاویر پیچیده بهتر عمل میکند
محتوای علمی و فنی: مانند مجموعه مندلبروت با دقت بیشتری تولید میشود
صرفهجویی در هزینه: ویرایش گفتگویی باعث کاهش نیاز به تولید دوباره میشود
نسخه پایه برای پروژههای شخصی مناسب است، اما برای کار حرفهای و تصاویر با متن دقیق، نسخه پرو پیشنهاد میشود.
نتیجهگیری
Nano Banana Pro به شما امکان تولید و ویرایش حرفهای تصاویر با قابلیتهای چندتصویری، ویرایش گفتگویی، نمایش متن دقیق و صحت اطلاعات واقعی را میدهد.
میتوانید با نسخه رایگان اپ Gemini شروع کنید و پس از آشنایی، از نسخه حرفهای برای پروژههای بزرگ استفاده کنید.
منبع: datacamp
























نظرات کاربران