Cách sử dụng GPT Image 2 qua Y Build trong 5 phút (Hướng dẫn năm 2026)
OpenAI vừa ra mắt GPT Image 2 — mô hình hình ảnh mạnh mẽ nhất từ trước đến nay. Hướng dẫn này sẽ đi qua từng bước sử dụng trên Y Build: tạo ảnh đầu tiên, chỉnh sửa bằng ngôn ngữ tự nhiên, quy trình làm việc hàng loạt và kết hợp với các agent khác. Có gói miễn phí, không cần thẻ tín dụng.
Những gì bạn sẽ làm trong hướng dẫn này
Sau 5 phút, bạn sẽ hoàn thành:
- Tạo hình ảnh đầu tiên với GPT Image 2 qua Y Build
- Chỉnh sửa hình ảnh bằng ngôn ngữ tự nhiên ("làm cho bầu trời trở nên bão táp hơn")
- Chạy một loạt hình ảnh cho một trường hợp sử dụng thực tế
- Kết nối (chaining) với các agent khác (ví dụ: viết bài blog + tạo ảnh bìa)
Bước 1 — Đăng nhập (30 giây)
Đăng ký tại ybuild.ai. Gói miễn phí là vĩnh viễn, không cần thẻ tín dụng. Nếu bạn đã có tài khoản, chỉ cần đăng nhập.Bạn sẽ chuyển đến trang phòng (rooms). Nhấp vào "+ 新建群" (hoặc "New room" trong tiếng Anh) để tạo một phòng mới. Đặt tên bất kỳ — "Thử nghiệm hình ảnh" là một khởi đầu tốt.
Bước 2 — Tạo ảnh đầu tiên (60 giây)
Trong phòng mới, nhập:
@Designer Generate a hero image for a minimalist coffee shop website — warm afternoon light, a single pour-over setup on a wooden counter, shallow depth of field, space for headline text on the right third.
Nhấn gửi. Agent Designer sẽ tự động chọn GPT Image 2 (prompt chân thực), tạo ảnh ở độ phân giải mặc định 1024x1024 và đăng hình ảnh trực tiếp sau khoảng 5 giây.
Bạn sẽ thấy:
- Hình ảnh được tạo
- Mô hình được sử dụng (gpt-image-2)
- Chi phí (lượng credit đã tiêu thụ trong gói miễn phí)
- Nút lưu vào không gian làm việc (Save to workspace)
- Nút chỉnh sửa (Edit)
Tải xuống hoặc lưu vào không gian làm việc. Đó là lần tạo ảnh đầu tiên của bạn.
Bước 3 — Chỉnh sửa bằng ngôn ngữ tự nhiên (60 giây)
Nhấp vào "Edit" trên hình ảnh, hoặc chỉ cần trả lời trong luồng hội thoại:
@Designer Change the pour-over to a french press, keep everything else identical. Keep the warm light.
Tính năng chỉnh sửa tại chỗ của GPT Image 2 giúp bảo tồn mọi thứ không bị thay đổi rõ ràng. Bạn sẽ nhận lại cùng một khung cảnh, cùng ánh sáng, cùng quầy pha chế — nhưng với một bình french press thay thế.
Thử thêm một vài lần chỉnh sửa:
- "Make the scene brighter, like midday"
- "Add a small plant on the counter, behind the coffee"
- "Change the counter from wood to marble"
Mỗi lần chỉnh sửa là một phiên bản mới được lưu vào không gian làm việc của bạn. Nhấp vào lịch sử phiên bản để quay lại.
Bước 4 — Chỉ định mô hình một cách rõ ràng (30 giây)
Đôi khi bạn muốn một mô hình cụ thể. Đối với các tác phẩm có tính nghệ thuật, hãy chọn Midjourney hoặc Stable Diffusion; đối với ảnh sản phẩm chính xác, chọn GPT Image 2 Ultra; để tạo ảnh nhanh, chọn DALL-E 3.
Ép buộc sử dụng một mô hình bằng tiền tố:
@Designer gpt-image-2-ultra: [prompt] # Highest quality, slowest, highest cost
@Designer gpt-image-2-hd: [prompt] # Good balance
@Designer gpt-image-2: [prompt] # Standard (default)
@Designer dalle-3: [prompt] # Fast, casual
@Designer sd4: [prompt] # Stable Diffusion 4 self-hosted (Pro+)
Đối với hầu hết các trường hợp sử dụng, hãy để Designer tự chọn — nó sẽ điều phối dựa trên prompt.
Bước 5 — Quy trình làm việc hàng loạt (90 giây)
Từng hình ảnh đơn lẻ rất hữu ích; nhưng làm việc hàng loạt (batch) mới là nơi tiết kiệm thời gian thực sự. Giả sử bạn cần 10 hình ảnh sản phẩm chính cho một trang thương mại điện tử nhỏ.
Trong bất kỳ phòng nào, hãy dán:
@Virtuoso I need product hero images for these 10 items:
1. Ceramic cortado cup, 4oz, hand-thrown
2. Walnut cutting board, end-grain
3. Cast iron skillet, 10 inch, pre-seasoned
4. Linen tea towel, natural
5. Glass coffee server, 500ml
...
Generate each as a clean studio shot, white background, subtle shadow, 1024x1024. Save to /public/products/{slug}.jpg and commit.
Virtuoso sẽ tiếp nhận nhiệm vụ:
- Yêu cầu agent Designer tạo từng hình ảnh
- Kiểm tra tính nhất quán thông qua agent Reviewer
- Lưu các tệp vào không gian làm việc của bạn
- Commit chúng vào một nhánh (branch)
- Gửi lại bản tóm tắt kèm theo link PR
Tổng thời gian chờ: khoảng 8 phút cho 10 hình ảnh. Bạn không cần làm gì trong thời gian đó — các agent sẽ xử lý mọi việc ở chế độ chạy ngầm.
Bước 6 — Kết nối với các agent khác (60 giây)
Sức mạnh thực sự của Y Build là khả năng kết nối (chaining). Ví dụ: viết một bài blog và tạo ảnh bìa cho nó trong cùng một cuộc hội thoại.
@Conductor I want to write a blog post about "the best ways to organize a small kitchen" — 1200 words, 5 sections, targeting a US audience. Also generate a hero image that matches the tone.
Conductor sẽ ủy thác:
- Copywriter phác thảo bài đăng
- Designer tạo hình ảnh chính với GPT Image 2
- Reviewer kiểm tra cả hai trước khi phản hồi
Bạn sẽ nhận lại một bài đăng định dạng markdown + một ảnh bìa, đã được lưu vào không gian làm việc của bạn, sẵn sàng để xuất bản.
Nâng cao: duy trì tính nhất quán của thương hiệu
Nếu bạn tạo nhiều hình ảnh cho một dự án, hãy thiết lập hướng dẫn phong cách (style guide) cho toàn bộ dự án một lần:
@Conductor For this project, all images should be: warm color palette, slightly desaturated, film grain subtle, 35mm photography feel. Apply this to every future image.
Agent Designer sẽ thêm nội dung này vào mọi prompt cho đến khi bạn thay đổi. Tính nhất quán về hình ảnh thương hiệu của bạn sẽ được giữ vững qua hàng chục lần tạo ảnh mà không cần bạn phải chỉ định lại mỗi lần.
Giá cả trong Y Build
- Free: 10 lần tạo GPT Image 2 Standard/tháng + không giới hạn DALL-E 3
- Pro ($69/tháng): Không giới hạn Standard, 200 ảnh HD/tháng, 50 ảnh Ultra/tháng
- Max ($199/tháng): Không giới hạn tất cả các cấp độ bao gồm cả Ultra
Các câu hỏi thường gặp
Tôi có thể sử dụng khóa API OpenAI của riêng mình không?
Có. Trong Workspace → Settings → Integrations, hãy dán khóa OpenAI của bạn. Y Build sẽ sử dụng khóa của bạn để tạo hình ảnh và bạn thanh toán trực tiếp cho OpenAI (không có phí chênh lệch từ Y Build). Điều này hữu ích nếu bạn còn dư credit.
GPT Image 2 có hoạt động tốt cho thiết kế logo không?
Có thể. Nó có thể tạo ra các hình ảnh giống logo, nhưng thiết kế logo thực thụ cần đầu ra dạng vector. GPT Image 2 cung cấp cho bạn định dạng raster. Hãy sử dụng kết quả đầu ra làm nguồn cảm hứng, sau đó vẽ lại trong Figma hoặc yêu cầu agent Designer tạo mã SVG từ hình ảnh tham chiếu.
Tôi có thể lấy chất lượng 4K / Ultra không?
Có, trên các gói Pro và Max thông qua gpt-image-2-ultra (lên đến 4096x4096). Mỗi lần tạo Ultra mất khoảng 20-40 giây.
Làm cách nào để sử dụng hình ảnh này trong ứng dụng Next.js của tôi?
Y Build xuất hình ảnh dưới dạng các tệp tĩnh thông thường vào thư mục /public trong không gian làm việc của bạn. Hãy tham chiếu chúng như bất kỳ tài sản nào khác:
<Image src="/products/cortado-cup.jpg" width={600} height={600} alt="Ceramic cortado cup" />
Y Build có huấn luyện trên các prompt hoặc hình ảnh tôi tạo ra không?
Không. Hợp đồng của chúng tôi với OpenAI tuân theo các điều khoản API tiêu chuẩn của họ (không huấn luyện trên dữ liệu đầu vào/đầu ra của API). Prompt và hình ảnh của bạn vẫn là của bạn.
Chuyện gì xảy ra nếu tôi dùng hết hạn mức của gói miễn phí?
Agent Designer sẽ tự động chuyển sang DALL-E 3 cho các lần tạo ảnh còn lại trong tháng đó và thông báo cho bạn. Hoặc bạn có thể nâng cấp lên gói Pro để truy cập Standard không giới hạn.
Các bước tiếp theo
- Đăng ký: ybuild.ai
- Đọc GPT Image 2 so với các mô hình hình ảnh khác năm 2026 để chọn mô hình phù hợp
- Kiểm tra thông báo ra mắt GPT Image 2 để biết thêm chi tiết về khả năng của nó