15/06/2026
Framework 7 bước Agent càng chạy càng khôn👇
Hầu hết mọi người dùng AI Agent theo kiểu:
Chạy → thấy sai → sửa prompt → chạy lại → lại sai → sửa tiếp…
Agent không khôn lên vì bạn viết prompt hay hơn.
Nó khôn lên vì bạn xây cho nó một vòng lặp cải tiến liên tục.
Đây là framework 7 bước mà team SEOSONA đang áp dụng mỗi ngày:
—
Bước 1️⃣: Xây luồng & chạy.
Trước khi tối ưu bất cứ gì, phải cho nó CHẠY ĐƯỢC đã.
Xây một luồng Agent hoàn chỉnh dựa trên bản thiết kế PRD.
Ví dụ: Agent viết bài SEO. Input là brief + từ khóa + data sản phẩm. Output là bài viết 1500 từ có heading, có số liệu, có CTA.
Chạy 5 - 10 lần xem kết quả như nào. Bạn chưa cần sửa gì. Quan trọng là mình có output để đánh giá.
—
Bước2️⃣: Đánh giá đầu ra.
Chạy xong → phải chấm điểm.
2 cách: người chấm hoặc QA Agent chấm. Giai đoạn này nên là người chấm trước để xây bộ tiêu chí. Sau đó nạp tiêu chí vào QA Agent để nó chấm thay.
Chấm dựa trên gì? Checklist cụ thể. Không phải "hay" hay "dở."
Ví dụ checklist dùng cho bài content SEO:
✅Có đúng từ khóa target trong H1, H2 không?
✅Có số liệu cụ thể không? (không dùng từ "nhất", "số 1", "đáng kể"...)
✅Có thông tin độc quyền không? (thông tin mà top 10 Google chưa có)
✅Có đúng giọng brand guideline không?
✅Có CTA rõ ràng không?
✅Có sai thông tin sản phẩm/giá không?
=> 6 tiêu chí. Đạt 6/6 = pass. Dưới 5 = viết lại.
Đánh giá bằng người thì chậm và mỗi người một gu. QA Agent chấm thì nhanh và nhất quán 100%, lần nào cũng cùng tiêu chuẩn.
—
Bước 3️⃣: Ghi lại case tốt & tệ.
Đây là bước hầu hết mọi người bỏ qua. Và cũng là bước quan trọng nhất.
Bài xuất sắc → lưu lại làm "văn mẫu." Agent sau này viết sẽ tham chiếu mẫu này.
Bài tệ → lưu lại làm "bài tệ." Không xóa. Không bỏ qua. Ghi rõ: bài này sai ở đâu, sai vì gì.
Ví dụ chạy Agent viết 10 bài. 7 bài tốt. 3 bài tệ:
▶️ Bài 3: sai giá sản phẩm (dùng giá cũ, chưa cập nhật bảng giá mới)
▶️Bài 7: viết đúng nhưng giọng quá formal, không đúng brand
▶️Bài 9: bịa một tính năng không tồn tại
Ghi hết, cả bài lẫn lý do vì đây là nguyên liệu cho bước tiếp theo.
—
Bước4️⃣: Tìm điểm chung của các lỗi.
3 bài sai ở bước trên, có điểm chung gì không?
Nhìn kỹ:
▶️Bài 3 sai giá → Agent không có bảng giá mới nhất (thiếu RAG cập nhật)
▶️Bài 7 sai giọng → System instruction chưa đủ cụ thể về tone
▶️Bài 9 bịa tính năng → Agent không có catalog sản phẩm chi tiết (lại thiếu RAG)
2/3 lỗi liên quan đến DỮ LIỆU THIẾU hoặc CŨ. Không phải prompt sai.
Bạn có thể tự phân tích, hoặc cho AI phân tích hộ. Cho nó 10 ca lỗi, hỏi "tìm điểm chung" nó tìm ra nhanh hơn người.
—
Bước 5️⃣: Cập nhật tiêu chí đánh giá.
Checklist ban đầu có 6 tiêu chí. Sau khi phân tích 3 bài tệ, thêm:
✅Tiêu chí 7: Giá sản phẩm phải khớp với bảng giá cập nhật trong 7 ngày gần nhất
✅Tiêu chí 8: Mọi tính năng/mô tả sản phẩm phải có trong file catalog, không được suy luận
✅Checklist từ 6 → 8.
Tháng sau chạy thêm, phát hiện lỗi mới → thêm tiêu chí mới. 8 → 10 → 12 → 14.
Bộ tiêu chí dày lên, càng dày → càng ít lỗi.
—
Bước 6️⃣: Cập nhật kiến thức theo quy tắc 80/20.
Không phải lỗi nào cũng cần fix ngay. Ưu tiên:
✅20% lỗi nghiêm trọng (sai giá, bịa thông tin, sai chính sách) → fix ngay
✅80% lỗi nhẹ (giọng chưa đúng 100%, thiếu 1 hashtag, format hơi lệch) → fix dần
Cách fix: nạp thêm dữ liệu vào RAG.
▶️Lỗi sai giá → cập nhật bảng giá mới vào knowledge base.
▶️Lỗi sai giọng → bổ sung thêm ví dụ "đúng giọng" vào brand guideline.
▶️Lỗi bịa tính năng → nạp catalog sản phẩm chi tiết hơn.
Và một cái nữa mà ít người làm: nạp "kiến thức ngầm" của chuyên gia.
Kiến thức ngầm = thứ người giỏi nhất team bạn làm được nhưng không viết ra được.
Ví dụ viết bài SEO, đối tượng là chủ doanh nghiệp:
Người mới viết:
SEO là quá trình tối ưu website để tăng thứ hạng trên Google...
Người có kinh nghiệm sẽ viết:
Bạn có thể tăng traffic 200%, nhưng nếu không tạo ra doanh thu thì SEO vẫn là một khoản chi phí.
Tại sao? Vì người có kinh nghiệm biết rằng chủ doanh nghiệp quan tâm đến doanh thu trước, traffic sau.
👉 Kiến thức ngầm:
Khi viết cho chủ doanh nghiệp, hãy mở bài bằng vấn đề kinh doanh, không mở bằng định nghĩa SEO.
—
Bước 7️⃣: Nhật ký thay đổi (Changelog).
Mỗi lần sửa bất cứ gì, ghi lại.
Ngày. Sửa gì. Vì sao sửa. Kết quả sau khi sửa.
Ví dụ:
10/6: Cập nhật bảng giá Q3 vào RAG. Lý do: Agent dùng giá Q2 cho 2 bài tuần trước.
12/6: Thêm tiêu chí "không được suy luận tính năng sản phẩm" vào checklist QA. Lý do: bài 9 bịa tính năng.
14/6: Bổ sung 5 bài mẫu "đúng giọng brand" vào knowledge base. Lý do: 3/10 bài bị đánh giá "quá formal."
Điều này giúp gì?
Bạn biết hệ thống đã thay đổi bao nhiêu lần, ở đâu?
Khi có lỗi mới, tra lại xem có phải do thay đổi gần đây gây ra không?
Khi bàn giao cho người khác, họ hiểu lịch sử hệ thống ngay
Và hay nhất: bạn có thể đưa file changelog cho Agent, bảo nó tự bảo trì.
—
Thật ra, bạn không cần làm tuần tự. Làm bước 1 xong có thể nhảy sang bước 7 trước cũng được. Quan trọng là chạy vòng lặp: chạy → đánh giá → ghi → tìm lỗi → sửa → chạy lại.
Mỗi vòng, Agent tốt hơn một chút. Từ sai 40% → 20% → 10% → 5%.