23/07/2025
Quá Điên Rồ !
Mình đã xem hết buổi RA MẮT CHATGPT AGENT vào rạng sáng nay của Open AI và đây là cảm nhận của mình, quá " Wow" !
Rõ ràng anh em mình không chỉ muốn AI làm việc nhỏ lẻ, mà còn mong công cụ AI linh hoạt, có quyền kiểm soát máy tính , thực thi chuỗi tác vụ phức tạp theo yêu cầu (làm, tự tra cứu, tương tác web, tạo tài liệu…).
Mình nhớ OpenAI từng ra mắt hai agent riêng biệt:
-Deep Research: Nghiên cứu chuyên sâu, tổng hợp báo cáo chất lượng cao từ Internet.
- Operator: Thực hiện thao tác online như đặt chỗ, gửi email, điều hướng giao diện web.
Vậy thực tế cái anh em cần : Muốn một agent “all-in-one”: biết tra cứu sâu, thao tác linh hoạt, giải quyết bài toán thực tế từ A-Z.
Chính xác là vậy! Một con AI có thể chơi hết mọi loại công việc
🔥 Mở đầu buổi giới thiệu, mình thực sự chạm vào sự phấn khích của team: “Chúng tôi xây dựng ChatGPT Agent không chỉ để nó 'suy nghĩ' mà còn phải biết 'hành động' – dùng máy tính riêng, thao tác web, chạy terminal, tạo file, tự tra cứu, và phối hợp các công cụ như một ‘con người’ thực thụ!”.
🎯 Vậy Agent mới này có gì nổi bật?
Được cấp quyền sử dụng “máy tính ảo riêng”, tích hợp đủ loại “vũ khí”:
• Text browser: Quét, đọc hàng chục trang thông tin với tốc độ ánh sáng, tổng hợp dữ liệu như một chuyên gia nghiên cứu (giống Deep Research).
• Visual browser: Thao tác giao diện web thật sự, bấm chuột, kéo thả, điền form, đặt vé – như "tay chân" của bạn trên mạng (đỉnh cao của Operator).
• Terminal: Viết & chạy code trực tiếp, phân tích file (thậm chí là Excel/Slides nâng cao), truy cập API tích hợp các nền tảng Google Drive, Calendar, GitHub… (bạn cho phép thì truy cập!).
• Image Gen API: Tự tạo hình ảnh, minh hoạ slide cực xinh.
Tư duy chọn công cụ thông minh:
-Đào tạo bằng reinforcement learning cho phép AI không chỉ biết dùng mà còn biết... chọn đúng "vũ khí" tuỳ hoàn cảnh, ví dụ tìm nhà hàng sẽ vừa so sánh, vừa đặt chỗ, vừa check ảnh real, vừa xử lý form booking.
Trao quyền điều khiển & hợp tác cho người dùng:
Bạn hoàn toàn có thể:
• Ngắt giữa chừng để bổ sung/giao việc mới
• Được AI hỏi lại, xác nhận khi có bước quan trọng (ví dụ gửi mail, giao dịch tài chính…)
• “Take over” bất cứ lúc nào để thao tác tay nếu thích an toàn (nhất là khi nhập dữ liệu nhạy cảm).
😍 Đoạn demo siêu thực tế: Chỉ bằng 1 prompt khá dài (“lên plan đi đám cưới bạn, tìm outfit chuẩn dresscode, đặt khách sạn, tư vấn quà tặng…”) – Agent tự động:
-Xác định địa điểm, tra thời tiết, lọc dresscode, so sánh suit/giày, bật browser để check web thời trang – rồi đề xuất trực tiếp.
-Mở booking.com, check phòng khách sạn trống, giá cả, lưu lại link...
-Tư vấn quà, tạo file tổng hợp và đưa ra hướng dẫn tiếp theo (có cả tuỳ chọn “tôi tự bấm mua” hoặc “cho agent tự xử lý tiếp”!)
-Quá trình “multitask” linh hoạt, kể cả bạn bổ sung task khác (mua thêm sticker, tìm thêm giày khác size...), Agent đều tiếp nhận và đan xen thực thi các nhiệm vụ.
⚡ Một điểm thú vị:
-Agent vừa có thể “collab” với bạn (team work đúng nghĩa), vừa tự động nhận ra khi gặp lỗi hay vướng mắc, chủ động hỏi lại hoặc xin phép xác nhận.
-Hệ thống kiểm soát rủi ro được đặt lên cao nhất: Luôn có lớp giám sát chủ động can thiệp khi phát hiện nghi vấn lừa đảo/phishing, cũng như cảnh báo tối đa cho người dùng về bảo mật, không tự động nhập liệu nhạy cảm thay bạn (ví dụ thẻ tín dụng).
Anh em nghĩ sao?