Google ra mắt mô hình AI mới, tạo bước ngoặt trong chỉnh sửa hình ảnh.
Chào buổi sáng, những người đam mê AI. Thế giới AI đã bị ám ảnh trong nhiều tuần với một mô hình bí ẩn xuất hiện bất ngờ trong quá trình thử nghiệm để phá vỡ bảng xếp hạng chỉnh sửa hình ảnh và giờ đây, nano-banana đã chính thức xuất hiện.
Google vừa tiết lộ hệ thống được đánh giá cao này với tên gọi Gemini 2.5 Flash Image, và khả năng chỉnh sửa nhiều bước trong khi vẫn giữ nguyên mọi chi tiết của nó có thể sẽ khơi mào làn sóng sáng tạo AI lan tỏa tiếp theo.
Trong bản tóm tắt AI hôm nay:
- Google Flash Image 2.5 đưa chỉnh sửa AI lên một tầm cao mới
- Anthropic thử nghiệm Claude cho trình duyệt agentic
- Video tiếp thị nhanh chóng với Veo 3 của Gemini
- Anthropic tiết lộ cách giáo viên sử dụng AI
- 4 công cụ AI mới, quy trình làm việc cộng đồng và hơn thế nữa
1. Google Flash Image 2.5 đưa công nghệ chỉnh sửa AI lên một tầm cao mới
Google vừa ra mắt Gemini Flash 2.5 Image (còn được gọi là nano-banana trong thử nghiệm), một mô hình AI mới có khả năng chỉnh sửa hình ảnh chính xác, nhiều bước, giữ nguyên hình ảnh nhân vật đồng thời cho phép người dùng kiểm soát sáng tạo hơn qua nhiều thế hệ.
- Mô hình này đã gây sốt với tên gọi "nano-banana" trong quá trình thử nghiệm, vươn lên vị trí số 1 trên bảng xếp hạng Chỉnh sửa Hình ảnh của LM Arena với khoảng cách rất lớn so với Flux-Kontext đứng thứ 2.
- Flash 2.5 Image hỗ trợ chỉnh sửa nhiều lần, cho phép người dùng tạo lớp thay đổi mà vẫn duy trì tính nhất quán trong suốt quá trình chỉnh sửa.
- Mô hình này cũng có thể xử lý việc pha trộn hình ảnh, áp dụng và kết hợp các kiểu dáng trên các cảnh và đối tượng, v.v., tất cả đều sử dụng lời nhắc ngôn ngữ tự nhiên.
- Nó cũng sử dụng lý luận đa phương thức và kiến thức về thế giới, đưa ra các lựa chọn chiến lược (như thêm cây phù hợp với bối cảnh) trong suốt quá trình.
- Mô hình này có giá 0,039 đô la/hình ảnh thông qua API và trong Google AI Studio, rẻ hơn một chút so với mô hình gpt-image của OpenAI và mô hình Flux-Kontext của BFL.
Ý nghĩa: AI vẫn chưa sẵn sàng thay thế quy trình làm việc kiểu Photoshop, nhưng mô hình mới của Google đưa chúng ta tiến gần hơn đến việc thay thế chỉnh sửa truyền thống. Với khả năng đồng nhất nhân vật và bảo toàn hình ảnh ở cấp độ tiếp theo, Flash Image AI có thể tạo nên cơn sốt theo phong cách Studio Ghibli cho Gemini và đồng thời tạo ra làn sóng ứng dụng lan truyền.
2. Tiết kiệm hơn 10 giờ mỗi tuần với trợ lý cá nhân AI
Đừng chìm đắm trong đống công việc và hãy bắt đầu phân công công việc như những người làm việc hiệu quả hàng đầu, những người sử dụng AI để xử lý 80% công việc thường ngày. Bộ công cụ miễn phí của HubSpot cung cấp chính xác các mẫu, lời nhắc và hệ thống mà hơn 10.000 chuyên gia sử dụng để hoàn thành công việc cả ngày trước giờ nghỉ trưa.
Bộ công cụ Trợ lý AI bao gồm:
- "Trung tâm Chỉ huy Trợ lý AI" sẵn sàng sử dụng để quản lý tất cả các công cụ AI của bạn
- Hướng dẫn triển khai từng bước để thành thạo việc phân công công việc AI trong vòng chưa đầy 60 phút
- Công cụ tính toán ROI tích hợp để theo dõi thời gian tiết kiệm được và mức tăng năng suất của bạn
- Lời nhắc và mẫu nâng cao để biến ChatGPT thành đối tác năng suất 24/7
- Tải xuống Bộ công cụ Trợ lý AI miễn phí của bạn ngay bây giờ.
3. Thử nghiệm nhân chủng Claude cho duyệt tác nhân
Anthropic đã giới thiệu tiện ích mở rộng "Claude dành cho Chrome" trong quá trình thử nghiệm để cung cấp cho trợ lý AI khả năng kiểm soát trình duyệt của người dùng, nhằm mục đích nghiên cứu và giải quyết các vấn đề bảo mật đã ảnh hưởng đến các trình duyệt và nền tảng hỗ trợ AI khác.
- Tiện ích mở rộng Chrome đang được thử nghiệm thông qua danh sách chờ dành riêng cho 1.000 người đăng ký Claude Max trong bản xem trước giới hạn.
- Anthropic cho biết việc chèn lệnh nhắc nhở là mối lo ngại chính với trình duyệt agent, trong đó Claude sử dụng quyền và các biện pháp giảm thiểu an toàn để giảm thiểu lỗ hổng.
- Brave đã phát hiện ra các vấn đề chèn lệnh nhắc nhở tương tự trong trình duyệt agent Comet của Perplexity, với các lệnh độc hại có thể được chèn vào nội dung web.
- Tiện ích mở rộng này cho thấy những cải tiến về an toàn so với Computer Use đã được Anthropic phát hành trước đó, một công cụ agent ban đầu có khả năng hạn chế.
Ý nghĩa: Trình duyệt agent vẫn còn trong giai đoạn sơ khai, nhưng những phát hiện và sự cố gần đây của Anthropic cho thấy bảo mật cho các hệ thống này vẫn đang trong quá trình hoàn thiện. Việc chuyển sang phần mở rộng là một sự tương phản thú vị so với các nền tảng độc lập như Comet và Dia, giúp dễ dàng thêm thanh bên cho những người trung thành với trình duyệt phổ biến nhất.
4. Video tiếp thị nhanh chóng với Veo 3 của Gemini
Trong hướng dẫn này, bạn sẽ học cách sử dụng Veo 3 của Gemini để tạo các clip tiếp thị ngắn từ các lời nhắc văn bản hoặc hình ảnh đơn giản — hoàn hảo để tạo nội dung chiến dịch mà không cần đội ngũ video.
Hướng dẫn từng bước:
- Truy cập Gemini và chọn "Công cụ" → "Video với Veo"
- Xây dựng bản tóm tắt bằng cách kéo tham chiếu hình ảnh hoặc nhập mô tả với các cảnh rõ ràng và các yếu tố "phải hiển thị"
- Sử dụng cấu trúc lời nhắc này: "Tạo video [sản phẩm]. Chủ đề: [thông điệp]. Cảnh 1: [mô tả]. Cảnh 2: [chuyển cảnh]. Phải hiển thị: [yếu tố chính]"
- Gửi và chờ kết xuất (Lưu ý: Giới hạn ~2 video mỗi ngày đối với gói Pro)
- Xuất sang Canva hoặc trình chỉnh sửa của bạn để hoán đổi văn bản, thêm nhạc có bản quyền và cắt cho các nền tảng khác nhau (9:16, 1:1, 16:9)
Mẹo chuyên nghiệp: Hãy sử dụng các thuật ngữ chuyển cảnh rõ ràng như "whip pan" hoặc "match cut" trong lời nhắc — Veo đề cao ngôn ngữ điện ảnh cụ thể hơn là mô tả mơ hồ.
5. Tham gia cùng chúng tôi tại Hội nghị thượng đỉnh Retool ở SF
Vào ngày 7 tháng 10, Retool sẽ tiếp quản SFJAZZ cho một sự kiện kéo dài một ngày với nhiều buổi thảo luận sôi nổi, trải nghiệm thực tế và giao lưu với các nhà phát triển Retool khác.
Tại Hội nghị Thượng đỉnh Retool, bạn có thể mong đợi:
- Các buổi tọa đàm chính về AI và phát triển ứng dụng
- Các buổi đào tạo với đội ngũ Retool
- Buổi trò chuyện thân mật với Giám đốc điều hành Stripe, Patrick Collison
- Một số tin tức thú vị về sản phẩm Retool
Đăng ký tham dự Hội nghị Thượng đỉnh Retool và nhận ưu đãi giảm giá 50% với mã RETOOL50.
6. Anthropic tiết lộ cách giáo viên sử dụng AI
Anthropic vừa công bố một báo cáo mới phân tích 74.000 cuộc trò chuyện từ các nhà giáo dục về Claude, phát hiện ra rằng các giáo sư chủ yếu sử dụng AI để tự động hóa công việc hành chính, trong khi việc sử dụng AI để chấm điểm một chủ đề gây tranh cãi.
- Các nhà giáo dục thường sử dụng Claude để thiết kế chương trình giảng dạy (57%), tiếp theo là hỗ trợ nghiên cứu học thuật (13%) và đánh giá bài tập của sinh viên (7%).
- Các giáo sư cũng xây dựng các công cụ tùy chỉnh với Claude’s Artifacts, từ phòng thí nghiệm hóa học tương tác đến bảng chấm điểm tự động và bảng điều khiển trực quan.
- AI đã được sử dụng để tự động hóa các tác vụ lặp đi lặp lại (lập kế hoạch tài chính, lưu trữ hồ sơ), nhưng mức độ tự động hóa thấp hơn được ưu tiên cho các lĩnh vực như giảng dạy và tư vấn.
- Chấm điểm là vấn đề gây tranh cãi nhất, với 49% các cuộc trò chuyện đánh giá cho thấy mức độ tự động hóa cao mặc dù được đánh giá là khả năng yếu nhất của AI.
Ý nghĩa: Việc học sinh sử dụng AI trong lớp học là một điều chỉnh khó khăn đối với hệ thống giáo dục, nhưng nghiên cứu này cung cấp một số hiểu biết sâu sắc hơn về cách AI đang được sử dụng ở phía bên kia bàn làm việc. Với việc áp dụng và tăng tốc AI vẫn đang tăng lên, việc sử dụng và chấp nhận AI có thể sẽ khác nhau rất nhiều giữa các lớp học.
7. Các công cụ AI thịnh hành
🍌 Gemini 2.5 Flash Image - Mô hình chỉnh sửa ảnh SOTA mới của Google
🎬 Wan2.2-S2V - AI chuyển giọng nói thành video mã nguồn mở với khả năng âm thanh
🗣️ Google Dịch - Bản dịch trực tiếp mới hỗ trợ AI cho hơn 70 ngôn ngữ
🎨 Adobe Firefly - Nền tảng sáng tạo AI, hiện đã tích hợp Gemini 2.5 Flash Image
📰 Mọi thứ khác về AI hiện nay
Hai tập đoàn truyền thông lớn của Nhật Bản là Nikkei và Asahi Shimbun đã đệ đơn kiện chung chống lại Perplexity, một ngày sau khi công ty này ra mắt chương trình chia sẻ doanh thu cho các nhà xuất bản.
Đệ nhất phu nhân Hoa Kỳ Melania Trump đã công bố Thử thách AI Tổng thống, một cuộc thi toàn quốc dành cho học sinh từ mẫu giáo đến lớp 12 để tạo ra các giải pháp AI cho các vấn đề trong cộng đồng của họ.
Google đã giới thiệu các bản nâng cấp AI mới cho nền tảng Google Dịch, bao gồm bản dịch trực tiếp trên màn hình cho hơn 70 ngôn ngữ và các công cụ học ngôn ngữ tương tác.
Các nhà nghiên cứu tại Stanford đã công bố một báo cáo mới về tác động của AI lên thị trường lao động, cho thấy số lượng việc làm mới vào nghề thuộc các ngành nghề "tiếp xúc với AI" đã giảm 13%.
AI2 đã ra mắt Asta, một hệ sinh thái mới gồm các công cụ hỗ trợ nghiên cứu khoa học, bao gồm trợ lý nghiên cứu, khung đánh giá và các công cụ khác.
Scale AI đã công bố một hợp đồng mới trị giá 99 triệu đô la từ Bộ Quốc phòng Hoa Kỳ, nhằm mục đích tăng cường việc áp dụng AI trên toàn Quân đội Hoa Kỳ.
Bạn cảm thấy thế nào về email hôm nay?
Phản hồi của bạn giúp chúng tôi cải thiện chất lượng nội dung!
🧠🧠🧠 Rất tuyệt vời
🧠🧠 Cũng ổn
🧠 Tệ lắm
Hẹn gặp mọi người ở email sau với AI Update và AI NTK.