Bản nâng cấp AI tạo video mới của Google

Biến ảnh thành video xây dựng thương hiệu cá nhân với Veo 3.1

Oct 18, 2025

Chào mừng bạn trở lại với AI Update. Google vừa ra mắt Veo 3, mô hình AI video nâng cấp của công ty — nhưng sau sự bùng nổ viral của Sora 2 từ OpenAI chỉ vài tuần trước, sự hào hứng có vẻ không còn giống như trước.

Với các tính năng chỉnh sửa mới và nâng cấp chung, Google đang nhắm mục tiêu vào các nhà làm phim và giới sáng tạo chuyên nghiệp thay vì các nền tảng nội dung lan truyền nhanh. Vấn đề đặt ra là gì? Trong nền kinh tế chú ý ngày nay, việc “hữu ích” có thể không quan trọng bằng việc “gây ấn tượng mạnh”.

Bản tin AI hôm nay:

Mô hình video Veo 3.1 được nâng cấp của Google
Anthropic ra mắt Claude 4.5 Haiku nhanh và giá rẻ
Biến ảnh thành video thương hiệu cá nhân với Veo 3.1
AI dựa trên Gemma của Google tìm ra phương pháp điều trị ung thư mới
4 công cụ AI mới, luồng công việc cộng đồng và nhiều thông tin khác ...và nhiều nội dung hấp dẫn khác.

1. Veo 3.1—Mô hình video AI nâng cấp của Google.

Google vừa giới thiệu Veo 3.1, mô hình tạo video mới tuyên bố có những cải tiến về chất lượng, độ chân thực, khả năng chuyển đổi ảnh thành video được nâng cấp, cùng một loạt tính năng chỉnh sửa mới nhắm đến các nhà làm phim và kiểm soát sáng tạo chuyên sâu.

Chi tiết nổi bật:

Veo 3.1 giờ đây chấp nhận tối đa ba ảnh tham chiếu để duy trì tính nhất quán của nhân vật/đối tượng qua nhiều cảnh quay.
Người dùng có thể cung cấp khung hình bắt đầu và kết thúc, Veo 3.1 sẽ tạo ra các chuyển cảnh mượt mà giữa hai khung hình đó, kèm theo âm thanh đồng bộ.
Khả năng mở rộng cảnh quay mới cho phép người dùng tạo các video dài tới một phút bằng cách thêm liên tục các phân đoạn khớp với clip trước đó.
Cả hai phiên bản tiêu chuẩn và tốc độ cao (fast versions) của 3.1 đều đang được triển khai trên toàn bộ hệ sinh thái của Google, bao gồm công cụ làm phim Flow, nền tảng Vertex AI và Gemini.

Sau khi Sora 2 nâng tầm video AI một cách gây sốt trên diện rộng chỉ vài tuần trước, Veo 3.1 không tạo ra cùng một sự phấn khích như vậy — bất chấp những gì các bảng so sánh hiệu suất có thể chỉ ra. Bản nâng cấp lớn hơn có lẽ nằm ở lĩnh vực chỉnh sửa, với các khả năng như mở rộng cảnh và khung hình bắt đầu/kết thúc, mang lại sự kiểm soát bổ sung cần thiết để nâng chất lượng sản phẩm lên một tầm cao mới.

2. Sự kiện GRC được mong chờ nhất năm: Tham gia VantaCon trực tuyến ngay

Hãy tham gia VantaCon vào ngày 19 tháng 11 tới. Tại sự kiện này, các lãnh đạo từ Vanta, Anthropic, 1Password, Sublime Security, và nhiều công ty khác sẽ cùng nhau giải quyết những thách thức lớn nhất mà các chuyên gia bảo mật đang đối mặt, đồng thời khám phá những cơ hội mới mở ra từ các công nghệ và xu hướng mới.

Những lợi ích bạn sẽ nhận được khi tham gia VantaCon:

Mở rộng mạng lưới: Kết nối với hơn 400 đồng nghiệp trong lĩnh vực bảo mật GRC (Quản trị, Rủi ro và Tuân thủ).
Học hỏi chuyên sâu: Tiếp thu các phương pháp hay nhất và kiến thức chuyên sâu từ các chuyên gia GRC hàng đầu trong ngành.
Thực hành kỹ năng: Cơ hội tham gia các phòng lab và hoạt động học tập thực tế để mài giũa bộ kỹ năng của bạn.

3. Anthropic ra mắt Claude Haiku 4.5: Mô hình nhanh, giá rẻ, hiệu năng cao

Anthropic vừa giới thiệu Claude Haiku 4.5, biến thể nhỏ nhất trong dòng mô hình mới nhất của họ. Đáng chú ý, mô hình này đạt hiệu suất tương đương với mô hình hàng đầu của hãng chỉ vài tháng trước, nhưng đi kèm với mức giá và tốc độ được cải thiện đáng kể.

Chi tiết đáng chú ý:

Mô hình mới này có khả năng lập trình sánh ngang với Claude Sonnet 4 (ra mắt hồi tháng 5), nhưng chỉ tính phí $1/một triệu token đầu vào, so với mức giá $3 của Sonnet.
Dù có kích thước nhỏ gọn, Haiku vượt trội hơn Sonnet 4 trên các thước đo như khả năng sử dụng máy tính, toán học và tác vụ công cụ (agentic tool use)— thậm chí còn tiệm cận cả GPT-5 ở một số bài kiểm tra.
Các doanh nghiệp có thể điều phối nhiều tác nhân (agent) Haiku hoạt động song song, trong đó mô hình Sonnet 4.5 (ra mắt gần đây) đóng vai trò điều phối viên cho các nhiệm vụ phức tạp.
Haiku 4.5 hiện đã có sẵn cho mọi cấp độ người dùng Claude (bao gồm cả người dùng miễn phí), và có thể sử dụng thông qua công cụ phát triển tác nhân Claude Code và API.

Với Haiku, giấc mơ về “trí tuệ quá rẻ để tính phí” vẫn đang đi đúng quỹ đạo. Bản phát hành mới nhất của Anthropic cho thấy nền kinh tế của ngành công nghiệp AI đang thay đổi nhanh chóng như thế nào, khi một mô hình nhỏ, chi phí thấp nay đã có thể đạt được hiệu năng từng đòi hỏi mức giá cao cấp chỉ vài tháng trước.

4. Biến ảnh thành video thương hiệu cá nhân với Veo 3.1

Trong hướng dẫn này, bạn sẽ học cách tạo các video xây dựng thương hiệu cá nhân chuyên nghiệp bằng cách sử dụng mô hình Veo 3.1 mới của Google trong công cụ Flow. Bạn sẽ chuyển đổi các ảnh tĩnh do AI tạo thành nội dung video hoàn chỉnh mà không cần tự quay phim.

Các bước thực hiện:

Tạo ảnh chân dung và bối cảnh: Tạo ảnh chân dung và không gian làm việc của bạn trong Google Gemini bằng các câu lệnh như: “ảnh người này [tải ảnh tham chiếu lên], mặc áo sơ mi denim thường ngày, nhìn hơi nghiêng sang phải” và “văn phòng hiện đại, nhìn ra thành phố, bàn làm việc tối giản”.
Thiết lập dự án trong Flow: Mở Google Flow, tạo dự án mới, chuyển từ chế độ “Text to Video” (Tạo video từ văn bản) sang “Ingredients to Video” (Tạo video từ nguyên liệu), sau đó tải cả hai hình ảnh vừa tạo lên.
Tạo cảnh đầu tiên: Đặt lệnh cho cảnh đầu tiên của bạn: “Sử dụng ảnh đã tải lên làm nhân vật tôi, đang ngồi ở bàn làm việc, mỉm cười nhìn vào camera trong khi nhâm nhi cà phê, sau đó gõ phím trên máy tính xách tay. Ánh sáng ấm áp buổi sáng, thêm nhạc acoustic nhẹ nhàng.”
Mở rộng cảnh quay: Nhấn vào “Add to Scene” (Thêm vào Cảnh), sau đó nhấn “+” để Extend (Mở rộng) với lệnh: “Tôi gõ xong, nhìn vào camera nói ‘Sẵn sàng cộng tác chưa? Gửi tin nhắn riêng cho tôi!’ Sau đó chuyển mờ sang lớp phủ văn bản với tiêu đề.”
Hoàn thiện và Xuất bản: Xem lại dòng thời gian, đảm bảo các chuyển cảnh giữa các clip diễn ra mượt mà, sau đó nhấp vào biểu tượng tải xuống để xuất video thương hiệu cá nhân hoàn chỉnh của bạn.

Mẹo chuyên nghiệp:

Sử dụng công cụ chỉnh sửa để chọn khu vực và chèn bất kỳ đối tượng nào vào trong video của bạn—điều này rất hoàn hảo để tạo video demo sản phẩm hoặc nội dung đào tạo mà không cần quay chụp thực tế.

5. AI của Delve biến RAG thành cơ hội kiếm tiền/tạo ra lợi nhuận khổng lồ

Công cụ AI đánh giá bảo mật hoàn toàn mới của Delve sử dụng kiến trúc GraphRAG tiên tiến để giúp bạn hoàn thành các quy trình kiểm tra bảo mật với độ chính xác tuyệt đối, được xây dựng bởi các chuyên gia AI đến từ Stanford và MIT.

Các tác nhân AI Delve có khả năng:

Thu thập chứng cứ, giải quyết các xung đột, và suy luận trên toàn bộ biểu đồ chính sách (policy graph) của doanh nghiệp bạn.
Thẩm vấn cơ sở hạ tầng và tự động soạn thảo các câu trả lời hoàn hảo (bulletproof responses).
Vượt qua các quy trình đánh giá từ các công ty thuộc danh sách Fortune 500 (F50), giúp tiết kiệm hàng chục giờ làm việc.

6. AI dựa trên mô hình Gemma của Google đã tìm ra phương pháp điều trị ung thư mới

Các nhà nghiên cứu từ Google và Đại học Yale vừa giới thiệu C2S-Scale 27B, một mô hình nền tảng—dựa trên dòng mô hình Gemma mã nguồn mở của Google—đã khám phá ra một cơ chế điều trị ung thư chưa từng được biết đến trước đây và được chứng minh có hiệu quả trên tế bào sống.

Chi tiết đáng chú ý:

Hệ thống AI C2S đọc dữ liệu tế bào như một ngôn ngữ, nắm bắt cách các tế bào riêng lẻ sẽ hoạt động và phản ứng với các phương pháp điều trị.
Các nhà nghiên cứu giao nhiệm vụ cho hệ thống tìm kiếm những hợp chất có thể làm cho khối u dễ nhận diện hơn với hệ thống miễn dịch, nhưng chỉ khi có các tín hiệu nhất định.
AI đã xác định được silmitasertib, một loại thuốc hiện có nhưng trước đây chưa từng được liên kết với việc giúp hệ thống miễn dịch phát hiện tế bào ung thư.
Các thử nghiệm trong phòng thí nghiệm đã xác nhận dự đoán của AI, cho thấy sự kết hợp thuốc này làm cho các tế bào khối u dễ bị hàng rào miễn dịch phát hiện hơn khoảng 50%.

Những khám phá “độc đáo” từ các hệ thống AI đang bắt đầu xuất hiện — điều mà nhiều nhà hoài nghi từng cho là bất khả thi. Khi Google cũng phát hiện ra rằng “các mô hình sinh học tuân theo các quy luật mở rộng rõ ràng” (biological models follow clear scaling laws), chúng ta có thể đang bước vào một kỷ nguyên tiến bộ khoa học vô cùng đột phá khi các mô hình tiếp tục phát triển lớn hơn và có năng lực hơn.

🛠️ Các Công Cụ AI Đang Thịnh Hành

💨 Claude 4.5 Haiku - Mô hình mới nhỏ gọn, tiết kiệm chi phí của Anthropic.
🎥 Veo 3.1 - Mô hình tạo video được nâng cấp của Google.
📽️ Flow - Công cụ làm phim của Google, bổ sung khả năng kiểm soát nghệ thuật mới.
🎨 MAI-Image-1 - Mô hình tạo hình ảnh nội bộ đầu tiên của Microsoft.

📰 Tin Tức AI Khác Trong Ngày

MIT giới thiệu Mô hình Ngôn ngữ Đệ quy (RLM), một kỹ thuật cho phép các mô hình xử lý ngữ cảnh dài bằng cách tự gọi lại chính chúng. Một mô hình GPT-5 mini sử dụng RLM đã đạt hiệu suất vượt trội 114% so với GPT-5 trên các bài kiểm tra ngữ cảnh dài.
Apple công bố chip M5, với các nâng cấp tập trung vào AI, bao gồm bộ xử lý chuyên dụng giúp các tác vụ AI nhanh hơn gấp 4 lần trên các dòng sản phẩm của hãng.
Runway giới thiệu “Apps”, một bộ công cụ chỉnh sửa video tinh gọn, với các tính năng như xóa đối tượng, quay lại cảnh sản phẩm (product reshoots), thêm hội thoại, và nhiều tính năng khác.
Báo cáo An toàn AI Quốc tế đã cung cấp “Cập nhật Chính lần thứ Nhất” cho báo cáo năm 2025 của mình, cho biết các vấn đề về hiệu suất, mức độ áp dụng và thiếu giám sát đang làm tăng nguy cơ an toàn của AI.
Meta công bố kế hoạch xây dựng một trung tâm dữ liệu tối ưu hóa cho AI mới trị giá $1,5 tỷ USD với công suất 1GW tại El Paso. Đây là trung tâm dữ liệu thứ 29 của công ty và thứ ba tại Texas.
OpenAI mở rộng gói dịch vụ giá rẻ ChatGPT Go sang các khu vực mới, hiện đã có mặt tại 89 quốc gia.

Bạn cảm thấy thế nào về email hôm nay?

Phản hồi của bạn giúp chúng tôi cải thiện chất lượng nội dung!

🧠🧠🧠 Rất tuyệt vời

🧠🧠 Cũng ổn

🧠 Tệ lắm

Hẹn gặp mọi người ở email sau với AI Update và AI NTK.

AI Update

Discussion about this post

Ready for more?