ByteDance gây kinh ngạc cho thế giới video AI
Chào buổi sáng, những người đam mê AI. Các phòng thí nghiệm AI của Trung Quốc đang bùng nổ trong lĩnh vực video — và Seedance 2.0 của ByteDance có lẽ là cái tên ấn tượng nhất từ trước đến nay.
Với những bản thử nghiệm đang gây bão, thể hiện hàng loạt phong cách và tính năng vượt xa mọi công cụ hiện có, công ty mẹ của TikTok đang đưa ra một bằng chứng thuyết phục rằng bước nhảy vọt sáng tạo tiếp theo trong lĩnh vực video AI đang đến từ phương Đông.
Nội dung bản tin AI hôm nay:
Seedance 2.0 của ByteDance gây kinh ngạc cho thế giới video AI: Mô hình mới này không chỉ tạo video chân thực mà còn hỗ trợ đầu vào đa phương thức (hình ảnh, âm thanh, video) và có khả năng giữ nhất quán nhân vật cực tốt.
OpenAI chính thức bắt đầu hiển thị quảng cáo trong ChatGPT: Một bước ngoặt về mô hình kinh doanh; quảng cáo sẽ xuất hiện cho người dùng bản miễn phí và gói “Go” dựa trên ngữ cảnh trò chuyện.
Xây dựng bộ xử lý phản đối bán hàng bằng AI: Cách tận dụng trí tuệ nhân tạo để tối ưu hóa quy trình kinh doanh và chốt đơn hiệu quả hơn.
Waymo tận dụng Genie 3 để huấn luyện xe tự lái: Công ty xe tự lái của Alphabet sử dụng mô hình thế giới của Google để mô phỏng các tình huống giao thông hiếm gặp và nguy hiểm.
4 công cụ AI mới, quy trình làm việc từ cộng đồng, và nhiều nội dung khác.
1. Seedance 2.0 của ByteDance gây kinh ngạc cho thế giới video AI
Gã khổng lồ AI Trung Quốc – ByteDance – đang gây bão trên khắp các mạng xã hội với Seedance 2.0. Đây là mô hình mới đang trong giai đoạn thử nghiệm (beta) với các khung hình chuẩn điện ảnh, độ nhất quán cao và âm thanh đồng bộ được nâng cấp, cho thấy khả năng vượt xa các hệ thống hàng đầu hiện nay.
Các chi tiết cụ thể:
Khả năng xử lý đa dạng: Mô hình này được báo cáo là có thể xử lý các đầu vào dạng văn bản, hình ảnh, âm thanh và video. Các bài kiểm tra cho thấy kết quả đầu ra cực kỳ ấn tượng trên nhiều phong cách và trường hợp sử dụng khác nhau.
Tính năng kỹ thuật: Hệ thống sở hữu khả năng tự tạo âm thanh gốc (native audio), độ phân giải 2K và thời lượng video đầu ra 15 giây. Hiện tại, người dùng chỉ có thể trải nghiệm thông qua nền tảng video AI Jimeng của ByteDance.
Mô hình tạo ảnh mới: ByteDance cũng dường như đã phát hành bản xem trước của mô hình tạo ảnh Seedream 5.0 trên một số ứng dụng bên thứ ba — đây được xem là câu trả lời đối trọng với mô hình Nano Banana Pro.
Bối cảnh cạnh tranh: Sự ra mắt này diễn ra chỉ vài ngày sau khi đối thủ Kuaishou tung ra Kling 3.0, cho thấy các mô hình AI từ Trung Quốc đang tiến sát đến những giới hạn tiên tiến nhất (frontier) trong lĩnh vực video.
Tại sao điều này lại quan trọng: Các phòng thí nghiệm hàng đầu của Trung Quốc đang liên tục tung ra những mô hình video mới cực kỳ mạnh mẽ, và Seedance 2.0 dường như là cái tên tiếp theo tạo nên bước nhảy vọt. Với những ví dụ thực tế đầy thuyết phục như các cảnh chiến đấu mượt mà, phim hoạt hình, nội dung do người dùng sáng tạo (UGC) và đồ họa chuyển động, Seedance 2.0 có thể tạo ra sức ảnh hưởng tương tự như Veo, mang đến một làn sóng đột phá sáng tạo trên phạm vi rộng lớn hơn nhiều.
2. OpenAI chính thức bắt đầu hiển thị quảng cáo trong ChatGPT
OpenAI vừa chính thức bắt đầu thử nghiệm quảng cáo trong ChatGPT dành cho người dùng tại Mỹ thuộc phiên bản miễn phí và gói “Go” (8 USD/tháng). Đây là bước đi mà công ty đã cân nhắc trong nhiều tháng qua, và cũng chính là chủ đề mà đối thủ Anthropic đã dùng để “cà khịa” trong chiến dịch quảng cáo tại trận chung kết Super Bowl cuối tuần trước.
Các chi tiết cụ thể:
Cách thức hiển thị: Quảng cáo xuất hiện bên dưới các câu trả lời của chatbot và được nhắm mục tiêu dựa trên cuộc trò chuyện hiện tại, lịch sử chat, bộ nhớ (memory) và các tương tác quảng cáo trước đó.
Cam kết về tính khách quan: OpenAI nhấn mạnh rằng nội dung quảng cáo sẽ không ảnh hưởng đến câu trả lời của ChatGPT, nhằm “bảo vệ niềm tin mà người dùng đặt vào ứng dụng cho các tác vụ quan trọng và cá nhân”.
Lựa chọn cho người dùng: Người dùng bản miễn phí có thể chọn tắt hoàn toàn quảng cáo, nhưng việc này sẽ làm giảm số lượng tin nhắn được gửi mỗi ngày — một cách thức để thúc đẩy người dùng chuyển sang các gói trả phí.
Chi phí quảng cáo: Đợt thử nghiệm này được báo cáo là có mức giá tối thiểu 200.000 USD cho các nhà quảng cáo. Những tập đoàn marketing lớn như Omnicom đã nhanh chóng đặt chỗ cho khách hàng của mình.
Tại sao điều này lại quan trọng: Chúng ta thường nói rằng việc đưa quảng cáo vào AI giống như “đi trên tảng băng trôi” đầy rủi ro, nhưng OpenAI đã quyết định là bên tiên phong thử nghiệm cho toàn ngành. Mặc dù cách triển khai hiện tại có vẻ ổn, nhưng sự xâm nhập của các nhà tài trợ có thể làm thay đổi trải nghiệm của nhiều người đối với ChatGPT. Dù vậy, việc chấp nhận quảng cáo để đổi lấy quyền truy cập miễn phí vào trí tuệ nhân tạo tiên tiến là một sự đánh đổi khó có thể chối từ.
3. Xây dựng bộ xử lý phản đối bán hàng bằng AI
Trong hướng dẫn này, bạn sẽ học cách xây dựng một công cụ thực sự hữu ích từ các bản ghi chép (transcripts) cuộc gọi bán hàng đang tích tụ mỗi ngày. Đây là một quy trình đơn giản hàng tuần giúp biến các bản ghi đó thành một tài liệu tham khảo nhanh và tiện lợi.
Các bước thực hiện:
Tạo dự án ChatGPT (ChatGPT Project): Tạo một dự án mới có tên “Sales Objections” (Xử lý phản đối bán hàng). Tải lên một tệp văn bản liệt kê các dòng sản phẩm, giá cả và các ưu đãi cốt lõi của bạn để AI hiểu rõ bạn đang bán gì.
Thiết lập hướng dẫn (Instructions): Đi tới phần Cài đặt dự án (Project settings) và dán đoạn lệnh sau: “Hãy đọc các bản ghi chép đính kèm. Tạo một mẫu báo cáo hàng tuần. Đối với mỗi lời phản đối của khách hàng, hãy: Đánh số thứ tự, Nêu rõ lời phản đối, Cung cấp 3 ý chính mô tả ngữ cảnh, Liệt kê tên khách hàng tiềm năng đã đưa ra lời phản đối đó, và đưa ra 2 câu phản hồi ngắn gọn, sắc bén.”
Cập nhật hàng tuần: Mỗi tuần, hãy tải các bản ghi chép cuộc gọi vào dự án của bạn. Hãy đảm bảo chúng có ghi ngày tháng và tên khách hàng. Mở một luồng chat mới và yêu cầu AI tạo báo cáo.
Lưu trữ trên Notion: Mở một trang Notion trống. Tạo một “Toggle Heading” (Tiêu đề thu gọn) cho tuần đó (ví dụ: “Tuần ngày 9 tháng 2”). Sao chép nội dung ChatGPT vừa tạo và dán vào bên trong thanh thu gọn này.
Mẹo nâng cao (Pro tip): Kết nối Notion trực tiếp bên trong ChatGPT (Cài đặt → Ứng dụng đã kết nối/Connected Apps). Như vậy, ChatGPT có thể trực tiếp xem trang hiện tại của bạn và tham chiếu lại dữ liệu của các tuần trước đó để đưa ra phân tích sâu hơn.
4. Waymo tận dụng Genie 3 để huấn luyện xe tự lái
Waymo vừa giới thiệu “Waymo World Model” (Mô hình Thế giới Waymo), một hệ thống mô phỏng lái xe được xây dựng trên nền tảng Genie 3 của DeepMind. Hệ thống này có khả năng tạo ra các kịch bản siêu thực mà đội xe tự lái của công ty chưa từng gặp phải, nhằm giúp chúng đối phó với những tình huống hiếm gặp và khắc nghiệt nhất (edge cases).
Các chi tiết cụ thể:
Chuyển đổi dữ liệu thông minh: Mô hình này tiếp nhận kiến thức thị giác từ Genie 3 và chuyển đổi chúng thành các đầu ra đồng bộ giữa camera và cảm biến lidar, giúp “hình dung” ra những kịch bản mà xe thực tế chưa bao giờ nhìn thấy.
Tùy biến linh hoạt: Các kỹ sư có thể tái cấu trúc các cảnh quay bằng câu lệnh văn bản, dữ liệu lái xe đầu vào hoặc chỉnh sửa bố cục (như thay đổi thời tiết hoặc thêm chướng ngại vật) để kiểm tra các phản ứng trong tình huống “giả định”.
Khắc phục giới hạn: Waymo đã tìm ra cách giải quyết vấn đề bộ nhớ ngắn của Genie 3 bằng cách chạy các cảnh quay ở tốc độ gấp 4 lần, giúp kéo dài thời gian mô phỏng đủ để bao quát các tác vụ lái xe dài hơn.
Tại sao điều này lại quan trọng: Dữ liệu từ Google Street View đã giúp Waymo có lợi thế dẫn đầu trong việc lập bản đồ thế giới thực, nhưng các mô hình thế giới (world models) hiện nay có thể tạo ra những tình huống cực đoan mà dù có chạy bao nhiêu dặm đường thực tế cũng không thể có được. Việc Waymo sử dụng Genie là một ví dụ điển hình cho một trong những ứng dụng quan trọng nhất của mô hình thế giới: tạo dữ liệu mô phỏng để huấn luyện robot.
5. Các công cụ AI đang thịnh hành
💻 Codex App: Giao diện ứng dụng trên máy tính Mac của OpenAI, dùng để quản lý các trợ lý AI (agents).
🚀 Composer 1.5: Mô hình lập trình tự chủ (agentic coding) do Cursor tự phát triển vừa được cập nhật phiên bản mới.
🎧 Audiobooks: Bộ công cụ thuyết minh bằng AI của ElevenLabs dành riêng cho việc sản xuất sách nói.
⚙️ Context Engine MCP: Công cụ tìm kiếm ngữ nghĩa trong các trợ lý lập trình của Augment Code (sử dụng giao thức MCP).
Bạn cảm thấy thế nào về email hôm nay?
Phản hồi của bạn giúp chúng tôi cải thiện chất lượng nội dung!
🧠🧠🧠 Rất tuyệt vời
🧠🧠 Cũng ổn
🧠 Tệ lắm
Hẹn gặp mọi người ở email sau với AI Update và AI NTK.





