DeepSeek lại khiến giới công nghệ "dậy sóng".

Dec 21, 2025

Chào buổi sáng, những người đam mê AI. Công ty khởi nghiệp DeepSeek của Trung Quốc đã làm chấn động thế giới AI với việc phát hành chip R1 hồi đầu năm nay, gây xáo trộn thị trường và làm dấy lên các cuộc thảo luận về việc siết chặt kiểm soát chip tại Mỹ.

Giờ đây, Whale đã trở lại với một màn trình diễn hoành tráng, tung ra hai mẫu mới cạnh tranh với GPT-5 và Gemini 3 Pro, công khai mã nguồn của chúng và định giá chỉ bằng một phần nhỏ so với giá của các đối thủ. Đột nhiên, công nghệ AI tiên tiến chưa bao giờ có giá cả phải chăng đến thế.

Trong bản tin tổng hợp về AI hôm nay:

Các mẫu máy dò kim loại mới của DeepSeek, Gemini-3 Pro, đang cạnh tranh với GPT-5.
Runway dẫn đầu bảng xếp hạng video với điểm số 4.5.
Tạo ra các chiến dịch tiếp thị đúng với thương hiệu cùng Pomelli.
Mô hình video đa năng của Kling dành cho việc tạo và chỉnh sửa video.
4 công cụ AI mới, quy trình làm việc cộng đồng và nhiều hơn nữa

1. Các mẫu máy dò kim loại mới của DeepSeek, Gemini-3 Pro, đang cạnh tranh với GPT-5.

Tóm tắt: Công ty khởi nghiệp AI DeepSeek của Trung Quốc vừa phát hành V3.2 và V3.2-Speciale, hai mô hình suy luận có hiệu năng ngang ngửa với các mô hình tiên tiến nhất hiện nay như GPT-5 và Gemini 3 Pro — đồng thời giảm chi phí và vẫn đảm bảo tính khả dụng theo giấy phép mã nguồn mở.

Thông tin chi tiết:

Phiên bản V3.2 đạt hoặc gần bằng GPT-5, Sonnet 4.5 và Gemini 3 Pro trong các bài kiểm tra về toán học, sử dụng công cụ và lập trình, trong khi Speciale nặng hơn lại vượt trội hơn ở một số lĩnh vực.
Biến thể Speciale đã đạt điểm số huy chương vàng tại Kỳ thi Olympic Toán học và Tin học Quốc tế năm 2025, đồng thời xếp hạng thứ 10 chung cuộc tại IOI.
Giá của V3.2 là 0,28 đô la phí đầu vào / 0,42 đô la phí đầu ra cho mỗi 1 triệu token, chỉ bằng một phần nhỏ so với Gemini 3 Pro (2 đô la / 12 đô la), GPT-5.1 (1,25 đô la / 10 đô la) và Sonnet 4.5 (3 đô la / 15 đô la).
Cả hai mô hình tham số 685B đều được phát hành theo giấy phép MIT, với các trọng số có sẵn trên Hugging Face để bất kỳ ai cũng có thể tải xuống.

Tầm quan trọng: Phiên bản R1 của DeepSeek đã gây chấn động thị trường và làm dấy lên các cuộc thảo luận về kiểm soát xuất khẩu chip của Mỹ, và phiên bản V3.2 tiếp theo cho thấy phòng thí nghiệm Trung Quốc này không phải là hiện tượng nhất thời — họ đã công khai mã nguồn một mô hình với hiệu năng vượt trội với mức giá giảm mạnh. Đối với các phòng thí nghiệm của Mỹ đang tính phí API cao ngất ngưởng, áp lực phải biện minh cho khoảng cách giá đó giờ đây trở nên gay gắt hơn rất nhiều.

2. Runway dẫn đầu bảng xếp hạng video với điểm số 4.5.

Tóm tắt: Runway vừa phát hành Gen-4.5, một mô hình video AI mới được cho là sẽ mở ra “một kỷ nguyên mới cho việc tạo video”, vượt trội so với các tiêu chuẩn và thể hiện hiệu suất mạnh mẽ về độ chân thực, chuyển động và khả năng kiểm soát sáng tạo.

Thông tin chi tiết:

Phiên bản 4.5 đã vươn lên vị trí dẫn đầu bảng xếp hạng Chuyển văn bản thành video của Artificial Analysis, sau khi gây được tiếng vang lớn với tên mã “Whisper Thunder” trong quá trình thử nghiệm.
Runway cho biết Gen-4.5 xử lý vật lý, động lực học chất lỏng và chuyển động của con người một cách tự nhiên hơn, với các chi tiết như tóc và vải vẫn nhất quán trong suốt các khung hình.
Phiên bản 4.5 có thể xử lý nhiều phong cách khác nhau, nhưng đặc biệt xuất sắc trong việc tạo ra hình ảnh điện ảnh/chân thực — Runway cho biết sản phẩm đầu ra “không thể phân biệt được với cảnh quay thực tế”.
Mẫu xe này cũng được đặt tên mã là ‘David’, với người đồng sáng lập Cristobal Valenzuela so sánh thứ hạng của công ty nhỏ này với chiến thắng ‘David chống lại Goliath’.

Tầm quan trọng: Runway đã đưa AI vào quy trình làm việc sáng tạo chuyên nghiệp, và phiên bản 4.5 dường như là phiên bản gần nhất với khả năng điện ảnh cần thiết để được áp dụng rộng rãi trong Hollywood. Mặc dù bước tiến tiếp theo là tạo ra các thế hệ video dài hơn và đồng bộ âm thanh/lời thoại tốt hơn nữa, nhưng sự cải thiện qua từng năm về video AI thực sự đáng kinh ngạc.

3. Tạo ra các chiến dịch tiếp thị đúng với thương hiệu cùng Pomelli.

Tóm tắt: Trong hướng dẫn này, bạn sẽ học cách sử dụng Pomelli (của Google Labs và DeepMind) để tự động tạo nhận diện thương hiệu cho doanh nghiệp của bạn và tạo ra các chiến dịch tiếp thị phù hợp với thương hiệu với các mẫu thiết kế sẵn có.

Từng bước một:

Hãy truy cập Pomelli, nhấp vào “Bắt đầu nào”, nhập URL trang web của bạn - Pomelli sẽ quét và trích xuất màu sắc, phông chữ, khẩu hiệu, giọng điệu và các yếu tố nhận diện sản phẩm.
Chỉnh sửa phần tóm tắt “DNA doanh nghiệp” của bạn bằng cách điều chỉnh màu sắc, giá trị và nội dung sao cho phù hợp với tầm nhìn thương hiệu - tất cả các trường đều có thể tùy chỉnh.
Hãy nhập lệnh cho công cụ tạo chiến dịch: “Tạo một chiến dịch Halloween vừa đáng sợ vừa tử tế”, và xem xét ba biến thể như “Tặng họ điều gì đó tốt đẹp” hoặc “Tự thưởng cho bản thân, không có trò đùa nào cả”.
Trong trình chỉnh sửa sáng tạo, bạn có thể thay đổi tiêu đề, văn bản, phông chữ, màu sắc, điều chỉnh kích thước cho các vị trí khác nhau, sử dụng “Sửa bố cục” để tự động sắp xếp lại các phần tử và thêm lời kêu gọi hành động.

Mẹo hay: Hãy nhớ kiểm tra tỷ lệ chuyển đổi của các mẫu quảng cáo do Pomelli tạo ra so với các mẫu quảng cáo trước đây của bạn.

4. Mô hình video đa năng của Kling dành cho việc tạo và chỉnh sửa video.

Tóm tắt: Công ty khởi nghiệp Kuaishou của Trung Quốc đã ra mắt Kling O1, một hệ thống video AI mới xử lý cả việc tạo và chỉnh sửa video trong một mô hình duy nhất — cho phép người dùng tạo clip, thay đổi nhân vật, thực hiện chỉnh sửa chi tiết và định hình lại cảnh quay trong một giao diện duy nhất.

Thông tin chi tiết:

O1 chấp nhận tối đa bảy đầu vào cùng lúc, có khả năng diễn giải hình ảnh, video, đối tượng và văn bản — với đầu ra trong khoảng 3-10 giây.
Người dùng có thể chỉnh sửa cảnh quay hiện có bằng các lệnh văn bản như “xóa người ngoài cuộc” hoặc “chuyển sang cảnh đêm” mà vẫn giữ nguyên nhân vật và bối cảnh.
Các tính năng khác bao gồm tham chiếu hình ảnh, phần tử, hành động, chuyển động máy quay và video, khung bắt đầu và kết thúc, khả năng xử lý nhiều đối tượng, và hơn thế nữa.
Các thử nghiệm nội bộ của Kling cho thấy mô hình này vượt trội hơn Google Veo 3.1 và Aleph của Runway trong các tác vụ tham khảo và chỉnh sửa video.

Tầm quan trọng: Giữa Runway và Kling, tháng 12 đang khởi đầu với những nâng cấp video AI mạnh mẽ. Khả năng chỉnh sửa mọi thứ và tích hợp tất cả trong một của O1 (tương tự như Aleph ra mắt trước đó của Runway ) đang giúp việc chỉnh sửa video chi tiết hơn bao giờ hết - một bước tiến lớn tương tự như những gì Nano Banana đã mang đến cho hình ảnh hồi đầu năm nay.

5. 4 công cụ AI mới, quy trình làm việc cộng đồng và nhiều hơn nữa

🎥 Runway Gen-4.5 - Mô hình video hàng đầu mới của Runway

🐳 DeepSeek V3.2 - Phiên bản mã nguồn mở mạnh mẽ mới nhất của DeepSeek

🎬 Kling O1 - Mô hình video với khả năng hiểu và chỉnh sửa đa phương thức

🧠 DeepSeek V3.2 Speciale - Mô hình suy luận sâu mã nguồn mở

Bạn cảm thấy thế nào về email hôm nay?

Phản hồi của bạn giúp chúng tôi cải thiện chất lượng nội dung!

🧠🧠🧠 Rất tuyệt vời

🧠🧠 Cũng ổn

🧠 Tệ lắm

Hẹn gặp mọi người ở email sau với AI Update và AI NTK.

AI Update

Discussion about this post

Ready for more?