“Mẹ Đỡ Đầu” Của AI Kêu Gọi Phát Triển Trí Tuệ Không Gian
Chào buổi sáng, những người đam mê AI. “Mẹ đẻ” của AI, Tiến sĩ Fei-Fei Li, vừa tiết lộ bước đột phá lớn tiếp theo trong AI — đó là các hệ thống thông minh không gian có khả năng hiểu và nắm bắt vật lý của thế giới thực.
Những hệ thống này có thể đánh dấu một số đột phá lớn, nhưng câu hỏi đặt ra là: Chúng ta đã sẵn sàng để đưa AI từ việc hiểu ngôn ngữ đến hiểu được những chi tiết phức tạp về thế giới xung quanh hay chưa?
Tóm tắt bản tin AI hôm nay:
“Mẹ đỡ đầu” của AI kêu gọi phát triển trí tuệ không gian
Lợi thế chi phí lớn của Anthropic so với OpenAI
Chuyển dữ liệu bảng tính thành thông tin chi tiết với Copilot
GPT-5 giải quyết thành công một trò chơi Sudoku 9x9
4 công cụ AI mới, quy trình cộng đồng và nhiều hơn nữa
1. “Mẹ đỡ đầu” của AI Kêu Gọi Phát Triển Trí Tuệ Không Gian
Nhà chuyên gia AI nổi tiếng Tiến sĩ Fei-Fei Li vừa xuất bản một bài luận mới, chi tiết lý do tại sao bước đột phá tiếp theo trong AI sẽ xuất phát từ trí tuệ không gian (spatial intelligence), hay các hệ thống có thể hiểu, suy luận và tạo ra các thế giới 3D nhất quán với vật lý.
Li cho rằng mặc dù các LLM đã thành thạo kiến thức trừu tượng, chúng thiếu khả năng nhận thức và hành động trong không gian (như việc ước lượng khoảng cách và chuyển động).
Bà lập luận rằng sự hiểu biết không gian là cốt lõi nhận thức của trí tuệ con người và là một bước quan trọng để đưa AI từ ngôn ngữ đến nhận thức và hành động.
Các mô hình thế giới, theo Li, sẽ là chìa khóa để xây dựng trí thông minh này, nhưng chúng cần khả năng tạo ra các thế giới 3D thực tế, hiểu các đầu vào như hình ảnh và hành động, và dự đoán cách các thế giới đó thay đổi theo thời gian.
Bà nói thêm rằng những mô hình này cuối cùng sẽ mở khóa những tiến bộ mới trong robotics, khoa học, chăm sóc sức khỏe và thiết kế bằng cách cho phép AI suy luận trong thế giới thực.
Các mô hình thế giới hiểu cách các đối tượng di chuyển và tương tác có thể một ngày nào đó dự đoán các phản ứng phân tử, mô hình hóa hệ thống khí hậu, hoặc kiểm tra vật liệu. Thách thức nằm ở việc dạy AI vật lý thế giới thực, nhưng động lực đang tăng nhanh khi các phòng thí nghiệm World Labs của Li, Google và Tencent đều đang chạy đua để đưa các hệ thống thông minh không gian vào cuộc sống.
2. Anthropic Đạt Lợi Thế Lớn Về Hiệu Quả Chi Phí So Với OpenAI
Anthropic được báo cáo là đang dự kiến có một lợi thế lớn về chi phí so với OpenAI — công ty kỳ vọng sẽ chi tiêu ít hơn rất nhiều cho năng lực tính toán để huấn luyện và vận hành các mô hình AI của mình trong vài năm tới, theo The Information.
Anthropic ước tính chi phí tính toán là $6 tỷ USD trong năm 2025 so với $15 tỷ USD của OpenAI, và sẽ tăng lên $27 tỷ USD vào năm 2028, trong khi OpenAI dự kiến là $111 tỷ USD.
Khoản tiết kiệm này được kỳ vọng đến từ việc công ty sử dụng chip của Amazon, Nvidia và Google cho các tác vụ chuyên biệt, không giống như sự phụ thuộc lớn của OAI vào Nvidia.
Tin tức này được đưa ra sau khi Anthropic tăng ước tính doanh thu, cho biết họ kỳ vọng sẽ đạt dòng tiền dương (cash flow positive) vào năm 2027 và tạo ra $70 tỷ USD doanh thu vào năm 2028.
Mặt khác, OpenAI kỳ vọng đạt mốc $100 tỷ USD doanh thu vào năm 2028 nhưng nhiều khả năng sẽ không đạt dòng tiền dương cho đến năm 2030.
Anthropic đang đi theo một con đường lặng lẽ, kỷ luật hơn, xây dựng AI thông qua hiệu quả và tập trung vào doanh nghiệp (80% doanh thu đến từ API). Trong khi đó, OpenAI đang theo đuổi sự mở rộng quy mô với việc thúc đẩy sản phẩm mạnh mẽ trên ChatGPT, nghiên cứu, Atlas và nhiều lĩnh vực khác. Những lựa chọn này sẽ định hình giai đoạn tiếp theo của AI.
3. Chuyển Dữ Liệu Bảng Tính Thành Thông Tin Chi Tiết Với Copilot
Trong hướng dẫn này, bạn sẽ học cách sử dụng các tính năng Voice (Giọng nói) và Vision (Thị giác) của Microsoft Copilot Desktop để phân tích dữ liệu Google Sheets hoặc Excel mà không cần dùng tay. Bạn có thể đặt câu hỏi bằng lời và nhận thông tin chi tiết ngay lập tức mà không cần gõ công thức.
Các Bước Thực Hiện Chi Tiết
Cài đặt Ứng dụng: Cài đặt Microsoft Copilot từ Microsoft Store (Windows) hoặc App Store (macOS 14.0+/chip M1), mở ứng dụng và đăng nhập bằng tài khoản Microsoft của bạn.
Kích hoạt Tính năng: Truy cập Cài đặt qua biểu tượng hồ sơ, bật “Voice Mode” (Chế độ Giọng nói) và “Copilot Vision” (Thị giác Copilot). Sau đó, mở tệp Google Sheets hoặc Excel của bạn trong trình duyệt.
Kích hoạt Vision: Nói “Hey Copilot,”, nhấp vào biểu tượng kính mắt (eyeglasses) trên thanh công cụ để bật chế độ Vision — Copilot sẽ quét và xác nhận rằng nó thấy dữ liệu của bạn.
Đặt Câu hỏi Phân tích: Đặt các câu hỏi phân tích như: “Sản phẩm nào tạo ra nhiều doanh thu nhất?” hoặc “Tính tổng doanh thu” — Copilot sẽ làm nổi bật các ô và giải thích các phép tính.
Tạo Báo cáo: Đóng thanh công cụ, sau đó nhập lệnh: “Soạn một báo cáo phân tích chuyên nghiệp với Tóm tắt Điều hành, bảng Xếp hạng Sản phẩm Hàng đầu và Các Thông Tin Chi Tiết Chính.”
Mẹo: Bạn có thể sử dụng quy trình làm việc này để học các kỹ năng mới, đọc tài liệu kỹ thuật hoặc nghiên cứu các bài báo.
4. GPT-5 Giải Thành Công Trò Sudoku 9x9 Hoàn Chỉnh
GPT-5 vừa trở thành mô hình AI đầu tiên giải được một trò Sudoku 9x9 hoàn chỉnh, theo Sudoku-Bench của Sakana AI—một bảng đánh giá được thiết kế để kiểm tra khả năng lý luận sâu, logic không gian và sự sáng tạo.
Sudoku-Bench, ra mắt vào tháng 5, kiểm tra các LLM bằng các biến thể Sudoku cổ điển và hiện đại, kết hợp nhiều bộ quy tắc và đòi hỏi lý luận dài, nhiều bước.
Chưa có mô hình nào trước đây giải được một câu đố 9x9 hoàn chỉnh cho đến khi GPT-5 phá vỡ nó, cho thấy khả năng lý luận không gian và logic tốt hơn so với các mô hình tiền nhiệm.
GPT-5 cũng đạt tỷ lệ giải thành công là 33% trên các câu đố—gấp đôi mô hình dẫn đầu trước đó, đánh dấu một bước tiến lớn về hiệu suất trong bảng đánh giá.
67% các câu đố vẫn chưa được giải quyết, do các mô hình gặp khó khăn với siêu lý luận (meta-reasoning - học các quy tắc mới lạ) và sự đột phá sáng tạo (creative “break-in”), những kỹ năng mà con người sử dụng một cách tự nhiên.
Bước đột phá Sudoku của GPT-5 cho thấy tiến bộ thực sự trong suy luận có cấu trúc, nhưng cũng cho thấy AI vẫn còn cách xa việc tư duy như con người. Việc thu hẹp khoảng cách đó sẽ đòi hỏi các mô hình có thể kết hợp logic toán học, nhận thức không gian và cái nhìn sáng tạo, về cơ bản là sự pha trộn kỹ năng tương tự mà chúng ta sử dụng để lý giải những điều chưa biết.
5. Các Công Cụ AI Đang Thịnh Hành
🧠 ScreenPlay – Các trợ lý thông minh (smart agents) có khả năng suy nghĩ, thích ứng và tự động hóa mọi thứ mà các bot cũ của bạn không thể xử lý được.
💬 Scribe v2 Realtime - AI phiên âm giọng nói (speech transcription) của ElevenLabs với độ trễ chỉ 150ms.
🤖 Kimi K2 Thinking - Trợ lý lý luận mã nguồn mở (open-source thinking agent) của Moonshot AI.
🗣️ Meta Omnilingual ASR - Nhận dạng giọng nói tự động (ASR) cho 1.600 ngôn ngữ của Meta.
Bạn cảm thấy thế nào về email hôm nay?
Phản hồi của bạn giúp chúng tôi cải thiện chất lượng nội dung!
🧠🧠🧠 Rất tuyệt vời
🧠🧠 Cũng ổn
🧠 Tệ lắm
Hẹn gặp mọi người ở email sau với AI Update và AI NTK.





