AI mã nguồn mở đạt thành tích áp đảo trong kỳ thi toán học chuyên sâu
Chào buổi sáng, những người đam mê AI. Các bạn còn nhớ thời điểm trí tuệ nhân tạo không thể giải được các phép tính số học cơ bản không? Giờ đây, một mô hình mã nguồn mở nhỏ đang chinh phục một trong những bài kiểm tra toán khó nhất thế giới.
Sau khi đạt điểm cao nhất trong cuộc thi Putnam, Nomos-1 của Nous Research gia nhập danh sách dài các tiến bộ toán học dựa trên trí tuệ nhân tạo trong năm nay, cho thấy lĩnh vực này có thể sắp bước vào một lãnh vực khám phá hoàn toàn mới.
Trong bản tin tổng hợp về AI hôm nay:
Trí tuệ nhân tạo của Nous Research chinh phục kỳ thi toán học cấp cao.
Microsoft đã lập bản đồ cách mọi người sử dụng Copilot.
Sửa lỗi và triển khai tính năng từ Slack với Claude Code.
Chiếc nhẫn AI cung cấp “bộ nhớ ngoài” cho não bộ của bạn.
4 công cụ AI mới, quy trình làm việc cộng đồng và nhiều hơn nữa
1. Trí tuệ nhân tạo của Nous Research chinh phục kỳ thi toán học cấp cao
Tóm tắt: Nous Research vừa công bố mã nguồn mở Nomos 1, một hệ thống suy luận tham số 30 tỷ mới đã đạt 87 điểm trên 120 trong cuộc thi Putnam năm 2025 — đánh bại các đối thủ như Qwen 3 trong một trong những cuộc thi toán học danh giá nhất dành cho sinh viên đại học.
Thông tin chi tiết:
Hệ thống này sử dụng phương pháp hai giai đoạn: các “nhân viên” AI giải quyết và tự đánh giá các câu trả lời, sau đó một sơ đồ thi đấu theo thể thức loại trực tiếp sẽ chọn ra bài nộp tốt nhất.
Điểm số của Nomos sẽ xếp thứ hai trong số gần 4.000 thí sinh tham gia năm ngoái, với việc mô hình này đạt được tám điểm tuyệt đối cho các bài toán.
Nous cũng đã phát hành và công khai mã nguồn của một bộ công cụ suy luận — mã điều phối quản lý cách mô hình giải quyết vấn đề.
Khi chạy Qwen3 với cùng bộ dây đeo và thiết lập, điểm số chỉ đạt 24/120, cho thấy sự tiến bộ đến từ việc huấn luyện mô hình chứ không phải từ bộ dây đeo.
Tầm quan trọng: Cách đây không lâu, ngay cả những bài toán đơn giản cũng là thách thức đối với các hệ thống AI hàng đầu — và giờ đây, một mô hình nhỏ, mã nguồn mở đang giải quyết được một bài kiểm tra nổi tiếng khó. Giữa Nomos, AI giúp chinh phục các vấn đề chưa được giải quyết, và các phòng thí nghiệm cho ra đời những mô hình toán học đoạt huy chương vàng, toàn bộ lĩnh vực này dường như đã sẵn sàng cho một sự bùng nổ do AI dẫn dắt.
2. Microsoft đã lập bản đồ cách mọi người sử dụng Copilot
Tóm tắt: Microsoft vừa công bố nghiên cứu mới phân tích 37,5 triệu cuộc hội thoại với trợ lý ảo Copilot trong năm qua, tiết lộ các mô hình hành vi khác biệt về cách người dùng tương tác với trợ lý AI trên các thiết bị, khoảng thời gian và chủ đề khác nhau.
Thông tin chi tiết:
Các câu hỏi về sức khỏe và thể chất chiếm ưu thế trong việc sử dụng điện thoại di động bất kể giờ giấc hay tháng nào, biến điện thoại trở thành người bạn đồng hành chăm sóc sức khỏe cá nhân suốt ngày đêm.
Việc tìm kiếm lời khuyên đã tăng lên trong suốt năm, với việc người dùng ngày càng coi AI như một nguồn hướng dẫn hơn là chỉ một công cụ tìm kiếm đơn thuần.
Các buổi trò chuyện đêm khuya chứng kiến các chủ đề triết học, tôn giáo và hiện sinh trở nên phổ biến hơn, trong khi các cuộc trò chuyện về mối quan hệ tăng đột biến đặc biệt vào dịp Lễ Tình nhân.
Lập trình chiếm ưu thế trong tháng Giêng, trong khi các chủ đề xã hội nổi lên vào cuối năm, phản ánh sự chuyển dịch từ những người tiên phong sang đối tượng khán giả rộng hơn, phổ biến hơn.
Tầm quan trọng: Đã có rất nhiều dữ liệu từ các phòng thí nghiệm lớn về cách người dùng tận dụng AI, nhưng nghiên cứu của Microsoft này cung cấp một cái nhìn thú vị về sự thay đổi động lực diễn ra dựa trên cả thời gian trong ngày và trong năm, cũng như thiết bị đang được sử dụng — những hiểu biết có thể định hình cách các trợ lý thế hệ tiếp theo thích ứng và tối ưu hóa theo ngữ cảnh.
3. Sửa lỗi và triển khai tính năng từ Slack với Claude Code
Tóm tắt: Trong hướng dẫn này, bạn sẽ học cách thêm Claude Code vào Slack và giao nhiệm vụ cho trợ lý lập trình tự động sửa lỗi hoặc triển khai các tính năng mới, mà không cần mở trình soạn thảo mã.
Từng bước một:
Kết nối Claude Code với GitHub và thêm ứng dụng Claude vào không gian làm việc Slack của bạn.
Giờ bạn sẽ thấy nó ở góc dưới bên trái của Slack. Nhấp vào “Kết nối tài khoản” và cấp quyền truy cập Slack cho Claude.
Thêm Claude vào kênh hiện có hoặc tạo kênh mới bằng cách gõ “@claude” và nhấn Enter. Hệ thống sẽ hỏi bạn có muốn thêm Claude vào kênh không. Hãy chấp nhận.
Giờ đây, bạn có thể gắn thẻ @Claude và giao cho nó các nhiệm vụ lập trình, trợ lý ảo sẽ xây dựng ngữ cảnh dựa trên các tin nhắn gần đây.
Mẹo hay: Hãy tạo một luồng thảo luận trên Slack về một vấn đề cụ thể để có hiệu suất tốt nhất. Ngoài ra, giờ đây bạn cũng có thể truy cập Claude Code trên thiết bị di động thông qua ứng dụng Slack.
4. Chiếc nhẫn AI cung cấp “bộ nhớ ngoài” cho não bộ của bạn
Tóm tắt: Nhà sản xuất Pebble, Core Devices, vừa giới thiệu Index 01, một chiếc nhẫn thông minh ghi âm giọng nói có trí tuệ nhân tạo (AI) giá 75 đô la, có khả năng ghi lại các ý tưởng được nói ra và sử dụng AI tích hợp trên thiết bị để chuyển chúng thành ghi chú, lời nhắc hoặc mục nhập lịch, mà không cần đăng ký hoặc kết nối internet.
Thông tin chi tiết:
Chiếc nhẫn được đeo vào ngón trỏ của người dùng, có nút bấm kích hoạt bằng ngón cái, cho phép ghi âm rảnh tay khi đang di chuyển.
Các bản ghi âm được đồng bộ hóa với điện thoại của người dùng, nơi một hệ thống LLM cục bộ sẽ phiên âm và xử lý ghi chú giọng nói thông qua một hệ thống chuyển đổi giọng nói thành văn bản mã nguồn mở.
Chiếc nhẫn không cần sạc, pin có thể sử dụng được đến hai năm trong điều kiện sử dụng thông thường và có thể ghi âm liên tục đến năm phút.
Tầm quan trọng: Sau khi các thiết bị đeo như Humane Pin và Rabbit R1 gặp khó khăn trong việc thay thế điện thoại bằng phần cứng AI, Index 01 đang áp dụng cách tiếp cận hẹp hơn — thực hiện một nhiệm vụ đơn giản duy nhất một cách đáng tin cậy. Chắc chắn đây không phải là thành công được đảm bảo, nhưng nó có thể cho thấy liệu thị trường thiết bị có chỗ cho các công cụ chuyên dụng so với những sản phẩm đột phá hướng đến thị trường đại chúng hay không.
5. 4 công cụ AI mới, quy trình làm việc cộng đồng và nhiều hơn nữa
🧑💻 Devstral 2 - Dòng sản phẩm thế hệ tiếp theo tập trung vào lập trình của Mistral
💡 Stitch - công cụ của Google giúp biến ý tưởng thành thiết kế giao diện người dùng, nay đã sử dụng Gemini 3.
🧮 Nomos 1 - Hệ thống suy luận toán học AI mạnh mẽ của Nous Research
🧠 Mục đích - Người hướng dẫn AI cung cấp hướng dẫn chuyên sâu, cá nhân hóa theo yêu cầu
Bạn cảm thấy thế nào về email hôm nay?
Phản hồi của bạn giúp chúng tôi cải thiện chất lượng nội dung!
🧠🧠🧠 Rất tuyệt vời
🧠🧠 Cũng ổn
🧠 Tệ lắm
Hẹn gặp mọi người ở email sau với AI Update và AI NTK.





