META THU HÚT 4 NGHIÊN CỨU VIÊN TỪ OPENAI
GOOGLE MANG AI MẠNH MẼ TỚI CÁC THIẾT BỊ VỚI RA MẮT GEMMA 3N
CHÀO MỪNG CÁC TÍN ĐỒ AI!
Meta đã có một động thái lớn khi bốn nghiên cứu viên từ OpenAI đã rời bỏ để gia nhập nhóm siêu trí tuệ mới của Zuckerberg.
CEO OpenAI, Sam Altman đã thể hiện sự tự tin trong việc giữ chân nhân viên bất chấp các mức đề nghị 100 triệu USD, nhưng rõ ràng túi tiền sâu của Meta đã nói lên điều đó — và đơn vị mới của họ đang dần hình thành theo cách lớn lao.
BẢN TIN HÔM NAY CÓ GÌ?
Meta thu hút bốn nghiên cứu viên từ OpenAI
Gemma 3n của Google mang AI mạnh mẽ đến các thiết bị
Chuyển đổi video bài giảng thành tài liệu học chi tiết
Anthropic nghiên cứu về sự hỗ trợ cảm xúc của Claude
4 công cụ AI mới
NHỮNG THÔNG TIN MỚI NHẤT
META THU HÚT 4 NGHIÊN CỨU VIÊN TỪ OPENAI
Nguồn ảnh: Midjourney / The Rundown
Meta được cho là đã thành công trong việc tuyển dụng bốn nghiên cứu viên từ OpenAI cho đơn vị siêu trí tuệ mới của mình, trong đó có ba người từ văn phòng Zurich của OAI và một người đóng góp chủ chốt cho mô hình suy luận o1 của lãnh đạo AI.
Zuckerberg đích thân tuyển dụng Lucas Beyer, Alexander Kolesnikov, và Xiaohua Zhai, bộ ba đã thành lập văn phòng Zurich của OpenAI vào năm ngoái.
Meta cũng đã thu hút Trapit Bansal, một người đóng góp nền móng cho mô hình suy luận o1 của OpenAI, người đã làm việc cùng với đồng sáng lập Ilya Sutskever.
Sam Altman cho biết tuần trước rằng Meta đã đưa ra các khoản thưởng 100 triệu USD trong nỗ lực thu hút nhân tài, nhưng “không ai trong số những người giỏi nhất của OpenAI” chấp nhận lời đề nghị này.
Beyer xác nhận trên X rằng bộ ba từ Zurich đang gia nhập Meta, nhưng phủ nhận các báo cáo về khoản tiền thưởng ký hợp đồng 100 triệu USD, gọi chúng là “tin tức giả”.
Chiến dịch tuyển dụng của Meta diễn ra sau khi họ đầu tư 15 tỷ USD vào Scale AI và thu hút CEO của công ty này là Alexandr Wang để dẫn dắt bộ phận mới.
Tại sao điều này quan trọng: Nhóm siêu trí tuệ mới của Meta đang dần hình thành — và mặc dù có bình luận của Altman vào tuần trước, ít nhất bốn trong số các nhà nghiên cứu của ông đã sẵn sàng di chuyển. Với sự gia tăng nhân tài mới từ các phòng thí nghiệm hàng đầu và một sự sẵn sàng chi tiêu không có giới hạn, phát hành đầu tiên từ đơn vị mới của Meta sẽ là một điều thú vị để quan sát.
GOOGLE’S GEMMA 3N MANG AI MẠNH MẼ TỚI CÁC THIẾT BỊ
Nguồn ảnh: Google DeepMind
Google ra mắt phiên bản đầy đủ của Gemma 3n, gia đình các mô hình AI mở mới của họ (các tùy chọn 2B và 4B) thiết kế để mang lại khả năng đa phương tiện mạnh mẽ cho các thiết bị di động và người tiêu dùng.
Các mô hình mới hiểu hình ảnh, âm thanh, video và văn bản một cách tự nhiên, trong khi vẫn hiệu quả để chạy trên phần cứng với chỉ 2GB RAM.
Tích hợp khả năng thị giác phân tích video ở 60 fps trên điện thoại Pixel, cho phép nhận diện đối tượng và hiểu cảnh hiện thời.
Tính năng âm thanh của Gemma dịch sang 35 ngôn ngữ và chuyển đổi giọng nói thành văn bản cho các ứng dụng truy cập và trợ lý giọng nói.
Phiên bản E4B lớn hơn của Gemma trở thành mô hình đầu tiên dưới 10 tỷ tham số vượt qua điểm 1300 trên bảng xếp hạng LMArena cạnh tranh.
Tại sao điều này quan trọng: Việc phát hành Gemma đầy đủ là một cú hích vô cùng ấn tượng nữa từ Google, với các mô hình ngày càng mạnh mẽ mặc dù nhỏ gọn dần cho phần cứng người tiêu dùng. Mô hình nhỏ gọn và mở mở ra vô tận các trường hợp sử dụng thông minh tại chỗ.
CHUYỂN ĐỔI VIDEO BÀI GIẢNG THÀNH TÀI LIỆU HỌC CHI TIẾT
Trong hướng dẫn này, bạn sẽ học cách sử dụng tính năng đầu vào video mới của Gemini từ Google để biến đổi video bài giảng thành các ghi chú chi tiết và các phiên kiểm tra tương tác để cải thiện trải nghiệm học tập của bạn.
Các bước thực hiện:
Truy cập vào ứng dụng Gemini của Google và tải lên video bài giảng của bạn.
Sử dụng lời nhắc này: “Phân tích video bài giảng này và cung cấp: dàn ý chi tiết, ghi chú toàn diện, công thức/ví dụ, và dấu thời gian cho mỗi chủ đề.”
Theo dõi bằng cách yêu cầu nó tạo bảng câu hỏi toàn diện, cùng đáp án và giải thích.
Yêu cầu nó mã hóa một câu đố tương tác dựa trên nội dung bài giảng này, và bao gồm một nút gợi ý khi cần giúp đỡ.
Mẹo chuyên nghiệp: Lưu tất cả tài liệu vào một tài liệu và lặp lại quy trình này cho nhiều bài giảng để xây dựng thư viện học tập toàn diện của khóa học của bạn.
ANTHROPIC NGHIÊN CỨU VỀ SỰ HỖ TRỢ CẢM XÚC CỦA CLAUDE
Nguồn ảnh: Anthropic
Anthropic công bố nghiên cứu mới về cách Claude được sử dụng cho sự hỗ trợ cảm xúc và các cuộc trò chuyện cảm mến, phát hiện rằng việc sử dụng ít hơn nhiều so với báo cáo, với sự tương tác và vai trò chơi chiếm dưới 0.5% tất cả các tương tác.
Các nhà nghiên cứu đã phân tích 4,5 triệu cuộc trò chuyện của Claude bằng công cụ Clio, một công cụ tổng hợp các mẫu sử dụng trong khi ẩn danh các cuộc trò chuyện cá nhân.
Dữ liệu cho thấy chỉ 2.9% liên quan đến hỗ trợ cảm xúc, với phần lớn tập trung vào các mối quan tâm thực tế như chuyển đổi nghề nghiệp và lời khuyên quan hệ.
Mặc dù có các câu chuyện truyền thông, nghiên cứu cho thấy rằng các cuộc trò chuyện tìm kiếm sự đồng hành hoặc tham gia vào vai trò chơi chỉ chiếm chưa đến 0.5% tổng số sử dụng.
Các nhà nghiên cứu cũng nhận thấy rằng cảm xúc của người dùng thường trở nên tích cực hơn trong suốt cuộc trò chuyện, cho thấy AI không khuếch đại xu hướng tiêu cực.
Tại sao điều này quan trọng: Các phương tiện truyền thông gần đây tuyên truyền một số trường hợp cực đoan về lãng mạn và phụ thuộc vào AI, nhưng dữ liệu cho thấy những trường hợp đó vẫn còn hiếm hoi (ít nhất là qua Claude). Tuy nhiên, Anthropic hướng đến phát triển và ít phổ biến hơn so với ChatGPT hoặc các nền tảng như Character AI — do đó các con số có thể sẽ khác ở nơi khác trong AI.
CÔNG CỤ AI MỚI
⚙️ Gemini CLI - Open-source terminal agent with high free usage limits
📸 Higgsfield Soul - New high-aesthetic photo model with advanced realism
🧬 AlphaGenome - DeepMind’s new AI model for DNA analysis
🗣️ Voice Design V3 - Create any voice you can imagine with a prompt
TIN TỨC NHANH
Black Forest Labs công bố FLUX.1 Kontext [dev], một mô hình chỉnh sửa hình ảnh SOTA có trọng lượng mở có thể chạy hiệu quả trên phần cứng người tiêu dùng.
Mô hình R2 của DeepSeek phải đối mặt với các vấn đề do kiểm soát xuất khẩu tạo ra sự thiếu hụt chip Nvidia, với CEO Liang Wenfeng không hài lòng với hiệu suất của mô hình.
OpenAI phát hành một loạt các cập nhật, bao gồm Nghiên cứu Sâu qua API, Tìm kiếm Web trong o3 và o4-mini, và sự kiện DevDay tiếp theo của họ, dự kiến vào ngày 6 tháng 10 tại San Francisco.
HeyGen giới thiệu HeyGen Agent, một “Hệ Điều Hành Sáng Tạo” tạo nội dung video với kịch bản, diễn viên, chỉnh sửa và nhiều hơn nữa từ một văn bản, hình ảnh hoặc video đơn giản.
Google ra mắt Doppl, một thử nghiệm mới trên nền tảng Labs của mình, cho phép người dùng tạo video thử nghiệm AI từ một bức ảnh và sản phẩm.
Meta trở thành công ty AI mới nhất nhận được phán quyết có lợi về “công bằng sử dụng” trong tòa án, chiến thắng một vụ kiện từ các tác giả về vi phạm bản quyền.
Suno công bố việc mua lại WavTool, mang trạm làm việc âm thanh số dựa trên trình duyệt của startup này lên nền tảng để tạo nhạc nâng cao hơn.
KẾT LUẬN
Bạn đang chứng kiến một kỷ nguyên nơi AI không chỉ hỗ trợ mà còn định hình tương lai. Sẵn sàng để khai phá tiềm năng và chinh phục đỉnh cao mới?
🚀 Tham gia cùng chúng tôi để dẫn đầu xu hướng và biến AI thành lợi thế của bạn!