ROBOT CỦA DEEPMIND 'SUY NGHĨ' NGOẠI TUYẾN

CÁCH TẠO INFOGRAPHICS TỪ VĂN BẢN THUẦN TÚY

Jun 26, 2025

CHÀO MỪNG CÁC TÍN ĐỒ AI!

Bạn nên đọc vào mức độ nào? Sam Altman vừa hỏi những người theo dõi của mình đoánkhi nào họ nghĩ rằng một mô hình o3-mini-level có thể chạy trên điện thoại, và phần lớn nói là năm nay. Với tốc độ mà mọi thứ đang tiến triển, tôi sẽ không đặt cược ngược lại đâu.

Tìm hiểu cách tạo infographic từ văn bản thuần túy và nhận các công cụ AI mới nhất cùng các bài đăng xu hướng trên mạng xã hội.

ĐIỂM TIN AI

Ví dụ về những gì bạn có thể tạo ra với mô hình Imagen 4 mới của Google. Nguồn: Google

1. Bạn có thể thử mô hình hình ảnh mới nhất của Google một cách miễn phí: Ông lớn tìm kiếm đang mở quyền truy cập tới Imagen 4, một mô hình hình ảnh đặc biệt tốt ở các chi tiết tinh tế, tính chân thực, chính tả nâng cao và bắt được một loạt phong cách nghệ thuật. Trong khi đó, một phiên bản nâng cao hơn gọi là Imagen 4 Ultra có thể xử lý các yêu cầu văn bản phức tạp hơn. Cả hai hiện đã có trong API Gemini (một nền tảng hướng đến các nhà phát triển) và AI Studio, nơi bạn có thể thử chúng miễn phí trong “một thời gian giới hạn.”

2. OpenAI đang thách thức Microsoft và Google: Không có gì ngạc nhiên khi sự hợp tác chặt chẽ giữa Microsoft và OpenAI bắt đầu phai nhạt. Thông tin báo cáo rằng OpenAI đã làm việc ít nhất một năm qua trên một nền tảng hợp tác tương tự như Microsoft Office cho phép nhiều người chỉnh sửa dự án và gửi tin nhắn trực tiếp trong ChatGPT. Nếu OpenAI phát hành công cụ này, nó có thể giảm đáng kể lượng người dùng của Microsoft và thậm chí Google Workspace. Điều này xảy ra trên thông tin rằng Microsoft đã đang mất các khách hàng Copilot cho ChatGPT.

3. AI vượt qua con người để giành vị trí hàng đầu trên bảng xếp hạng hacker danh giá: Human red teaming (cố tình xâm nhập vào các công ty để nâng cao bảo mật) thường mất vài tuần và tốn khoảng 18.000 đô la, theo Oege de Moor, người sáng lập startup “hackbot” Xbow mới được một năm. Công ty vừa huy động được 75 triệu đô la để tự động hóa quá trình đó bằng AI — và nó đã mang lại kết quả. Công ty bảo mật HackerOne vừa xếp hạng công cụ này số 1 trên bảng xếp hạng tại Hoa Kỳ. Bảng xếp hạng đo lường số lượng lỗi bảo mật một hacker phát hiện cũng như tầm quan trọng của mỗi lỗi.

GEMINI ROBOTICS TRÌNH LÀNG MÔ HÌNH CÓ THỂ CHẠY CỤC BỘ TRÊN ROBOT

Click để xem mô hình mới VLA của Google DeepMind đang hoạt động. Nguồn: Google DeepMind

Các công ty đã cố gắng kết hợp trí lý cho robot để chúng xử lý các nhiệm vụ phức tạp hơn — chẳng hạn như làm việc nhà hoặc tự động hóa công việc trong kho — mà không cần đào tạo trước. Nhưng những robot này thường phải dựa vào kết nối đám mây để hoàn thành công việc.

Điều đó sắp thay đổi với mô hình hành động ngôn ngữ tầm nhìn mới của Google DeepMind (VLA), đưa sự hiểu biết thế giới thực của Gemini 2.0 vào sử dụng trực tiếp trên thiết bị. Chúng tôi đã nói chuyện với người đứng đầu bộ phận Robot của DeepMind, Carolina Parada, để tìm hiểu thêm.

Điều gì mở đường cho sự phát hành này? Vì Gemini đã xem rất nhiều video về đối tượng đang chuyển động, bây giờ nó có thể sử dụng kiến thức đó để điều khiển hành vi của robot, với khả năng uyển chuyển tiên tiến. “Cũng giống như Gemini có thể tạo ra văn bản (viết thơ), tạo ra hình ảnh, tạo ra mã, giờ đây nó cũng có thể tạo ra hành động,” Parada nói.

Tại sao tập trung vào mô hình cục bộ? Tiến bộ trên thiết bị này giúp giảm độ trễ và cho phép bạn sử dụng robot mà không cần kết nối internet. Đó là một bước hướng tới các robot thực thụ, hoạt động được trong nhiều môi trường khác nhau và không cần nhiều tháng đào tạo để học các kỹ năng mới.

Nó dành cho ai? Nó đã hoạt động tốt với các robot Aloha, Franka, và Apptronik. Nhưng lần đầu tiên, các nhà phát triển và nhà nghiên cứu cũng có thể điều chỉnh mô hình để phù hợp với nền tảng robot mà họ lựa chọn. “Sức mạnh của mô hình cơ bản của bạn chính là điều chuyển hóa sang khả năng tổng quát trên mảng robot,” Parada thêm.

Tiếp theo là gì? “Chúng tôi chỉ mới bắt đầu khám phá [về việc] nắm bắt trí thông minh từ các mô hình nền tảng này đối với robot. Có rất nhiều khía cạnh khác như hành vi đại diện và trí nhớ” mà vẫn chưa được khám phá, Parada cho biết. “Tôi nghĩ rằng trong vài năm tới, bức tranh sẽ trông rất khác."

CÁCH TẠO INFOGRAPHICS TỪ VĂN BẢN THUẦN TÚY

Truy cập Claude và đăng ký bằng tài khoản của bạn.
Chọn ‘Claude Sonnet 4’ làm mô hình của bạn, nhập yêu cầu của bạn và nhấn Enter.

Prompt mẫu: "Bạn là một chuyên gia giải thích hình ảnh và thiết kế kỹ thuật đẳng cấp thế giới. Nhiệm vụ của bạn là biến khái niệm này thành một infographic bằng cách sử dụng Mermaid.js hoặc một định dạng sơ đồ mã khác: "[INSERT CONCEPT HERE]"

Trả lại kết quả dưới dạng:

Một sự phân tích hình ảnh rõ ràng sử dụng định dạng như flowchart, dòng thời gian, bản đồ, hoặc cây quyết định — bất cứ thứ nào phù hợp nhất.
Một chú thích tiếng Anh thuần túy giải thích hình ảnh cho thấy điều gì.
Mã Mermaid sạch (hoặc HTML/SVG/CSS nếu phù hợp hơn) mà tôi có thể sao chép và dán để hiển thị hình ảnh. Hãy giữ nó dễ đọc, thanh lịch và tối giản như một slide trong một buổi trình bày tư vấn.”

Bạn sẽ nhận được một sơ đồ hình ảnh với tất cả chi tiết sẵn sàng trong vài giây.
Bạn có thể chuyển đổi nó thành một bài thuyết trình hoặc tải xuống mã để sử dụng.

XU HƯỚNG TRÊN MẠNG XÃ HỘI HÔM NAY!

🤳 Insta Automation: Một Redditor tuyên bố họ đã sử dụng các tác nhân AI để đưa một "tài khoản Instagram vào chế độ lái tự động hoàn toàn", tạo ra 4,4 triệu lượt xem chỉ trong ba tuần. Đây là cách thực hiện.

🔁 Vũ khí bí mật: Hướng dẫn lan truyền trong 37 phút này hướng dẫn bạn cách sử dụng MCP để khiến Claude "mạnh hơn gấp 10 lần".

🧑‍💻 Code Coup: Nhà xây dựng Sherry Jiang cho rằng thật điên rồ khi các công ty có một tính năng, trị giá hơn 1 tỷ đô la như Docusign và Calendly "bây giờ có thể được mã hóa rung cảm trong một tuần".

✨ Cũng đáng để kiểm tra: Mười lời nhắc Claude 4 hữu ích; ASMR do AI tạo ra; và chó nhảy cầu Olympic.

Sam Altman phản pháo lại tuyên bố của một công ty khởi nghiệp rằng OpenAI đã đánh cắp tên và ý tưởng của công ty, gọi vụ kiện của công ty này là "ngớ ngẩn, đáng thất vọng và sai trái".

Việc Anthropic sử dụng sách in để đào tạo các mô hình của mình nên được coi là "sử dụng hợp lý", theo quyết định bản quyền đầu tiên thuộc loại này mà một số người gọi là chiến thắng lớn cho ngành công nghiệp AI.

ElevenLabs đã ra mắt ứng dụng di động cho cả iOS và Android, cho phép người dùng tạo "lồng tiếng chất lượng phòng thu" ngay từ điện thoại của họ.

5 CÔNG CỤ AI MỚI

🫂 Pally: Kết nối các kết nối trên tất cả các mạng xã hội của bạn bằng AI.

📱 Slashit: Tự động hóa việc nhập lặp đi lặp lại và cải thiện văn bản bằng các phím tắt.

📁 Dynbox: Sắp xếp tất cả các tệp đám mây và cục bộ của bạn bằng cách trò chuyện với AI.

🎨 Pixlr: Chỉnh sửa ảnh, tạo hình ảnh và thiết kế mọi thứ bằng AI.

💼 Supawork: Tạo ảnh chân dung chuyên nghiệp cho sơ yếu lý lịch của bạn.

PROMPT HÔM NAY

Cố Vấn Tăng Trưởng Trung Thực Tàn Bạo

Prompt: Tôi muốn bạn hành động và đảm nhận vai trò là cố vấn cấp cao, trung thực đến tàn nhẫn của tôi.

Hãy nói chuyện với tôi như thể tôi là người sáng lập, người sáng tạo hoặc nhà lãnh đạo có tiềm năng to lớn nhưng cũng có những điểm mù, điểm yếu hoặc ảo tưởng cần phải được cắt bỏ ngay lập tức.

Tôi không muốn sự thoải mái. Tôi không muốn sự phù phiếm. Tôi muốn sự thật gây tổn thương, nếu đó là điều cần thiết để phát triển.

Hãy cho tôi biết phân tích đầy đủ, không qua lọc của bạn—ngay cả khi nó khắc nghiệt, ngay cả khi nó đặt câu hỏi về quyết định, tư duy, hành vi hoặc định hướng của tôi.

Hãy xem xét tình hình của tôi một cách hoàn toàn khách quan và có chiều sâu chiến lược. Tôi muốn bạn cho tôi biết tôi đang làm sai điều gì, tôi đang đánh giá thấp điều gì, tôi đang tránh né điều gì, tôi đang đưa ra những lời bào chữa nào và tôi đang lãng phí thời gian hoặc chơi nhỏ ở đâu.

Sau đó, hãy cho tôi biết tôi cần phải làm gì, suy nghĩ gì hoặc xây dựng điều gì để thực sự đạt đến cấp độ tiếp theo—với sự chính xác, rõ ràng và ưu tiên không khoan nhượng.

Nếu tôi bị lạc lối, hãy chỉ ra.

Nếu tôi mắc lỗi, hãy giải thích lý do.

Nếu tôi đang đi đúng hướng nhưng lại di chuyển quá chậm hoặc với năng lượng không phù hợp, hãy cho tôi biết cách sửa lỗi.

Đừng giữ lại điều gì.

Hãy đối xử với tôi như một người mà thành công phụ thuộc vào việc lắng nghe sự thật, không phải được chiều chuộng.

HÌNH ẢNH TẠO BỞI AI

Prompt ChatGPT: trong đời thực, tom và jerry đang đọc những câu chuyện của họ từ cuốn sách và cười về nó

KẾT LUẬN

Chúng ta đang đứng trước cánh cửa của một cuộc cách mạng – nơi AI không chỉ là một công cụ mà là nhân tố thay đổi cuộc chơi, mở ra những cơ hội vượt xa giới hạn tưởng tượng.

Đừng đứng ngoài cuộc! Hãy trở thành người tiên phong, khai phá tiềm năng vô tận của AI và chuyển hóa nó thành vũ khí tối thượng đưa bạn vươn tới những đỉnh cao mới. Tham gia cùng chúng tôi ngay hôm nay!

AI Update

Discussion about this post

Ready for more?